Spleeter : Quand le Deeplearning permet d’isoler des pistes audio

L’Intelligence artificielle est de plus en plus présente et ordinaire dans notre quotidien sur-connecté : les PNJ de nos jeux vidéo favoris, les robots qui indexent les pages de résultat Google, les vidéos en page tendance de Youtube, les suggestions et autres bannières publicitaires… Tout ça obéit en réalité déjà à une suite d’algorithmes mathématiques dont le but est simple : prendre des décisions et opérer des choix d’après une quantité d’informations trop volumineuse pour qu’un humain les traite.

Or, certains d’entre vous on peut être vu passer dernièrement des outils tels que Lyrebird, DeepfaceLab ou Ebsynth. Outils respectivement capables d’imiter la voix d’un président Américain, de greffer le visage de Jim Carrey sur le corps d’Alison Brie ou encore de transformer une peinture en séquence vidéo animée. Et c’est bluffant, vraiment.

L’architecture de ces logiciels est directement inspirée du cerveau humain puisque l’IA est cette fois-ci constituée de plusieurs couches de neurones artificielles dont le modèle mathématique se réajuste au fil des erreurs qui sont faites. Un principe qu’on nomme Apprentissage Profond, ou Deeplearning. Voilà, vous savez tout, et oui ça fait peur, même si les domaines d’applications sont très prometteurs … (#BlackMirror quand tu nous tiens).

Bon, après cette longue introduction, il est temps que je vous parle de ce qui m’amène à rédiger ce billet : Spleeter

Un outil édité par deezer et capable d’isoler différentes pistes d’un morceau qu’on lui donne à analyser : la voix, la batterie, l’instru … Et le résultat, même s’il n’est pas parfait, est déjà très probant.

Bien entendu, pour obtenir les résultats les plus pointus, il vous faudra quelques skills de geek afin d’installer ce petit bijou totalement open source et disponible ici :

https://github.com/deezer/spleeter

Et dans l’absolu, il vous faudra aussi une bête de pc, parce que ce que le Deeplearning, en vrai, ca bouffe des ressources incroyables en provenance de la carte graphique et du processeur. Donc, à moins de disposer d’un abonnement Shadow confortable et d’avoir de sérieuses compétences en débrouillardise informatique, je vous conseille pour le moment de faire quelques essais ici :

https://melody.ml/

Le site utilise le moteur de Spleeter, et c’est plus simple (mais un peu moins performant, je le concède). Voilà, une technologie qui intéressera en tout cas pour sûr les deglingos du karaoké, les fadas du mashup, les malades de remix ou simplement les petits curieux.

Amusez-vous bien !

Clem

Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l'aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s