Applications

Streamr sous-titre, traduit et double pour 45€

Logiciel Mac/PC, Streamr transcrit et sous-titre les vidéos, traduit les sous-titres dans toutes les langues et les convertit en voix de doublage. Pas parfait, mais bluffant !

Le sous-titrage ne sera bientôt plus un sujet ! Certaines applis et plateformes facturent aujourd’hui 15 €/l’heure de transcription (et parfois de traduction), mais le service est gratuit depuis des années pour les possesseurs de chaînes YouTube, ou les utilisateurs d’Adobe Premiere Pro par exemple. Car la technologie existe et l’IA dans ce domaine fait des progrès constants.

D’où l’idée maline d’Atlas Web, startup marocaine : exploiter les API mises à disposition de Google dans le Cloud pour transcrire, traduire et doubler le contenu des vidéos. C’est ce que fait Streamr, un logiciel vendu 49$ pour Mac OS X ou Windows, qui ne fonctionne qu’après avoir ouvert un compte gratuit sur le service https://cloud.google.com. Comptez ensuite 5 minutes pour y activer et configurer les API concernées (Cloud speech-to-text, Cloud text-to-speech, Cloud translation et Cloud storage) avant d’y récupérer la clé API, sésame à coller dans le logiciel à sa première utilisation. L’opération n’est pas très compliquée en suivant le tuto en anglais proposé par l’éditeur, ou celui que j’ai fait en français ci-dessous.

Sous-titrez vos vidéos… et celles de YouTube

Une fois configuré, Streamr fournit à peu près les mêmes services de base que les plateformes et applications de transcription. On dépose la vidéo à transcrire dans sa fenêtre, on indique la langue (native) que l’IA doit analyser et on patiente quelques secondes. Streamr peut aussi faire la même chose avec n’importe quelle vidéo de YouTube dont vous lui communiquez l’URL : il télécharge alors la vidéo, en 360p ou en 720p au maximum. Si vous voulez mieux, utilisez un aspirateur de vidéos YouTube…

Puis recoupez les phrases péniblement !

Commence ensuite l’incontournable session de corrections/ajustements de la transcription. L’IA ne cesse de progresser, elle se trompe encore de temps en temps. Sur quelques mots ou tournures grammaticales qui se corrigent rapidement. En revanche, côté coupe des phrases, il y a beaucoup à redire ! Aucun système que j’ai testé n’effectue correctement les retours à la ligne et la découpe des sous-titres. Et ce, quelle que soit la langue. Pour faire les choses bien, il convient de refaire les coupes soi-même, sous-titre par sous-titre, dans l’éditeur de Streamr. De rares systèmes de transcription proposent pour cela des outils pour passer un mot d’un sous-titre au suivant ou au précédent. C’est le cas de l’application Autocap notamment. Mais dans Streamr cela s’opère par un bon vieux couper/coller. Qui implique ensuite d’ajuster le timecode du sous-titre raccourci et de celui qui a été rallongé. L’opération est peu pratique, car le player de Streamr est peu précis, et il est indispensable d’effacer les valeurs de timecode avant d’en saisir de nouvelles pour les valider. Sur ces points, le logiciel gagnerait sérieusement à être amélioré. Au final, la transcription avec ses timecodes corrigés peut-être exportée au format .srt.

Personnalisation limitée

Vient après la phase de personnalisation des sous-titres. Là encore, le logiciel propose le minimum : police, taille, couleur du texte mais aussi du contour et de l’ombre, avec quatre épaisseurs au choix. Mais pas d’arrière-plan semi-transparent, ni la possibilité de positionner le sous-titre où on le souhaite. Par dessus le marché, le logiciel avertit que l’aperçu des sous-titres n’est pas toujours fiable. Je vous le confirme : pour les vidéos aux format carré (1:1) ou portrait (9:16), il vaut mieux ne pas grossir la taille de caractères par défaut (18) sinon les sous-titres prennent beaucoup plus de place sur les images que prévu, beaucoup trop en tout cas…

Traduction et doublage

C’est ensuite que Streamr a vraiment son intérêt. Il permet d’abord de traduire ultra)rapidement la transcription obtenue (et corrigée) dans une foule de langues. Je ne saurai affirmer que les traductions sont parfaites, elles ont au moins le mérite de dépanner. Néanmoins pour bien faire, vous devrez, là encore, ajuster les coupes et les timecodes. Avant, si vous le souhaitez, de récupérer le fichier .srt ou d’incruster les sous-titres pour chaque langue traduite. Mais le meilleur, c’est la possibilité de doubler la vidéo originale avec une voix de synthèse. Et là je dois vous avouer que malgré les imperfections et manques de ce logiciel, le résultat m’a scotché  : les voix de synthèse (homme ou femme) sonnent de plus en plus réaliste, dans les deux langues étrangères que je pratique modestement. Le seul soucis tient à la longueur du speech initial et à son débit. Je parle vite dans mes vidéos, j’en suis conscient. Et il a été indispensable que j’accélère la voix de doublage dans les options de Streamr, pour qu’elle ait le temps de dire dans une autre langue, tout ce que je en français. Et pour cela, il faut tâtonner et si reprendre à, plusieurs fois.

Streamr streame aussi !

Reste la fonction de streaming -qui donne son nom à l’application- et qui permet de diffuser en direct une vidéo générée avec sous-titres et doublage par exemple. Sur Facebook, YouTube, mais aussi Twitch ou autre, le logiciel générant un flux rtmp avec la clé qui va avec. Mais j’ai beau réfléchir, je ne vois toujours pas bien l’intérêt de cette fonction. Si ce n’est d’éviter d’avoir à poster sur Facebook par exemple une vidéo générée avec Streamr : le logiciel propose de le faire instantanément, sitôt la vidéo rendue, c’est tout. En revanche, on peut rêver qu’un jour le système proposera transcription et sous-titrage en simultané. En attendant, et m$eme si l’outil n’est pas parfait vous l’aurez compris, Streamr justifie ses 49$ pour les producteurs de vidéo marketing multilingues, qui l’auront rentabilisé passé 3 heures de transcription, traduction et doublage.

Laurent Clause

Laurent Clause

Journaliste par vocation, spécialiste des nouvelles technologies depuis la fin des années 80, je suis devenu réalisateur d'images et formateur (à la vidéo en général et à la "vidéo mobile", sur smartphone, en particulier). J'ai enseigné le MoJo à l'Ecole de Journalisme de Sciences-Po Paris et interviens avec ma société Milledix notamment à Gobelins l'Ecole de l'Image, pour Samsa, le groupe CapCom ou aux Antilles et à la Réunion pour Inzy-Learning . J'enseigne l'écriture audiovisuelle, le montage avec FCP X, Adobe Premiere Pro ou Da Vinci Resolve et bien sûr la vidéo mobile, le MoJo (mobile journalism), le tournage avec Filmic Pro, Open Camera ou autres et le montage notamment avec Adobe Rush, LumaFusion ou VN..

Leave a Reply

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.