A la une

Le plein d’outils pour sous-titrer vos vidéos

L’Intelligence Artificielle analyse aujourd’hui les paroles des vidéos dans à peu près toutes les langues pour y ajouter des sous-titres de mieux en mieux… Mais pas toujours gratuitement et pas avec les mêmes possibilités d’édition ni la même simplicité. Florilège des solutions à disposition.

Sur le fond

Le sous-titrage des vidéos aujourd’hui est moins une question d’IA et de réussite de la transcription, que d’interface utilisateur et de simplicité/rapidité d’édition de la transcription. Quelle que soit la plateforme ou l’application que vous utiliserez pour sous-titrer vos vidéos, il y a fort à parier que, derrière, ce sera la même IA qui sera chargée de transcrire les paroles en texte une fois que vous aurez, bien sûr, choisi la langue que celle-ci doit analyser et restituer. Preuve en est que, quel que soit l’outil, on y trouve la même liste de langues avec les même variations. Pour traduire un texte en français, vous devrez opter entre les français de Belgique, du Canada, de France ou de Suisse, qui n’ont ni les mêmes intonations ni les mêmes expressions.

Voilà pour le tronc commun. Mais une fois la transcription effectuée, les outils ne sont pas les mêmes quand il s’agit d’éditer les sous-titres fournis et de corriger l’orthographe, la grammaire mais aussi la compréhension du sens du texte. Cela influe évidemment sur la façon dont les pavés de texte sont coupés, et les phrases du discours passées à la ligne. C’est là que le bats blesse encore : si l’IA comprend les sons et interprète de mieux en mieux les mots, elle est bien loin de ponctuer et découper intelligemment les phrases. D’où l’intérêt d’outils bien pensés pour corriger, couper et ajuster rapidement le timing des pavés de sous-titres.

La solution YouTube (ordi)

Pendant longtemps, je me suis contenté comme beaucoup de YouTube et l’IA de Google pour transcrire le contenu audio (parlé) des vidéos. Le résultat est loin d’être parfait et la transcription demande à être à la fois corrigée et ajustée. Mais l’avantage, c’est que c’est gratuit pour les vidéos postées sur Youtube et qu’on dispose de pas mal d’options pour personnaliser l’habillage des sous-titres (typo, taille, couleurs…) En revanche, quand on souhaitait les diffuser ailleurs, la manip se compliquait : après la transcription de YouTube, il fallait télécharger les sous-titres sous la forme d’un fichier .srt. Puis les incruster dans les images avec un autre outil pour générer une nouvelle version de la vidéo. Avec les sous-titres « gravés » dans la vidéo, celle-ci pouvait alors être diffusée n’importe où. Au delà de la gratuité, l’autre intérêt de la solution YouTube tient à son interface utilisateur  : les textes s’affichent dans des petits pavés sur une timeline en dessous de la vidéo. Cliquer sur un pavé affiche ses poignées de trim qui permettent de recaler la durée d’affichage des sous-titres. C’est très pratique, même si cela manque parfois un tout petit peu de précision.

Les plateformes Headliner et Kapwing (en ligne)

Depuis sont apparues des plateformes web de création de vidéos pour les réseaux sociaux avec des fonctions de sous-titrages gratuites. La première que j’ai repérée, c’est headliner.app. Sa vocation première était de faire des audiogrammes (transformer un son en une vidéo composée d’un fond fixe et de la forme d’ondes qui bouge par dessus) comme en font les podcasteurs depuis des années. La plateforme s’est enrichit et propose depuis d’y téléverser ses propres vidéos pour réaliser de petits montages très simple. Elle profite aussi d’une IA qui transcrit les speeches de ces vidéos, indépendamment de leur langue puisqu’elle reconnaît la plupart. Les sous-titres peuvent être ensuite édités, recalés sur le time code, et bien sûr mis dans la forme esthétique que l’on veut. Et la vidéo sous-titrée peut être téléchargée pour être ensuite postée n’importe où.


Kapwing fait à peu de choses près la même chose et son IA est tout aussi efficace pour transcrire les sous-titres de n’importe quelle vidéo parlée. Mais le procédé, en version bêta, devrait profiter à termes, d’une interface bien pensée pour le recalage des sous-titres. La difficulté avec les outils de sous-titrage apparaît souvent quand il faut équilibrer les pavés de texte ou couper intelligemment les phrases. Il faut alors faire passer un morceau de phrase dans le pavé suivant, quitte a créer un pavé de texte pour cela. Dans Headliner, comme dans la plupart des outils, on utilise pour cela les timecode, valeurs temporelles qui définissent la durée précise des pavés de texte avec une valeur en entrée (In) et une autre en sortie (Out). Exemple : in = 02:02:22, out = 02:07:18 ( où les derniers chiffres correspondent parfois à des dixièmes ou centièmes de seconde, parfois à des « frames »). C’est un peu fastidieux, je vous le concède, mais pas très compliqué. Là où Kapwing devrait faire mieux, c’est en remplaçant ces timecodes, par des curseurs pour ajuster, sur une sorte de timeline, la durée des segments correspondant aux différents pavés de texte. Sur le fond, le principe n’est pas éloigné de celui de YouTube, avec une présentation bien différente dans Kapwing où chaque pavé de texte profite aujourd’hui de sa propre timeline. Celles-ci s’empilent ainsi dans la page dans un ordre rapidement anarchique si l’on crée soi-même des paves pour réagencer le texte… A terme, la version définitive devrait mettre de l’ordre dans tout cela.

Les applis (smartphones) MixCaptions et Autocap

Il y aussi la possibilité de sous-titrer directement depuis les smartphones avec quelques applications pas tout à fait gratuite. La première que j’avais découverte, c’est MixCaptions pour iOS. Point fort : une vraie personnalisation des styles de sous-titres (avec quantité de polices et des fonds de couleur semi  transparents si besoin). L’édition y est assez fastidieuse avec une interface qui mériterait d’être grandement améliorée. Et si l’appli est gratuite au téléchargement, elle demande rapidement de payer pour sous-titrer, avec un système de crédits par minute de transcription, pour un coût aux alentours de 15€/heure.


Heureusement, la concurrente Autocap travaille pour beaucoup moins cher (28€/an). Voire gratuitement si l’on s’accommode de son watermark dans le coin inférieur droit des vidéos qu’elle produit. Elle propose nettement moins d’options de personnalisation que MixCaptions. En revanche, elle profite d’outils bien pratiques pour éditer rapidement les transcriptions et faire passer simplement un mot ou un morceau de phrase d’un pavé de texte à l’autre. Et surtout, elle fonctionne aussi bien sur Android que sur iOS.

Les solutions pro

Et pour les outils professionnels, Adobe Premiere Pro ou FCP X ? Les adeptes de Premiere Pro ont souvent recours à Transcriptive de Digital Anarchy depuis qu’Adobe a renoncé au module de transcription qui intégrait Premiere jusqu’en 2014. A ma connaissance, côté FCP X, il n’y a pas encore de solutions intégrées. Les plug-ins disponibles -comme Caption Burner de Noise Industries ou  – se contentent d’incruster, synchroniser et personnaliser un fichier de sous-titres généré ailleurs et téléchargé. Par Youtube ou Headliner par exemple. Ou par des solutions plus avancées et payantes comme Speedscriber ou Scribeomatic  en achetant des minutes de transcription. Ou encore par la magnifique solution Descript.com qui fait bien plus de que de la transcription basique -mais ceci est un autre sujet- et que je vous invite à aller regarder de près. Avec elle, on joue là dans la cour des pros avec des coûts bien supérieurs à celui des solutions citées plus haut. Je ne m’étends pas davantage.

Pour conclure, ne me demandez pas quel est le meilleur outil du lot : cela dépend si vous montez sur ordi ou sur smartphone, si vous hébergez vos vidéos sur YouTube seulement ou ailleurs aussi, si vous êtes radins et acceptez de perdre du temps ou pressés et prêts alors à lâcher quelques euros… Je n’aurai qu’un conseil : essayez les solutions gratuites, faites-vous votre idée. Et n’hésitez pas à me signaler les autres solutions de sous-titrage gratuites que vous auriez dénichées.

Laurent Clause

Laurent Clause

Journaliste par vocation, spécialiste des nouvelles technologies depuis la fin des années 80, je suis devenu réalisateur d'images et formateur, formateur vidéo smartphone en particulier. J'interviens avec ma société Milledix ainsi notamment qu'à Gobelins l'Ecole de l'Image, Sciences Po Paris et pour le groupe CapCom. J'enseigne l'écriture audiovisuelle, le montage avec FCP X ou Adobe Premiere Pro, et je forme à la vidéo-mobile, au MoJo (mobile journalism), au tournage avec Filmic Pro, Open Camera ou autres et au montage notamment avec LumaFusion, Adobe Rush et Kinemaster.

7 Commentaires

  • Christophe Lê dit :

    Merci pour ce post.
    Pour ma part, j’utilise Aegisub et j’en suis très satisfait.

    • Si ce ne je me trompe pas, Aegisub ne fait pas la transcription (le sous-titrage automatique), contrairement à l’ensemble de solutions présentées dans cet article.

  • Christophe Lê dit :

    Au temps pour moi, j’ai lu l’article trop vite. Mais j’ignorais que Premiere et FCPX le faisait.

  • MOURON dit :

    Merci pour ce recap.
    j’utilise speedscriber ( achat de minutes ..) et scribeomatic (achat minutes également…) de coremelt

  • Laurent Berthault dit :

    Bonjour Laurent,
    de mon côté j’ai découvert avec surprise la fonction de sous-titrage en temps réel de la petite appli gratuite Clips, sur iOs, avec l’application Titres live. Bien sûr c’est très basique mais pour un selfie ou plateau réalisé dans l’urgence ça marche bien. Possibilité de choisir différents styles et de modifier le texte après-coup.

    • Laurent Berthault dit :

      Fonction Titre livre, pas appli…

    • Merci Laurent, de me rappeler l’existence de Clips d’Apple. Que j’ai oubliée en effet sitôt que je l’ai eu découverte, déçu par son seul mode 1:1 et son orientation purement réseaux sociaux. Mais vous avez raison, elle sous-titre plutôt correctement et surtout en temps réel à la volée.

Laisser une réponse

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.