GénéralitésTechniques

Le regard a un sens, dans tous les sens du terme

Faut-il regarder l’objectif ou la personne qui vous interviewe ? Tout le monde s’en fout depuis le smartphone. Pourtant, ça n’est pas la même chose !

Cela fait des années que je me retiens d’écrire sur cette problématique. J’y consacre un peu de temps durant mes cours et formations. Je vois bien que les plus jeunes la jugent carrément futile. Comme ce sont souvent les mêmes qui jugent accessoires l’orthographe, la grammaire ou la ponctuation…

Et puis voilà que je tombe sur une vidéo de NVidia vantant une nouvelle fonction logicielle d’un de ses produits graphiques, qui permet de déplacer la pupille d’un sujet filmé pour rétablir le contact de son regard avec l’objectif quand il regardait ailleurs.

Une question de fond

Et là je me dis qu’il est (grand) temps de rappeler qu’on n’est pas censé faire tout et n’importe quoi. Et qu’il y a une certaine logique à la direction du regard : quand une personne est filmée, la direction de son regard ne dit pas la même chose selon qu’elle fixe, ou non, l’objectif. Quand bien même les réseaux sociaux ont cassé les codes depuis que la vidéo s’y est installée.

Interview vs déclaration

L’interview. Il y a une vingtaine d’années encore, l’interview se pratiquait immuablement de la même façon. Le sujet (l’interviewé) était placé dans les 2/3 droit ou 2/3 gauche du cadre et regardait son interlocuteur (l’intervieweur) qui se trouvait lui respectivement à gauche ou à droite de la caméra. Ceci afin que le regard du sujet traverse l’image vers l’intervieweur et atteste de l’entretien. Et ce quand bien même la personne qui pose les questions n’était pas visible… ni même souvent audible puisqu’on coupe traditionnellement les questions dans un montage. Ce principe du regard traversant -qu’on voit aussi dans les dialogues filmés- avait une raison technique évidente : l’entretien était mené par un journaliste tandis que les images étaient filmées par une autre personne. Appelez-le « cadreur », « reporter d’images », « opérateur de prise de vue »… lui était derrière l’œilleton ou l’écran LCD de la caméra, le journaliste s’installant lui à sa droite ou à sa gauche pour attirer le regard de l’interviewé. Un entretien se fait entre deux individus qui se regardent. On est le spectateur (voyeur passif) d’une interview.

La déclaration. Regarder l’objectif correspond à un tout autre mode narratif : celui de la déclaration. Parler en fixant la caméra, c’est s’adresser à celles et ceux qui regardent (en direct) ou regarderont (en différé) le propos filmé. Le Président de la République, le présentateur du 20h ou le correspondant au bout du monde, la patron qui s’adresse à ses collaborateurs, le blogueur qui fait un tuto, l’influenceur qui vante les mérites d’un produit… tous s’adressent au spectateur parce qu’ils ont quelque chose à lui dire (ou à lui « vendre »), à lui qui les regarde… sans s’entretenir avec lui, ni avec personne d’autre ! Le ressenti pour le spectateur est donc tout autre que pour l’interview, du genre : « C’est à moi que tu parles ? Are you talking to me ? »

Le smartphone a effacé les règles

Depuis que les smartphones sont capables de filmer (approximativement depuis 2008), ces codes sont malmenés pour différentes raisons.

  • Parce que nos petits appareils mobiles ont simplifié la prise de vue et réduit le personnel : plus besoin d’un cadreur en plus de l’intervieweur, chacun peut à la fois filmer et poser des questions ;
  • parce qu’avec les selfies et la « visio », on a pris l’habitude de voir les personnes au centre de l’image, qui plus est dans un ratio souvent plus étriqué que le 16:9eme historique ;
  • parce que les ratios 9:16 (portrait) et 1:1 (carré) des plateformes sociales incitent à cadrer les personnes au centre de l’image, la règle des 2/3 – 1/3 étant, soi-disant plus difficilement applicable ; (même si ce n’est pas mon avis)
  • et sans doute aussi parce que la plupart de ceux qui se sont appropriés l’outil ignorent tout de la grammaire audiovisuelle et des conventions.

En demandant aux interviewés de regarder l’objectif, les médias sociaux ont brouillé les cartes de l’entretien audiovisuel

Résultat, il n’y a quasi plus que les contenus conçus par des professionnels pour une diffusion télé en particulier, qui continuent de faire une distinction claire entre interview et déclaration. Les vidéos à destination du Web et des réseaux sociaux sont beaucoup moins strictes : les personnes interviewées y sont très souvent centrées dans l’image, le regard braqué vers l’objectif. Alors qu’en réalité ce n’est pas à vous -le spectateur- qu’elles s’adressent, mais à celui ou celle qui les a fait parler. Pourquoi cette façon de faire ?

  • Evidemment, parce que c’est bien plus pratique pour celui qui est à la fois journaliste et cadreur de contrôler l’image en se mettant juste derrière l’écran durant l’entretien qu’il doit aussi mener.
  • Mais aussi, diront certains, parce que cela crée soi-disant une « proximité » entre l’interviewé et le spectateur. Permettez-moi de douter !

Pas de proximité sans interaction

Personnellement, je ne me sens pas plus proche d’une personne qui explique qui elle est ou ce qu’elle fait à l’image en me regardant !  Comme je ne me sens pas proche non plus de l’individu sur une photo anthropométrique ou une photo d’identité. Ni même de la personne qui se présente dans un CV vidéo.

Dans une interview où la personne me regarde, je sais pertinemment que ce n’est pas moi qui lui ai posé les questions. Et j’ai le sentiment qu’elle essaie de me convaincre, de me « vendre » quelque chose. Bien plus que si je l’avais vue regarder en diagonale l’interlocuteur qui l’interviewait. Bref, j’ai moins l’impression qu’elle a été interrogée que le sentiment qu’elle déclare quelque chose, comme n’importe quelle personne s’exprimant traditionnellement en regardant l’objectif.

La soi-disant « proximité » avec une personne à l’image existe bel et bien en vidéo… si l’on peut interagir avec elle. Par exemple durant un live où il est possible de poser des questions via le tchat, auxquelles l’intervenant répondra. Ou durant une visio : au delà des kilomètres qui séparent les personnes, la proximité existe par l’échange verbal et visuel possible entre elles. Je signale que le images de promotion des outils de visioconférence montrent toujours des utilisateurs regardant parfaitement l’objectif de la webcam. Alors qu’en réalité, ils ont les yeux rivés sur l’écran, la webcam parfois au dessus ou à côté d’eux selon la hauteur de leur caméra ou la position du smartphone qui les filme.

En visio, les utilisateurs regardent plus souvent leur ordi (à droite) que la caméra qui les filme (comme le laisse croire l’image de promo à gauche)

Je rappelle que pour soigner cet échange en direct et de visu, il est bien :

  • de placer sa webcam à hauteur de ses yeux (pour éviter une contre plongée permanente comme on le voit trop souvent quand l’ordi portable est posé sur le bureau),
  • de s’obliger à regarder l’objectif de la webcam -et non pas la tête des autres dans l’écran- si l’on veut que les interlocuteurs aient bien l’impression que vous les regardez dans les yeux.

Deux cams, deux axes regard

Rendons quand même hommage aux gros médias sociaux, type Brut ou Konbini, qui ont commencé à revoir leur copie. Sans renoncer au regard caméra au profit du regard traversant pour les interviews, Brut et Konbini font maintenant les deux en simultané ! Certaines de leurs vidéos sont effet filmées à deux appareils (smartphone et/ou DSLR). L’intervieweur est derrière un des deux pour attirer le regard du sujet dans son objectif, tandis qu’un second cadreur -généralement au DSLR- est placé de côté pour filmer un regard traversant. Ça c’est intéressant !

Interviewé à deux caméras par Konbini, le cinéaste D. Cronenberg a deux axes regard différents

Pour les plus grosses productions, le média télé pratique déjà le tournage multi-caméras depuis des lustres, « bi-cam » ou parfois « tri-cam ». Mais les caméras sont toujours placées de façon traditionnelle du même côté de l’intervieweur, en respectant la règle des 180°. Elles ne filment donc qu’un seul et même axe regard traversant. Les différentes vues et valeurs de plan servent juste à rythmer le montage. Mais vu la propension de la télé à adopter les recettes des réseaux sociaux, je ne serai pas étonné d’y voir binetôt les deux axes regard dans la même vidéo.

 

Dans un tournage télé, l’interviewé a aujourd’hui toujours un regard traversant

Où je veux en venir ?

La techno de Nvidia me semble bien futile. J’ai beau réfléchir, je ne lui vois pas d’usage. Quand je tourne une vidéo, j’invite la personne :

  • soit à me regarder (et surtout pas la caméra) quand j’ai des questions à lui poser pour la faire témoigner
  • soit à regarder la caméra si son message doit s’adresser aux spectateurs.

Le discours n’est pas le même, et je ne vois pas pourquoi j’aurai un quelconque intérêt à modifier l’axe regard.

Cette techno va peut-être faire prendre conscience au plus grand nombre de l’importance qu’on ne peut pas faire n’importe quoi avec un regard.

Sur les réseaux, certains voient bien les jeunes streamers -qui se filment en train de jouer en ligne- recourir à cette fonction pour donner l’impression qu’ils regardent leur communauté droit dans les yeux, quand ils ont en fait les yeux rivés sur leurs moniteurs. Mais ça ne marche pas ! Quand vous regardez quelqu’un jouer aux jeux vidéos, vous vous attendez bien à le voir regarder son moniteur : ses expressions (surprise, joie, colère, panique…) concernent ce qu’il fait. Elles n’ont aucune raison d’être adressées, les yeux dans les yeux, aux spectateurs.

Bill Clinton avait eu le courage de mentir aux journalistes… Mais je ne pense pas qu’il aurait pu dire, en regardant la caméra bien en face à des millions d’américains, qu’il n’avait rien fait avec Monica Lewinsky !

Laurent Clause

Laurent Clause

Journaliste par vocation, spécialiste des nouvelles technologies depuis la fin des années 80, je suis devenu réalisateur d'images et formateur (à la vidéo en général et à la "vidéo mobile", sur smartphone, en particulier). J'ai enseigné le MoJo à l'Ecole de Journalisme de Sciences-Po Paris et interviens avec ma société Milledix notamment à Gobelins l'Ecole de l'Image, pour Samsa, le groupe CapCom ou aux Antilles et à la Réunion pour Inzy-Learning . J'enseigne l'écriture audiovisuelle, le montage avec FCP X, Adobe Premiere Pro ou Da Vinci Resolve et bien sûr la vidéo mobile, le MoJo (mobile journalism), le tournage avec Filmic Pro, Open Camera ou autres et le montage notamment avec Adobe Rush, LumaFusion ou VN..

Leave a Reply

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.