Pourquoi le RAW en vidéo ?

Dans le domaine de la vidéo professionnelle, parmi les innombrables possibilités de paramétrage qu'offrent les menus des caméras HD et 4K, deux réglages sont centraux :

  1. La courbe de Gamma (Master Gamma dans les menus) ; c'est le contraste de l'image ;
  2. Le choix du matriçage (Matrix en anglais ou Gamut dans les menus) : c'est le rendu colorimétrique / saturation des couleurs de l'image.


Qu'est-ce que RAW, LOG et REC709 en vidéo, menu Gamma et Matrix Sony, capture d'écran Qu'est-ce que RAW, LOG et REC709 en vidéo, menu Gamma et Matrix Panasonic, capture d'écran
Les menus Gamma et Matrix chez Sony et Panasonic.

Ces choix vont formater, contraindre le signal vidéo numérique de la caméra pour obtenir, en gros, sur les écrans prévus à cet effet une image suffisamment contrastée (c'est ici la courbe de Gamma qui officie) et suffisamment saturée (c'est le matriçage) pour que le téléspectateur dispose d'une image "sexy", flatteuse pour la cible de diffusion : l'écran dernière génération qu'il vient d'acheter en HD, Ultra HD 4K, etc.

Qu'est-ce que RAW, LOG et REC709 en vidéo, exemple de gamma 1 Qu'est-ce que RAW, LOG et REC709 en vidéo, exemple de gamma 2
Différentes courbes de gamma pour différents rendus de contraste/saturation.

En télévision, on est censé connaître le support de diffusion, sauf dans le cas ou la diffusion est multi-écrans : TV HD, salles de cinéma, Internet, tablettes, smartphones, etc.

La diffusion HD est régie par la norme REC709 ; la diffusion 4K, par la norme REC2020, et la diffusion en salle de cinéma, par la norme DCI D-Cinema.
On retrouve ces termes dans les caméras pour que tous les fabricants puissent converger techniquement et artistiquement vers des dispositifs d'affichage qui vont tenter de restituer une image fidèle à la captation, quels que soient le modèle ou la marque.

Dans le domaine de la photo, on pourrait transposer ces réglages à ce que les constructeurs appellent les Pictures Styles ou Picture Control, que les photographes peuvent choisir et modifier selon leurs intentions artistiques et les conditions de prise de vues, sans savoir comment les photos seront tirées ni sur quel support.

Qu'est-ce que RAW, LOG et REC709 en vidéo, l'équivalent en photo, presets Canon et Nikon, capture d'écran
Réglages du rendu des images dans des "presets" chez Nikon ou Canon.

Ces réglages pilotent le laboratoire numérique intégré à nos caméras modernes pour passer du "négatif" numérique (le fichier brut ou RAW) au "positif" numérique  (JPEG). En vidéo, on a l'habitude d'appeler le RAW le "négatif" numérique, par opposition au "positif" numérique très compressé destiné à la diffusion audiovisuelle.

En somme, avec le JPEG ou le "positif" compressé, on cherche à obtenir une image prête à être diffusée dès la fin du tournage. Cela réduit aussi considérablement les possibilités de modification et de traitement ultérieurs de l'image : on va perdre de manière drastique les informations recueillies par le capteur, pour aboutir à leur plus faible poids numérique.

Mais depuis que le RAW a envahi nos caméscopes et nos APN (appareils photo numériques), il est possible de ne choisir aucun de ces réglages définitifs et de reporter nos choix artistiques à plus tard, lors d'une deuxième étape appelée "postproduction" en vidéo, au chaud devant nos écrans d'ordinateur.

C'est à ce moment qu'il faudra choisir et adapter à chaque scène le bon contraste et la bonne colorimétrie, pour l'intention artistique finale voulue et le support cible. Les photographes vont alors "révéler" numériquement leurs photos RAW, tandis que les vidéastes vont "étalonner" leurs rushes vidéo, à l'aide de logiciels dédiés à l'étalonnage vidéo tels que DaVinci Resolve, Adobe Speedgrade, Misitika, Assimilate Scratch, Quantel Pablo, mais il est aussi possible de le faire dans les logiciels de montage comme Premiere Pro, Avid Media Composer ou Final Cut Pro X...

Le RAW est donc la solution idéale si on veut conserver toutes les réserves possibles de l'image en termes de dynamique, de contraste, de colorimétrie, de définition... : c'est la voie de la quintessence du capteur de la caméra après récolte analogique puis binaire de tous les photosites.

Mais (car il y a un mais...) en vidéo, le RAW coûte cher.

Voici un exemple de débit pour une caméra de référence du marché audiovisuel 4k, la Sony F55 :
  • - débit en XAVC Intra 4K 10 bits à 25 images/seconde : 250 Mbps (sur une carte mémoire de 64 Go, on peut enregistrer environ 30 minutes) ;
  • - débit en RAW 16 bits à 25 images/sec : environ 1,2 Gbps (sur une carte mémoire de 64 Go on peut enregistrer environ 6 minutes seulement) !

Le RAW "négatif" va donc "peser" de 4 à 10 fois le poids d'une vidéo "positive" définitive.

Ainsi, le choix qualitatif du processus RAW vidéo va avoir de nombreuses conséquences, dont :
  • - le poids numérique des fichiers à stocker sur des cartes mémoires onéreuses qui seront déchargées ensuite sur de larges disques sécurisés ;
  • - la puissance des ordinateurs qui vont devoir relire et "révéler" ces fichiers imposants à 25 images par seconde ;
  • - le temps passé à pré-étalonner les images avant le montage, à exporter des images intermédiaires appelées PROXY destinées au montage, puis, à la fin du montage, à relier les éléments du montage avec les rushes d'origine en RAW pour réaliser l'étalonnage définitif (ce que l'on appelle la conformation et le finishing).

Tout cela nécessite donc impliquer différents logiciels, de puissantes machines, des unités de stockage très rapides avec des capacités très importantes, ainsi que du temps et de l'argent.
 
Qu'est-ce que RAW, LOG et REC709 en vidéo, signal Interdit aux poids lourds
 
Quelles sont alors les alternatives au RAW si l'on n'a ni ce temps ni cet argent, et que l'on souhaite faire de l'étalonnage avec des intentions artistiques ?

Les alternatives au RAW

Il existe deux grandes solutions :
  1. faire du RAW compressé – c'est la solution du constructeur RED avec la compression lossy Redcode (ondelettes, compression de 18:1 à 2:1) ;
  2. utiliser une courbe de Gamma et un matriçage les moins destructeurs possible, dans un "positif" numérique peu compressé offrant de nombreuses nuances à destination de l'étalonnage.
Examinons la deuxième solution.

Inter-positif numérique et LUT

Il s'agit d'appliquer lors du tournage le moins de contraintes possible au signal dès le début du traitement numérique interne à la caméra, en termes de contraste et de colorimétrie : l'image enregistrée sera donc la moins contrastée et la moins saturée possible (on peut toujours re-contraster et re-saturer une image qui ne l'est pas, l'inverse étant plus difficile).

L'image obtenue devra impérativement être modifiée par la suite en postproduction, afin de re-contraster et re-saturer l'image avant diffusion. Cette méthode implique donc passage obligatoire par la phase étalonnage, comme avec le RAW.

Qu'est-ce que RAW, LOG et REC709 en vidéo, les phases de postproduction, montage et étalonnage, schéma

Le grand intérêt de cet "inter-positif" numérique est qu'il pèse quasiment le même poids qu'un fichier "positif" standard, qu'il demande la même puissance de traitement que ce dernier et, surtout, qu'il offre potentiellement une grande marge de travail pour l'étalonnage.

Voici un exemple avant/après :

Qu'est-ce que RAW, LOG et REC709 en vidéo, Rush LOG sans correction, capture d'écran
Avant : Rush LOG sans correction ;
l'image est laiteuse, sans contraste et sans saturation : elle n'est pas faite pour la diffusion, mais pour l'étalonnage !

Qu'est-ce que RAW, LOG et REC709 en vidéo, Rush Log après LUT, capture d'écran
Après : Rush Log après correction et application d'une LUT qui va pré-étalonner l'image.

Les constructeurs vont alors développer leur propre courbe de Gamma et leur propre matriçage à large étendue, et la correction pourra être normalisée dans un profil que l'on appelle en vidéo "LUT" (Look Up Table), à la manière des profils ICC que les photographes connaissent.

Qu'est-ce que RAW, LOG et REC709 en vidéo, LUT SLOG2 vers REC709, capture d'écran
LUT SLOG2 vers REC709 dans Resolve : pré-étalonnage du rush dans un profile.

Après le tournage de cette image laiteuse, l'étalonneur va pouvoir trouver une LUT de correction dans tous les bons logiciels d'étalonnage pour redonner à l'image désaturée et décontrastée un aspect artistique visualisable sur un écran de télévision. L'étalonnage fin peut alors commencer, suivi du montage...

Pour offrir cette marge de travail, cet "inter-positif" numérique doit :
  • - répartir équitablement la dynamique du RAW sur le nombre de nuances enregistrées ;
  • - ne pas restreindre l'espace colorimétrique à celui du dispositif de diffusion (REC709 pour la TVHD), mais offrir un espace plus large (wide gamut) ;
  • - utiliser plus de nuances que les standards de diffusion TV sur 8 bits, par exemple sur un minimum de 10 ou 12 bits ;
  • - ne pas trop compresser l'image pour offrir une image peu dégradée à l'étalonnage (en DnxHD ou ProRes par exemple).

Si l'on considère que les capteurs récents offrent jusqu'à 14 diaphragmes de dynamique, voici le nombre de nuances nécessaires à la conservation de ce contraste :

Valeurs numériques Interprétation en diaphragmes Exposition
16384 Signal clippé (blanc maximum) 100%
8192-16383 1 diaph sous le blanc maximum f/128
4096-8191 2 diaphs sous le blanc maximum f/90
2048-4095 3 diaphs sous le blanc maximum f/64
1024-2047 4 diaphs sous le blanc maximum f/45
512-1023 5 diaphs sous le blanc maximum f/32
256-511 6 diaphs sous le blanc maximum f/22
128-255 7 diaphs sous le blanc maximum f/16
Point d'équilibre de la dynamique
64-127 7 diaphs au-dessus du noir minimum f/11
32-63 6 diaphs au-dessus du noir minimum f/8
16-31 5 diaphs au-dessus du noir minimum f/5,6
8-15 4 diaphs au-dessus du noir minimum f/4
4-7 3 diaphs au-dessus du noir minimum f/2,8
2-6 2 diaphs au-dessus du noir minimum f/2
1-2 1 diaph au-dessus du noir minimum f/1,4
0 Noir minimum : aucune information 0%

On en déduit que si le gamma est strictement linéaire en suivant la réaction du capteur, il faudrait au moins 16 384 nuances linéaires pour encoder 14 diaphragmes, avec une plus faible représentation des diaphragmes en basse lumière ; il faudrait donc un fichier RAW sur 16 bits pour stocker ces 14 diaphragmes de manière linéaire.

Notre inter-positif ne peut pas être codé en 16 bits si l'on veut qu'il reste léger. Par contre, il est possible d'appliquer une courbe logarithmique à partir des valeurs du fichier RAW pour répartir l'ensemble des diaphragmes sur 10 bits log minimum.

Qu'est-ce que RAW, LOG et REC709 en vidéo, différents gammas et dynamiques
Les différents Gammas et la dynamique qu'ils peuvent offrir :
dynamique du capteur sur l'axe des X, signal de sortie caméra sur l'axe des Y

Ce qui donnerait : 1024 (12 bits) / 14 diaphragmes (dynamique) = 72 nuances par diaphragme.

On pourrait le résumer ainsi :
  • - option lourde : fichier RAW 16 bits/photosite LIN (Linéaire) sur 65 000 nuances ;
  • - option légère : fichier ProRes ou DnxHD en 10 bits/pixel LOG sur 1024 nuances avec 72 nuances par diaphragme.

Ce que l'on appelle un fichier 10 bits LOG pourrait s'apparenter à un RAW 16 bits pour pauvres !

LOG/RAW : avantages et inconvénients

Les avantages du LOG par rapport au RAW :
  • - même dynamique,
  • - fichier standard ProRes ou DnxHD (idem positif numérique) autour de 150 Mbps,
  • - besoin en ressource machine faible (idem positif numérique),
  • - stockage standard (idem positif numérique),
  • - coûts standard (idem positif numérique).
  •  
Les avantages du RAW par rapport au LOG :
  • - réserve en définition (on peut débayeriser différemment avec de meilleurs algorithmes dans le futur, ou en fonction de la puissance de la machine),
  • - réserve en colorimétrie,
  • - réserve en dynamique (plus de nuances qu'en LOG).

Les inconvénients du LOG :
  • - moins de nuances qu'en RAW (surtout dans les extrêmes),
  • - définition définitive (souvent en HD alors que le RAW peut être en 3K, 4K...),
  • - colorimétrie définitive avec balance des blancs et espace colorimétrique "cuits" dans l'image (backed in),
  • - compression lossy.
Il est important de noter qu'il existe une différence fondamentale entre une caméra qui intègre dans ses menus une courbe de Gamma LOG qui va chercher la totalité de la dynamique du capteur en début de traitement numérique, et une caméra qui offre des profils d'images en fin de chaîne de traitement numérique (LUT) dont certains sont appelés "neutres" ou "flat" : ceux-ci ne sont que des LUT appliquées sur un positif déjà formaté par la caméra et sur lequel on a aucun levier, comme c'est le cas généralement dans les DSLR. Dans ce dernier cas, il est difficile de récupérer des diaphragmes extrêmes ou encore des nuances dans un espace colorimétrique très réduit (type REC709) dans des fichiers très compressés : il ne s'agit que du choix du "look" d'une image dont on a déjà pressé l'essentiel du jus.

Conclusion

Il existe donc 3 grandes philosophies de tournage en vidéo.
  1. Le tournage en "négatif" numérique, lourd et cher, passage obligatoire à l'étalonnage : c'est le RAW ;
  2. le tournage en "inter-positif" numérique, léger et économique, passage obligatoire à l'étalonnage : c'est le LOG ;
  3. le tournage en "positif" numérique, léger et économique, diffusable tel quel ou offrant la possibilité de légères corrections : c'est le REC709 en HD et le REC2020 en 4K.
    Les constructeurs offrent des courbes de gamma "positives" améliorées dans les menus des caméras professionnelles, avec une dynamique plus large ; elles se nomment Hypergammas chez SONY et CinéLike chez Panasonic.

Négatif RAW 12-16 bits Inter-positif LOG 10-12 bits Positif REC709 8 bits


PARTAGER
Contact Vie privée, Cookies Conditions Générales d'Utilisation