Au commencement...

Pour s'échanger et travailler avec des fichiers informatiques, il faut que tous les ordinateurs puissent se comprendre, quelque soit la marque de l'ordinateur ou celui du logiciel qui va les importer, donc ils doivent partager les mêmes valeurs, codes, normes. C'est ce que l'on appelle l'interopérabilité (ou la compatibilité si on veut parler simplement).

Et quand on parle de fichiers de type vidéo, on parle souvent en jargon et en acronymes; Il y avait parmi les nombreuses variantes de fichiers le Mpeg-1, le Mpeg-2, puis vint le Mpeg-4 (le Mpeg3 n'aura pas eu d'existence).

 

codec vidéo expliqué

 

Le Mpeg (Moving Picture Experts Group), c'est un ensemble de normes, de gros cahiers ou de classeurs remplis de chapitres et de spécifications. Un gros classeur par norme. Le chiffre indique à quel classeur appartient le fichier (par exemple les fichiers .mp3 appartiennent au classeur MPEG-1 du chapitre Codec Audio, puisque c'est l'acronyme de Mpeg-1 audio Layer/codec 3, d'où mp3).

Certains chapitres de ces classeurs décrivent le container, l'enveloppe du fichier. Dans le monde vidéo, les containers les plus courants sont .AVI, .MOV, .MXF, et dans le cas de la norme on retrouve le .MP4 dans le cas du Mpeg-4. le container .mp4 est généralement destiné au grand public (le streaming sur le web, les petits camescopes, l'échange de fichiers...), alors que le container .MXF est généralement destiné au monde de la production audiovisuelle, comme l'ont adopté Sony, Panasonic et Avid notamment.

D'autres chapitres de ces normes décrivent les stratégies mathématiques utilisées pour réduire le poids du fichier et jouer avec les limites de perception de l’œil (modèles psychovisuels) et de l'oreille (modèles psychoacoustiques) qui tiennent compte des propriétés du système visuel et auditif humain: ce sont les fameux codecs intégrés à la norme, lesquels s'appliquent soit à l'audio, soit à l'image (COder-DECoder soit codeur-décodeur, une partie dans la caméra pour réduire/compresser le poids, l'autre dans le lecteur pour décompresser/reconstruire l'ensemble des données avant affichage).

En règle générale, plus le codec est évolué et récent, plus il offre une complexité importante lors de l'encodage et lors du décodage. Quand le codec est trop complexe pour le montage par exemple, on passe par des codecs intermédiaires plus simples à décoder et travailler, mais qui vont alourdir le poids du fichier: c'est alors qu'on utilise le DnxHD d'Avid et le Prores d'Apple qui rendent la vie plus simple aux monteurs et étalonneurs. On nomme généralement ces codecs des codecs intermédiaires.

Complexe implique que vous allez avoir besoin d'un ordinateur puissant et cher ! C'est le coté négatif, résolu par les cartes accélératrices (GPU CUDA par exemple) ou par la montée en puissance régulière de la technologie.

Le coté positif est le poids du fichier qui est réduit fortement sur les supports mémoires, notamment pour le grand public.

Donc, si l'on voulait faire une généralité:
- le matériel vidéo grand public utilise des cartes mémoires low cost (SD), et des fichiers légers très compressés et donc complexes à décoder.
- le matériel vidéo professionnel utilise des cartes mémoires chères et rapides (P2, SxS, AXS...), et avec des fichiers lourds mais simples à décoder.

Compression spatiale et temporelle

Les codecs récent les plus faciles à décoder limitent leurs stratégies de réduction de débit au plan spatial, dans l'espace de l'image fixe donc, appelé aussi INTRA (intra image, chaque image est compressée indépendamment des autres images et se suffit à elle même), comme le fait le codage JPEG ou le DnxHD/Prores.

 


Exemple de différences de complexité spatiale (stratégies INTRA)
entre l'ancien codec Mpeg2 et le récent codec H264

Les codecs les plus complexes utilisent en plus une réduction de débit sur le plan temporel, appelée INTER (inter-images, chaque image faisant partie d'un groupe d'images dans une séquence, qui sont interdépendantes entre elles, c'est à dire qu'elles ont besoin des autres images de la séquence pour être complètement reconstituées et diffusées), comme le fait notamment le codage H264 quand il utilise cette option de compression temporelle.

Répartition des blocs d'images dans un groupe d'images (GOP):
ce qui est redondant n'est pas codé dans le temps (stratégie INTER-IMAGES ou temporelle)

Voici une vidéo de 2008 qui illustre le calcul et les vecteurs de mouvement appliqué aux blocs de l'image dans une séquence vidéo Mpeg en INTRA+INTER:
 

Quand la compression temporelle est utilisée (INTER), le codec modélise mathématiquement la répartition et le calcul des blocs d'un certain nombre d'images à l'intérieur d'une séquence appelée Groupe d'Images, ou Group Of Pictures en anglais: c'est le fameux GOP. Il est généralement structuré sur une durée d'une demi seconde, soit 12 images en Europe; on parle alors d'un long groupe d'images, appelé LONG GOP en anglais. Cela veut dire que ces 12 images (ou plus) interdépendantes qui se succèdent rendent le travail du montage souvent laborieux, et ce principe accèlère aussi la dégradation due à la compression, génération d'encodage après génération (montage, titrage, étalonnage, export...).

Je vous propose un petit laboratoire de compression gratuit que vous pouvez télécharger pour jouer avec les paramètres de la réduction de débit: BigLab 1.9

Ces options de compression sont déjà présentes dans les appareils photos Canon quand il s'agit de choisir le mode d'enregistrement vidéo, en intra (I) ou en long Gop (IPB, faisant référence aux différentes images spécialisées à l'intérieur du GOP sous le nom de I (intra), P (Predite)et B (bidirectionnelle)).

 


Choix de la compression Spatiale et Spatiale+Temporelle chez Canon

 

Dans la grande famille de la norme MPEG-4, on peut retenir les éléments des chapitres principaux suivants:

  • - le container .MP4 contient les données image et son et les synchronisent (Multiplexage).

  • - Le codec image AVC (Advanced Video Coding), appelé H264 Part 10, s'occupe de réduire le débit du flux image, et peut travailler en INTRA et/ou en INTER quand le débit doit être réduit au minimum sur des supports mémoires grand public.

  • - Le codec audio AAC (Advanced Audio Coding) s'occupe de réduire le débit du flux sonore.

La norme embrasse toutes les applications de flux audio et vidéo, du streaming bas débit sur internet jusqu'à la production cinématographique HD, 2K, 4K et au delà.

Il est donc difficile de parler "du" MPEG4, car il existe de nombreuses déclinaisons de la norme:

- Définition en SD, HD, 4K...
  • - sous-échantillonnage luma/chroma en 4:2:0, 4:2:2, ou 4:4:4
  • - Quantification en 8 bits, 10 bits, 12 bits...
  • - Compression INTRA ou INTER
  • - Débit cible de quelques Kbps jusqu'à plusieurs Gbps...
  • - Sans compter les innombrables paramètres liés aux méthodes de réductions de débit inhérente au codec (par exemple CABAC, filtres de deblocking DCT...).

Le Mpeg4 se retrouve dans tous les domaines de la production, de la post-production et de la diffusion, avec des paramètres et des appellations qui varient, qui se réfèrent toujours à la norme d'origine, en respectant plus ou moins tous les niveaux de compatibilité (par exemple en utilisant des containers différents).

Que pouvons nous dire du Mpeg4 arrivé à mi-article ?
Que c'est une norme universelle, qui met tout le monde d'accord, quelle que soit la sphère vidéo.
Mais si tous les constructeurs se mettent au diapason du Mpeg4, comment font ils pour se démarquer et attirer les pro à eux.
Le format K7 et le codec DV en est un parfait exemple:
- tous les constructeurs faisaient des camescopes compatible DV
- Alors Panasonic a conservé l'essence du DV, et en modifiant la vitesse de défilement de la bande et le format physique de la K7, lance pour ses caméras le format DVC Pro.
- De son coté, Sony a conservé l'essence du DV, et en modifiant la vitesse de défilement de la bande (mais en conservant la compatibilité avec les mêmes K7), lance pour ses caméras le format DV CAM.
Les 3 partagent le même niveau de qualité (même débit, même définition, même ratio luma/chroma...), mais ils se distinguent par le nom, leur gamme interne, sur la même base technique et qualitative. Et parfois le workflow change notamment à cause du changement de container.

Avec l'arrivée de la HD et du 4K, c'est le même schéma:
- tous les constructeurs font de l'AVCHD (AVC = Mpeg4 H264) limité à 24 Mbps.
- Panasonic a conservé l'essence du H264, mais a décliné une gamme semi-pro appelée AVCCAM, ainsi qu'une gamme professionnelle appelée P2HD pour la télévision et Varicam pour le cinéma utilisant les codecs AVC Intra et AVC Ultra avec des débits plus importants.
- De son coté, Sony a conservé l'essence du H264, mais a décliné une gamme semi-pro appelée NXCAM, ainsi qu'une gamme professionnelle appelée XDCAM pour la vidéo et CineAlta pour le cinéma utilisant les codecs XAVC et XAVC S avec des débits plus importants.

Donc la base mathématique du codec reste la même, et c'est la gamme et le workflow de chaque constructeur qui personnalise le H264 à sa sauce propriétaire (les profils et levels du H264 sont modulés en fonction des besoins de la gamme, complexité et débit cibles....

Dans le domaine de la vidéo grand public HD, on retrouve donc le Mpeg4 et le codec H264 en version INTRA+INTER IMAGES sur des cartes mémoires grand public (par exemple SD card) sous ces appelations:

  • - AVCHD (Advanced Video Codec High Definition, gamme grand public)
  • - AVCCAM (Panasonic gamme semi-pro)
  • - NXCAM (Sony gamme semi-pro)


Le H264 chez Panasonic et sa dénomination commerciale AVCCAM

Dans le monde de la production professionnelle, la norme Mpeg-4 est adaptée aux besoins du workflow:

  • - Utilisation du container .MXF à la place du .MP4
  • - Utilisation du codec H264 (AVC) en mode INTRA seulement pour optimiser la post-production et la résistance aux multiples générations d'encodage (workflow parfois complexe sur différents sites)
  • - Enregistrement de multiples pistes audio non compressées
  • - Ajout de métadatas, etc...

Du coup, les constructeurs utilisent, dans la sphère professionnelle, l'acronyme AVC suivit parfois du mot INTRA dans un cas (productions orientées qualité), et Long GOP dans d'autres cas quand la compression INTER est aussi utilisée pour gagner de l'espace disque (pour les news par exemple).

On le retrouve en version INTRA ou INTER-IMAGES sur des cartes mémoires professionnelles sous ces appelations:

  • - chez Panasonic sur cartes P2: AVC-Intra / AVC LongG (Long GOP)/ AVC-Ultra
  • - chez Sony sur cartes SxS / XQD: XAVC / XAVC-S (Long GOP)

et parfois dans le domaine du cinéma numérique avec des codecs vidéo différents:

  • - Mpeg-4 Part2 Visual: Mpeg-4 SStP (Simple Studio Profile) 10/12 bits 4:2:2/4:4:4 (proposé dans les Sony F65/F55/F5 pour le mastering).

    On retrouve donc face au XAVC de Sony l'AVC intra de Panasonic pour la HD et l'AVC Ultra pour le 4K; le XAVC Long GOP de Sony face à l'AVC LongG de Panasonic.
    Pour ceux qui ont encore l'oeil vivant après ces explications, notez que Sony exploite la variante OP1a du container MXF (1 seul fichier pour multiplexer image et son) alors que Panasonic exploite la version Op-Atom du container MXF (Autant de fichiers que d'essences de média, soit en général 1 fichier MXF pour l'image, et autant de fichiers MXF pour le son qu'il n'existe de pistes audio enregistrées).

    XAVC / XAVC-S, en route pour la 4K télé et ciné



Sony vient de sortir l'Alpha 7S qui enregistre ses vidéos au format maison XAVC-S, alors que ses caméras de cinéma numérique enregistrent au format XAVC.

Enregistrement vidéo en XAVC-S avec le Sony Alpha 7s

Voyons dans le détail à quoi correspondent ces deux appelations.

Spécifications du format XAVC de SONY

Le 'X' du XAVC évoque sa capacité à potentiellement travailler sur 10 bits par pixel, et le mot AVC rappelle la parenté au codec H264 AVC part 10.

Reste à découvrir les variantes de cette appellation.

3 sous-familles composent le XAVC de Sony:

XAVC

XAVC Long GOP

XAVC S

Type de compression: H264 INTRA seulement

 


définition : jusqu'au 4096 x 2160 en 4:2:2 sur 10 bit

 

Débit: jusqu'à 960Mbps

 

Container: MXF

Audio : Linear PCM 8ch

Type de compression: H264 INTRA+INTER

 

définition : jusqu'au 4096 x 2160 en 4:2:2 sur 10 bit et 4:2:0 sur 8 bit


Débit: jusqu'à 150 Mbps

 

Container: MXF

Audio : Linear PCM 8ch

Type de compression: H264 INTRA+INTER

 

définition : jusqu'au 3840x2160 en 4:2:0 sur 8 bit

 

Débit: jusqu'à 150 Mbps

 

Container: MP4

Audio: Le plus souvent compressé en AAC

Le XAVC-S peut être considéré comme l'évolution du AVCHD, à destination de la sphère UHD.
Le XAVC peut être considéré comme l'évolution du XDCAM HD 4:2:2 50 Mbps (Mpeg2), à destination de la sphère 4K et UHD.

Voyons les options d'enregistrement qui s'affichent selon la sphère grand public ou professionnelle dans laquelle évolue le matériel 4K chez Sony.

Tout d'abord le choix d'enregistrement grand public;


Menu d'enregistrement du SONY AX100 4K grand public:
HD en AVCHD ou 4K en XAVC S

On voit ici que l'on peut tourner en XAVC S en HD et en 4K, ce qui simplifie les workflows (les logiciels compatibles XAVC) à venir; pour ceux qui veulent rester compatible avec les logiciels compatibles AVCHD, ce dernier est encore disponible.

et maintenant le choix d'enregistrement professionnel ou semi-pro:
 


Menu d'enregistrement de la Sony Z100 4K Semi-pro:
HD en Mpeg2 (XDCAM HD 4:2:2) ou 4K en XAVC

 

D'un coté AVCHD et XAVC-S pour des fichiers de petites tailles qui n'auront pas forcément vocation à traverser un workflow professionnel, et qui doivent tenir sur des cartes mémoires low cost (SD/SDHC/SDXC...), et de l'autre MPEG2 50 Mbps 4:2:2 en HD et XAVC en HD et en 4K stockés sur des cartes mémoires professionnelles (SxS, XQD...), pour affronter la post-production en 10 bits pour l'étalonnage.

Les débits XAVC (intra) sont plus lourd, et le stockage sera la première des préocupations:

  • - XAVC HD: 100 Mbps à 25 images/seconde
  • - XAVC 4K: 250 Mbps à 25 images/seconde
  • - XAVC 4K: 600 Mbps à 60 images/seconde


 

Allons faire un petit tour dans la structure interne des fichiers XAVC pour voir les différences:

Tout d'abord explorons un fichier XAVC professionnel.

XAVC MXF 25P 4:2:2 4K à 250 Mbps:

Container

Format du container : MXF

Format profile : OP-1a (1 seul fichier image/son multiplexé)

Overall bit rate : 250 Mbps

Writing library : Sony Mem 2.00

Codec Video

Format : AVC

Format/Info : Advanced Video Codec

Format profile : High 4:2:2@L5.2

Format settings, CABAC : No

Format settings, GOP : N=1 (INTRA)

Format_Settings_Wrapping : Frame

Bit rate : 240 Mbps

Width : 4 096 pixels

Height : 2 160 pixels

Display aspect ratio : 1.896

Frame rate : 25.000 fps

Color space : YUV

Chroma subsampling : 4:2:2

Bit depth : 10 bits

Scan type : Progressive

Codec Audio #1

Format : PCM

Format settings, Endianness : Little

Format_Settings_Wrapping : Frame (AES)

Bit rate mode : Constant

Bit rate : 1 152 Kbps

Channel(s) : 1 channel

Sampling rate : 48.0 KHz

Bit depth : 24 bits

TIME CODE

Type : Time code

Format : MXF TC

Time code de la première image : 03:59:06:48

Et maintenant explorons un fichier en XAVC-S grand public.

XAVC-S MP4 25P 4:2:0 4K à 20 Mbps:

Container

Format du container : MPEG-4

Format profile : Base Media / Version 2

Codec ID : mp42

Overall bit rate mode : Constant

Overall bit rate : 20.3 Mbps

Codec Video

Format : AVC

Format/Info : Advanced Video Codec

Format profile : Main@L5.1

Format settings, CABAC : Yes

Codec ID : avc1

Codec ID/Info : Advanced Video Coding

Bit rate mode : Constant

Bit rate : 20.0 Mbps

Width : 4 096 pixels

Height : 2 304 pixels

Display aspect ratio : 16:9

Frame rate mode : Constant

Frame rate : 25.000 fps

Color space : YUV

Chroma subsampling : 4:2:0

Bit depth : 8 bits

Scan type : Progressive

Codec Audio #1

Format : AAC

Format/Info : Advanced Audio Codec

Format profile : LC

Bit rate mode : Constant

Bit rate : 320 Kbps

Channel(s) : 2 channels

Channel positions : Front: L R

Sampling rate : 48.0 KHz

Compression mode : Lossy

TIME CODE

Absence

Le XAVC-S étant destiné au marché grand public et le XAVC étant destiné au marché professionnel, le XAVC Long Gop propose une alternative aux professionnels désirant ensuite tourner et monter leur rushes tout en économisant de l'espace disque, comme le faisait en HD le standard SONY XDCAM HD 4:2:2 50 Mbps en Mpeg2 Long GOP, présent sur la plupart des camescopes HD pro et semi-pro de Sony, sur disque Prodisc optique ou carte SxS.

La différence entre le codec H264 et le codec Mpeg2, c'est une affaire de complexité justement !
La puissance actuelle de nos ordinateurs nous permet de monter du Mpeg2 Long GOP en HD sans problème de ralentissement, mais il faudra attendre encore de longs mois pour monter sans saccades des rushes en H264 Long GOP en 4K avec l'ordinateur de monsieur tout le monde.
C'est l'une des problématiques principales. Lecture complexe ou fichiers lourds, il faut choisir !

Postproduction

Le lecteur VLC relit toutes les versions de XAVC.

Pour le montage, est important de noter que votre logiciel doit être récent pour pouvoir accepter des fichiers XAVC ou XAVC-S.

Les dernières versions d'Avid Media Composer, Adobe Premiere CC et Apple Final Cut Pro X sont déjà compatibles.


import de fichier XAVC et XAVC S dans premiere CC en simple draganddrop

Selon la cible grand public ou professionnelle de votre logiciel de montage, il faudra vérifier la compatibilité avec le container .MP4 ou .MXF, puis le codec XAVC H264. Il est toujours possible de remultiplexer ces fichiers dans d'autres containers (avec par exemple MpegStreamclip ou FFMPEG) pour les faire accepter par un logiciel de montage moins récent qui ne serait pas d'emblée  compatible (sans toucher à la qualité de la vidéo, on ne fait que changer de container pour assurer la compatibilité, ce que faisait systématiquement Final Cut Pro 7 pour pouvoir exploiter les fichiers MXF par exemple).

Une liste de logiciels compatibles avec les fichiers XAVC est fournie par Sony, que vous trouverez en fin d'articles avec d'autres pages de références parlant du XAVC.

Voici donc un petit récapitulatif des plus et des moins, qui concerne tel ou tel variante du XAVC.

Les points négatifs: quel codec concerné ?

  • - Poids important des fichiers en 4K (disques durs): XAVC
  • - Lecture saccadée en 4K (CPU): XAVC Long Gop / XAVC-S (modéré)
  • - Montage saccadé en 4K (CPU): XAVC (modéré, concerne les disques) / XAVC Long Gop / XAVC-S
  • - les performances de vos disques durs pour assurer les débits du 4K sur 10 bits en INTRA: XAVC / XAVC Long Gop (modéré)
  • - Dégradation rapide de la qualité d'image suite aux générations en cascade liées au workflow (montage/étalonnage/export/diffusion): XAVC Long Gop / XAVC-S

Au final, voici ce qu'il faut retenir des avantages des variantes du XAVC:

XAVC Intra

XAVC Long GOP

XAVC S

Les plus:
- 10 bits pour l'étalonnage
- Montage plus facile
- Résistance aux générations

Les moins:
- Poids des fichiers: lourd
 

Les plus:
- 10 bits pour l'étalonnage
- Poids des fichiers: léger (gain d'espace sur les cartes onéreuses)

Les moins:
- dégradation plus rapide aux générations (à confirmer)
- Puissance importante demandée au montage

Les plus:
- Poids des fichiers: léger

Les moins:
- dégradation plus rapide aux générations (à confirmer)
- Puissance importante demandée au montage
- pas de metadatas

Les marques compatibles avec le XAVC:

Références sur le net:

http://www.sony.fr/pro/article/broadcast-products-xavc-product-list
http://www.sony.fr/pro/article/broadcast-products-xavc-faqs
http://mpeg.chiariglione.org/technologies/media-coding/2-d-video-coding
http://www.xavc-info.org/


PARTAGER
Contact Vie privée, Cookies Conditions Générales d'Utilisation