GoPro Odyssey intro
GoPro Odyssey

En nouvelles technologies comme ailleurs, chaque époque a ses modes. Celle du moment s’appelle "VR", pour virtual reality, réalité virtuelle dans notre idiome. Que l’on parle d’une photo ou d’une vidéo, le principe fondamental de la VR est la liberté de cadre : comme dans un jeu de tir à la première personne – vue subjective –, la VR donne la possibilité de pointer son regard dans n’importe quelle direction. L’intérêt de cette technologie est d’immerger le spectateur, qu’il se sente au cœur de l’action : libéré des choix du cadrage d’un réalisateur, le "spect-acteur" peut tourner la tête dans l'équivalent d'une sphère d’images et choisir de regarder où ça lui chante.

Plus encore que la 3D en son temps, la VR est une technologie transverse qui touche une foultitude domaines techniques, du matériel (caméras, smartphones, casques VR), en passant par le logiciel (montage, diffusion) jusqu’aux productions culturelles (films, clips, reportages, jeux vidéo). Quoi qu’encore très imparfaites, ce sont les technologies vidéoludiques qui sont les plus avancées. Et pour cause : les images sont générées par un ordinateur et ne sont pas issues de dispositifs de captation telles que des caméras.

Nokia Ozo
Nokia Ozo.

Sur Focus Numérique c’est pourtant bien cette captation et la transformation de contenus issus du réel qui nous intéresse. La question des différents types de caméras ou dispositifs (et les technologies employées) soulève, par ricochet, de nombreuses problématiques comme l’enregistrement et l’usage du son, l’assemblage éventuel des rushes, le montage bien sûr et, en bout de chaîne, les supports, services et méthodes de diffusion.

Il faudrait un livre entier (voire plusieurs !) pour aborder tous ces sujets, mais nous allons essayer de balayer avec vous les tenants et aboutissants de ce que nous appellerons, tout du long de cet article, la VR.

L’héritage de la "3D"

La VR et toutes les technologies à 360° sont les héritières du monde de la stéréoscopie, technologie improprement appelée la "3D". Poussée de 2008 à 2012 par la plupart des maillons de l’industrie high-tech (fabricants de téléviseurs, de consoles de jeux vidéo, de cartes graphiques, etc.), la "3D" s’est effacée dans un silence qui contraste avec les lourds budgets marketing mis au service de sa promotion.

Les domaines de la photo et de la vidéo ont été, à l’époque, parmi les plus sages et les plus mesurés — on se souvient de la débauche de moyens employés par le secteur de la télévision. Fujifilm s’est bien essayé à produire des appareils photo stéréoscopiques (le FinePix W1 en 2009 et le FinePix W3 en 2010), mais les limites de l’époque — définition des dalles des casques 3D, puissance des processeurs — bridait les possibilités de l’industrie de la captation. La 3D est morte, vive la 3D. Certes, mais il ne faut pas la mépriser pour autant : ce sont bien sur ses cendres que nombre d’acteurs impliqués dans la VR se sont appuyés, profitant des erreurs commises par le passé et des améliorations techniques actuelles.

La VR n’est pas la stéréoscopie, car elle est moins restrictive : quand la 3D nécessite des lunettes ou des écrans spéciaux et se limite à l’angle tourné par la caméra, la VR peut s’apprécier sur un simple écran d’ordinateur 2D et donne, par définition, la liberté de regarder dans tous les sens (depuis un point fixe). On peut ainsi regarder une séquence sur YouTube et bouger avec le curseur de la souris. Ou bien, si on est équipé, enfiler un casque et tourner physiquement la tête.

Si elle s’envisage en 2D, la VR s’appuie sur la 3D pour son stade ultime : une image stéréoscopique (3D donc) sur 2 x 360° (axes horizontal et vertical). D’onéreuses solutions professionnelles permettent d’atteindre un tel objectif, mais les technologies sont encore balbutiantes. Dans le domaine grand public, on n’en parle même pas.

Monoscopique ou stéréoscopique

La VR tel que nous l’entendons actuellement s’envisage comme une image "plate" dans laquelle on peut déplacer le point de vue. C’est ce genre de photos/vidéos que vous voyez poindre dans votre flux Facebook ou sur YouTube : des versions dites monoscopiques de la VR qui ne donnent aucun aperçu de profondeur lorsque l’on enfile un casque VR.

Si l’expérience est imparfaite en termes d’immersion, puisque que chaque œil voit la même chose, c’est pourtant celle qui est la plus aboutie en termes de captation. Car la seconde VR, dite stéréoscopique (3D par abus de langage), apporte en plus l’impression de profondeur. Théoriquement le Graal de la catégorie, cette VR n’en est encore qu’à ses balbutiements, puisqu’en plus difficultés d’assemblage des flux des différentes caméras, elle doit aussi prendre en compte la stéréoscopie — chaque caméra est doublée pour correspondre à chaque œil.

En clair et sauf mention contraire, nous parlerons ici de VR monoscopique, c’est-à-dire sans impression de profondeur ni relief.

La vision stéréoscopique et 360° par Izugar.

La vidéo ET la photo

On imagine bien souvent la réalité virtuelle sous l’angle vidéo en raison, notamment, de l’héritage des projections à 360° des parcs comme le Futuroscope ou par l’aspect vidéoludique. Dans les faits, le médium le plus simple qui permette de s’immerger dans une scène à 360° reste la photographie numérique. Un support presque aussi vieux que le web des années 2000 : il fallait à l’époque installer des plug-ins propriétaires pour profiter d’images assemblées par de coûteux dispositifs.

Aujourd’hui, les solutions pour produire de tels clichés sont bien plus simples, puisqu’il suffit d’un smartphone pour assembler des sphères à 360° de manière logicielle. Ou, plus simple encore et plus propre, utiliser les Theta et Theta S de Ricoh, des appareils dotés de deux blocs optiques qui assemblent automatiquement les images.

Ricoh Theta

La vidéo est bien sûr le média le plus séduisant, mais la photo a toujours beaucoup d’attraits et les médias disponibles sont nombreux, que ce soit sur Flickr, qui propose des galeries dédiées et une interface adaptée, ou même Facebook, qui prend nativement en charge les photos VR depuis un certain temps déjà.

Appareil unique : un ou plusieurs modules caméra

Nul besoin d’avoir plusieurs modules optiques pour capturer des contenus VR. Les Kodak Pixpro SP360 et Pixpro SP360 4K sont équipées d’un seul capteur et d’un seul bloc optique. De la forme d’un dôme imposant, ce bloc enregistre bien à 360° sur l’axe horizontal, mais il est limité à 235° sur l’axe vertical (ce qui signifie tout de même que la caméra voit "derrière" elle !). Cette solution est suffisante pour tout usage où la caméra est posée/collée sur un support (véhicule, table).

Dans un usage immersif où l’on recherche la liberté à 360° sur les deux axes, et où l’on souhaite voir aussi bien dessus que dessous, Kodak propose un kit réunissant deux SP360 4K, une solution bricolage qui nécessite d’assembler les flux a posteriori. Consciente de cela, la marque américano-taïwanaise a annoncé un nouveau modèle à la photokina 2016, la SP360 4K VR qui réunit deux modules caméra dans un seul boîtier.
Kodak SP3604K dual PackKodak SP3604K en duo.

Cette solution à deux dômes est celle retenue par Ricoh pour ses Theta et Theta S susmentionnés, mais aussi par Nikon dont le modèle haut de gamme de ses futures caméras d’action KeyMission lui aussi annoncé à la photokina reprend peu ou prou le même design que celui de Kodak. Une conception pas franchement révolutionnaire, puisque Samsung avait déjà adopté cette solution pour son Gear 360 annoncé en début d’année. Le modèle de Samsung a comme défaut que ses dômes optiques ne couvrent que 195° sur le plan vertical : un excédent de 15° insuffisant pour garantir un assemblage parfait, contrairement aux dômes de Kodak qui offrent un peu plus de "gras" pour garantir une bonne jonction des deux flux vidéo.

Au-delà des solutions à 2 modules caméra, on retrouve l’un des pionniers du genre, le français Giroptic (jadis sous le giron des magasins Decathlon et dont les premiers essais remontent, sur Focus, à 2008) ; il monte à 3 modules avec son 360CAM, une solution qui a comme intérêt de garantir un assemblage très propre. Plus fort, la Nokia Ozo, qui combine pas moins de 8 modules caméra. Hors de portée du commun des mortels avec un prix de 45 000 €, l'Ozo est une solution de captation professionnelle. Son originalité dans le secteur est sa grande intégration matérielle, puisque les pros utilisent historiquement non pas une caméra unique, mais plusieurs caméras dont ils combinent les flux.

Combiner les caméras

Les débuts de la VR se sont fait avec plusieurs GoPro, le géant californien étant toujours la solution de choix à l’heure actuelle. De nombreux acteurs, dont GoPro lui-même, proposent des solutions plus ou moins maison. Bien que ces solutions soient tout à la fois complexes à mettre en œuvre, lourdes à manipuler et fastidieuses à combiner, elles offrent de nombreux avantages. Le premier étant la définition d’image : si une Kodak SP360 4K enregistre bien une image vidéo en 4K (définition jusqu’ici suffisante pour un rectangle fermé), cette définition est tout juste limite pour représenter une scène à 2 x 360° : l’image visible dans un casque ou sur un écran est bien moins définie que la 4K promise. Il faut donc monter bien plus haut en définition pour profiter ne serait-ce que de la Full HD dans un cadre.

Le couplage de 6 caméras du rig GoPro Omni permet de combiner 6 flux 4K afin de proposer une image haute définition en 360°. Plus fort (et bien plus cher), le rig haut de gamme de GoPro appelé Odyssey combine 16 caméras Hero Black 4K et peut ainsi offrir un flux qui soit équivalent à de la 8K à 30 images par seconde.

GoPro Omni rig hero4
Le rig de 6 Hero4 par Gopro : Omni.

Le défi pour ces solutions n’est pas que matériel (il faut ajuster les caméras de manière précise), mais il est aussi logiciel : dans les deux cas précédemment cités, il faut assembler respectivement 6 et 16 flux vidéo en 4K. De quoi faire chauffer les processeurs et exploser les disques durs ! Car oui, une fois les vidéos captées, il faut les assembler et les monter avant de les diffuser.

Montage : les outils sont là

Si les débuts de la VR professionnelle étaient placés sous le signe de coûteux plugins After Effect, l’édition de flux VR a connu son plus grand saut de maturité en juin 2016 avec l’arrivée d’une mise à jour d’Adobe Premiere Pro CC, qui prend désormais nativement en charge de tels contenus. Les solutions les plus professionnelles et les plus exotiques (Odyssey, Ozo) doivent être préalablement assemblées par les logiciels propriétaires de marques, mais le logiciel de montage vidéo d’Adobe avale désormais les fichiers finaux sans broncher et permet leur montage et l’export. Pour l'assemblage, c'est le logiciel Autopano Vidéo de GoPro Alps (anciennement Kolor) qui fait figure de référence. 

Adobe Premiere et la vidéo VR
Adobe Première accepte désormais du flux 360° de manière native.

La question que l’on se pose est donc : "Comment monter une vidéo où l’utilisateur peut orienter son regard où il le souhaite ?" Tout simplement en donnant la première direction de chaque plan.

Premiere Pro permet de choisir le degré de zoom et le cadre initial de chaque plan ; libre à l’utilisateur de se laisser guider par la suite ou de tourner la tête quand bon lui semble. L’utilisateur — car il n’est plus uniquement spectateur — évite ainsi de se perdre et on peut tout de même créer une narration. De tels montages existent déjà sur YouTube, comme cette découverte des coulisses du festival musical Tomorrow Land. Ce qui est intéressant dans cette vidéo, c’est que la liberté de regard se greffe à une caméra mobile, un détail qui a son importance. Si la prise en charge des fichiers VR par Adobe était attendue, d'autres sociétés avaient pris les devants comme Cyberlink avec Director Suite au tout début de l'année.


Attention aux usages

La grammaire visuelle et technique de la discipline est en train d’être écrite, mais on sait déjà que toutes les situations ne se prêtent pas à la VR. Ainsi, si les débuts des utilisations grand public consistaient notamment à mettre une caméra 360° sur le bout d’une scène d’un concert, cet usage s’est avéré vite dépassé. Passés les premiers émois de cette liberté de regarder tout autour de la scène, de voir aller et venir l’artiste et de regarder la tête des spectateurs, la lassitude s’installe. Car il est un constat qui s’impose : tourner la tête ou bouger la souris représente un effort. Et l’humain est fainéant par nature ! Il faut donc que nous trouvions un intérêt à réaliser cet effort. Cet intérêt peut être apporté par le montage et le mouvement, comme évoqué précédemment dans l'exemple du festival musical. En tout état de cause, une caméra à 360° ne suffit pas à faire un bon programme VR : il faut une situation (ou une narration) et, selon la teneur de celle-ci, un montage à partir d’un ou plusieurs points de vue.

Consommation

Si les lecteurs logiciels de YouTube et Facebook sont pratiques pour consommer de la VR sur un écran de PC/tablette/smartphone en bougeant la souris ou le terminal, il faut être honnête : le vrai effet "waouh", la vraie immersion se vit avec un casque.

De nombreuses solutions se revendiquent les premières dans ce domaine — on se souvient des premiers casques Sony ou Epson. Mais celle qui, historiquement, a marqué les esprits est celle de la start-up Occulus avec son Rift. Une solution à la définition médiocre et au paramétrage hasardeux — il fallait un gros PC, les drivers PC étaient instables, etc. —, mais qui avait le mérite d’être simple à mettre en place et à utiliser, et aussi opérationnelle sur les médias que sur les jeux vidéo. Vinrent ensuite les "Cardboard" de Google et consorts, des casques en carton ou plastiques équipés de grossières lentilles utilisant les dalles à très haute résolution de nos smartphones pour faire office d’écran VR.

Casques de réalité virtuelle
Différentes solutions pour s'immerger dans la vidéo 360°.

À l’heure actuelle, les solutions les plus abouties sont issues, une fois encore, du jeu vidéo, puisqu’il s’agit du HTC Vive et du PlayStation VR. Ce dernier est le moins cher des deux, mais il est limité à la PlayStation. Le HTC Vive est le top du top, mais requiert la mise en place de boîtiers laser de suivi de mouvement – une installation assez lourde. Si les jeux vidéo requièrent une grosse carte graphique, la consommation de photos ou de vidéo ne demande qu’une machine assez modeste. Parfaitement synchrone avec les mouvements de la tête, le HTC Vive est le top technologique, mais sa définition d’image, pourtant la meilleure du genre, est un peu juste à l’heure actuelle (2 160 x 1 200 px au total avec les deux écrans).

Comme avec les systèmes de captation, il y a encore beaucoup de progrès techniques à faire avant de rendre la consommation de la VR aussi facile et intuitive que celle de la photographie. Patience : il ne faudra que quelques années !

PARTAGER
Contact Vie privée, Cookies Conditions Générales d'Utilisation