Dépôt légal et data.ina.fr : terrain d’expérimentation de l’intelligence artificielle

Le 25 juin dernier lors du festival Cinema Rittrovato qui se tient chaque année en Italie, à Bologne, une table ronde dédiée à l’archivage et à l’IA accueillait Alann Hery, responsable du département des technologies à l’Ina. Il a présenté le projet visant à indexer la colossale quantité d’images et de sons dans le cadre du dépôt légal. Magic Hour était présent : compte-rendu…


À gauche, Alann Hery, responsable du département des technologies (Ina) lors de la table ronde intitulée « IA, point de vue sur le catalogage ».

« Depuis 1995, la mission de dépôt légal a été confiée à l’Ina, lequel enregistre 24 heures sur 24 le flux de 184 chaînes de radio et de télévision. Cette mission a été étendue au Web média en 2009. Aujourd’hui, plus de 27 millions d’heures de programmes sont archivées, complétant un patrimoine historique qui s’élève à près de 30 millions d’heures au total, soit 45 pétaoctets de données — l’équivalent de 3 400 années de visionnage ininterrompu, » résume Alann Hery. responsable du département des technologies à l’Ina. Or décrire un tel volume par des moyens strictement humains est pour ainsi dire irréalisable : « à raison d’une heure de programme finement décrit en six heures de travail de documentaliste, il faudrait près de 180 millions d’heures, soit 100 000 années de labeur pour documenter les 27 millions d’heures que représente le dépôt légal, » explique-t-il. Sans compter les 1,5 million d’heures nouvellement déposées chaque année… Face à ce défi, l’Ina mobilise l’intelligence artificielle pour automatiser la production de métadonnées.



Une ferme de 90 GPU

Description des outils IA appliqués sur le JT de France 2.

Dans ce projet de recherche, l’Institut déploie aujourd’hui un parc de 90 GPU travaillant sur le fonds du dépot légal où chaque heure de vidéo est traitée en à peine deux secondes. Le pipeline enchaîne la transcription speech-to-text, la diarisation des intervenants, la segmentation en unités logiques (journaux, reportages, météo), la reconnaissance visuelle des logos, des visages et des objets, ainsi que l’OCR des habillages et la détection d’entités nommées. Les textes obtenus sont ensuite résumés automatiquement et vectorisés, rendant possible une recherche sémantique en langage naturel. Ainsi, grâce à ces algorithmes — existants, mais aussi développés en interne — l’Ina génère chaque jour des sommes de métadonnées inaccessibles au potentiel humain. Pour donner un aperçu de la tâche, le responsable du département des technologies indique : « sur les notices du dépôt légal, 85 % demeurent aujourd’hui sans mot-clé ni résumé. » Seuls les éléments présentant un intérêt majeur bénéficient d’un traitement humain.

 

 

Pipeline de production de métadonnées de l’acquisition à la publication sur data.ina.fr.

Et si l’introduction de l’IA apparaît comme une solution de traitement incontournable, rien ne peut se faire au détriment de la confiance : « Tous les algorithmes ont des biais », avertit Alann Hery. Pour contrôler et documenter ces biais, l’Ina affiche publiquement ses taux de précision : 83 % pour l’extraction d’entités nommées et 95 % pour la détection du genre. Chaque résultat publié est adossé à son extrait d’origine, permettant de remonter à la portion exacte du média source et d’en vérifier la validité. Lorsqu’un algorithme commet une erreur — comme la confusion entre la milice Wagner et le compositeur Richard Wagner — celle-ci reste visible et annotée sur la plateforme, illustrant le souci de transparence et incitant à la vigilance humaine.




Empreinte environnementale maîtrisée
Un autre enjeu, souvent relégué au second plan dans le monde de l’intelligence artificielle, est l’empreinte environnementale : « Faire tourner l’IA sur des data centers, ça consomme de l’énergie et de l’eau », concède Alann Hery. Pour réduire cet impact, l’Ina a choisi de conserver l’ensemble de ses infrastructures en France, où l’électricité est largement décarbonée : « Nos data centers hébergeant les 30 millions d’heures d’archives sont maintenus à 25 °C plutôt qu’à 20 °C, diminuant les besoins en climatisation ; le stockage, quant à lui, repose sur des systèmes peu énergivores. » Grâce à ces décisions — électricité bas carbone, température optimisée et architecture de serveurs à haut rendement — l’empreinte carbone du traitement IA reste maîtrisée. Un effort qui doit être poursuivi à mesure que les volumes augmentent.

Vitrine et terrain d’expérimentation

À partir de 4 entrées, les statistiques répondent à 16 questions prédéfinies. data.ina.fr peut sortir jusqu’à 28 types de visualisation des données sur la période 2015-2024. Les applications sont légions, du monde de la recherche à la simple curiosité du grand public.

En octobre 2024, l’Ina a ouvert data.ina.fr, une démonstration concrète de ces outils IA, permettant de faire ressortir tout un tas de données sur les contenus d’information dont le corpus cible les journaux télévisés du soir TF1, France 2, France 3, Arte, les principales matinales radio et les chaînes d’info en continu sur la période 2015-2024. « L’objectif affiché est d’élargir à terme ce corpus avant 2015 », précise Alann Hery. Chaque semaine, plusieurs centaines d’heures de programmes sont intégrées, offrant aux chercheurs, professionnels et grand public la possibilité de naviguer par thèmes, d’identifier des personnalités, de comparer l’évolution des formats et des discours, tout en bénéficiant d’un contrôle humain permanent sur le flux et d’une traçabilité totale.

Mais au-delà de la technologie, c’est une vraie réflexion éthique et organisationnelle qui se joue : « Un mauvais ouvrier blâmerait ses outils ; ce n’est pas de l’IA dont il faut parler, mais de l’usage que nous en faisons », insiste bien Alann Hery. L’Ina place ainsi l’humain et la crédibilité au cœur de son dispositif, convaincue que seule une IA supervisée et transparente permettra de préserver et d’enrichir le patrimoine audiovisuel. À suivre donc…
Magic Hour



L’Ina invite à la réflexion

Contrôle humain rigoureux, intégration des outils IA dans les pratiques professionelles… L’Ina s’interroge également sur des enjeux éthiques et juridiques : statut pour les ayants droit dont les contenus alimentent l’IA, comment encadrer une éventuelle collaboration internationale, mais aussi envisager une gestion plus sobre et collective sur le front énergétique. Enfin, s’agissant de souveraineté numérique, pour l’Institut, il convient de prévenir les biais, les détournements et la dissémination incontrôlée des données patrimoniales, en créant des réseaux de protection adaptés aux réalités géopolitiques.

Nouveau firmware pour le Trimaster BVM-HX3110

Sony propose la disponibilité du firmware Version 2.0 pour son moniteur de référence Trimaster HX 4K BVM-HX3110, téléchargeable dès à présent pour tous les appareils équipés d’un firmware 1.0 ou ultérieur.
Cette mise à jour apporte au total dix nouvelles fonctions, trois améliorations et quatre corrections de bugs. Nouvelles fonctions : affichage côte à côte de contenus 4K SDI et IP ; prise en charge du calibreur BVMK-R10 ; copie de la configuration entre moniteurs de la série BVM-HXxx10 ; support étendu des sous-titres (Closed Caption) sur 3G-SDI ; affichage de l’ID source et statut F-Key ; mode Picture Out ; réglage de retard horizontal/vertical (H/V Delay) ; scopes doublés (2× display) ; visualisation de l’état de l’interface IP via le menu Web. Côté améliorations : niveaux de pic de luminosité étendus (4000/3000/2000/1000/700/600/500/400 cd/m²) en plus des modes 4×, 2× et Off ; zoom pixel 300 % sur neuf zones d’écran ; réduction du temps de réponse du tally. Les corrections portent quant à elles sur : la stabilité de lecture de l’audio SDI embarqué ; la précision du balayage natif 1920 × 1080/24 PsF ; l’élimination des parasites sur les entrées SDI non sélectionnées et une meilleure tenue dans le temps de la température de couleur.

Conversion : Virtuoso Adapt, package clef en main

Sony commercialise en ce moment Virtuoso (Nevion), solution chargée du transport, du traitement et du monitoring des signaux en temps reel, sous forme de package : Virtuoso Adapt. Idéal en tant que solution passerelle entre SDI et IP. Elle convertit dans les deux sens 16 canaux SD/HD/3G SDI, chacun prenant en charge 16 canaux audio et un flux auxiliaire. Côté fonctionnalités avancées, citons la gestion du monitoring du SDI, la protection via la norme ST2022-7, la synchro, le mélange, le gain et le délai. Le package inclut tout le matériel, les softs et les modules SFP (VSFP et SFP+) nécessaires.

Un whitepaper vert chez Nevion

Apprenez pourquoi la migration du SDI vers l’IP ne serait pas seulement une mise à niveau technique, mais un véritable choix stratégique orienté développement durable.
Nevion, la filiale IP de Sony publie un livre blanc consacré au rôle de l’infrastructure dans la mise en place d’opérations vertes pour les diffuseurs en production live. Le document explore la façon dont la production à distance peut réduire les émissions liées aux déplacements de 80 à 90 %, ainsi que des propositions écologiques intégrables par les diffuseurs, comme les effets de la compression des données sur les infrastructures et le pipeline de production. Objectif visé : réduire le gaspillage. Ce whitepaper vert détaille également comment des solutions comme Virtuoso et eMerge, grâce à leurs fonctions de veille et d’hibernation, contribuent à réduire la voilure de la consommation électrique jusqu’à 80 %…

Trois versions de moniteurs tiroir chez Konvision

Le constructeur chinois propose une gamme de moniteurs rackables de 17 pouces conçus spécialement pour les environnements OB Van, DSNG et studios compacts. Logés dans un châssis 1RU, ces écrans se déploient via un tiroir rétractable de manière à optimiser l’espace tout en offrant une qualité d’image optimale. Côté entrées et sorties SDI, ils prennent en charge, selon les modèles, le 3G ou le 12G. On y retrouve les fonctions d’affichage des waveforms, du vecteur scope et les VUmètres audio.
La série se décline en trois références. Le KFM-1710U propose une dalle 4K HDR couplée à deux ports 12G-SDI pour un flux UHD jusqu’à 60 i/s. Le KFM-1720U prend en charge le 8K nativement grâce à ses quatre ports 12G-SDI. La dalle est quant à elle 4K. Enfin, le KFM-1753W est Full HD (1920×1080) avec deux ports 3G-SDI, offrant une solution plus économique sans sacrifier la fiabilité. Parmi leurs avantages d’utilisation, il est possible de les extraire ou de les remplacer sans démonter le châssis du rack.

Sécurisation : Evo de SNS chiffre en AES-256

Dans un article publié sur son site Internet, Studio Network Solutions met en avant les atouts du chiffrement intégré sur ses solutions de stockage : protection automatique des données, gestion transparente pour l’utilisateur et performances optimisées. Résumé…

La clef de cette protection de données n’est autre que l’AES-256, le chiffrement le plus robuste à jour. Ainsi, toutes les données — vidéos, pistes audio, fichiers projets — sont codées en un format illisible sans la clef de 256 bits associée. Dans l’écosystème Evo, chaque volume est chiffré « at rest » via AES-256, garantissant qu’un disque volé ou compromis ne livre aucun contenu exploitable. Parallèlement, les partages de fichiers SMB (Server Message Block) bénéficient d’une signature et d’un chiffrement à la volée (in flight), protégeant les échanges entre le serveur et les stations de travail locales et distantes contre toute interception. Cette mise en œuvre est dite « zero-touch » : les utilisateurs n’ont aucune action à effectuer, et aucun plug-in n’est requis. L’accélération matérielle intégrée dans les contrôleurs Evo assure des débits élevés sans pénalité notable sur les performances des workflows, même dans les cas de lecture/écriture simultanée de plusieurs flux 4K. SNS rappelle également que AES-256 est résistante aux potentielles « menaces quantiques » à venir, notamment à travers des attaques en force brute (bruteforce). Bref, un niveau de sécurité qui répond aux exigences réglementaires de privacy (RGPD et normes broadcast) de bout en bout : de la sauvegarde d’archives à la postproduction.

Studio Virtuel : France 3 Toulouse opte pour Aximmetry

Depuis fin mars, France 3 Occitanie diffuse Une image, une histoire, un magazine conçu par la rédaction de France 3 Toulouse et produit en studio virtuel. Retour sur un projet où se mêlent technologie et maîtrise des coûts…

Décrypter le passé, éclairer le présent et envisager l’avenir. Tel est le concept de Une image, une histoire, programme de sept minutes diffusé depuis le 31 mars sur l’antenne de France 3 Occitanie en amont du JT régional Midi-Pyrénées. Tous les jours de semaine à 19h07, UIUH éclaire un thème d’actualité propre à la Région à l’aide d’images d’archives de l’Ina et d’un invité. Spécialiste du sujet du jour, il ou elle est issu(e) du monde associatif, universitaire ou institutionnel, et fait le lien entre les époques. Pour ce format aisément déclinable à toutes les antennes régionales, France 3 Toulouse a fait le choix d’optimiser ses coûts de production en s’affranchissant de décors physiques.


Le choix Aximmetry« Du lancement à la mise à l’antenne de Une image, une histoire, une brève fenêtre de tir s’offrait à nous, raconte Yvan Kalfon, responsable de projets et du support en charge de l’IT à France 3 Toulouse. Nous avions par ailleurs un budget serré pour cette production entièrement conçue en interne. Le choix du studio virtuel s’est imposé de fait. »
Reste que pour demeurer dans les clous, également le choix de la plateforme virtuelle était un élément essentiel : elle devait être puissante et économique. « J’ai découvert Aximmetry quelques années plus tôt lors d’un projet qui n’a pas vu le jour, explique le responsable de projets. Nous avons également fait des tests avec un simple chromakey, mais les résultats n’ont guère été satisfaisants : trop statique, trop daté. Après avoir fait le tour du marché, lorsque l’on réalise que les licences Aximmetry Broadcast DE coûtent environ cinq fois moins que celle de son premier concurrent sous Real Engine, le choix se fait naturellement. » Un rapport performances/coûts qui a permis de financer en partie l’achat de deux nouvelles caméras confie le responsable de projets : « des Panasonic PTZ AW-UE80, compatibles Free-D pour les plans trackés. Pour les plans non trackés, deux Panasonic AW-HE130 déjà en notre possession servent pour le beauty shot et le plan large et sont utilisées en caméra virtuelles zoom-in/out et circulaire. »



Un décor signé France Télévisions
Mais quid du décor ? Synergies obligent, France 3 Montpellier disposait d’un décor virtuel charté antennes régionales. Repassé entre les mains de la direction artistique de France Télévisions à Paris, et après quelques modifications de couleurs, celui-ci a pu être modifié rapidement pour France 3 Toulouse. Si ce décor comporte trois écrans incrustés, il a fallu ajouter une « sucette » 9/16e droite-cadre au plan large en tête et en fin d’émission accueillant respectivement le sujet du jour et le teaser du prochain numéro. « Alors que Magic Hour était déjà en charge du déploiement d’Aximmetry et de son intégration dans notre workflow, son directeur technique chargé du projet, Éric Soulard, a repris certains éléments graphiques pour créer cette sucette modélisée sous Blender », précise Yvan Kalfon. Le décor ainsi prêt, il restera à alimenter en images chacun des trois écrans incrustés du plateau.


SDI et NDI
Pour le studio virtuel, les ressources matérielles dédiées aux calculs sont assurées par une tour Supermicro, et le rendu temps réel des décors et l’animation Blender par une carte Nvidia GeForce RTX5090. « Notre configuration nous limite physiquement à 4 flux SDI (BMD DeckLink Quad 2, Ndlr), ceux des quatre caméras PTZ de plateau. Il fallait donc trouver une astuce pour alimenter de manière efficace les écrans du décor, » raconte le responsable de projets. Et c’est ici qu’intervient le NDI. Pour l’avoir déjà implémenté sur un autre plateau, Yvan Kalfon connaît bien ses capacités et ses limites. Il détaille : « l’écran de gauche contient le clip Une Image, une histoire joué à partir d’Aximmetry ; et depuis la grille, l’écran central affiche les médias et les off joués par le serveur Dubmaster, l’écran de droite les localisations jouées par un canal d’Avid Maestro, chacun étant convertis en NDI avant d’être injectés dans le projet ». Et quant au choix du NDI pour les écrans incrustés, il ne peut être plus clair : « dans ce cas précis, le NDI donne visuellement le même résultat qu’une source SDI ». Et d’insister sur le fait qu’une telle configuration a également contribué à l’économie du projet.


Revenant sur la chronologie de UIUH, le responsable technique salue la réactivité des intervenants techniques au service de l’éditorial : France Télévisions pour la fourniture du décor, Magic Hour pour avoir livré un proof of concept pour les premiers essais, ses développements, l’intégration, la formation des opérateurs… « En moins d’un mois, nous sommes passés de la prise de décision — le 25 février, au tournage du pilote le 18 mars. » Sur le plateau de 80 m2, la première série d’enregistrements a été réalisée du 24 au 26 mars pour les douze premières d’émissions et une mise à l’antenne le 31 mars 2025. Un « tour de force » estime-t-il, dans lequel Aximmetry Broadcast DE a entièrement été intégré au dispositif de fabrication de France 3 Toulouse.

Nouveau châssis 3RU chez Aja

Le constructeur a profité d’InfoComm pour monter un nouveau châssis 3 RU conçu pour accueillir jusqu’à 24 Mini-Converters de la marque, le DRM2-Plus. Pensé pour les environnements pro AV, film/TV, production live et broadcast, le châssis est décliné en quatre versions permettant d’opter pour un refroidissement actif à quatre ventilateurs ou passif, et d’intégrer une alimentation simple ou redondante délivrant jusqu’à 288 W. Le DRM2-Plus dispose d’une façade articulée et de seize compartiments modulaires accessibles par l’avant ou l’arrière. L’espace intérieur autorise le double empilage de douze modules Aja FiDO ou D5 Series plus compacts (connecteur Mini-Con-X), pour un total de 24 unités. D’autres cas de configurations sont possibles : douze Mini-Converters de taille moyenne équipés du même connecteur d’alimentation Mini-Con-X, ou six modèles plus volumineux. On pense notamment au boîtier du Dante-12Gam (mini-XLR). Il peut par ailleurs recevoir un hub USB tiers connecté directement aux convertisseurs hébergés.

Nouveau ColorEdge 4K HDR pour la postproduction

Annoncé il y a peu, le ColorEdge CG3100X (31 pouces) se positionne comme un moniteur de référence DCI 4K de 30,5 pouces (4096 × 2160) optimisé pour les workflows HDR et la postproduction. Il intègre un port USB Type-C en plus des entrées DisplayPort et HDMI capables de gérer du DCI 4K 4:4:4 en 10- et 12 bits à 60 i/s, facilitant la connexion à un MacBook ou PC professionnel.
Côté specs, le CG3100X atteint une luminosité de 500 cd/m² et un contraste de 1 800:1. Son espace colorimétrique couvre 97 % de l’Adobe RGB et 99 % du DCI-P3, soutenu par un 3D LUT 16 bits et la technologie brevetée DUE (Digital Uniformity Equalizer) pour garantir une uniformité sur toute la dalle. Sur commande à partir cet été, il s’adresse aux étalonneurs et monteurs.

Archiware P5 en version 7.4 et nouveau nom pour l’outil Data Mover

Avec sa version 7.4, Archiware P5 arbore un nouveau tableau de bord. Il propose un suivi en temps réel des tâches de sauvegarde, d’archivage et de synchronisation, avec des graphiques modulables et personnalisables selon les besoins. Parmi les autres nouveautés, P5 Data Mover devient P5 Archive DLM (Data Lifecycle Management, soit l’ensemble des politiques et des processus qui accompagnent une donnée de sa naissance à sa suppression.). On y retrouve ses outils d’automatisation du cycle de vie des données et la vérification programmée de l’intégrité des contenus. Les données peuvent être réparties sur jusqu’à trois espaces de stockage simultanément. Enfin, la fonctionnalité S3 Object Archive se dote de paramètres avancés, offrant un contrôle affiné du transfert et de la mise en file d’attente des objets vers le cloud.