Les images vues par ordinateur
Béatrice Joyeux-Prunel & Nicola Carboni
Une image en version numérique peut être lue et analysée par un ordinateur. Pourquoi ne pas le faire pour des millions ?
Toute image numérique est comme une matrice de pixels colorés, un quadrillage rempli d’une multitude de couleurs.
Chaque pixel est caractérisé par ses coordonnées dans le quadrillage, ainsi que par ses couleurs : une couleur est elle-même un mélange d’une proportion R de rouge, d’une proportion G de vert, d’une proportion B de bleu. Si bien qu’une image numérique peut être traduite par une série de chiffres qui décrivent la longueur et la largeur de l’image, les quantités de R, de G, de B pour chaque pixel, etc…
Tout cela peut s’analyser avec ce qu’appelle aujourd’hui la « vision artificielle ».
L’idée d’utiliser les techniques de vision artificielle en sciences humaines est très récente. Pour notre projet, l’usage le plus simple de ces techniques sera le plus adapté. Nous n’avons pas besoin, par exemple, de reconnaître le contenu des images que nous étudions. Nous contentons de demander à la machine de nous dire si deux images se ressemblent ou pas. C’est ce qui nous permet de travailler à la circulation mondiale des images dans les imprimés illustrés.
Première étape, un ordinateur peut extraire automatiquement, dans une page au format numérique, des éléments de cette page.
L'ordinateur détecte en particulier ces quadrilatères qui singularisent une illustration dans une page imprimée. Ce processus, que l’on appelle « segmentation », permet d’extraire automatiquement, les images reproduites dans des milliers de pages d’imprimés numérisés (journaux, revues, magazines illustrés).
Nous voici donc en mesure de constituer un corpus d’images publiées dans la presse à certaines époques.
Deuxième étape, la machine peut, sans grands « efforts », comparer deux images et déterminer qu’elles se ressemblent ; ou qu’elles sont les mêmes.
--
Une poignée d'illustrations de périodiques, rassemblées automatiquement par la machine. Algorithmes utilisés: ResNet18, HNSW, puis IVPY.
Donc déterminer dans un lot plus gros d’images, quelles images sont les mêmes ou se ressemblent beaucoup.
Comment fait l’ordinateur ? Il extrait des morceaux de l’image leurs pourcentages de couleurs, la position des traits, la proportion de blanc et de noir et bien d’autres éléments formels qu’il quantifie… Cette extraction permet de produire un vecteur, lui-même déterminé selon un nombre donné de caractères. La machine projette alors tous les vecteurs de toutes les images dans un même espace. Il est alors possible, algorithmiquement, de regrouper tous les points de cet espace selon des groupes de points les plus proches. En évaluant la proximité mathématique des vecteurs qui représentent nos images, on peut détecter par ordinateur, sur des millions d’images et sans les voir, quelles sont les images les plus proches les unes des autres. Copies, inspirations, images qui se ressemblent – voici qu’elles nous arrivent en quelques minutes. Un chaos d’image se trouve soudain ordonné.
Il suffirait alors de savoir, pour chaque image, quelle a été sa date de création, pour ordonner les images chronologiquement.
Et de connaître, pour chaque image, où elle a été créée, pour représenter cette chronologie dans l’espace.
De quoi retracer la circulation de motifs, de styles ou d’images dans l’espace et le temps pour des quantités d’images jamais traitées jusque-là.
Lire la suite :
Une possibilité épochale : le passé numérisé
Dans la cuisine du projet
Retour au chapitre :