Connaissez-vous la culturomique ?
La culturomique
Une nouvelle discipline
scientifique serait en train de voir le jour. Son nom, "la
culturomique", a été suggérée**** par Jean-Baptiste Michel, chercheur à
l'université de Harvard suite à la constitution par la firme Google d'une
gigantesque bibliothèque numérique. Pus de 5 millions de livres provenant de 40
universités ont été numérisés. Cela représente 4% de la totalité des livres
publiés depuis Gutenberg.
Des outils
informatiques ont été développés pour explorer le contenu de ces 5 millions de
livres. Ils permettent de déterminer la fréquence d'usage d'un mot ou d'une
expression par langue et par année en remontant jusqu'en 1800. On peut ainsi
étudier l'évolution du vocabulaire, l'apparition de nouveaux mots, l'émergence
de concepts ou encore la façon dont fluctue la notoriété des personnes célèbres.
Plus
généralement, aujourd'hui l'information
artificielle stockée sur Terre l'est majoritairement sous forme numérique, principalement
inscrite sur des disques durs. Et l'on dispose d'ordinateurs assez puissants
pour explorer ces bases de données. Cette situation sans précédent dans
l'histoire de l'humanité offre aux linguistes, sociologues, psychologues et autres
historiens une nouvelle façon d'explorer la culture et les écrits produits par
nos sociétés.
Présentation de l'éditeur
L'apparition des bases de
données informatiques et des moteurs de recherche permettant de les explorer a
introduit de nouvelles pratiques dont l'ego-surfing est une des plus ludiques :
estimer sa propre notoriété, celle de ses amis ou des célébrités, mesurée en
nombre de pages Google. Étrange classement puisque, en octobre 2012, Lady Gaga
était plus "célèbre" que Jésus-Christ. De même, le classement des chercheurs scientifiques
et des universités à partir d'autres bases de données se heurte à de nombreux
biais, dont il est essentiel d'être informé afin de ne pas prendre des vessies
pour des lanternes.
La numérisation de cinq millions de livres réalisée à l'Université Harvard
fournit quant à elle un outil nouveau, permettant d'analyser l'évolution de
l'usage d'un mot ou d'une expression au cours des deux derniers siècles. De "nos ancêtres les Gaulois" au "biais de positivité" et à la "loi de Benford", ce petit guide pittoresque a été conçu pour initier aux subtilités de la
culturomique, la science numérique de la culture.
Les auteurs
Jean-Paul Delahaye mathématicien. Il est professeur à l'université de Lille et
chercheur au laboratoire d'informatique fondamentale (LIFL).
Nicolas Gauvrit mathématicien et psychologue. Il enseigne les mathématiques à
l'université d'Artois.
Commentaires
Connectez-vous à votre compte franceinfo pour participer à la conversation.