Cet article date de plus de dix ans.

Les SMS sous la loupe des scientifiques

Le contenu de nos SMS intéresse de plus en plus de scientifiques. Des linguistes, des informaticiens ou encore des sociologues ont fait des textos un véritable objet d'étude. En début de semaine, ont été publiés les résultats d'une étude montrant que les SMS ne constituent pas une menace pour le niveau en orthographe des adolescents.
Article rédigé par franceinfo
Radio France
Publié Mis à jour
Temps de lecture : 4min
  (©)

Pour cette étude, des chercheurs du Centre de Recherche sur la Cognition et l'Apprentissage, ont confié un téléphone mobile à 19 adolescents de 12 ans qui n'en avaient jamais possédé. En étudiant les 4.524 textos émis pendant un an par ces jeunes les chercheurs en sont arrivés à cette conclusion : la pratique des SMS n'a pas d'influence sur l'orthographe des collégiens, c'est leur niveau en orthographe qui détermine le type de fautes présentes dans les SMS.

Les chercheurs s'intéressent à ces petits messages électroniques car ils permettent d'étudier les évolutions de la langue et d'observer d'éventuelles mutations en cours dans notre société.

Depuis une dizaine d'années des grandes collectes de SMS ont été entreprises. En 2004, des universitaires belges ont initié un projet international intitulé sms4science. Le grand public était invité à envoyer ses SMS, avec un slogan simple : "faites don de vos SMS à la science". Des collectes de ce type ont par la suite été faites, sur l'île de la Réunion, en Suisse ou encore au Québec. En 2011, en Languedoc-Roussillon, le projet Sud4science a récolté plus de 93.000 SMS en 3 mois. C'est la plus grande base de données de SMS en langue française jamais collectée.

D'un point de vue juridique, les chercheurs ont pris les précautions nécessaires. Il était uniquement possible de leur envoyer des SMS que l'on avait écrits soi-même et pas des SMS que l'on avait reçus.
Puis, les scientifiques ont pris soin d'anonymiser les messages, c'est-à-dire d'effacer toute trace pouvant conduire à l'identification des personnes comme un prénom, une date, un lieu, ou même un numéro de carte bleu. Ce travail d'anonymisation des données a duré 21 mois.

L'usage des données

Les chercheurs vont pouvoir mener des études statistiques sur l'emploi des mots. Par exemple, une première analyse a révélé que le mot simple le plus utilisé est le mot "je" ou encore que l'enchainement de 3 mots le plus employé est "je t'aime".

Ce genre d'analyse statistique va permettre de mieux cerner les codes sociaux implicites qui régissent la communication par SMS. Les chercheurs vont par exemple regarder de quels mots se servent les gens pour entrer en contact (salut, hello ou coucou).

Plus généralement, ces textos donnent aux linguistes la possibilité d'étudier un registre familier auquel ils n'ont pas facilement accès avec les autres formes d'écrits.

Beaucoup de créativité

Beaucoup de mots inventés apparaissent dans ces SMS. Des mots comme miameur, dodoter ou encore cinémater, des mots-valises comme chocobisous, des emprunts plus ou moins francisés comme " je cleane" ou même des innovations sémantiques tel que "tu vas lui dissoudre le porte-monnaie". Il faut savoir que 80 % des auteurs des textos étudiés ont moins de 30 ans.

Cette créativité lexicale des textoteurs n'effraie pas les linguistes du projet qui précisent qu'ils ne sont pas là pour juger mais pour observer la façon dont la langue évolue et se transforme.

Il y a peut-être en germe dans ces SMS, des expressions que nous emploierons demain. A l'image du fameux "lol" qui est maintenant un terme que certains emploient à l'oral et qui a fait son entrée dans le Petit Robert en 2013.

Les chercheurs vont aussi s'intéresser aux abréviations et à l'écriture phonétique des mots dans les textos. Ils voudraient notamment avec l'aide d'informaticiens développer des logiciels capables de traduire le contenu des SMS en français standardisé. Un tel logiciel associé à un système de synthèse vocale permettrait d'obtenir une version orale du texto pour une personne non-voyante par exemple.

Accès public

La grande base de données de Sud4science sera accessible d'ici juin au grand public sur le site internet d'Huma-Num, une infrastructure de recherche en sciences humaines et sociales. Les chercheurs prévoient un archivage à plus long terme au Centre Informatique National de l'Enseignement Supérieur pour que dans un siècle ou peut-être plus des chercheurs puissent étudier ce que l'on s'écrivait par SMS au début des années 2010.

Commentaires

Connectez-vous à votre compte franceinfo pour participer à la conversation.