Algospeak : les influenceurs, bilingues en censure automatisée

Thibault Prévost - 8 mai 2022 - Silences & censures - Clic gauche - 29 commentaires

Pour échapper aux robots-censeurs, les utilisateurs de TikTok et d'Instagram ont développé leur propre dialecte : l'algospeak. Une nouvelle preuve que, sur internet, même le langage a été privatisé.

Sur TikTok, personne ne vous entendra parler de sexe, de santé mentale, d'automutilation, de suicide, d'addictions, de viol, d'avortement, de guerre, de violence et, globalement, de tout ce qui est considéré par vos invisibles maîtres algorithmiques comme des sujets "sensibles". Sur Instagram, même combat. Sur YouTube, pareil. Si vous essayez, ne serait-ce qu'un peu, de mettre ces sujets en avant, dans le titre, le résumé ou le référencement – via les hashtags – de votre vidéo, la sanction tombe : suppression sans préavis, avec le risque que votre chaîne toute entière subisse le même sort pour outrage aux toutes-puissantes Conditions générales d'utilisation (CGU) de la plateforme en question. Ici-bas, code is law, le code fait loi, c'est comme ça et pis c'est tout – et d'ailleurs, de plus en plus souvent, sur les questions de modération, law is code. On ne négocie pas avec un logiciel de modération automatique. Mais de l'autre côté, au bout du clavier, des êtres humains ont des choses à dire sur ces sujets interdits. Alors, comment on fait? On camoufle la langue, se marrent les créateurs et créatrices de contenu, qui ont apparemment tous pris la LV2 option algorithmes.

Le résultat s'appelle "algospeak", nous raconte la journaliste Taylor Lorenz dans le Washington Post du 8 avril dernier. Faute de consensus francophone, tout est permis, alors partons sur..."argorithme" (si la Commission d'enrichissement de la langue française me lit, le néologisme superflu, c'est cadeau). L'argorithme, donc, se retrouve aussi bien sur TikTok que sur Instagram, Twitch et Youtube. Il n'obéit qu'à un principe : décrire sans nommer littéralement, par toutes les substitutions imaginables. Les travailleuses du sexe, cibles récurrentes des "purges" algorithmiques, ont recours aux innocents emojis de fruits et légumes, au terme "comptable", mais aussi à l'émoji de l'épi de maïs (corn)pour décrire leur secteur d'activité (porn). Dans les communautés LGBT anglophones, également habituées aux purges arbitraires, la phrase absurde "le dollar bean" remplace le mot "le$bian", une première modification du mot interdit "lesbian" déjà repérée par les robots-censeurs. Et l'argot queer offre un puissant outil d'évasion de la censure. La communauté noire anglophone, régulièrement victime de~~bugs~~ fonctionnalités racistes de TikTok, a aussi recours à l'Anglais vernaculaire afro-américain (AAVE) pour tromper les algorithmes, trop heureux de flagger (signaler comme inapproprié) le mot..."black".

Peu importe les sujets, les modifications les plus courantes consistent à remplacer des lettres par des chiffres ou des symboles, même si d'autres abrègent ("sexual assault" devient "SA") ou ajoutent des lettres ("seggs" pour "sex", "blink" au lieu de "link", car les plateformes interdisent souvent de mettre des liens vers ses autres comptes de réseaux sociaux). Certains vont cependant encore plus loin dans l'orwellien, explique la journaliste, en remplaçant le mot interdit par son contraire en négation – "mort" devient "non-vivant", "je déteste" devient "j'inverse d'aimer"–, en utilisant un signe de la main à la place du mot "blanc" pour parler de racisme, ou en utilisant de véritables langages codés façon Radio Londres – ainsi des antivax sur Facebook qui, pour éviter de voir leurs groupes disparaître ("se faire zucc", comme on dit), se rebaptisèrent "soirées dansantes", et le mot "pandémie" devint "panda" ou "panini". Bref, chacun essaie de tromper la vigilance des machines et de protéger son compte (qui, rappelons-le, constitue pour certain·es un gagne-pain).

Si l'anglais reste la lingua franca du web, le phénomène des suppressions ou invisibilisations arbitraires et automatisées de contenus (qu'on appelle plus généralement shadowban, et que Loris Guémart a traité en profondeur ici même en deux volets) concerne également les influenceurs et influenceuses francophones. L'argorithme a donc, logiquement, sa version française. Sur TikTok, l'emoji du zèbre est utilisé pour évoquer les scarifications, l'automutilation et, par extension, pour parler santé mentale. Dans les communautés féministes, on utilisera "vi01" ou "vi0l" au lieu de viol, "v10lence" pour "violence", les organes génitaux (masculins comme féminins) subissent le même traitement – s€ins, fe$$es, pen1s, etc. –, mais aussi le mot… "règles", qui devient "r€gles".

Remplacer une voyelle par une étoile semble également suffire : c'est ce que fait la youtubeuse et tiktokeuse Simplement Débora, obligée de se censurer y compris dans la piste audio de ses vidéos (!) pour parler s*xualité et B*SM. Mais aussi ce que font des youtubeurs beaucoup plus généralistes comme… HugoDécrypte, nouvelle star de l'actu sur YouTube (que nous décryptions entre les deux tours), dont les résumés de vidéos sont criblés de petites étoiles dès qu'il est question de la guerre en Ukraine. Un véritable arsenal technique du non-dit qui concerne une grande variété de sujets, de l'éducation seggsuelle à la santé m€ntale en passant par la v10lence sous toutes ses formes. Car la patrouille n'est jamais loin, tout particulièrement sur TikTok, dont l'algorithme de recommandation est aussi puissant que mystérieux.

D'un côté, cette "apparition" (toute relative) d'un sociolecte numérique (relativement) inédit est à la fois une bonne nouvelle et un événement assez commun dans l'histoire linguistique des technologies de la communication. Il y a d'abord eu le l33t sp34k parlé sur les bulletin boards des années 80, inventé pour que les n00bs (non-initiés) et les indics des forums d'antan ne puissent pas comprendre ce que se racontaient les hackers et phreakers qui partageaient l'espace.Puis les langages texto, forum et chats en ligne, faits d'abréviation – "lol", "mdr", "wtf", l'inoubliable "asv", entre autres . Le langage caché des emojis, utilisé par l'artificielle "génération Z" pour parler sexe, drogues (et trap music). Le lolspeak faussement enfantin - "I can has cheezburger"- des créateurs de mèmes. Au fond, le succès d'une plateforme est presque toujours lié à la constitution d'une communauté d'intérêts, dont les membres se reconnaissent par l'utilisation d'un lexique et d'un dialecte.

À ce titre, le web social ressemble à une fédération de villes-État, chacune avec son accent régional dérivé le plus souvent de l'anglais. Sur Tumblr, on parle sans majuscules. Sur Facebook… on parle boomerspeak… où les points de suspension et la virgule s'intervertissent (oui… on vous voit,,,). Sur Twitter, on fragmente la parole en #threads et on sème les messages de hashtags. Sur 4chan, on oublie la ponctuation Sur le fameux forum de jeuxvideo.com, selon la chercheuse Noémie Marignier, on réduit les sujets à "gay ou pas gay", etc...

Selon la sociolinguiste Gretchen McCulloch, autrice en 2019 de Because Internet : Understanding the New Rules of Language, ce foisonnement argotique est une bénédiction, qui enrichit le vocabulaire des locuteurs, et n'aurait aucune influence sur la supposée baisse de niveau de langues des plus jeunes (rep a sa lé rageu).De son côté, le linguiste David Crystal, auteur en 2008 de Txting : The gr8 db8 affirme quela culture web aurait ajouté près de 5 000 mots au dictionnaire anglais. Une véritable explosion cambrienne du langage. Cet algospeak venu de TikTok, dont la "néographie" (selon la définition du linguiste français Jacques Anis, qui s'intéressait au langage SMS) emprunte d'ailleurs de nombreuses techniques de dissimulation à ses prédécesseurs, est donc une bonne nouvelle pour le biotope linguistique numérique; sa déclinaison française, l'argorithme (oui, j'y tiens), est parallèlement une bonne nouvelle pour le français, qui tient sa place dans une sphère informationnelle régie par un féroce darwinisme linguistique (pour vous donner une idée, une superbe enquête du Guardian estimait récemment que 10 langues sur 6 000 se partageaient 82 % du contenu du web).

Au premier abord, il serait tentant de considérer l'argorithme comme une sorte de louchébem contemporain, un argot d'influenceurs fait pour n'être compris que par le public-cible. Il tient pourtant autant du langage SMS, résultat d'une contrainte technique et financière (le SMS coûtait alors cher, et le nombre de caractères était limité) que du lexique Twitter (limité par 280 caractères) et, surtout, du lexique des forums, déjà conçu en réponse à la modération – on y écrit traditionnellement "pr0n" plutôt que "porn" pour cette raison. À chaque fois ou presque, l'argot permet d'échapper au regard d'une altérité autoritaire – les flics, les parents, les modérateurs et, désormais, les machines.

Qu'est-ce que l'argorithme, sinon le produit d'une asymétrie totale des pouvoirs entre l'humain, constamment surveillé, et la machine, à l'affût du moindre écart de langage ?

Mais l'algospeak est encore plus que ça : c'est à la fois un outil politique de résistance contre la surveillance automatisée du langage et une stratégie de survie pour celles et ceux qui vivent et gagnent leur vie sur les réseaux sociaux. Le souci, c'est qu'ils n'ont pas le choix. "Une technologie intellectuelle ne s'invente jamais seule", écrit Olivier Ertzscheid au détour d'un article. "Elle est le fruit d'une époque, d'un rapport à l'information et au savoir, d'une organisation des pouvoirs qu'il s'agit d'éprouver en la contestant ou en la renforçant ainsi que d'un jeu complexe d'affordances cognitives et corporelles." Et qu'est-ce que l'argorithme, sinon le produit d'une asymétrie totale des pouvoirs entre l'humain, constamment surveillé, et la machine, à l'affût du moindre écart de langage ? Si les mots de l'argorithme, portés sans le vouloir par une classe littéralement définie par sa capacité d'influence – les "influenceurs" –, passent dans le langage IRL (comme ceux du lolspeak avant eux) par un processus appelé accommodation linguistique, si l'on entend un jour des adolescent·es utiliser "SA" à la place du terme "agression sexuelle" dans la rue, ce rapport de pouvoir achèvera d'être normalisé. Et c'est là que ça devient inquiétant.

C'est inquiétant parce que l'attitude des plateformes quant à la modération des contenus est celle d'un État autoritaire orwellien, celle de la Russie et de la Chine : il existe des listes de mots interdits, qui changent sans cesse, mais que personne n'a le droit de consulter. Les utilisateurs affrontent un adversaire tout-puissant, arbitraire et opaque, qui ne daigne jamais expliquer les règles qui régissent son territoire, et face à qui les recours légaux n'ont aucun effet. C'est inquiétant parce que sur les réseaux sociaux, au nom de la sécurité, les adolescent·es qui découvrent les règles d'expression publique en ligne font l'expérience (heureusement partielle) du régime fasciste. Ils découvrent un territoire parsemé de checkpoints et de shibboleths invisibles, où chaque phrase est scrutée comme un laisser-passer. Ils apprennent très vite que certains mots ne peuvent pas être prononcés, sous peine d'être effacés. Ils apprennent très vite comment modifier leur comportement sous surveillance, en normalisant ou en chiffrant leur discours. Ils apprennent comment s'autoorganiser, en maintenant des listes noires empiriques de mots bannis. Ils apprennent que le panoptique a des angles morts, à condition de maîtriser un éventail de techniques cryptographiques sans cesse renouvelées. Ils s'habituent à cohabiter avec la censure, à la considérer comme une force naturelle qui régit leur espace conversationnel commun, un intangible omniscient contre lequel on ne lutte pas.

Chaque mot est une marchandise, assignée à un cours et mise en compétition avec les autres dans la grande place boursière du langage

Ils apprennent, enfin, à penser comme l'algorithme qui les gouverne : à assigner inconsciemment une valeur intrinsèque aux mots. Ils intègrent le fonctionnement du capitalisme linguistique inauguré par l'indexation Google au début du millénaire (et décrit notamment comme "économie de l'expression"par Frédéric Kaplan pour le Monde diplomatique), où chaque mot est une marchandise, assignée à un cours et mise en compétition avec les autres dans une grande place boursière du langage. Dans l'économie des mots, les enjeux sont énormes : sur TikTok plus qu'ailleurs encore (car l'algorithme se fout de votre nombre d'abonnés), la bonne combinaison de termes peut propulser votre vidéo au firmament de la viralité (et vous rapporter de l'argent) mais à l'inverse, la mauvaise peut littéralement vous faire disparaître du site (et vous faire perdre votre revenu). Et sur le terreau d'un langage privatisé, c'est un système de pensée mercantile qui fleurit dans les esprits.

Bloqués dans les monopoles et les jardins emmurés, les utilisateurs n'ont pas le choix. Face à l'arbitraire, mieux vaut se conformer à la norme, invisibiliser certains sujets, trop "risqués" : racisme, sexisme, luttes sociales, oppressions, non seulement ça ne fait pas vendre, mais ça met l'algo en rogne, alors pourquoi se donner la peine ? Et pendant ce temps-là, les discours de haine, pas inquiétés pour un sou par la censure aveugle, continuent de croître, sous d'autres formes, d'autres argots, sur d'autres médias. Il existe pourtant une solution évidente, rappelle le journaliste Clive Thompson sur OneZero: revenir à une modération humaine, quitte à forcer les plateformes à embaucher beaucoup, beaucoup de monde. Pour que le consensus du dicible s'établisse au moins entre humains, modérateurs d'un côté et utilisateurs de l'autre, sur le terrain du contexte et de la polysémie. Pour que, in fine, le prolétariat des plateformes se réapproprie un tant soit peu son principal outil de production. Sans quoi nous finirons tous un jour par parler l'argorithme.