Intégrité documentaire : les 11000 appareils génitaux masculins de Guillaume Algobinaire.

Un article du journal Le Temps nous apprend qu'Apple dispose d'un brevet daté de 2014 mais qu'il pourrait prochainement déployer lui permettant de modifier automatiquement les paroles de chansons jugées trop choquantes. Pour l'instant et officiellement, il semble qu'il s'agit "simplement" d'évacuer la grossièreté des paroles de chansons mais également de livres audio disponibles sur iTunes.

La première fois que j'ai commencé à réfléchir à la notion "d'intégrité documentaire" c'était quand j'écrivais beaucoup sur Google Books. Donc il y a plus de 10 ans. Pour faire passer cette notion auprès de mes étudiants j'utilise souvent l'exemple des éditions des grands classiques en version "digest" disponibles aux USA du type "la bible en 20 pages" ou "les misérables en 50 pages." Je leur explique que si l'on n'est confronté qu'à la version "courte" des misérables, version dont on a expurgé, non seulement différents niveaux de l'intrigue mais dont on a aussi modifié pour les atténuer les aspects paraissant les plus "choquants", le référent culturel que l'on construit et les comportements et les repères sociaux communs qu'il permet d'inscrire dans un horizon culturel partagé changent de manière radicale. En modifiant et en édulcorant "Les misérables" comme oeuvre littéraire (ou fait culturel) on influe nécessairement sur la perception que nous aurons de "la misère" comme réalité sociale.

L'intégrité en général c'est ça :

"L'intégrité est la motivation première à être conforme à ce que l'on est réellement. L'intégrité est donc le qualificatif donné à ce mécanisme de conformité à soi-même (en incluant ce qui n'est pas humain)." (Wikipédia)

Et "l'intégrité" dans le domaine informatique c'est ça :

"L'une des missions d'une base de données est d'assurer à tout instant l'intégrité, c'est-à-dire la cohérence, la fiabilité, et la pertinence des données qu'elle contient" (Wikipédia)

Donc à la fois être conforme à ce que l'on est réellement, et pour ce faire – dans la sphère informatique pour un document ou un enregistrement quelconque – garantir la cohérence, la fiabilité et la pertinence des données concernées.

La digue du biiiiip. En revenant de Nantes.

Remplacer les paroles des chansons. Techniquement c'est bien sûr assez facile. Les travaux de l'ingénierie linguistique et du TAL (traitement automatique des langues) permettent d'analyser très rapidement un corpus (les chansons) d'y repérer des mots-clés (ou des entités nommées) et d'effectuer différentes opérations, donc celle d'une substitution ou d'un remplacement.

Ce qui pose problème c'est bien sûr l'automaticité de ce processus : qui va décider et sur quels critères ?

L'autre grand problème c'est celui de l'intégrité du texte, et donc de l'oeuvre modifiée (on peut bien sûr imaginer le même remplacement sur des textes littéraires, des films, etc …).

Dans un vieux billet de 2013 j'écrivais déjà ceci :

"L'un des enjeux cruciaux de la transition numérique porte – à mon avis en tout cas – sur la notion "d'intégrité documentaire", c'est à dire ce qui permet (ou non) de garantir l'originalité d'un texte ou d'une oeuvre (= le fait qu'il soit conforme à l'intention originale de l'auteur et que sa diffusion respecte les droits que ce même auteur aura souhaité y attacher). C'est cette intégrité qui permet d'assurer une traçabilité des documents et de leurs auteurs, et qui régule donc également l'ensemble des processus de retribution associés et les logiques économiques qui vont de pair, mais également les logiques de prêt, d'échange, de partage, etc. Bien au-delà des seuls enjeux économiques de la propriété intellectuelle, la question du numérique pose nécessairement la question – complexe – d'un acte de "publication" devenu simple routine "cliquable" et des régulations ou dérégulations qui peuvent lui être associées."

Et le camarade Hervé Le Crosnier avait de son côté pointé dès 1995 :

"La modification d’un document porteur de sens, de point de vue, d’expérience est problématique. Ce qui change dans le temps c’est la connaissance. Celle d’un environnement social et scientifique, celle d’un individu donné … Mais ce mouvement de la connaissance se construit à partir de référents stables que sont les documents publiés à un moment donné. Les peintres pratiquaient le « vernissage » des toiles afin de s’interdire toute retouche. Les imprimeurs apposaient « l’achevé d’imprimer ». Il convient d’élaborer de même un rite de publication sur le réseau afin que des points stables soient offerts à le lecture, à la critique, à la relecture … et parfois aussi à la réhabilitation."

Hervé Le Crosnier. "De l’(in)utilité de W3 : communication et information vont en bateau." Présentation lors du congrès JRES’95, Chambéry, 22-24 Novembre 1995. [en ligne] http://www.cru.fr/JRES95/actes/appliu2/1/le-crosnier.html, consulté le 28/11/1997.

Si l'article du Temps interroge c'est moins par l'enjeu technique (à l'heure des intelligences artificielles et autres chatbots) que par les enjeux sociétaux et culturels qu'il soulève : derrière l'anecdotique remplacement de tel ou tel "gros mot" dans les paroles d'une chanson disponible sur iTunes, derrière la confirmation d'un large mouvement d'automaticité de la censure sur les plateformes dont nombre d'auteurs et d'éditeurs ont déjà fait la douloureuse expérience, derrière la pruderie très américaine qui est culturellement intégrée aux conditions générales d'utilisation des GAFAM, derrière tous ces paramètres donc, la question n'est pas tant de savoir si Apple est ou non en capacité de produire de tels remplacements (il l'est), pas davantage de savoir si ces remplacements sont justifiés (ils ne le sont pas), non plus que de savoir si cela représente un intérêt pour la firme (oui, celui de tenir sa promesse marketing d'un environnement "safe and clean"), mais de savoir si ces remplacements seront encore traçables, détectables. Et ce faisant de déterminer quelle sera la responsabilité algorithmique éditoriale, presqu'auctoriale, dans l'ensemble des documents et des traces culturelles accessibles dans 40, 50 ou 100 ans ans pour des générations qui n'auront jamais été confrontées à la version "originale" de ces oeuvres et n'auront eu accès qu'à la version médiée par les grandes oligarchies de l'accès (les plateformes donc).

Que deviendront alors les 11 000 appareils génitaux de Guillaume Apollinaire ?

Le mariage de la carpe algorithmique et du lapin de la création.

Faudra-t-il aux auteurs du 21ème siècle, apprendre à jouer avec les mécanismes automatiques de censure comme ceux du 16ème au 19ème siècle avaient du recourir à différents subterfuges pour contourner les censeurs ? Probablement. Les questions (et le constat) que pose Figaro dans la célèbre scène 3 de l'acte V ont-elles jamais connu une plus brûlante actualité ?

"Je lui dirais… que les sottises imprimées n’ont d’importance qu’aux lieux où l’on en gêne le cours ; que sans la liberté de blâmer, il n’est point d’éloge flatteur ; et qu’il n’y a que les petits hommes qui redoutent les petits écrits. (Il se rassied.) Las de nourrir un obscur pensionnaire, on me met un jour dans la rue ; et comme il faut dîner, quoiqu’on ne soit plus en prison, je taille encore ma plume et demande à chacun de quoi il est question : on me dit que, pendant ma retraite économique, il s’est établi dans Madrid un système de liberté sur la vente des productions, qui s’étend même à celles de la presse ; et que, pourvu que je ne parle en mes écrits ni de l’autorité, ni du culte, ni de la politique, ni dé la morale, ni des gens en place, ni des corps en crédit, ni de l’Opéra, ni des autres spectacles, ni de personne qui tienne à quelque chose, je puis tout imprimer librement, sous l’inspection de deux ou trois censeurs."

Après que le Gorafi a assassiné le second degré, les algorithmes qui identifient nos visages même travestis (reconnaissance faciale) ont encore grand peine à détecter une pensée "choquante" ou non conforme aux bonnes moeurs des CGU quand elle est travestie sous le masque de l'ironie. Mais même dans ce domaine leur marge de progression est constante.

En attendant il s s'attaquent à ce qu'ils savent faire de mieux, le "matching" : ils isolent et ciblent des mots, des expressions, des images, des séquences qui "matchent" avec les règles édictées dans leurs CGU ou commanditées par différents ayants-droits au nom d'un non-respect du droit d'auteur, et ils suppriment ou remplacent ou modifient. Mais ils ont d'ores et déjà attaqué la phase 2, celle du "watching", c'est à dire qu'ils sont à la fois en train de surveiller en permanence l'ensemble des contenus culturels disponibles et d'en fournir leur propre "vue", de véhiculer leur propre vision du monde, de plus en plus souvent au prix de toutes les réécritures.

Une nouvelle double articulation de la production de traces culturelles est en train de s'affirmer sans qu'un réel discours critique ait eu ou ait pris le temps d'en saisir l'ensemble des conséquences : les plateformes font fonction d'éditeur sans en avoir ni le statut ni la responsabilité juridique, et les algorithmes se font censeurs ou gardiens des bonnes moeurs sans en porter une quelconque responsabilité. D'autant que les mêmes algorithmes et les mêmes plateformes sont de plus en plus opaques à toute forme d'inspection, de moins en moins prévisibles pour ceux qu'ils gouvernent et de moins en moins robustes contre toute manipulation, instaurant ainsi un cercle bien loin d'être vertueux. 

Dans le monde d'Apple et d'iTunes les 11000 verges d'Apollinaire n'ont pas davantage de place que n'en avait l'origine du monde de Courbet chez Facebook.

 

6666010573_65c91edcbd_b

Refuser de penser la question de l'éditorialisation algorithmique, refuser de statuer clairement sur la responsabilité éditoriale des plateformes, refuser de se doter des outils (et/ou des législations) qui pourraient garantir l'intégrité documentaire des contenus culturels accessibles à travers elles, revient à retourner à l'époque où l'on saluait les censeurs d'un retentissant "bonsoir".

Soit l'avènement d'un passage à l'ère industrielle des technologies de l'artefact, mais des technologies dont l'usage mainstream se trouve confiné à la portion congrue tandis que les écritures algorithmiques s'en repaissent. Et la difficulté toujours plus grande, malgré ou à cause d'une massification des accès et de la nécessaire régulation qu'elle implique, de pouvoir s'appuyer, pour des faits politiques, culturels et sociétaux, sur la valeur de preuve d'un document, valeur que les anciennes corporations du filtre (journaux, éditeurs, bibliothécaires, etc.) et les processus de publication et de diffusion permettaient jusqu'ici d'établir d'une manière transparente à l'inspection, assez prévisible pour ceux qui se trouvaient gouvernés et finalement assez robuste contre toute forme de manipulation.

Ils ont changé ma chanson.

Dans une interview au journal Le Monde, Umberto Eco disait la chose suivante :

"A l'avenir, l'éducation aura pour but d'apprendre l'art du filtrage. Ce n'est plus nécessaire d'enseigner où est Katmandou, ou qui a été le premier roi de France après Charlemagne, parce qu'on le trouve partout. En revanche, on devrait demander aux étudiants d'examiner quinze sites afin qu'ils déterminent lequel, selon eux, est le plus fiable."
Nul doute qu'il faudra également et peut-être prioritairement les initier aux secrets d'alcôve de l'art du filtrage … algorithmique. Pour les rendre capables de s'en abstraire quand il leur sera encore possible de le faire.

En attendant … "Look What They Done To My Song !" 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Articles similaires

Commencez à saisir votre recherche ci-dessus et pressez Entrée pour rechercher. ESC pour annuler.

Retour en haut