Hypothesis

Très bon article, mais le site est assez illisible : la police est horrible à lire, le panneau d’annotation est vraiment mal fichu.

Finalement ces outils nous sont imposés comme "incontournables". En effet, les GAFAM les foutent partout et il devient presque impossible de les éviter: les moteurs de recherche nous les imposent, toutes les applications multiplient les petites icônes avec des étincelles pour signifier l'usage d'un LLM, les applications de bureautique en sont pleines... Sans qu'on puisse choisir, les sociétés commerciales dont nous sommes devenus dépendants décident désormais que nous allons utiliser des agents conversationnels pour tout faire, même quand leur utilisation n'est pas pertinente, même quand elle est complètement aberrante. Et quelle est notre réaction? Nous disons: et ben, on ne peut pas résister au progrès, il faut s'y faire. "Ces technologies sont là pour rester", il faut former les jeunes à les utiliser. Donc ok: il faut que nos sociétés s'adaptent à la volonté de deux sociétés commerciales -- à savoir leur faire faire de l'argent. C'est comme si on disait que nos sociétés doivent imposer à tout le monde de boire 10 litres de Coca-Cola par jour parce que Coca-Cola le veut. Et surtout, interdisons l'eau et disons que qui boit de l'eau est crétin, car le coca est tellement meilleur, tellement plus performant, tellement plus....

Pas mieux, c'est l'argument Electrolyte d'Idiocracy dans toute sa splendeur. J'ai exactement ce cas dans mon entreprise ou la direction veut absolument foutre de l'iA partout dans le produit alors que celui-ci s'adresse à une population qui ne veut pas interagir avec l'informatique....

Des gens comme Musk et Altman (oui, désormais, on se fie à des multimillionnaires sans aucune autre compétence que l'argent qu'ils ont cumulé de manière complètement fortuite pour se faire une idée sur le monde) n'arrêtent pas de nous le dire: nous allons bientôt atteindre l'"intelligence artificielle générale". Comme si l'intelligence pouvait être une seule chose. C'est quoi l'intelligence? Que signifierait une "intelligence générale"? Cet argument est stupide parce qu'il pense pouvoir se passer de donner une définition d'intelligence, d'une part et d'autre part parce qu'il présuppose que l'intelligence peut être pensée comme une chose unique, mesurable de manière uniforme. Il y aurait donc une échelle et des choses plus ou moins en haut de cette échelle. C'est ce que Samuel Buttler proposait en 1860 en appliquant de façon très naïve l'idée de sélection naturelle de Darwin: dans une lettre envoyée au journal "The press", le 13 juin 1863, intitulée Darwin among the machines, il se demande qui sera le successeur des êtres humains dans la domination de la Terre. Les machines pourraient prendre cette place et se mettre au sommet de la hiérarchie de l’évolution et "dépasser" les humains. Sauf que l'évolution ne fonctionne pas comme cela... sinon il n'y aurait plus autre espèce que l'homo sapiens... L'évolution et la sélection sont situées, par rapport à des contextes et des environnements particuliers -- ce qui fait que chaque espèce évolue de manière parallèle aux autres et qu'il n'y a pas une sélection naturelle transespèce. L'argument de l'intelligence artificielle générale oublie la question de l'environnement et du contexte qui oblige à comprendre qu'il ne peut qu'y avoir une multiplicité très grande d'intelligences différentes. Or qu'Altman puisse le penser, soit, cela nous en dit beaucoup de son ignorance profonde et de sa naïveté -- outre que de son rôle commercial... ce qu'il veut, c'est faire de l'argent et non nous instruire pour augmenter notre connaissance. Mais que des "experts" puissent le penser! Les bras m'en tombent.

Là, rien à ajouter. Ce concept fumeux d’intelligence artificielle générale est complètement pseudo scientifique, et pour cette raison et plein d'autres, complètement inatteignable. Ce concept n'existe que pour maintenir le rythme des levées de fonds.

Les grandes compagnies numériques nous poussent à utiliser ces technologies pour tout faire. Le matraquage publicitaire essaye de nous faire croire que ces applications -- qui, en réalité, ne savent bien faire qu'une chose somme toute très limitée et spécifique, à savoir converser -- devraient être utilisées pour accomplir n'importe quel type de tâche. Par exemple: rechercher des informations. Or utiliser un agent conversationnel pour chercher des informations est une aberration totale. C'est comme essayer d'ouvrir une porte avec un bazooka: on aura un résultat qui semblera analogue à l'ouverture de la porte, mais on n'aura pas ouvert la porte, on aura défoncé un mur et peut-être le bâtiment entier -- en rendant l'ouverture de la porte complètement inutile, vu qu'il n'y aura plus de bâtiment. Un LLM n'a aucune conception de la vérité et cela par design. Le fait que l'analyse statistique du corpus d'entrainement permette de reproduire des discours qui imitent de façon probabiliste les connaissances qui sont contenues dans le corpus n'a rien à voir avec une idée quelconque de connaissance: car la connaissance nécessite aussi de structures déterministe et experte et que ces algorithmes ne peuvent pas, par design, être déterministes ni experts. On peut certes investir encore et rajouter des couches applicatives pour "corriger" le problème, mais l'approche reste aberrante. Au lieu d'ouvrir la porte juste en utilisant la poignée, on dépense des millions pour construire des bazookas qui permettent de ne pas défoncer le bâtiment et d'autres millions pour renforcer les bâtiments autour de la porte pour qu'ils tiennent le coup quand on lui tire dessus avec le bazooka. Rechercher une information pourrait se faire, par exemple, avec des requêtes sparql sur des bases de connaissance (comme wikidata)... cela aurait un coup computationnel pratiquement égal à 0 et donnerait la bonne réponse (des objections débiles à mon argument peuplent désormais le discours, suite à l'influence de la publicité: "oui, mais, désormais on a affaire à des "agents" qui mobilisent des applications", etc.: c'est faux, le résultat est le même, non déterministe, probabiliste et inutilement couteux, mais pour le démontrer, il faudra un autre billet de blog).

Oui et non : oui, l'utilisation d'un LLM est dramatiquement mauvais énergétiquement parlant pour récupérer des informations dans un corpus de texte. Mais d'un autre coté, qu'est ce que c'est facile (encore une fois, on ferme les yeux sur le coup environnemental) !! On fait avaler la documentation de dizaines d'années d’ancienneté d'une entreprise à un LLM et celui-ci est capable de nous répondre en langage naturel, avec un aplomb impressionnant : quelqu'un qui ne connais pas les grande ligne de cette documentation ne le remettra jamais en question. Par ailleurs, former au Sparql, non, ça n'est pas une solution 1) il faudrait que la connaissance soit structuré correctement en amont, or d’expérience, ça n'est jamais le cas et 2) le coût de formation pour l'ensemble des usager serait terrible (à moins de l'intégrer dans un cursus scolaire mais c'est un autre débat)

Ces technologies seraient "très puissantes", "très performantes" ou en tout cas beaucoup plus "puissantes" que des technologies préexistantes. Or cette "puissance" ne correspond qu'à l'énormité des investissements et à leur concentration. Les agents conversationnels réalisent de manière excellente la tâche pour laquelle ils sont programmés: manipuler la langue naturelle. Mais le coût computationnel pour le faire est énorme. Pour réaliser d'autres tâches -- par exemple, extraire des informations précises d'un texte -- souvent leur "performance" est très médiocre si on s'arrête un instant à analyser la tâche demandée et à comparer ce que fait un agent conversationnel avec ce qu'on peut faire avec d'autres méthodes. Souvent, j'ai vu des collègues s'émerveiller devant les résultats d'un chatbot pour trouver des choses dans un texte qui auraient pu être trouvées avec une regex (si vous ne savez pas ce qu'est une regex, vous devriez réaliser que votre manque de littératie vous rend encore plus vulnérables au discours commercial qui vous vend des solutions à des problèmes dont vous n'avez aucune compréhension). Or la réalité est que la performance d'un agent conversationnel est souvent très médiocre: il demande des ressources très grandes pour faire une chose de manière moyennement fiable, alors qu'une autre approche computationnelle aurait pu faire la même chose de manière plus fiable et à un cout computationnel incomparablement plus bas.

Moyennement d'accord : les LLM, notament ceux orienté code sont assez bluffant par leur capacités à ganéré des pages et des pages de codes de très bonne qualité en un temps record. Oui, un humain aurait pu faire de même, mais le temps de réalisation aurait été bien plus long et pour une qualité plus ou moins équivalente. Reste cependant la question de l'énergie dépensée. Je fais actuellement tourné un petit serveur linux avec un llama.cpp donc j'ai une assez bonne idée de la quantité d'énergie électrique nécéssaire : c'est assez gargantueque, peu importe les optimisations que je peux mettre dans ma configuration

Elle serait révolutionnaire. On prend désormais la date de sortie d'un produit commercial (chatGPT) comme une date de rupture. Mais la seule rupture qu'il y a eu est une rupture publicitaire: le fait que, sous la pression immense d'une compagnie privée, les médias ont commencé à parler beaucoup de quelque chose qui existe depuis très longtemps. Les approches computationnelles n'étaient pas trop à la mode à partir des années 1990. Après une époque faste de présence dans le discours public, on était passé à autre chose -- le web, la circulation des contenus, le "numérique". Les recherches sur les méthodes computationnelles n’ont jamais cessé, conduites non pas par quelques entreprises privées, mais par des chercheurs et chercheuses qui ont développé des algorithmes variés et différents pour résoudre une variété de problèmes captivants, y compris le traitement automatique des langues. Les approches inductives, fondées sur le principe du perceptron, font partie de ces méthodes depuis 1946. Il n'y a eu aucune révolution en 2022, parler de révolution signifie ignorer le travail de la recherche et ne pas comprendre l'évolution lente et irrégulière d'une tendance d'analyse formelle du monde qui caractérise nos civilisations depuis leur préhistoire.

Complètement d'accord : j'ai appris les bases de la conception d'un réseau de neurones multi couche en 2014 pendant mes études, et depuis, rien à évoluer : au mieux, on a eu des optimisations des algorithmes (MoE, optimisation du cache clef-valeur, etc.)

Annotators

URL