18 Matching Annotations
  1. Jun 2026
    1. Gouvernance des Communs de Données à l'Ère de l'IA Post-Générative

      Synthèse

      Ce document de breffage analyse les défis critiques auxquels sont confrontés les communs de connaissances — tels que Wikipédia et les institutions patrimoniales (bibliothèques, musées) — face à la montée de l'intelligence artificielle (IA) générative.

      La recherche met en lumière un changement de paradigme : la transformation du savoir en simples données d'entraînement, ce qui entraîne une rupture du contrat social implicite du web ouvert.

      Les organisations de connaissances font face à une triple menace : une charge technique et financière liée au moissonnage massif (scraping), une chute du trafic humain (« la mort du clic ») et une crise de durabilité des communautés de contributeurs.

      Pour y répondre, des stratégies proactives émergent, comme la création de Wikimedia Enterprise, qui monétise non pas la donnée elle-même, mais le « pipeline » d'accès, afin de reprendre le contrôle via le droit des contrats.

      L'enjeu futur réside dans la coordination stratégique entre les communs et les institutions patrimoniales via de nouveaux standards comme le Model Context Protocol (MCP) pour préserver l'autonomie et l'agence collective face aux géants de la technologie.


      1. La Crise de Durabilité des Communs de Connaissances

      L'IA générative repose sur des architectures de deep learning dépendantes de jeux de données massifs, souvent extraits sans réciprocité.

      Cette situation crée des asymétries extractives profondes.

      Pressions Techniques et Financières

      • Surcharge des serveurs : Le trafic de robots (bots) dépasse désormais le trafic humain sur le web.

      En janvier 2026, Wikipédia a dû bloquer jusqu'à 2,7 milliards de requêtes automatisées hostiles pour éviter le crash de ses serveurs.

      • Coûts de maintenance : 70 % des institutions patrimoniales signalent une augmentation du trafic attribuée aux bots, compliquant l'accès pour les utilisateurs humains.

      « La Mort du Clic » et Érosion de l'Audience

      L'intégration de synthèses d'IA directement dans les moteurs de recherche (ex: Google AI Overviews) détourne les utilisateurs du contenu original.

      • Le trafic humain vers Wikipédia a chuté de 8 % entre janvier 2025 et 2026.

      • Les renvois via Google ont diminué de 22 % entre 2022 et 2025.

      Impact sur le Travail et les Contributeurs

      La durabilité de Wikipédia repose sur quatre dimensions menacées :

      • Infrastructure : Coûts de maintenance accrus.

      • Finances : Moins de visiteurs signifie moins de dons.

      • Main-d'œuvre : Le manque d'attribution et de visibilité réduit la motivation des bénévoles.

      • Pollution des données : L'augmentation du contenu généré par IA sur les plateformes collaboratives épuise les contributeurs qui doivent vérifier et corriger ces informations.


      2. Le Changement de Paradigme : De la Connaissance à la Donnée

      La recherche souligne une distinction fondamentale entre la « connaissance comme pratique sociale » et la « donnée comme ressource exploitable ».

      | Concept | Définition dans le contexte de l'IA | | --- | --- | | Désintermédiation | L'IA rompt le lien entre le savoir et le contexte social de sa production. | | Asymétrie Extractive | Quelques acteurs puissants extraient de la valeur de contenus produits et maintenus par des infrastructures publiques ou civiques. | | Paradoxe du Réemploi | L'ouverture même qui fait la valeur des communs les rend vulnérables à une exploitation à grande échelle. |

      Citation clé : « Le savoir ne peut être réduit à une ressource à exploiter, mais doit être compris comme une pratique sociale ancrée dans des communautés épistémiques. »


      3. Stratégies Proactives : Le Modèle Wikimedia Enterprise

      Face à l'échec du « contrat social » implicite du web, la Wikimedia Foundation a lancé Wikimedia Enterprise en 2021 pour réguler les relations avec les plateformes commerciales.

      Monétiser le « Pipeline », pas « l'Eau »

      Contrairement à d'autres organisations (comme Reddit ou certains journaux) qui vendent des licences de contenu, Wikimedia Enterprise vend un accès technique optimisé (API) à haut volume.

      • Droit des contrats : L'utilisation de contrats commerciaux permet de regagner un contrôle sur les flux de données là où les licences libres ne permettent pas de discriminer les utilisateurs.

      • Segmentation par volume : La tarification ne repose pas sur le type d'utilisateur (ce qui serait contraire à l'éthique de Wikipédia), mais sur le volume de données consommé.

      Tensions de Gouvernance Interne

      L'évolution vers des structures commerciales crée des frictions au sein du mouvement :

      • Vitesse vs Consensus : Certains employés voient les processus de décision communautaires (lents par nature) comme un obstacle au développement technique.

      • Culture : L'idée que « la communauté est une fonctionnalité, pas un bug » (community is a feature, not a bug) reste centrale pour les défenseurs du modèle original.


      4. Vers une Agence Collective : Coordination entre Communs et Institutions

      Un nouvel axe de recherche examine la convergence entre le mouvement Wikimedia et les institutions de type GLAM (Galleries, Libraries, Archives, Museums).

      Le Model Context Protocol (MCP) comme Levier

      Le MCP est un standard ouvert émergent (2024) visant à intégrer les systèmes d'IA avec des sources de données externes.

      • Objet frontière : Le MCP est jugé assez flexible pour répondre aux besoins de ré-intermédiation de différents acteurs (bibliothèques, Wikipédia).

      • Gouvernance de l'IA agentique : Il existe une lutte pour l'influence au sein des fondations d'IA (ex: Linux Foundation).

      Actuellement, les droits de vote y sont souvent proportionnels à l'investissement financier, excluant de fait les institutions à but non lucratif qui n'ont qu'un rôle d'observateur.

      Valeur de la Curation et de la « Fraîcheur »

      L'expertise des institutions patrimoniales et des communs apporte une valeur ajoutée que le simple moissonnage web ne peut égaler :

      • Fiabilité : Connaissance de la genèse des données et de leur valeur de vérité.

      • Fraîcheur : Capacité de Wikipédia à mettre à jour les informations en temps réel grâce à ses contributeurs mondiaux.

      • Curation : La numérisation et l'indexation experte transforment les archives en données exploitables et fiables pour les modèles de langage (LLM).


      Conclusion : Une Nouvelle Éthique de l'Accès

      La gouvernance des communs de données ne doit pas seulement être vue comme une gestion de dépôts d'informations, mais comme le développement de formes organisationnelles incarnant une politique d'accès au savoir.

      La survie de ces écosystèmes dépendra de leur capacité à construire une autonomie stratégique vis-à-vis des infrastructures propriétaires (comme Amazon Web Services) et à imposer une réciprocité réelle dans l'économie de l'IA.

  2. Apr 2026
  3. Jul 2023
    1. When I tag a note with a new keyword like [[Productivity]], it then becomes a ghost note on the graph.

      This is the first time I've seen someone use the phrase "ghost note" to mean a future implied note which could be created by using wiki syntax [[*]] which in some systems like Obsidian or WikiMedia creates a (red) link which one could click on to create that note.

      via u/THX-Eleven38 at https://www.reddit.com/r/Zettelkasten/comments/14ox2tw/what_is_the_proper_way_to_create_a_moc_note_from/

  4. Sep 2022
    1. Many of you are already aware of recent changes that the Foundation has made to its NDA policy. These changes have been discussed on Meta, and I won’t reiterate all of our disclosures there,[2] but I will briefly summarize that due to credible information of threat, the Foundation has modified its approach to accepting “non-disclosure agreements” from individuals. The security risk relates to information about infiltration of Wikimedia systems, including positions with access to personally identifiable information and elected bodies of influence. We could not pre-announce this action, even to our most trusted community partner groups (like the stewards), without fear of triggering the risk to which we’d been alerted. We restricted access to these tools immediately in the jurisdictions of concern, while working with impacted users to determine if the risk applied to them.
  5. Jul 2022
    1. 人们对最大的在线百科全书的评价褒贬不一,维基百科允许任何人匿名编辑,它的文章如何影响我们在现实中的决策?这种影响又能如何衡量?MIT、Maynooth 大学和康奈尔大学的研究人员发表了一篇论文,他们做了一个随机实验,创建新的法律类维基文章,观察它们如何影响法官的决定。 在普通法(common law)中,裁决是基于法规和先例,但法律从业者也是人,他们未必有时间和精力翻出每一本法律书籍查看每条裁决,他们会依赖于互联网上的匿名人士写的法律文章。研究人员让法学系学生编写了逾 150 篇爱尔兰最高法院判决相关的文章,随机选择一半上传,另一半则只保存在线下。结果显示,维基文章使得一个案例的引用率增加了 20% 以上,具有统计显著性。下级法院更可能引用,而最高法院和上诉法院则基本不引用。研究人员猜测是因为下级法院的法律从业者工作量更大,而维基百科文章提供了巨大的便利性。

  6. Jun 2022
    1. 维基媒体基金会的商业产品 Wikimedia Enterprise 宣布了首批客户:Google 和互联网档案馆。它同时提供了免费试用账号,供感兴趣的客户更好的评估产品是否符合其需求。过去二十年,维基百科项目不仅成为数亿用户的重要知识来源,也被许多企业使用将百科内容整合到产品中。为了解决这些企业的特定技术需求,以及直接资助维基百科的生态系统,社区多年来讨论了构建面向企业的付费服务。结果就是 Wikimedia Enterprise API。API 打包现有的维基百科内容,标准化数据源,帮助商业公司更容易的在其服务中使用。

  7. Jan 2022
    1. the existing Wikimedia Cloud Services computing infrastructure (virtual private server (VPS)), the Toolforge hosting environment (platform as a service (PaaS))

      Wikimedia Cloud VPS is Infrastructure as a Service, whereas Toolforge is Platform as a Service.

      As explained in this article, PaaS is further away from on-premises than IaaS, and the user does not have to manage the operative system, middleware and runtimes.

  8. Jun 2021
  9. Nov 2020
  10. May 2020
  11. Apr 2019
    1. The Wikimedia Foundation says it is seriously concerned about the idea that cisgender women and transgender editors could be repelled from Wikipedia by online abuse.

      This is also, to myself, indicative of the main problem with Wikipedia: most editors are white men in a certain age span.

      When abuse is added like this, non-men are more likely to stay away, and watch Wikipedia wither into a reason for staying with professionally edited encyclopedias.

  12. Sep 2017
    1. Upphovsrätten

      I den här faktarutan saknas den för fallet i fråga viktigaste paragrafen, nämligen § 24: ** 24 § Konstverk får avbildas

      1. om de stadigvarande är placerade på eller vid allmän plats utomhus,
      2. om syftet är att annonsera en utställning eller försäljning av konstverken, men endast i den utsträckning som behövs för att främja utställningen eller försäljningen, eller
      3. om de ingår i en samling, i kataloger, dock inte i digital form.

      Byggnader får fritt avbildas. Lag (2005:359).**

      Källa: https://www.riksdagen.se/sv/dokument-lagar/dokument/svensk-forfattningssamling/lag-1960729-om-upphovsratt-till-litterara-och_sfs-1960-729

    2. Den är vår och vi borde få göra vad vi vill med den.

      "Göra vad vi vill" som formulering ger upphov till lite väl liberala tolkningar. Jag hade förvisso inget särskilt emot Geijer som hippie, men jag tycker inte att var person ska få vandalisera (eller redekorera) offentlig konst hipp som happ - det är respektlöst mot resten av den allmänhet som betalat för konstverket. Däremot tycker jag inte alls att det är orimligt att man skulle få fotografera det offentliga konstverket och sedan dela bilden online.

      Jämför även med stolsliknelsen i kommentaren ovan: skulpturen är byggd, arbetstimmarna är betalda - varför ska samma arbete betalas för igen?

    3. – Man måste sluta dalta med konstnärerna, de har redan fått betalt för sina skulpturer och borde nöja sig med det,

      Det här citatet är tyvärr taget ur sin kontext och passar inte som uppföljning till påståendet ovan. Att upphovsrätten inte är anpassad för vårt digitala samhälle är inte relaterat till särbehandling av särskilda yrkesgrupper.

      Jag kan absolut se det som en form av daltande i jämförelse med andra yrkesgrupper - en stolsmakare får t.ex. inte betalt varje gång någon sitter på en stol denne byggt - men den här frågan kan inte lösas genom en reformerad upphovsrätt. Snarare bör vi fundera över varför vissa yrkesgrupper har fler rättigheter än andra - är det knutet till Foucaults tankar om "the author"? Är konstnären som ensamt geni en modern (och numer förlegad) företeelse? Är det rimligt att forma ett lagligt samhälle kring en föreställning om att intellektuell produktion är viktigare än fysisk produktion, och i ett digitalt samhälle - var drar man gränsen mellan dessa?

  13. Jun 2017
    1. ☛ Risk: The Wikimedia global movement does not improve in cultural, geographic, or demographic diversity, leading to less relevant and lower-quality content for a global audience.

      Nex time Wikimedia ask me for money only, without any attempt to make any real two way communication, I will try to volunteer time to help them with this Risk, particularly showing them diversity in concerns and technology.