Pětadvacet let Wikipedie: Znalosti jsou lidské

Marek Blahuš

Kdysi přezíraná kolektivně tvořená encyklopedie připomíná, jaký by mohl internet být, pokud by na něm nezuřila válka o zisk a moc digitálních gigantů.

Wikipedie je impozantní kolektivní dílo lidí z celého světa, inspirovaných hnutím za svobodný software. Foto WmC

U příležitosti čtvrtstoletí existence Wikipedie ČTK tuto encyklopedii označila za „jeden z posledních symbolů původní éry otevřeného internetu“. Je to trefné, protože veškerý obsah Wikipedie je dostupný zdarma, provoz encyklopedie je hrazen z darů a návštěvníci jsou na tomto webu stále ještě skutečnými uživateli, a nikoliv produktem prodávaným inzerentům, s jehož údaji se čile obchoduje a jemuž neprůhledné algoritmy předkládají obsah „na míru“.

Posláním Wikipedie i dnes zůstává rychle a věcně uspokojit návštěvníkovu potřebu informací, a nikoliv rvát se co nejdéle o jeho pozornost za cenu mělkého obsahu a vyvolávání kontroverzí. Kdo zažil internet přelomu tisíciletí nebo třeba ještě i prvopočátky Facebooku, ten ví, o čem je řeč. Anglická verze Wikipedie byla spuštěna 15. ledna 2001.

Iniciativa amerického vizionáře Jimmyho Walese je zároveň jedním z historicky nejúspěšnějších projektů otevřené spolupráce dobrovolníků z celého světa, inspirovaným hnutím za svobodný software. Společným úsilím milionů dobrovolníků vznikla v krátké době prostřednictvím internetu vůbec největší encyklopedie v dějinách, jejímž cílem je dávat každému člověku na světě volný přístup k veškerým znalostem lidstva.

Už po několika málo letech dosáhla Wikipedie srovnatelné kvality s encyklopedií Britannica a počtem česky psaných hesel překonala v červenci 2011 Ottův slovník naučný, do té doby největší českou encyklopedii, ovšem už tehdy zoufale zastaralou. Práce na Wikipedii přitom nikdy nekončí, protože je stále co opravovat, doplňovat a aktualizovat. Každou minutu je na Wikipedii upraveno 324 stránek.

I když encyklopedie nebyla původně plánována jako mnohojazyčná, velmi brzy po napsání prvních anglických článků začaly vznikat další jazykové verze Wikipedie. Jejich vznik měli obvykle na svědomí nadšenci pro podobně idealistické myšlenky z různých koutů světa. Například třeba příznivci mezinárodního jazyka esperanto se zasloužili o vznik šesti jazykových verzí Wikipedie, včetně té české, kterou v roce 2002 založil brněnský esperantista Miroslav Malovec.

Dnes je Wikipedie dostupná ve 342 jazycích a nabízí celkem 66 milionů článků, přičemž jednotlivé verze jsou různě obsáhlé a obvykle se nejedná o přímé překlady. Pro mnoho menších jazyků je Wikipedie největším korpusem kvalitních textů dostupných na internetu. Mezi nejnavštěvovanějšími internetovými stránkami je Wikipedie devátá a vyniká i tím, že je jako jediná nekomerční. Každý měsíc stránky Wikipedie poskytnou čtenářům patnáct miliard konzultací a na českou verzi každý měsíc návštěvníci přistoupí z jedenácti milionů unikátních zařízení.

Přestože je tato on-line encyklopedie pravidelně obviňována z nedostatečné názorové vyváženosti, lidé na ni při hledání informací masivně spoléhají a na základě čísel by se mohlo zdát, že je Wikipedie na výsluní přízně. Jenže jen málo oblastí se za posledních pětadvacet let proměnilo tolik jako digitální obsah a způsob, jakým ho konzumujeme, takže i Wikipedie musí o své místo na slunci neustále bojovat.

Nic nedávat a jenom brát: nejdřív Google, pak AI

Už v roce 2009 se začaly objevovat první zprávy o tom, že po nadšení z prvních let počet dobrovolníků tvořících encyklopedii klesá. Někteří se to snažili vysvětlovat tím, že „všechno snadno napsatelné už bylo napsáno“. Ovšem už tehdy se upozorňovalo na skutečnost, že počet aktivních editorů jde ruku v ruce s návštěvností internetové encyklopedie — a ta v té době byla také na sestupu. Přisuzovalo se to zavedení informačních souhrnů o žádaném tématu přímo ve výsledcích vyhledávání v Googlu, díky kterým se už uživatelé nemuseli tak často proklikávat dovnitř do Wikipedie.

Krátkodobě znamená taková změna pro uživatele jistě přínos: znalosti z Wikipedie díky tomu začali nacházet rychleji a pohodlněji. I Google dosáhl svého, protože mu návštěvníci začali méně „odcházet jinam“. Jenže z dlouhodobého hlediska začala změna encyklopedii ohrožovat: nelze prostě jenom brát a zpátky nic nedávat.

Většina wikipedistů, včetně pisatele těchto řádků, začala do Wikipedie přispívat poté, co si při čtení všimli chyby v některém článku, vlastnoručně takový nedostatek odstranili a opravená verze se skutečně hned začala zobrazovat všem ostatním čtenářům. Ovšem ve výsledcích z Googlu žádné tlačítko „Editovat“ není. Natožpak informace, jak lze encyklopedii podpořit finančně. Vlastně tam někdy ani vůbec není uvedeno, že informace z Wikipedie pochází.

Počet přispěvatelů se mezitím stabilizoval a od roku 2012 vykazuje setrvalý stav. Od roku 2023 však čtenářsko-editorskou zpětnovazební smyčku ohrožuje další změna technologického paradigmatu: velké jazykové modely (LLM), lidově zvané „AI“, a s nimi související přechod od vyhledávání webových stránek pomocí klíčových slov k přímému dotazování znalostních databází.

Mediální analytik Josef Šlerka ve své nedávné přednášce na Wikikonferenci označil Wikipedii a LLM za „dokonalý pár“. Zároveň ale varoval, že v současnosti je jejich vzájemný vztah velmi nerovnovážný: fundamentální pro LLM a parazitický pro Wikipedii. Wikipedie, která žije z darů a z dobrovolnické komunity, má proti sobě miliardový byznys AI.

Kdokoliv si sedne k ChatuGPT, de facto podle Šlerky žije z práce wikipedistů. Ta je významně zastoupena již v pretréninkové fázi, tj. v datech, na kterých se model učí, ale zásadní roli hraje zejména ve fázi posttréninkové, kdy se vzniklý model dolaďuje a ověřuje se, jestli dává pravdivé odpovědi.

Právě pro fact-checking, ale třeba i ad hoc dohledávání aktuálních údajů robotem na webu, je dnes Wikipedie nepostradatelná. Ve srovnáních vychází násobně lépe než zbytek internetu, jenž je plný nepodložených tvrzení, tendenčních článků či rovnou dezinformací.

Kolektivně tvořená encyklopedie, na kterou mnozí dlouhá léta hleděli spatra, „protože si tam každý může napsat, co chce“, se tak díky svým samoregulačním pravidlům nakonec ukazuje být objektivnější než nijak neregulovaný zbytek internetu, ve kterém zuří informační boje a víc vidět je ten, kdo víc křičí nebo víc zaplatí.

I Google už mnoho let odkazuje na články Wikipedie z horních příček výsledků vyhledávání a i jím nedávno zavedené „přehledy od AI“, tedy strojové shrnutí výsledků, nejčastěji čerpají právě z Wikipedie. Dá se tedy říct, že technologičtí giganti za nás uzavřeli někdejší debaty o důvěryhodnosti Wikipedie, a činí-li teď z wikipedistů arbitry pravdy, skládají tím jim a jejich dílu velkou poklonu.

Jenže jen slova chvály nestačí, protože servery si za ně wikipedisté nepořídí, jejich správci se jich nenají a třeba i právníci bránící Wikipedii proti útokům něco stojí. Wikipedie žije z darů veřejnosti a Jimmy Wales správně upozorňuje, že „lidé darují peníze na podporu Wikipedie, a nikoliv aby dotovali OpenAI, která neustále vytěžuje naše servery a nás to stojí kopu peněz“.

Samotní encyklopedisté sice dál pracují bez nároku na honorář — což, spolu s absencí reklamních bannerů, přispívá k neutralitě Wikipedie — ale jejich populaci je nutné průběžně obnovovat, vzdělávat je či jim umožnit se setkávat. Přestanou-li kvůli přežvýkaným souhrnům z LLM lidé Wikipedii znát, hrozí jednak nedostatek darů na její další provoz, jednak se méně lidí bude zapojovat do tvorby encyklopedického obsahu. Tvůrčí komunita by se tak mohla zhroutit.

A nefunkční, neudržovaná Wikipedie není v zájmu nikoho; ani podnikatelů v AI. V jejich zájmu ostatně není ani současný boom nadšenci či vtipálky vkládaných strojově generovaných článků, které se wikipedisté snaží odhalovat a jejichž případná exploze by potenciálně mohla vést až ke zhroucení modelů — v důsledku faktu, že se AI trénují na svém vlastním výstupu.

I ve světě plném „sečtělých strojových asistentů“ tak prostě dál platí, že skutečné znalosti jsou lidské. Problémy s financováním zvýšených nákladů na AI nejspíš pomůže řešit platforma Wikimedia Enterprise. Také se snad vývojáři LLM chytnou za nos a začnou nějakou formou podporovat i rozvoj komunity lidí, kteří dennodenně sbírají, třídí a prezentují ověřitelné informace o světě kolem nás. Je to ostatně i v jejich zájmu. A zapojit se může i každý čtenář: Nadále totiž platí ona okřídlená věta, že na Wikipedii jsou chyby proto, že ty jsi je neopravil. Wikipedie je zkrátka nás všech.

Diskuse
January 26, 2026 v 16.12
Wiki vs. AI

Proslýchá se, že se plánuje nějaký druh podpory od velkých společností pro Wikipedii. Moc bych jí to přál. Anebo raději ne ?!