Lidi nahradí umělý hlas. Česká železnice ztratí kousek své duše a my s ní
Martin VeselýSpráva železnic se definitivně rozhodla, že staniční hlášení bude generovat počítačem. Změna zřejmě přijde v příštím roce. Co všechno znamená, že k cestujícím začne promlouvat hlas vytrénovaný na nakradených datech?
Správa železnic na konci minulého roku konečně vypsala tendr na dodání jednotného informačního systému pro česká nádraží. Cestující v České republice teď na jejich nástupiště navádí software čtyř různých dodavatelů, a železničáři proto musejí absolvovat školení navíc, řešit zvláštnosti každého ze systémů, pasažéři se zase mohou v každé stanici dočkat trochu jiných pokynů.
Dává smysl, že chce Správa železnic mít jediné řešení, aby mohla vše potřebné řešit s jedním dodavatelem přes jednu smlouvu za jednu cenu. Veřejná zakázka však zahrnuje i požadavek, aby nový systém uměl strojově syntetizovat staniční hlášení. Lidské hlasy tak z české železnice zmizí.
Kdo se ohradí proti „nevyhnutelnému“ technologickému pokroku, riskuje, že bude vykřičen jako staromilec nebo luddita. Nebudou copak nová hlášení pro všechny příjemnější? Stát ušetří za dabéry, dabéři ušetří čas strávený nahráváním názvů nových stanic, cestující ocení plynulejší tok informací. Už jsme si zvykli na to, že hlášení řídí počítač z předem nahraných zvukových úryvků, nepřichází teď zkrátka jen další zákonitý krok, další „inovace“?
Přeci jen je situace jiná. Poslední roky žijeme v době nadšení z toho, čemu říkáme „umělá inteligence“. Tímto pojmem zpravidla označujeme tzv. velké jazykové modely a další modely založené na principu strojového učení.
Zjednodušeně: počítač dostane na vstupu obrovské množství strukturovaných dat, třeba knih a novinových článků nebo zvukové nahrávky reálných konverzací a proslovů, a v těch hledá vzorce. Po nějaké době si program začne všímat, jak do sebe slova zapadají, a dokáže pravděpodobnostním výpočtem vygenerovat „přirozenou“ větu, ať už v textu nebo v řeči.
Zdrojových dat je k takovému procesu potřeba opravdu spousta. Technologické firmy, které takovéto modely vytvářejí, se moc netají tím, že vstupní data získávají, kde se dá. Na společnost Meta, pod kterou patří Facebook, Instagram či WhatsApp, vyšlo nedávno najevo, že své modely trénovala i na pirátských kopiích knih ze serverů, jako je notoricky známý LibGen.
Když si na této stránce někdo jako jednotlivec stáhne knihu, kterou třeba nikde nemůže sehnat nebo si ji nemůže dovolit, v mnoha částech světa se tím dopustí trestného činu. Korporátní giganti dělají to samé en bloc čistě pro účely zisku a k úhoně nedocházejí.
Strojové učení bere kvanta lidského poznání a důvtipu, která nachází na internetu, a přebouchává je v bezduché výtvory, které se řídí pouhou pravděpodobností a nemají za sebou žádný lidský záměr. Zisk z provozu modelu putuje jeho majitelům, kteří se na tvorbě zdrojových dat nijak nepřičinili.
Na takovém principu bude stavět i příští syntetický hlas Správy železnic. Možná v něm uslyšíte i ozvěnu svých rodinných videí, které jste před lety nahráli na internet a úplně na to zapomněli, nebo hlasu své oblíbené československé zpěvačky. Čím přesně firmy své modely „krmí“, nevíme — ale někde český materiál brát musejí.
Co víc — český veřejný prostor přijde o část své lidskosti. Na železnici vždy bylo fascinující právě sepětí lidského a strojového. Republikou a kontinentem křižují mnohatunové stroje po kilometrech a kilometrech kovových kolejí.
Děje se to v každou danou chvíli a navzdory obrovským vzdálenostem vlaky dopravují cestující do svých destinací v tu dobu, kdy tam mají být; alespoň vesměs. Za tímto mechanickým baletem je zároveň úsilí neskutečného množství lidí. Jsou to ti, kteří dráhu obsluhují v daný okamžik — strojvedoucí, posunovači, dispečeři — i ti, kdo potřebnou techniku vymysleli a vyrobili, aby ji ostatní mohli používat.
Poprvé v dějinách se tohle mění.
Umělá inteligence přeskládala hlásky z nahrávek způsobem, kterému pořádně nerozumíme, a vytvořila je v něco nového, co si na lidské pouze hraje. Za každou automatizací dosud stály mysl a ruka programátora, ale teď už to neplatí.
To, čemu říkáme „umělá inteligence“, nikdy nevymyslí nic nového, protože jen umí odhadovat na základě dat, co by asi řekl člověk na jejím místě. Syntetický hlas bude amalgámem nás všech, ale nikdy nepřijde se svým jedinečným chraplákem nebo charismatickým altem.
Co že to vlastně získáme? Ach, prý budou nová hlášení plynulejší — to určitě ano, ale nejsou to právě nedokonalosti, které nás činí lidskými? Vždycky, když se v tramvaji blížím k brněnskému hlavnímu nádraží, tetelím se, až uslyším hlas jihomoravské veřejné dopravy moderátora Tomáše Peterku, jak až příliš dává důraz na jednotlivá slova anglického hlášení (a cizinci tak naslouchají podivuhodnému staccatu: „Hlavní nádraží. Main! Train! Station!“); na lince B pražského metra zase nedám dopustit na stanici Křižíkova, jejíž jméno zadrmolila Eva Jurinová až příliš rychle („Křžkova!“). Jiní lidé zase přísahají na staniční hlášení Václava Knopa, kterého kdysi z většiny nádraží vytlačila anonymní „Andula“ aneb Danuše Hostinská-Klichová.
Ano, dalo by se nad tím mávnout rukou jako nad detailem pro lidi, co jsou vysazení na veřejnou dopravu. V posledku ale přece jde o to, jaký chceme mít v českých zemích veřejný prostor. Správa železnic je k tomuto aspektu svého působení bohužel přehlíživá.
Ve jménu šetření nechává bourat staré nádražní budovy, za jejichž záchranu místní mnohdy neúspěšně bojují, a nahrazuje je nevzhlednými buňkami. Před pěti lety nemilosrdně škrtla lokální nádražní znělky kvůli „úspoře času“.
V pražských Dejvicích se posledních několik let snaží vyhnat nádražku, jejíž majitel zřejmě opravdu není jednoduchým obchodním partnerem, ale drží na místě příjemné místo pro Pražany i přespolní. Na konci minulého roku nechala Správa železnic bez varování zamalovat grafiky studentů na nádraží v Ústí na Orlicí — podle všeho jenom proto, že se řediteli SŽ prostě nelíbily.
Budoucností je automatizace, dobrá. Ve většině případů to má smysl. Tady však stát ušetří nanejvýš pár drobných. Místo člověka nás potom ke správné koleji navede software v soukromé licenci nějaké firmy, jejíž vlastníci jej vytrénovali na cizích hlasech, ale poplatky za provoz služby od státu si rádi nechají. Tvořivost a lidskost necháme strojům, na nás lidi zůstane jen práce a služba v cizím zisku.