Umělá inteligence, AI

Umělá inteligence versus Google: Budeme muset kvůli AI předělat většinu internetu?

  • Umělá inteligence je tady a její dopady můžeme zatím jen odhadovat
  • Už dnes je ale prakticky jisté, že zničí některá povolání
  • Zároveň ale otevře nové a nečekané možnosti pro ta ostatní

Důsledky příchodu AI budou podstatně komplikovanější než se zdá. Zatím se řeší hlavně zjevné případy – tedy jak věrohodné jsou nebo nejsou odpovědi, ale to je nepodstatné. U modelů, jako je ChatGPT, je zásadní, že jde o sémantické modely, emulují tedy člověka – a vlastně nejde ani o to, jestli je výstup pravda nebo ne, ale jestli to vypadá věrohodně.


Nepřehlédněte: Bez perexů a bez dezinformací: Zoufalí lidé dělají zoufalé věci, ukazuje novela mediálního zákona


Právě věrohodnost výstupů bude ovlivňovat použití inteligence – a podobně, jako málokdo očekával rychlý nástup kreativní AI, budou důsledky podstatně komplikovanější, než si dovedeme představit. Zatím si školy uvědomily, že tato technologie dokáže studentům zatraceně zjednodušit práci, takže ji zakázaly jak francouzská Sciences Po, tak třeba i RV University v Bangalore. Jde údajně o snahu bojovat proti „plágiátům“, což je vtipné, protože výstupy sémantické AI plagiáty rozhodně nejsou.

Nemyslím, že by jim to nějak zásadně pomohlo – a je to do značné míry zbytečné. ChatGPT dokázala projít celou řadou testů z medicíny i vysokých škol právního a ekonomického typu, doslova každý den přibývají další a další. Její výsledky jsou podprůměrné, což znamená, že by prošla, i když ne zrovna skvěle. Ukazuje se, že sémantický model dokáže věrohodně psát, ale nedokáže reálně uvažovat, ohodnocovat konfliktní zdroje nebo provádět logické a matematické dedukce. To nevadí, alespoň budou tvůrci AI vědět, kde jsou její slabá místa.

Věrohodné výstupy

To, co je pro sémantickou inteligenci důležité, je fakt, že fakticky prochází Turingovým testem, tedy dokáže věrohodně emulovat člověka. Dokáže pochopit dotaz a sestavit z dostupných zdrojů odpovídající výstup. Neznamená to, že je nejlepší nebo že je pravdivý, ale dokáže velmi dobře kompilovat. A právě schopnost kompilovat z existujících znalostí ukazuje, kdo je na řadě první – copywriteři.

Copywriting je nejnižší forma práce s textem, je to vlastně smolení reklamních textů podle zadaných pravidel. Copywritery si AI namaže na chleba, protože dokáže udělat to samé co oni, ale mnohem líp a mnohem, mnohem rychleji. Navíc dokáže významně lépe dělat SEO (Search Engine Optimization), což je jádro mnohem většího maléru, který následuje v závěsu.

Youtuber Enrico Tartaroti ve své úvaze „What happened to Google Search?“, která vyšla týden před vydáním ChatGPT, rozebírá upadající relevanci vyhledávání Google, které bojuje jak s uzavřenými systémy založenými na databázích (Deep Web, neplést s Dark Webem!) a také záplavou SEO, která kompletně zkresluje informace pro vyhledávání, takže relevance vyhledávání stále klesá.

Google, AI
Zdroj: Geralt / Pixabay

Příchod sémantické AI znamená, že bude následovat doslova záplava obsahu optimalizovaného pro SEO, který lze generovat automaticky a tím tlačit ve vyhledávání vpřed to, co chtějí prodejci. Problém je v tom, že jakmile nasadí takové nástroje masově první z nich, nasadí je i další – a díky automatizaci mohou generovat doslova lesy obsahu, který nepřináší nic nového a slouží jenom k oklamání vyhledávače.

Ne že by se takové věci neděly dřív, ale právě automatizace dovoluje otevřít hotový gejzír generátorů, které zvládnou to, co by s lidmi bylo jen velmi složitě proveditelné. A pak budeme mít na výběr: Zavést nějakou regulaci, která bude rozlišovat výstupy AI od výstupů lidí –  a nebo kompletně ztratit představu o tom, co je co.

Regulace šmekulace

Představa, že nás regulace spasí, je poněkud úsměvná. Pokud by vyhledávače mohly snadno odlišit výstup AI od lidského, mohou generovaný obsah ignorovat, což by ho učinilo zbytečným. Navíc jsme vždy jen pidipixel od nějakého triku, například toho, že nějaký nešťastník bude „vybírat“ AI výstupy a metodou copy-paste z nich udělá svůj, tedy člověkem vytvořený obsah.

Pokud se ukáže, že jsou AI články dostatečně efektivní, nastane doslova nekonečná bitva mezi regulátory a tvůrci obsahu. Pokud netušíte, jak divoké to může být, podívejte se na to, jak moc jsou státy schopné vybírat daně od nadnárodních společností: Není naprosto žádnou výjimkou to, že technologičtí giganti mají celou speciální právně-ekonomickou jednotku, jejímž jediným úkolem je daňová optimalizace.

Pointa chatovací inteligence je v tom, že pokud projde Turingovým testem a pokud nebude obsahovat nějaké rozeznatelné watermarkování, nerozeznáme její výstup od lidského. Studenti si samozřejmě vygenerují svoje práce mimo akademickou půdu – a pokud nejsou úplně hloupí a nebo líní, výstup AI učešou a opraví v tom ty chyby, které tam sami poznají. V takovém okamžiku už je „boj s plagiáty“ zcela ztracený – pokud se student orientuje v odevzdané práci a je schopen ji vysvětlit, už nelze efektivně doložit, zda je původním autorem on a nebo AI.

Wikileaks
Zdroj: Marten Newhall / Unsplash

Studentské podvádění je ale jen okrajová část folklóru, ostatně není velkým tajemstvím to, že se někdy práce a nebo dokonce celé tituly kupují. Podstatně zajímavější je to, že sémantická AI dokáže chrlit velké množství obsahu, který může odkazovat sám na sebe – a tím se radikálně, radikálně zjednodušuje výroba toho, čemu se dnes říká dezinformace.

Je relativně snadné vyrobit falešnou zprávu a vypustit ji do světa. Co když ale vyrobíte celý systém na sebe odkazujících zdrojů, takže při běžném ověřování zjistíte, že je zpráva konzistentní? Co když ji propojíte s falešnými weby využívajícími deep fake technologie a začnete vyrábět zprávy, které nejsou úplně zjevná lež  a které by mohly být pravda? Propagandistické mašinérie získají zdroj zcela nové síly!

Falešná realita

Současné vyhledávače používají systém referencí, který se podařilo oklamat přes SEO. Nově můžeme díky sémantické AI chrlit hory obsahu, který na sebe bude navzájem odkazovat, což může vyhledávání úplně vykolejit. Algoritmy vyhodnocující relevanci nejsou magické, jsou statistické – a už dnes mají problém se stránkami, které jsou šité specificky pro ně, i když se dají relativně snadno odlišit od běžného webu.

Příchod sémantické AI znamená, že můžeme vyrábět velké množství poměrně věrohodně vypadajícího obsahu. Podstatná je věrohodnost a rychlost, protože pokud chcete vylučovat špatné zdroje, bojujete s obojím. Situace ve skutečnosti může dojít až tak daleko, že si vyhledávače spolu se sémantickou AI začnou vyrábět svou vlastní realitu: Sémantická AI vychází z dostupných informací, ale sama je generátorem informací, takže je jen otázkou času, až jako vlastní vstupy začne využívat ve velkém rozsahu výstupy ze sama sebe.

Už dříve se stávalo to, že na počátku velkých událostí bylo neporozumění nebo úmysl, který se začal šířit mezi lidmi jako pomluva – ale celá ta věc časem tak eskalovala, až se z toho stala realita. Úplně klasickým příkladem je Španelsko-americká válka (1898), i když by se měla správně jmenovat Vydavatelsko-americko-španělská válka. Hlavní bulvární vydavatelé amerických novin, Pulitzer a Hearst, totiž přiživovali snahu o válku tím, že neustále vydávali články o domnělých zvěrstvech Španělů na Kubě – a celé to dodělali tím, že explozi na USS Maine vydávali za španělskou sabotáž. Jejich propagandistická kampaň byla tak úspěšná, že k válce nakonec došlo (To, že Pulitzer založil cenu za výjimečně kvalitní novinařinu, považuji za dokonalý historický sarkasmus).

Počítač, uživatel, internet
Zdroj: tirachardz / Freepik

Pokud v 19. století vyžadovalo vyvolat veřejnou hysterii opravdu hodně lživé novinářské práce, s AI můžeme tento proces tak automatizovat, že si ho budou moci dovolit i mnohem menší organizace nebo talentovaní jedinci. AI generuje obsah, nemá žádný morální kompas v tom smyslu že je „dobrý“ a nebo „špatný“ – tedy pokud nebudeme do morálního kompasu počítat to, že aby se do ChatGPT nedostal „nenávistný obsah“, outsourcovali její tvůrci prefiltering tréninkových dat do Keni, kde pracovníky platí 2 dolary za hodinu – a ano, na Al-Jazeeře to označili za „otrokárnu digitálního věku“.

Hackerský ráj

Sémantická AI umí nejen psát, ona umí i tvořit kód. To otevírá ještě větší prostor pro lidi, kteří to nemusí myslet s ostatními dobře. Klasickým příkladem jsou takzvané „shitcoiny“, digitální kryptoměny, které v posledních letech vznikaly jako houby po dešti jen proto, aby se po jejich uvedení na trh jejich hodnota propadla efektivně na nulu.

Většina shitcoinů vznikala klonováním zdrojových kódů jiných kryptoměn, obvykle na bázi Etherea. Pokud spojíme schopnost AI rychle generovat kód a také rychle generovat obsah, můžeme mít například továrnu na kryptoměny, které AI vyrábí včetně legendy o tom, proč budou super. Máme schopnost kontaminovat vyhledávání, emulovat lidi, kteří tu věc chválí – a tedy vlastně industrializovat a automatizovat celý podvod.

Už dnes se některé země zaměřují na finanční podvody – i my máme zkušenosti s princi, kteří se nemohou dostat ke svému dědictví a nebo americkými lékaři zajatými Talibanem, který za ně žádá výpalné. Sémantická AI může psát gramaticky lepší a věrohodnější příběhy – a nejen to, může generovat celé ostrůvky reality, jako například weby, kde hořekují domnělí rodinní příslušníci a fiktivní reakce úřadů.

Zatím se to nedělalo proto, že to je pracné – a co si budeme povídat, skameři třetího světa také nebývají nejpilnější a nejchytřejší, takže se cíleně zaměřují na naivní a na zranitelné oběti. AI jim dovolí generovat podstatně věrohodnější podvody, které nemusí jít už snadno prohlédnout – a s deep fake technologií mohou generovat i obrazový a video obsah.

Je vlastně jen otázkou času, než vzniknou hackerské balíčky, které dokážou vytvořit poměrně věrohodný pokus o podvod na klíč – a bude vyhledatelný a s referencemi, už nebude možné ho prohlédnout tak snadno. Takové nástroje mohou například procházet novinové zprávy a samy hledat situace, ke kterým vygenerují příslušné podvody. Automaticky, spolehlivě, rychle, masově, se SEO optimalizací.

Sémantická AI umí psát různými styly – a podobně může i generovat kód. Hackeři se proto mohou rozhodnout, že ji nechají psát kód různými styly a obsah různými styly, což zkomplikuje jejich dohledání. A nenechte se plést: Hackeři jsou nadšenci, u nich je prakticky úplně jisté, že vyzkouší všechno, co jim AI dovolí – a půjdou ještě dál.

Samozřejmě: Možná začne vznikat AI, která bude klasifikovat informace a snažit se odhalit výstupy práce té druhé AI. Možná nás čekají uměle inteligentní závody v uměle inteligentním zbrojení – to se vážně může stát. A dost možná se bude muset úplně předělat vyhledávání a klasifikování informací, jinak se utopíme v moři báchorek a falešných informací.

Další články autora:

Zdroj náhledové fotografie: Freepik, zdroj: vlastní (viz autor článku).

Total
0
Shares
1 komentář
  1. Článek je výborný, moc děkuji. Akorát jsem si hned zkraje myslel, že titulek hovořící o “předělání” Internetu napsala nějaká betaverze titulkovací AI, ale zdá, se že i titulek je dílem autora, soudě podle “…a celé to dodělali tím, že explozi na…” a “A dost možná se bude muset úplně předělat vyhledávání a klasifikování informací”.

Comments are closed.