Umělá inteligence, AI

Robot samostatně myslící bez internetu: Edge AI přináší klíčové změny v počítačových architekturách

  • Současná umělá inteligence (AI) je obvykle založená na výkonných serverovnách, které komunikují s počítači uživatelů přes internet.
  • Edge AI je koncept, že vlastní uvažování dělá samotné zařízení – robot, autonomní auto a nebo třeba inteligentní kamera – a to i bez nutnosti trvalého připojení k internetu.
  • Požadavky Edge AI vedou k návrhům revolučních architektur, které jsou rychlé, efektivní – a hlavně energeticky úsporné. To vše vede k takovému rozvoji nových konceptů, které jsme tu už dlouho neměli.

Pojem Edge AI je důležitý, protože se s ním budeme setkávat stále více. U nové generace AI vyhledávacích služeb, jako je Google Bard a nebo Bing vybavený modely GPT, nevadí, že počítače uživatelů jsou tradiční, protože uživatelé jsou připojení stejně k internetu a tím pádem mají k dispozici výkon obřích serveroven. V podstatě jde o analogii současného internetového vyhledávání a používání online služeb, jako je třeba Wikipedie: Počítá se s tím, že uživatel sedí doma, v práci a nebo v kavárně a jeho počítač se připojuje k internetu tak jako tak.

U robotů a nebo autonomních vozidel je ale situace diametrálně jiná, protože u nich se nesmí předpokládat, že mají internet trvale dostupný a musejí být schopná rozhodovat se i v situaci, kdy připojení vypadne. Idea Edge AI říká, že samotné řešení úloh umělé inteligence dovedeme „až na samotnou hranu existence“ – a stroje budou samy vyhodnocovat co vidí, rozeznávat příkazy a plnit je tak dobře, jak jenom dokážou. To klade velké nároky nejenom na schopnosti jejich samostatného uvažování, ale také na jeho rychlost a na energetické nároky, protože místní výpočetní výkon bude vždy omezený.


Nepřehlédněte: Tohle bude lidi bolet. Poplatek za televizi a rozhlas budou platit i majitelé telefonů


Inspirováni mozkem

mozek, AI
Zdroj: geralt / Pixabay

V současnosti se rozpracovává velké množství různých architektur AI akcelerátorů, z nichž některé jsou pojaté velice tradičně, jako například akcelerátory Nvidia Hopper H100 Tensor Core GPU. Tento akcelerátor, založený na architektuře grafických karet, funguje jako akcelerátor pro práci s tenzory, což jsou matematické struktury: Vektory, matice a podobné struktury z lineární algebry, které se v umělé inteligenci používají často a v masivních velikostech. Akcelerátory Nvidie – a jejich konkurence, akcelerátory Microsoft Athena, jsou určeny pro instalaci v masivních datacentrech a používají se hlavně pro učení.

V současnosti se můžeme setkat s TPU (Tensor Processing Units) i v pokročilých čipech jako je Apple M2 a nebo v procesorech moderních mobilních telefonů, kde se používají pro zpracovávání fotografií, rozeznávání hlasových příkazů a podobné úlohy. Jsou mnohem jednodušší, v podstatě jenom provádějí funkce umělé inteligence a práce s obrazem, mají ale velmi úsporný chod.

V současnosti se také experimentuje s pokročilými modely neuronových sítí, které jsou inspirovány lidským mozkem mnohem více než kdy předtím. Z klasických modelů, které se vždy počítaly celé, se přechází na SNN (Spiking Neural Networks), které podobně jako lidský mozek pracují s jednotlivými pulzy. Nemají centrální hodiny, jsou aktivní pouze když nastane událost (spike) – a tím pádem mají zlomek energetické spotřeby oproti klasickým neuronovým sítím. 

V podstatě se dá říci, že protože lidský mozek pracuje jenom s pulsy, nemusí být neustále plně aktivní celý najednou – a to šetří jak jeho energetickou spotřebu, tak také vyzařovanou teplotu při zbytečné práci. Mozek je efektivní a limituje jak svoji vlastní spotřebu glukózy (jinak bychom potřebovali mnohem více potravy) a také reguluje svoji teplotu. I tak má ale aktivní lidský mozek odhadovanou spotřebu asi 20 wattů a spotřebuje zhruba 20% veškeré tělem vyžadované energie.

Zpět k analogovým výpočtům

V minulosti byly běžné analogové počítače a hybridní počítače, které kombinovaly analogovou a digitální část. V současnosti jsme přešli na plně digitální modely z toho důvodu, že jsou přesnější a digitální počítače jsou přitom dostatečně rychlé. Analogové výpočty se nám ale spolu s Edge AI vracejí, protože mají tři výhody: Jednoduchost návrhu, rychlost a energetickou nenáročnost. Robot nebo automobil nemusí spočítat výsledek zcela přesně, stačí „dost dobrý odhad“, ale musí být rychle a nesmí to stát moc energie.

IBM pracuje na analogových výpočtech – a nejenom to, kombinují je s konceptem in-memory compute, tedy výpočty prováděnými přímo v paměti. Klasické počítače mají oddělenou paměť a procesor, ty jsou propojené sběrnicí, což je omezení, kterému se říká „von Neumannův bottleneck“, neboli úzké hrdlo klasické architektury. Výpočty pro umělou inteligenci se ale neustále točí kolem opakovaných operací s maticemi, takže je logické přesunout tyhle výpočty přímo do paměti a provádět je tam, všechny najednou!

Za normálních okolností by to velice zkomplikovalo paměť, ale protože jde o paměť specializovanou pro umělou inteligenci, potřebujeme od ní jenom několik operací – a pokud se navíc tato paměť udělá jako analogová, obvody pro výpočet (a nebo spíš odhad výsledku) se neuvěřitelně zjednoduší.

Inteligentní analogový paměťový čip IBM má omezené operace i přesnost, ale to nám u robota nevadí: Uloží se do něj například model pro rozeznávání tvarů a ten jede pořád dokola, protože jeho jediným smyslem je, aby robot analyzoval obraz, aby se neustále díval kolem sebe. Ostatně i mozek to má podobné, oba zadní laloky lidského mozku (lobes occipitales) slouží jenom k analýze obrazu.

Využití analogových výpočtů je zdánlivým krokem zpět, ale v případě Edge AI si ho můžeme dovolit, protože nejde o univerzální strukturu pro umělou inteligenci, ale o specializovanou strukturu. Smyslem podobných obvodů je naučit stroje pohybovat se v reálném světě – a k tomu nám stačí „jen dostatečně dobrá přesnost“, výsledek nemusí být dokonalý, hlavně když je to rychle! 

AI, umělá inteligence, robot
Zdroj náhledové fotografie: Pixel-DZ / Pixabay

Fotonika – výpočty rychlostí světla

Poměrně překvapujícím prvkem, který zažívá v současnosti rozmach, je fotonika, tedy forma výpočtů a přenosu dat, která nevyužívá elektrony, ale přímo elementy světla – fotony. Elektrony se ve vodičích pohybují zhruba jednou setinou rychlosti světla – a přechod na fotony tedy nabízí zásadní zrychlení. A nejenom to: Fotony se mezi sebou navzájem neovlivňují, takže firmy jako Lightmatter a Salience Labs experimentují s čipy, které využívají ty samé obvody najednou až pro osm světel různé barvy, které dokážou zpracovat ve stejných obvodech současně a tím dosáhnout osminásobného zrychlení!

S fotonikou se experimentovalo už v minulosti, ale většinou jen v laboratorních podmínkách, protože lasery, zdroje koherentního světla, byly vždy velké a jakékoliv propojení klasické křemíkové elektroniky a optické fotoniky představovalo problém. Dnes se už ale experimentuje s tak malými lasery, že se vejdou do pouzdra čipu, takže navenek vypadá fotonický procesor jako normální počítačová komponenta.

V současnosti se oceňuje hlavně rychlost zpracování a přenosu dat, firma Lightmatter například vyvinula fotonický datový přepínač Lightmatter Passage, který má až 200krát vyšší datovou propustnost při pouze pětinové spotřebě oproti křemíkovým alternativám. Právě nižší spotřeba ale podle odborníků na fotoniku otevírá cestu fotonickýcm procesorům i pro Edge AI, protože robotům i autonomním vozidlům nabídne mnohem vyšší rychlost zpracování dat při významně nižší spotřebě energie.

Fotonika má možná v ruce ještě jeden trumf: V současnosti se experimentuje s konceptem fotonického kvantového počítače, který využívá toho, že fotony neinteragují mezi sebou navzájem. Proto je možné je uvést do kvantových stavů, které jsou mnohem odolnější a stabilnější než ty současné, které se rychle rozpadají. Předpokládá se, že by kvantové fotonické počítače měly být schopné fungovat i při pokojových teplotách, zatímco současné kvantové počítače vyžadují extrémní chlazení blízké absolutní nule. 

Kvantové fotonické počítače by znamenaly zásadní revoluci hlavně u přechodu na kvantový internet, který by nabídl mnohem vyšší rychlosti, větší bezpečnost a také by dokázal detekovat pokusy o odposlech a o úpravy komunikace. Zatím jde o technologii ve fázi výzkumu a vývoje – ale je to jedna ze slibných cest, které by nám mohly pomoci jít zase dále do budoucnosti!

Další články autora:

Zdroj náhledové fotografie: Bing Image Creator (generováno AI), zdroj: Nvidia, micro, techtarget, Nature, janoptik

Total
0
Shares
1 komentář
  1. “I tak má ale aktivní lidský mozek odhadovanou spotřebu asi 20 wattů a spotřebuje zhruba 20% veškeré tělem vyžadované energie.”

    To by možná vysvětlovalo, proč jsou obézní lidé zpravidla méně inteligentní 😃.

Comments are closed.