Keď OpenAI začiatkom týždňa predstavil verejnosti svoj prémiový produkt GPT-4o mal k tomu veľmi pádne dôvody. Snažil sa totiž predbehnúť Google, ktorý na vývojárskej konferencii I/O 2024 predstavil poľudštenú umelú inteligenciu s kódovým označením Project Astra. V podstate ide o podobné multimodálne AI, ktorého silu bude využívať aj umelá inteligencia Gemini. Šéf Google, Sundar Pichai o projekte Astra hovoril ako o novej generácii virtuálneho asistenta, ktorého schopnostiam sa súčasní asistenti ani len nepribližujú.
Google tiež zverejnil video, ktoré demonštruje, čo jeho multimodálne AI dokáže. Mobil so zapnutou kamerou a mikrofónom dokáže analyzovať objekty v miestnosti a odpovedať na náhodné otázky, ktoré s nimi súvisia. Vo videu napríklad osoba asistenta požiadala, aby v miestnosti našiel objekt, ktorý vydáva zvuk. Výsledkom bolo identifikovanie reproduktora. Osoba sa následne spýtala ako sa nazýva jeho horná časť. Oveľa zaujímavejšie však bolo okamžité analyzovanie zdrojového kódu na monitore. Umelá inteligencia dokázala v priebehu sekúnd zistiť o aký kód ide a čo robí. Pri pohľade z okna zas identifikovala, v ktorej londýnskej štvrti sa osoba nachádza. Odpovedať dokázala aj na otázku, kde v miestnosti si osoba zabudla svoje okuliare.
Nahradí učiteľa a rozpozná ‚príbehy‘ z fotiek
Počas úvodnej prednášky Sundar Pichaj spomenul slovné spojenie “umelá inteligencia” presne 120-krát. Práve AI má totiž dominovať všetkým produktom v portfóliu Google. Nový AI model Gemini 1.5 Pro cez funkciu “Ask Photos” umožní používateľom vyhľadávať fotografie na základe hlbších súvislostí než sú len dátumy a miesta. Na základe fotiek dokáže napríklad zistiť, kedy sa vaša dcéra naučila plávať alebo aká je poznávacia značka vášho auta. Gemini 1.5 Pro tiež dokáže sumarizovať všetky e-maily zo školy, ktorú vaše dieťa navštevuje, vrátane príloh a zobraziť najdôležitejšie informácie, ktoré vám pomôžu pripraviť sa na rodičovské združenie. Umelá inteligencia môže aj “prečítať” poznámky z učiva a na základe nich vytvoriť akúsi lekciu s virtuálnym učiteľom s ľudsky znejúcim hlasom. Model Gemini Pro 1.5 bude súčasťou kancelárskych aplikácií ako sú Gmail, Dokumenty, Tabuľky, Prezentácie alebo Disk Google, avšak len s predplatným Google One AI Premium.
Vylepšené vyhľadávanie cez Google vyhľadávač
Umelá inteligencia bude viac integrovaná aj vo vyhľadávači. Google oznámil, že z pôvodného beta-testovania presúva AI vyhľadávanie aj do ostrej prevádzky. Funkcia s názvom AI Overview bude najprv dostupná pre všetkých na americkom trhu. Do konca roka ju chcel ale Google ponúknuť zhruba miliarde používateľov. Použitie AI Overview v krajinách Európskej únie však kvôli reguláciám môže chvíľu meškať. V súčasnej podobe funkcia ponúka rýchly, umelou inteligenciou generovaný, sumár informácií z viacerých stránok na základe komplexnejšieho vyhľadávania. Ak napríklad do vyhľadávača zadáte “navrhni jedlá na prípravu v mikrovlnke na 7 dní pre študenta s malým rozpočtom,” AI Overview vám vygeneruje niekoľko jedál pre každý deň zvlášť a ponúkne odkazy na stránky s detailnými receptami. Návrhy je možné ďalej prispôsobovať a upravovať – napríklad pridaním dodatočného vyhľadávania vyžadovaných ingrediencií alebo receptov na základe potravinovej intolerancie.