Nové AI modely od Open AI a Google

22. května 2024

•

Minulý týden se nesl ve znamení umělé inteligence. Nejznámější firma v oblasti OpenAI a technologický gigant Google představili na svých konferencích novinky týkající se jejich modelů GPT a Gemini. Pojďme se společně podívat na shrnutí těchto novinek, kde nové modely vyzkoušet, a co od nich v budoucnu očekávat.

Gemini 1.5 Pro

Google představil dvě nové aktualizace pro svůj AI model. Gemini 1.5 Pro nyní dokáže pracovat až s milionem tokenů, což je v porovnáním s dosavadními modely obrovské množství. Znamená to, že bude hravě zvládat obrovské soubory (klidně celé knihy), videa (a kontext v nich) nebo třeba tisíce řádků kódu. Do konce roku se paměť kontextového okna rozšíří až na 2 miliony tokenů.

AI tokeny umožňují umělé inteligenci rozumět a manipulovat s textem (nebo obrázky apod.). Když AI čte nebo generuje text, rozděluje ho na malé kousky, které se nazývají tokeny. Každý token může být například jedno slovo, interpunkční znaménko nebo jiný útvar. AI pracuje s těmito tokeny, aby “pochopila” význam a kontext textu, a tak může provádět různé úkoly, jako je překlad, odpovídání na otázky nebo generování nového obsahu. Například věta “Jsem rád, že tě vidím!” by byla rozdělena na tři tokeny: “Jsem”, “rád,” a “že tě vidím!”

Je třeba však zmínit, že tento počet tokenů má zatím k dispozici jen omezená skupina vývojářů. Podle Sundara Pichaie, CEO Google a Alphabet, je však cílem dosáhnout AI modelu s “neomezenou” pamětí (počtem tokenů).

Gemini 1.5 Flash

Gemini 1.5 Flash je druhou verzí AI modelu Gemini představenou na konferenci Google I/O. Model podporuje až 1 milion tokenů a je vytvořen pro aplikace s nízkou latencí nebo jiné účely, kde je důležitá rychlost.

Oba modely je možné si zdarma vyzkoušet přímo na stránkách Google AI Studio.

Google I/O 2024 Keynote: Gemini

Kromě těchto dvou modelů Google představil také další zajímavé novinky na tento rok. Za zmínku stojí aplikace Google Live, Projekt Astra, Gemini Advanced nebo personalizovaná verze Gemini “Gems.”

Generativní AI přímo ve vyhledávání

Google také představil generativní AI pro svůj vyhledávač. Ta bude fungovat jako rychlé shrnutí nebo odpověď na dotaz uživatele s odkazem na zdroj. To by mělo podle Googlu umožnit uživatelům vyhledávat efektivněji, pomocí delších otázek nebo příkazů, aniž by museli otevírat více vyhledávacích oken. Funkce bude nejdříve dostupná v USA a posléze v dalších zemích světa. Je otázkou, kdy se dostane do Evropy.

Tato změna je obrovský “gamechanger” v oblasti organického vyhledávání a má potenciál změnit způsob, jakým uživatelé interagují s prohlížečem. Tato změna bude zároveň klást ohromný důraz na to, být v organickém vyhledávání první, především pokud se má generovaná odpověď objevovat nad sponzorovanou sekcí ve vyhledávání. SEO odborníci se tak mají opět na co těšit.

GPT-4o

Novinky představila také společnost OpenAI. GPT-4o je novou aktualizací známého modelu GPT-4. Model nově zvládne zpracovat libovolnou kombinaci zvukových, obrazových nebo textových vstupů. Stejně tak dokáže pracovat s výstupy. Odpovědi navíc dokáže generovat stejně rychle, jako by vám odpovídal člověk. Dokáže tedy reagovat do 200-300 milisekund. Což je opravdu neporovnatelné s předchozí dobou reakce 2,8 sekund.

Takto vysoké rychlosti reakce může model dosahovat především díky změně procesu zpracování informací. Model si již informace (například zvukové) nepřeposílá mezi několika různými neuronovými sítěmi, ale zpracovává vstupy i výstupy pouze v rámci jedné.

GPT-4o je již nyní plně dostupný velké části uživatelů, jak platícím, tak neplatícím. Postupně se bude spouštět všem. Nástroj si můžete zdarma vyzkoušet na stránkách ChatGPT.

Ukázka rychlosti reakce a práce s obrazovými vstupy GPT-4o (na výuce matematiky)

Desktopová aplikace od Open AI

OpenAI také představilo novou aplikaci pro MacOS. Jde v podstatě o webové rozhraní v aplikaci. V průběhu roku má přijít i aplikace pro Windows, nicméně ten již nyní využívá technologii GPT pro svůj MS Copilot.

V tomto směru bude vývoj také velice zajímavý. V souvislosti s novými AI modely se očekává také vývoj osobních asistentů a přechod k lokální AI na osobních zařízeních. Mohli jste si také všimnout nových AI PC, které již od konce minulého roku představují velcí výrobci telefonů a počítačů. Jedním z nich je například ASUS nebo Lenovo. Ty v budoucnu umožní koncovým uživatelům přenést nové AI modely z cloudu přímo k nim bez větších ztrát výkonu.

Minulý týden tak byl pro AI velmi přínosný. OpenAi i Google představily nové verze svých modelů. S nimi přišly parametry, jako 2 miliony tokenů paměti nebo reakce do 200-300 milisekund. AI modely nově zvládají lépe a rychleji zpracovávat zvukové a obrazové vstupy a výstupy. Zajímavou novinkou je také budoucnost generativní AI v prohlížeči Google, která má potenciál kompletně změnit způsob, jakým uživatelé na internetu vyhledávají a interagují s prohlížečem.

Předchozí článek Monitory OLED: klíčové pojmy a funkce

Další článek Thunderbolt 4 vs. OCuLink: Přišel čas na upgrade?

Vojtěch Tomášek

Jsem redaktor se zájmem o technologie, grafický design a IT. Je pro mě klíčová zpětná vazba a podněty od čtenářů. Chci tak tvořit obsah, který nejen informuje, ale také inspiruje a obohacuje. Od dokončení vysoké školy se věnuji převážně grafice a IT. Když zrovna nejsem v redakci Intervalu, jsem v přírodě nebo se právě snažím dokončit quest v nejnovějším Zaklínači.