Google představil Gemini 3.5 Flash a Gemini Omni – nové AI modely

Google na své konferenci I/O odhalil nejnovější řadu modelů umělé inteligence Gemini 3.5 a představil také revoluční model Gemini Omni, který dokáže vytvářet videa na základě různých typů vstupů.

Gemini 3.5 Flash – nejrychlejší model s inteligencí velkých modelů

Prvním dostupným modelem z rodiny Gemini 3.5 je Gemini 3.5 Flash. Ten je již nyní přístupný všem uživatelům prostřednictvím aplikace Gemini a je také integrován do režimu AI v Googlím vyhledávání. Podle společnosti Google tento model „dosahuje inteligence srovnatelné s velkými vlajkovými modely v několika ohledech, při rychlostech, na něž si uživatelé zvykli u řady Flash".

Jde o nejsilnější model Gemini v agentivním zpracování a programování. Překonává i Gemini 3.1 Pro na náročných benchmark testech zaměřených na kódování a agentivní úkoly, přitom vede také v oblasti multimodálního porozumění. Gemini 3.5 Flash se nyní stal výchozím modelem.

Gemini Omni – generování videí z libovolného vstupu

Zajímavější novinkou je nový model Gemini Omni, který přináší zcela novou možnost: vytváření videí z jakéhokoliv vstupu. Uživatelé mohou kombinovat obrázky, zvuk, video a text a model vygeneruje kvalitní videa „zakořeněná v reálném světě poznatků, kterými disponuje Gemini". Po vytvoření videa ho lze jednoduše upravovat prostřednictvím dialogu s modelem.

První variantou z rodiny Gemini Omni je model Omni Flash, který umožňuje uživatelům měnit konkrétní prvky videa, nebo jej celé přepracovat. Změny lze provádět postupně bez ztráty kontinuity původní scény.

Vylepšené fyzikální porozumění

Model má „vylepšené intuitivní porozumění fyzikálním silám, jako je gravitace, kinetická energie a dynamika tekutin", což umožňuje generování realističtějších scén. Gemini Omni umožňuje uživatelům využívat vlastní hlas a avatary – digitální reprezentace uživatele. Všechna vygenerovaná videa obsahují digitální vodotisk SynthID, kterým Google označuje obsah svých modelů.

Dostupnost a plány

Gemini Omni Flash je od dnešního dne dostupný všem předplatitelům plánů Google AI Plus, Pro a Ultra po celém světě v aplikaci Gemini a v Google Flow. Zároveň se postupně zavádí také bezplatně pro uživatele YouTube Shorts a YouTube Create.

Nové modely představují další krok ve vývoji AI technologií Googlu a rozšiřují možnosti, které mají uživatelé při práci s umělou inteligencí k dispozici.

---

Původní zpráva pochází z webu GSMArena.com

Související články