Nowości w Google Gemini 2.0
Google ogłosił premierę Gemini 2.0 – nowej generacji swojego modelu AI, która teraz wspiera multimodalne wyjście audio-wizualne oraz integrację narzędzi w tzw. "erze agentów". Modele agentowe AI to systemy zdolne samodzielnie wykonywać zadania z adaptacyjnym podejmowaniem decyzji. Można je wykorzystać do automatyzacji codziennych czynności, takich jak zakupy czy umawianie spotkań na podstawie podanego polecenia.
Gemini 2.0 wprowadza wiele agentów, którzy mogą pomóc w różnych dziedzinach – od udzielania na bieżąco sugestii w grach, takich jak Clash of Clans, po dobieranie prezentów i dodawanie ich do koszyka na podstawie wskazówek.
Agenci w Gemini 2.0 charakteryzują się celowym zachowaniem. Mogą stworzyć listę zadań do wykonania i zrealizować je autonomicznie. Wśród agentów znajduje się Project Astra, zaprojektowany jako uniwersalny asystent AI dla telefonów z systemem Android, z multimodalnym wsparciem i integracją Google Search, Lens oraz Maps.
Drugim eksperymentalnym agentem jest Project Mariner, który potrafi samodzielnie poruszać się w przeglądarce internetowej. Mariner jest obecnie dostępny w wczesnej wersji testowej dla "zaufanych testerów" jako rozszerzenie do Chrome.
Oprócz agentów AI, Gemini 2.0 Flash to pierwsza wersja nowego modelu AI Google. To eksperymentalna (beta) wersja, która oferuje niższe opóźnienia, lepszą wydajność benchmarków oraz poprawione umiejętności rozumienia matematyki i programowania w porównaniu z modelami Gemini 1.0 i 1.5. Może również generować obrazy dzięki modelowi text-to-image Imagen 3 od Google DeepMind.
Gemini 2.0 Flash Experimental jest dostępny w wersji webowej dla wszystkich użytkowników i wkrótce pojawi się w mobilnej aplikacji Gemini. Użytkownicy, którzy chcą go przetestować, muszą wybrać Gemini 2.0 Flash Experimental z rozwijanego menu.
Deweloperzy mogą uzyskać dostęp do nowego modelu przez Google AI Studio oraz Vertex AI. Google potwierdził również, że w styczniu zaprezentuje więcej rozmiarów modelu Gemini 2.0.