Google présente Gemini 2.0 : IA multimodale

Google présente Gemini 2.0 : IA multimodale

Google a récemment dévoilé Gemini 2.0, la toute dernière génération de son modèle d'intelligence artificielle. Ce modèle révolutionnaire prend désormais en charge la sortie multimodale d'images et d'audio, ainsi que l'intégration d'outils pour ce que l'on appelle l'ère agentique.

Les modèles d'IA agentiques sont des systèmes capables d'accomplir des tâches de manière autonome, tout en s'adaptant aux décisions. Imaginez des applications telles que l'automatisation des courses en ligne ou la planification d'un rendez-vous simplement à partir d'une demande.

Gemini 2.0 propose plusieurs agents qui peuvent vous assister dans divers domaines, allant des suggestions en temps réel dans des jeux comme Clash of Clans à la sélection de cadeaux et leur ajout à votre panier d'achat selon vos instructions.

Comme les autres agents d'IA, ceux de Gemini 2.0 affichent un comportement orienté vers des objectifs. Ils sont capables de créer une liste de tâches à accomplir et de les exécuter de manière autonome. Parmi les agents de Gemini 2.0 se trouve le projet Astra, conçu comme un assistant IA universel pour les téléphones Android avec un support multimodal intégré à Google Search, Lens et Maps.

Un autre agent expérimental, le Projet Mariner, peut naviguer de manière autonome dans un navigateur web. Mariner est actuellement disponible en version d'aperçu pour un groupe de testeurs de confiance, sous forme d’extension Chrome.

En dehors des agents d'IA, Gemini 2.0 Flash est la première version du nouveau modèle d’intelligence artificielle de Google. Actuellement en version expérimentale (bêta), il offre une latence réduite, une meilleure performance dans les benchmarks et une compréhension améliorée des mathématiques et de la programmation par rapport aux modèles Gemini 1.0 et 1.5. Il est également capable de générer des images grâce au modèle Imagen 3 de Google DeepMind, qui convertit le texte en image.

Gemini 2.0 Flash Experimental est accessible sur le web pour tous les utilisateurs et sera bientôt disponible sur l'application mobile Gemini. Les utilisateurs souhaitant tenter l'expérience doivent sélectionner l'option Gemini 2.0 Flash Experimental dans le menu déroulant.

Les développeurs ont également la possibilité d'accéder à ce nouveau modèle via Google AI Studio et Vertex AI. Google a également annoncé qu'il présentera de nouvelles tailles pour le modèle Gemini 2.0 en janvier prochain.