Google DeepMind accélère l'IA générative pour les développeurs

D'après Google DeepMind (30 juin 2026 à 02h00)

Résumé

Google DeepMind dévoile Nano Banana 2 Lite, modèle d’images ultra-rapide et économique, et rend Gemini Omni Flash accessible aux développeurs pour la génération et l’édition vidéo.

Les faits

Google DeepMind annonce deux nouveautés pour faciliter l’expérimentation et la montée en charge des projets de médias génératifs : le modèle d’images Nano Banana 2 Lite et le modèle vidéo Gemini Omni Flash, tous deux intégrés à l’écosystème Gemini. Nano Banana 2 Lite est présenté comme « notre modèle d’image Gemini le plus rapide et le plus économique à ce jour au sein de la famille Nano Banana, conçu pour un haut débit, la vitesse et l’échelle ». Le modèle Nano Banana 2 Lite (gemini-3.1-flash-lite-image) est conçu pour la « génération rapide d’idées » et des « pipelines de développement à grande vitesse où la vitesse et le coût sont les principales contraintes ». Google DeepMind le recommande comme remplacement pour les développeurs utilisant la première version de Nano Banana (gemini-2.5-flash-image), en promettant « des avantages immédiats sur les principales dimensions de performance ». Sur le plan opérationnel, Nano Banana 2 Lite « délivre des sorties texte-vers-image en 4 secondes », ce qui le rend adapté au prototypage interactif et à la création de brouillons visuels rapides. Le modèle est présenté comme « un choix économique pour les développeurs concentrés sur la rédaction, l’idéation, la gestion des budgets opérationnels ou les usages à faible bande passante », avec un coût annoncé de « 0,034 dollar par image 1K ». Malgré un positionnement axé sur la vitesse, Google DeepMind souligne que Nano Banana 2 Lite « conserve une adhérence fiable aux prompts, une forte cohérence des personnages et un rendu lisible des textes dans l’image ». L’article décrit la « famille Nano Banana » : Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image) « conçu pour la vitesse » et « optimisé pour des flux de travail à très haut volume quasi temps réel » ; Nano Banana 2 (Gemini 3.1 Flash Image) comme « le cheval de bataille généraliste » offrant « le meilleur équilibre entre performance et coût » ; Nano Banana Pro (Gemini 3 Pro Image) « optimisé pour des cas d’usage complexes et professionnels » nécessitant un contrôle poussé et un raisonnement avancé ; enfin Nano Banana (Gemini 2.5 Flash Image) est qualifié de « modèle patrimonial » dont la mise à jour vers Nano Banana 2 Lite est recommandée « pour une meilleure qualité, des vitesses plus rapides et des coûts plus bas ». Nano Banana 2 Lite est disponible « aujourd’hui dans Google AI Studio, Gemini API et Gemini Enterprise Agent Platform » et commence à être déployé « dans les surfaces grand public de Google, y compris AI Mode dans Search, l’application Gemini et de nombreux autres produits ». L’extrait précise aussi qu’« en parallèle de son lancement sur les plateformes développeurs, Nano Banana 2 Lite arrive également sur les surfaces grand public de Google, y compris AI Mode dans Search, l’application Gemini, NotebookLM, Google Photos, Stitch, Google Flow et Google Ads ». Gemini Omni Flash est présenté comme « notre modèle de haute qualité et économique pour la génération vidéo et l’édition conversationnelle », désormais « disponible dans Google AI Studio, Gemini API et Gemini Enterprise Agent Platform pour la première fois ». L’article rappelle qu’à Google I/O, Gemini Omni Flash a été introduit comme « le modèle où le raisonnement multimodal de Gemini rencontre la génération et l’édition vidéo ». Le modèle Gemini Omni Flash (gemini-omni-flash-preview) est « en cours de déploiement auprès des développeurs via Gemini API et Google AI Studio », avec un support natif pour « la génération vidéo de haute qualité et l’édition conversationnelle à partir d’une combinaison d’entrées texte, image et vidéo ». Le prix de Gemini Omni Flash est détaillé : « ce modèle est tarifé de manière compétitive à 0,10 dollar par seconde de sortie vidéo, ce qui est identique à Veo 3.1 Fast ». Parmi ses points forts, Omni Flash « brille » dans plusieurs domaines : « édition vidéo conversationnelle » permettant de « peaufiner et éditer des vidéos en langage naturel » ; « référencement multimodal » pour « combiner des entrées comme des images, du texte et de la vidéo afin de maintenir le contrôle et la cohérence de la scène » ; « connaissance du monde réel », Omni s’appuyant sur « la connaissance de Gemini comme l’histoire, la biologie et la logique narrative pour construire des vidéos convaincantes » ; enfin la « synchronisation texte et action » permettant de « connecter texte et graphiques directement aux actions vidéo via des prompts simples ». Les limitations actuelles de Gemini Omni Flash sont explicitées : « Omni propose actuellement des générations vidéo de 10 secondes, avec des durées plus longues à venir bientôt » ; « le téléchargement de références audio et l’extension de scène ne sont pas encore pris en charge dans Gemini API pour ce modèle » ; enfin « des références vidéo jusqu’à 3 secondes de durée sont acceptées par le schéma d’API mais ne sont pas correctement » gérées pour l’instant.

Pourquoi c’est important

La mise sur le marché de Nano Banana 2 Lite et l’ouverture de Gemini Omni Flash aux développeurs marquent une étape stratégique dans l’offensive de Google DeepMind sur les médias génératifs. En proposant un modèle d’images ultra-rapide et peu coûteux, tout en conservant une qualité jugée fiable et une bonne adhérence aux prompts, l’entreprise cible les workflows intensifs qui exigent une latence très faible et un contrôle budgétaire serré. En parallèle, Gemini Omni Flash positionne l’offre vidéo de Google DeepMind sur des cas d’usage avancés d’édition conversationnelle et de génération multimodale, avec un tarif explicite de 0,10 dollar par seconde de vidéo et des capacités de synchronisation texte-action et de « connaissance du monde réel ». L’intégration conjointe de ces modèles dans Google AI Studio, Gemini API, Gemini Enterprise Agent Platform et plusieurs produits grand public comme l’application Gemini ou AI Mode dans Search crée un continuum entre prototypage rapide, déploiement industriel et expérience utilisateur, renforçant l’écosystème Gemini sur l’image et la vidéo.

Questions fréquentes

Qu’est-ce que Nano Banana 2 Lite ?

Nano Banana 2 Lite est le modèle d’images Gemini le plus rapide et le plus économique de la famille Nano Banana, conçu pour haut débit, vitesse et échelle.[3]

Combien coûte Nano Banana 2 Lite par image ?

Nano Banana 2 Lite est annoncé à 0,034 dollar par image en résolution 1K, avec une génération texte-vers-image en 4 secondes.[0]

Où Nano Banana 2 Lite est-il disponible ?

Il est disponible dans Google AI Studio, Gemini API et Gemini Enterprise Agent Platform, et déployé sur des surfaces grand public comme AI Mode dans Search et l’app Gemini.[3][0]

Quel est le prix de Gemini Omni Flash ?

Gemini Omni Flash est tarifé à 0,10 dollar par seconde de sortie vidéo, au même niveau que Veo 3.1 Fast.[0]

Quelles sont les limites actuelles de Gemini Omni Flash ?

Les vidéos générées sont limitées à 10 secondes, les références audio et l’extension de scène ne sont pas encore prises en charge, et les références vidéo de 3 secondes ne sont pas correctement gérées.[0]

Source

Google DeepMind

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.