Gemini Omni 3.5 : Google dévoile ses nouvelles IA multimodales

Google a officiellement dévoilé à l'occasion de la Google I/O 2026 deux nouveaux modèles d'intelligence artificielle : Gemini Omni 3.5 et Gemini 3.5. Ces avancées sont illustrées par neuf vidéos de démonstration, mettant en lumière leurs capacités multimodales inédites.
Des modèles conçus pour une interaction naturelle
Les vidéos publiées par Google montrent comment ces modèles gèrent simultanément du texte, des images, de l'audio et de la vidéo. Parmi les exemples, on observe la génération de réponses en temps réel à des questions complexes, la transcription et l'analyse de contenus audiovisuels, ou encore la création de résumés dynamiques à partir de flux multimédias.
Une approche centrée sur l'utilisateur
Contrairement aux solutions existantes, Gemini Omni 3.5 et Gemini 3.5 semblent privilégier une intégration fluide dans des outils du quotidien, comme les assistants vocaux ou les plateformes de collaboration. Google insiste sur leur capacité à comprendre des contextes variés, même en l'absence de données structurées.
Ces démonstrations, bien que techniques, laissent entrevoir des applications concrètes pour les professionnels comme pour le grand public, notamment dans les secteurs de l'éducation, du travail collaboratif ou du divertissement.
Source : Google – The Keyword (AI). Synthèse éditoriale assistée par IA — TechnoExpress.

