Le démonstration n'avait pas d'interaction vocale et ne se déroulait pas en temps réel. Ce manque d'immédiateté et d'interaction rendait-il l'expérience moins immersive ?

Comme vous le savez sans doute, la firme américaine Google compte énormément sur son propre concurrent de GPT-4, rebaptisé Gemini. Le géant californien est allé jusqu’à mettre en scène certaines parties de sa récente vidéo de démonstration, une manœuvre qui suscite aujourd’hui des interrogations.

Selon une opinion publiée par Bloomberg, Google reconnaît que pour sa vidéo intitulée “Hands-on with Gemini : Interacting with multimodal AI”, non seulement elle a été montée pour accélérer les résultats, mais surtout, l’interaction vocale suggérée entre l’utilisateur humain et l’IA n’était en réalité pas réelle.

En fait, la démonstration a été réalisée “en utilisant des images fixes tirées des séquences filmées et des textes pour lancer l’action”, plutôt que d’avoir Gemini qui réagit ou prédit un dessin ou un changement d’objets sur la table en temps réel.

Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0

We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP

— Oriol Vinyals (@OriolVinyalsML) December 7, 2023