- ▸ Ce qui change concrètement à compter du déploiement
- ▸ Les faits : évaluation du nouveau modèle
- ▸ Décryptage : l'apport d'Antigravity dans la recherche
- ▸ Qui est concerné par cette mise à jour
Mise à jour effective dès aujourd’hui. NotebookLM, l’outil d’analyse documentaire de Google, intègre désormais Gemini 3.5 et Antigravity pour renforcer ses capacités de recherche et d’exécution de code. Selon les évaluations internes communiquées par Google, le service affiche un taux de victoire moyen de 65 % face à son modèle précédent. Les utilisateurs professionnels disposent immédiatement des nouvelles fonctionnalités, sans action de migration requise.
Points clés – Bascule de NotebookLM sur Gemini 3.5 Flash, présenté comme plus rapide et plus efficient sur les coûts de jetons. – Intégration d’Antigravity : l’assistant peut désormais écrire et exécuter du code via un « ordinateur cloud » interne doté de plus de 100 compétences logicielles. – Taux de victoire moyen de 65 % du nouveau modèle face à Gemini 3.1 dans les tests côte à côte menés par Google. – Évaluation structurée autour de cinq « top five core evaluation dimensions » : précision, multilinguisme, analyse de gros documents, génération et recherche avancée. – Support étendu de nouveaux types de fichiers et intégration web simplifiée pour les sources externes.
Ce qui change concrètement à compter du déploiement
NotebookLM n’est plus animé par la même génération de modèles. Google a basculé son service d’analyse documentaire sur Gemini 3.5, accompagné de l’environnement d’exécution Antigravity. Cette double mise à jour modifie deux choses pour l’utilisateur : la qualité des synthèses produites à partir de sources téléversées, et la capacité de l’outil à exécuter des tâches complexes incluant la rédaction et l’exécution de code. Aucun changement d’interface ni d’abonnement n’est imposé pour en bénéficier.
Ce qui nous amène à examiner précisément la méthodologie qui a permis à Google de revendiquer un saut de performance.
Les faits : évaluation du nouveau modèle
Google indique avoir conduit des évaluations côte à côte entre la version sortante de NotebookLM, motorisée par Gemini 3.1, et la nouvelle version sous Gemini 3.5. L’éditeur revendique un taux de victoire moyen de 65 % en faveur du nouveau modèle. Cette mesure se présente comme une moyenne agrégée sur plusieurs axes d’évaluation, sans publication détaillée des protocoles.
Les axes retenus par Google sont décrits comme « top five core evaluation dimensions ». Selon les éléments rapportés par Ars Technica le 8 juin 2026, ces cinq dimensions couvrent la précision et la qualité des réponses, le support multilingue, l’analyse de grands documents, la création de documents, ainsi que la recherche avancée. L’éditeur ne précise pas le poids relatif de chaque dimension dans la moyenne finale, ni la nature exacte des jeux de test mobilisés.
La mention « Flash » dans le nom complet du modèle déployé — Gemini 3.5 Flash — n’est pas anodine. Cette famille de modèles est positionnée par Google comme la branche optimisée pour le débit et le coût par jeton, par opposition aux variantes Pro orientées qualité maximale. Le choix d’embarquer la déclinaison Flash dans NotebookLM traduit une recherche d’équilibre entre temps de réponse, capacité à traiter de gros corpus et économie de ressources.
Pour comprendre — « taux de victoire » Un taux de victoire (« win rate ») compare deux modèles sur un même jeu de prompts. Pour chaque prompt, des évaluateurs — humains ou automatisés — désignent la meilleure réponse. Un taux de 65 % signifie que le nouveau modèle a été préféré dans environ deux comparaisons sur trois. Sans publication des prompts, du nombre d’évaluations et du profil des juges, l’indicateur reste interne.
Ce qui nous amène à comprendre ce que recouvre la seconde brique technique de cette mise à jour, Antigravity.
Décryptage : l’apport d’Antigravity dans la recherche
Antigravity n’est pas un nouveau modèle. C’est un environnement d’exécution qui s’adosse à Gemini 3.5 et confère à NotebookLM la capacité d’écrire et d’exécuter du code pour appuyer les objectifs de recherche d’un utilisateur. Google décrit cette brique comme un « ordinateur cloud » interne, doté de plus de 100 compétences logicielles activables pour construire des flux de travail complexes. En pratique, l’assistant peut décomposer une question en étapes, déclencher l’écriture d’un script, l’exécuter, puis intégrer le résultat dans sa réponse finale.
Cette logique change la nature des tâches qu’on peut confier à NotebookLM. Jusqu’ici, l’outil agissait principalement comme un moteur de synthèse : on lui soumettait un corpus — documents, pages web — et on obtenait des résumés, des extraits, des réponses contextualisées. Avec Antigravity, l’outil devient capable d’opérations actives : extraction tabulaire avec retraitement, comparaison structurée entre plusieurs documents, génération d’artefacts dérivés des sources.
Pour comprendre — « compétence logicielle » Dans le vocabulaire utilisé par Google, une compétence logicielle désigne une fonctionnalité unitaire que l’assistant peut mobiliser : lire un fichier, exécuter un script Python, requêter un format particulier, manipuler un tableau. Le chiffre de plus de 100 compétences renvoie au catalogue d’actions disponibles à l’orchestrateur, et non au nombre de modèles distincts.
L’arrivée d’un ordinateur cloud interne soulève toutefois plusieurs questions de gouvernance. L’exécution de code dans un environnement délégué pose la question des données en transit, de l’isolement entre sessions utilisateurs, et de l’auditabilité des actions menées. Google n’a pas, à ce jour, publié de documentation technique détaillée précisant le périmètre d’exécution, les bibliothèques disponibles, ou les éventuelles limites d’usage pour les abonnements grand public et professionnels.
Pour la pratique de la recherche documentaire, cette évolution rapproche NotebookLM des outils d’analyse assistée qu’on commence à voir émerger autour des modèles agentiques. L’utilisateur passe d’une logique « pose une question, lis la réponse » à une logique « formule un objectif, supervise l’exécution ». La supervision reste indispensable : l’outil produit des artefacts, c’est à l’utilisateur de vérifier la fidélité aux sources.
Cette montée en capacité concerne d’abord les profils habitués à des charges de travail documentaires lourdes. Mais elle redessine plus largement le périmètre fonctionnel de l’outil. Ce qui nous amène à identifier précisément les acteurs concernés.
Qui est concerné par cette mise à jour
La mise à jour est appliquée par défaut. Aucun utilisateur n’a à activer manuellement Gemini 3.5 ou Antigravity pour en bénéficier. Trois segments d’utilisateurs sont impactés de façon distincte.
Les utilisateurs individuels — chercheurs, étudiants, journalistes, analystes — voient leur outil de synthèse documentaire passer à un modèle annoncé comme plus performant et capable d’opérations enrichies. L’élargissement du support à de nouveaux types de fichiers, combiné à une intégration web simplifiée pour les sources externes, réduit le travail de préparation des corpus. La courbe d’apprentissage reste limitée tant qu’on s’en tient aux usages de synthèse classique.
Les équipes en entreprise sont concernées au double titre des coûts et de la conformité. Le positionnement Flash du modèle déployé est présenté par Google comme une optimisation pour les organisations sensibles au coût par jeton. À usage équivalent, les charges de travail répétitives — extraction documentaire récurrente, traitement de corpus volumineux, génération de notes de synthèse — devraient mécaniquement coûter moins. La contrepartie : il convient de mesurer, et non de présumer, ce gain sur les usages internes réels.
Pour les directions juridiques et conformité, l’introduction d’un ordinateur cloud interne capable d’exécuter du code mérite un examen documentaire. Les processus d’évaluation des risques liés à l’IA, déjà engagés dans les organisations soumises à l’AI Act, doivent intégrer cette nouvelle surface fonctionnelle. La question n’est pas de savoir si l’outil est utilisable, mais à quelles conditions de traçabilité.
Les développeurs et équipes data trouvent dans l’intégration d’Antigravity un cas d’usage spécifique. La capacité d’écrire et d’exécuter du code à partir de sources fournies se prête à des analyses ad hoc — exploration d’un dataset, prototypage rapide, vérification d’hypothèse — sans sortir de l’environnement NotebookLM. Ce périmètre reste cependant distinct des environnements de développement intégrés à part entière.
Enfin, les éditeurs de contenu et organisations productrices de sources voient leur matériel devenir potentiellement plus exploitable : meilleur traitement des gros documents, support multilingue renforcé. Ce qui n’épuise pas la question, ouverte, des modalités d’usage commercial de contenus tiers chargés dans l’outil.
Ce qui nous amène à examiner les limites de la démonstration faite par Google sur la performance.
Analyse contradictoire : un protocole d’évaluation peu détaillé
Le chiffre de 65 % de taux de victoire est avantageux pour Google. Il mérite cependant d’être lu avec précaution. L’éditeur reste, comme le souligne Ars Technica, relativement vague sur la nature exacte des tests menés. La référence aux « top five core evaluation dimensions » — précision, multilinguisme, analyse de gros documents, création de documents, recherche avancée — donne un cadre, mais ne livre ni la composition des jeux de test, ni le profil des évaluateurs, ni la méthode d’agrégation des cinq axes en une moyenne unique.
En l’absence de protocole publié, le chiffre vaut comme indication d’orientation, pas comme preuve indépendante de performance. Plusieurs questions restent ouvertes : la marge d’erreur statistique, la sensibilité du résultat au choix des prompts, la part éventuelle d’évaluation automatisée par un autre modèle Gemini — pratique courante mais dont les biais sont documentés dans la littérature académique. L’évaluation indépendante par des tiers, ou la mise à disposition d’un jeu de tests reproductible, permettrait de consolider l’affirmation.
À l’inverse, il faut reconnaître que l’industrie ne dispose pas, à ce jour, d’un référentiel public unifié pour évaluer un outil de synthèse documentaire dans les cinq dimensions retenues. La publication par Google de ses propres axes d’évaluation a au moins le mérite de rendre lisible la grille qu’il s’applique à lui-même. Les utilisateurs peuvent confronter cette grille à leurs propres cas d’usage.
Ce qui nous amène aux questions pratiques que se posent les premiers utilisateurs.
FAQ : questions pratiques sur NotebookLM
Gemini 3.5 est-il plus cher à utiliser ?
Selon les éléments communiqués par Google, le déploiement repose sur Gemini 3.5 Flash, présenté comme la déclinaison optimisée en termes d’efficience par jeton. Pour les utilisateurs grand public, l’expérience reste inchangée d’un point de vue tarifaire. Pour les organisations consommant des charges importantes via l’écosystème Google, le positionnement Flash vise à contenir les coûts à qualité comparable.
Qu’est-ce qu’Antigravity dans ce contexte ?
Antigravity est la brique qui dote NotebookLM d’un « ordinateur cloud » interne. Elle permet à l’assistant d’écrire et d’exécuter du code pour soutenir un objectif de recherche, en mobilisant plus de 100 compétences logicielles. Ce n’est pas un modèle de langage, mais une couche d’exécution adossée à Gemini 3.5, qui élargit le périmètre d’actions possibles au-delà de la simple synthèse de texte.
Quels types de fichiers puis-je analyser désormais ?
NotebookLM bénéficie d’un support étendu à de nouveaux types de fichiers, en complément des documents et pages web déjà pris en charge. L’intégration web est par ailleurs simplifiée pour ingérer des sources externes. Google n’a pas publié de liste exhaustive des nouveaux formats supportés à ce jour ; les utilisateurs ont intérêt à vérifier directement dans l’interface les extensions reconnues.
Calendrier : ce qui reste à observer
La bascule est effective immédiatement. À court terme, les utilisateurs disposent de la nouvelle version sans manipulation. Trois jalons méritent attention dans les semaines à venir : la publication éventuelle, par Google, d’un protocole d’évaluation détaillé venant étayer le chiffre des 65 % ; la documentation technique précisant les compétences logicielles activables par Antigravity et les éventuelles limites par profil d’abonnement ; les premiers retours d’usage en environnement professionnel, qui permettront de mesurer le gain réel sur des corpus métiers complexes.
En résumé – NotebookLM bascule sur Gemini 3.5 Flash et l’environnement Antigravity, sans action requise des utilisateurs. – Google annonce un taux de victoire moyen de 65 % face au modèle précédent, sur cinq axes d’évaluation internes. – Antigravity apporte un « ordinateur cloud » avec plus de 100 compétences logicielles pour exécuter du code. – Le protocole d’évaluation reste peu détaillé : le chiffre de 65 % vaut comme indication, pas comme preuve indépendante. – L’élargissement aux nouveaux formats de fichiers et l’intégration web simplifiée concernent en premier lieu les usages documentaires intensifs.
Reste une question ouverte : la généralisation d’environnements d’exécution de code embarqués dans les outils d’analyse documentaire — au-delà du seul cas NotebookLM — appelle une réflexion plus large sur les obligations de traçabilité, en particulier pour les organisations soumises à l’AI Act. L’arrivée d’Antigravity dans un produit grand public en accélère l’urgence.



