Le computer use de GPT-5.4 te permet de déléguer des tâches complètes à une IA qui contrôle ton écran : cliquer, taper, naviguer entre applications. Ce guide t’explique comment l’activer, le configurer et l’utiliser concrètement pour automatiser tes workflows quotidiens sans écrire une seule ligne de code.
Points clés
- Disponible sur ChatGPT Plus, Team, Pro et Enterprise — Pas d’accès sur le plan gratuit.
- Fonctionne sur Mac et Windows — Via l’application desktop ChatGPT ou l’API OpenAI.
- Contexte de 1 million de tokens — L’agent peut suivre des workflows longs sans perdre le fil.
- Permissions granulaires — Tu contrôles quelles applications l’agent peut utiliser.
Étape 1 : activer le computer use
Ouvre l’application desktop ChatGPT (pas la version navigateur — le computer use nécessite un accès au système d’exploitation). Va dans Paramètres → Fonctionnalités bêta → Computer Use et active l’option. L’application te demandera d’accorder les permissions d’accessibilité : c’est ce qui permet à GPT-5.4 de voir ton écran et d’interagir avec les fenêtres.
Sur Mac, tu devras aller dans Réglages Système → Confidentialité → Accessibilité et autoriser ChatGPT. Sur Windows, accepte la boîte de dialogue UAC qui apparaît au premier lancement. Sans ces permissions, l’agent pourra discuter avec toi mais pas contrôler ton écran.
Étape 2 : configurer les permissions
C’est l’étape la plus importante pour ta sécurité. Dans les paramètres du computer use, tu trouveras une liste d’applications avec trois niveaux d’accès : lecture seule (l’agent voit mais ne touche pas), clic (il peut cliquer mais pas taper) et accès complet (clic + frappe + navigation). Par défaut, commence par tout mettre en lecture seule et n’accorde l’accès complet qu’aux applications que tu souhaites automatiser.
Conseil : n’accorde jamais l’accès complet à ton navigateur principal si tu y as des sessions bancaires ou des mots de passe enregistrés. Utilise un profil navigateur dédié ou un navigateur secondaire pour les tâches automatisées. Selon les premiers retours d’entreprise rapportés par OpenAI, la configuration par défaut est trop permissive pour un usage en production.
Étape 3 : tes premiers workflows
Voici trois exemples concrets pour te lancer. Workflow 1 : extraction de données — Dis à l’agent « Ouvre le tableur clients.xlsx, copie la colonne e-mail dans un nouveau fichier et envoie-le par mail à [adresse] ». L’agent ouvre le fichier, sélectionne les données, crée un nouveau document et compose l’e-mail.
Workflow 2 : veille concurrentielle — « Va sur [site concurrent], capture les prix de leurs 10 produits principaux et crée un tableau comparatif dans Google Sheets ». L’agent navigue, collecte les informations et les structure. Workflow 3 : publication sociale — « Prends le dernier article de mon blog, rédige 3 posts LinkedIn de tonalités différentes et programme-les dans Buffer ». En moyenne, ces tâches prennent entre 2 et 5 minutes contre 15 à 30 minutes manuellement.
Les pièges à éviter
Le computer use n’est pas infaillible. Trois erreurs courantes : les pop-ups inattendues (une notification système peut bloquer l’agent), les interfaces dynamiques (les sites avec beaucoup d’animations ou de lazy loading ralentissent la reconnaissance visuelle) et les timeouts (les tâches longues peuvent être interrompues après 10 minutes d’inactivité apparente). Active le mode « Ne pas déranger » sur ton système avant de lancer un workflow automatisé.
Autre point important : surveille toujours l’agent la première fois que tu lui confies un workflow. Comme tout agent autonome — et c’est un sujet que l’Europe encadre activement — il peut prendre des décisions inattendues face à des situations imprévues.
Computer use vs MCP : quelle approche choisir
Le computer use et le protocole MCP résolvent le même problème (connecter l’IA à des applications) mais de manières radicalement différentes. Le MCP utilise des connecteurs API structurés : plus fiable, plus rapide, mais nécessite une intégration technique. Le computer use passe par la vision et le clic : universel (fonctionne avec n’importe quelle application), mais plus lent et plus fragile. Pour tes workflows critiques, préfère le MCP quand un connecteur existe. Pour tout le reste, le computer use est ton couteau suisse.
FAQ
Le computer use fonctionne-t-il sur mobile ?
Non, pas en mars 2026. Le computer use nécessite l’application desktop ChatGPT sur Mac ou Windows. Aucune version iOS ou Android n’est prévue à court terme.
L’agent peut-il voir mes mots de passe ?
Techniquement, oui — il voit tout ce qui s’affiche à l’écran. C’est pourquoi il est crucial de limiter ses permissions et d’utiliser un profil navigateur dédié sans gestionnaire de mots de passe actif.
Combien ça coûte en tokens API ?
Un workflow de 5 minutes consomme environ 50 000 à 100 000 tokens (screenshots + raisonnement). À 2,50 $/MTok en entrée, cela représente entre 0,12 $ et 0,25 $ par workflow via l’API. Via ChatGPT Plus, c’est inclus dans l’abonnement à 20 $/mois.



