Faire tourner un modèle de langage (LLM) directement sur sa machine séduit de plus en plus : confidentialité des données, absence d’abonnement, fonctionnement hors-ligne et liberté de tester des modèles open source. Mais un portable « puissant » au sens jeu vidéo ou bureautique n’est pas forcément taillé pour cet usage. Voici les critères concrets à regarder avant d’investir, sans promesses irréalistes.
La mémoire vidéo (VRAM) avant tout
C’est le critère numéro un, et de loin. Pour générer du texte à une vitesse confortable, le modèle doit idéalement tenir entièrement dans la mémoire du GPU. La taille d’un modèle dépend de son nombre de paramètres et de sa quantification (la compression appliquée aux poids). En pratique, un modèle de quelques milliards de paramètres quantifié se loge dans une poignée de gigaoctets, tandis que les modèles plus ambitieux réclament beaucoup plus.
Concrètement, plus vous avez de VRAM, plus vous pouvez charger de gros modèles, garder un contexte long (la « mémoire » de la conversation) et éviter que le système ne déporte une partie des calculs sur la RAM classique, ce qui s’accompagne d’un effondrement de la vitesse. Sur un portable PC, la VRAM est fixe et soudée : impossible de l’étendre après l’achat. Visez donc le maximum que votre budget permet, car c’est ce chiffre qui déterminera ce que vous pourrez exécuter pendant les années à venir.
RAM, processeur et stockage : le reste de l’équation
La RAM système joue un rôle de complément. Quand un modèle dépasse la VRAM disponible, une partie peut être déchargée vers la RAM : c’est plus lent, mais cela permet parfois de faire tourner un modèle qui ne rentrerait pas autrement. Prévoyez une marge confortable au-delà de ce que réclame votre système d’exploitation, d’autant que les outils d’inférence locaux et votre navigateur consomment aussi.
Le processeur compte moins que le GPU pour la génération pure, mais il intervient au chargement du modèle et lors du traitement initial du contexte. Côté stockage, privilégiez un SSD NVMe rapide et généreux : les fichiers de modèles pèsent facilement plusieurs gigaoctets chacun, et on en accumule vite plusieurs. Un disque à moitié plein dès le départ devient vite frustrant.
Le refroidissement, l’angle mort à ne pas négliger
Un LLM sollicite le GPU de façon intense et prolongée, bien différemment d’un pic de quelques secondes. Sur un châssis fin et mal ventilé, la machine atteint vite sa limite thermique et réduit ses fréquences pour ne pas surchauffer : c’est le throttling, qui fait chuter les performances après quelques minutes. Un portable réellement adapté dispose d’un système de dissipation sérieux, de plusieurs ventilateurs et d’un mode de performance accessible. C’est un critère souvent ignoré dans les fiches techniques, mais déterminant pour une utilisation soutenue. Attendez-vous aussi à du bruit et à une autonomie réduite : l’inférence locale est rarement un exercice silencieux et nomade.
Portable PC à carte dédiée ou MacBook à mémoire unifiée ?
Deux philosophies s’affrontent. Côté PC, les portables à GPU dédié de type RTX offrent une VRAM rapide et un large écosystème logiciel optimisé pour ce matériel. L’inconvénient : cette VRAM est généralement plus limitée en quantité, et les châssis performants sont volumineux, chauds et énergivores.
Côté Apple, les MacBook à puce de la gamme M reposent sur une mémoire unifiée partagée entre processeur et GPU. L’avantage est considérable : un modèle configuré avec beaucoup de mémoire peut allouer une part importante de celle-ci au LLM, ce qui permet de charger des modèles que peu de portables PC encaissent, le tout dans un format silencieux et endurant. En contrepartie, la bande passante mémoire et l’écosystème logiciel diffèrent, et les configurations très dotées en mémoire grimpent rapidement en prix.
Le bon arbitrage dépend donc de votre usage : si vous visez les plus gros modèles dans un format transportable et discret, la mémoire unifiée d’un MacBook bien doté est redoutable. Si vous privilégiez la vitesse brute, la compatibilité logicielle et un budget contenu sur des modèles de taille moyenne, un portable RTX reste pertinent. Dans tous les cas, raisonnez d’abord en quantité de mémoire accessible au GPU, puis en refroidissement : ce sont ces deux facteurs, plus que la marque, qui décideront de votre expérience au quotidien.
Notre sélection
PLAN
PLAN



