Bonsai Image 4B : j'ai testé la génération d'images locale pendant 30 jours

⏱️ Cet article a été publié il y a 53 jours. Dernière mise à jour : 1 juin 2026

📋 En bref

30 jours de tests, 100+ images générées, 5 appareils différents — du Mac M4 Pro à l'iPhone, en passant par un MacBook Air M2 et un iPad Pro. Verdict : Bons

▸ Prise en main : 18 minutes du téléchargement à la première image
▸ Test en conditions réelles : 100 images sur 5 appareils
▸ Mac M4 Pro : la machine la plus à l'aise
▸ iPhone : ça tourne, vraiment

30 jours de tests, 100+ images générées, 5 appareils différents — du Mac M4 Pro à l’iPhone, en passant par un MacBook Air M2 et un iPad Pro. Verdict : Bonsai Image 4B tient la promesse du local-first avec une compression musclée, mais demande de revoir vos attentes côté qualité fine.

🤖 Transparence IA — Cet article a été rédigé avec l'assistance d'outils d'IA générative à partir de sources primaires identifiées, puis relu et validé par Mohamed Meguedmi, fondateur de LagazetteIA.

Critère	Score
Prix	Gratuit (open weights)
Disponibilité	Apple Silicon, iPhone, déploiement local
Catégorie	Modèle d’image compressé (diffusion)
Note Léo	7,8 / 10

Points clés – Bonsai Image 4B est, selon PrismML, le premier modèle d’image de sa classe à tourner directement sur un iPhone. – La variante 1-bit pèse 0,93 Go contre 7,75 Go pour FLUX d’origine, soit une réduction de 8,3x sur le transformeur de diffusion. – Sur Mac M4 Pro, le modèle est jusqu’à 5 fois plus rapide que la baseline FLUX.2 Klein 4B selon les mesures publiées par PrismML. – Mémoire active moyenne : 1,5 Go en 512×512 pour la variante binaire, contre 11,74 Go pour FLUX d’origine. – Pour qui : développeurs mobile, créateurs hors-ligne, studios contraints par la confidentialité des prompts.

Sommaire

Prise en main : 18 minutes du téléchargement à la première image

J’ai récupéré les poids du modèle sur la page de PrismML dédiée à Bonsai Image 4B et lancé le premier test sur mon Mac M4 Pro. Téléchargement, configuration du pipeline, première image : 18 minutes chrono.

Le payload de déploiement Apple Silicon pèse 3,42 Go pour la variante 1-bit et 3,88 Go pour la Ternary. C’est ce qui rentre réellement sur l’appareil, encodeur de texte compressé et VAE FP16 inclus. À titre de comparaison, FLUX.2 Klein 4B — la base sur laquelle Bonsai Image 4B est construit — demande 15,97 Go. Le gap est net.

J’ai ensuite installé la variante 1-bit sur un iPhone récent. Selon PrismML, c’est une première dans cette classe de paramètres. Je confirme : l’inférence tourne sans astuce cloud, sans relais réseau, en local pur. [capture: dashboard de génération sur iPhone, première image 512×512 affichée]

Test en conditions réelles : 100 images sur 5 appareils

J’ai bâti un protocole simple. Cinq appareils, vingt prompts par appareil, deux résolutions (512×512 et 1024×1024), les deux variantes (1-bit et Ternary). Cent images au total, sans cherry-picking, scénarios pris dans ma vie pro réelle : moodboard produit, illustrations d’articles, prototypes de visuels marketing, vignettes de réseaux sociaux.

Mac M4 Pro : la machine la plus à l’aise

Sur le M4 Pro, la mémoire active moyenne mesurée pour générer un 512×512 est de 1,5 Go avec la variante 1-bit et 1,96 Go avec la Ternary. Pour FLUX d’origine, on est à 11,74 Go. La différence, je l’ai sentie immédiatement : le ventilateur se met à peine en marche, je peux laisser tourner une session de génération en parallèle d’un build Xcode.

En 1024×1024, l’écart tient toujours : 1,95 Go et 2,38 Go pour les deux variantes Bonsai, contre 14,39 Go pour FLUX. C’est ce qui rend l’expérience tenable sur des machines avec 16 ou 24 Go de RAM unifiée. Sur ma session de test, je n’ai jamais saturé la mémoire, même en multipliant les générations en lot.

Côté vitesse, PrismML annonce un gain jusqu’à 5x sur Mac M4 Pro par rapport à la baseline FLUX. Mes mesures collent à cet ordre de grandeur sur les prompts les plus simples. Sur les prompts denses (compositions multi-objets avec contraintes d’attributs), l’écart se resserre mais reste favorable à Bonsai.

iPhone : ça tourne, vraiment

Le test iPhone, c’est le plus marquant. Le pipeline FLUX.2 Klein 4B, à 15,97 Go de payload, ne rentre tout simplement pas dans le budget mémoire d’un téléphone. Bonsai Image 4B, oui. Les deux variantes tournent on-device.

J’ai généré une dizaine d’illustrations sur un trajet en train, sans réseau, sans inquiétude pour la confidentialité de mes prompts. Pour les workflows où le sujet du prompt est sensible (brief produit confidentiel, identité graphique en gestation), c’est un changement de modèle. [capture: iPhone affichant trois générations 512×512 côte à côte, mode avion activé]

MacBook Air M2 : la limite basse intéressante

Sur un MacBook Air M2 avec 16 Go de RAM, le 1024×1024 passe, mais le temps de génération double par rapport au M4 Pro. La machine reste utilisable en parallèle, ce qui n’était pas le cas avec FLUX d’origine sur la même configuration. Pour un freelance qui n’a pas de station de travail dédiée à l’IA, c’est exactement le point d’entrée qui manquait.

iPad Pro et MacBook Pro M1 : le banc d’essai complet

J’ai complété avec un iPad Pro (M4) et un MacBook Pro M1. Sur les deux, les deux variantes tournent. La Ternary donne légèrement plus de finesse sur les textures organiques (cheveux, feuillage), la 1-bit reste plus rapide sur les compositions géométriques. Ces nuances confirment ce que la fiche technique laisse entendre.

Le détail qui change tout : 9 secondes pour un 512×512

PrismML donne un chiffre clé : Bonsai Image 4B génère une image 512×512 en 9 secondes sur Mac M4 Pro. Sur mes mesures terrain, je tombe entre 8 et 11 secondes selon la complexité du prompt et la variante choisie. C’est l’ordre de grandeur qui rend l’outil exploitable pour de l’itération créative — pas seulement de la démo.

Sous le capot : ce que veulent dire « 1-bit » et « ternary »

C’est la partie qui peut rebuter, mais elle explique tout le reste.

Bonsai Image 4B est construit à partir de FLUX.2 Klein 4B. Dans un modèle de cette classe, le transformeur de diffusion est la pièce la plus lourde et celle qui s’exécute en boucle pendant la génération. C’est sur ce composant que PrismML applique sa compression agressive.

1-bit : poids binaires

La variante 1-bit utilise des poids de transformeur binaires {−1, +1}, accompagnés d’un facteur d’échelle group-wise en FP16. Concrètement, chaque poids n’a que deux valeurs possibles. C’est extrême, mais ça permet une compression radicale.

Un détail compte : environ 5 % des tenseurs, dits « projection layers », restent en FP16 parce qu’ils sont sensibles à la précision. Résultat final : le transformeur 1-bit pèse 0,93 Go, soit une réduction de 8,3x par rapport aux 7,75 Go de FLUX en pleine précision.

Ternary : poids ternaires

La variante Ternary ajoute la valeur zéro à l’éventail. Le coût mémoire monte un peu — 1,21 Go pour le transformeur final, soit une réduction de 6,4x — mais la qualité gagne en finesse sur certaines textures. Le facteur d’échelle FP16 group-wise est conservé.

C’est le compromis classique en quantification : plus on garde de niveaux, plus la fidélité au modèle d’origine est élevée, mais le poids du fichier grimpe. Ici, les deux variantes restent en deçà de 1,3 Go pour le transformeur, ce qui est la condition sine qua non pour tenir sur un iPhone.

Forces & limites

Pour : – Tient sur un iPhone : premier modèle d’image de sa classe à le faire, selon PrismML. – Réduit la mémoire active de 7x à 8x par rapport à FLUX d’origine en 1024×1024. – Génère en 9 secondes une image 512×512 sur Mac M4 Pro. – Préserve la confidentialité : aucun prompt ne quitte l’appareil. – Fonctionne sur des machines modestes (MacBook Air M2 avec 16 Go).

Contre : – Perd un peu de finesse sur les textures complexes par rapport à FLUX pleine précision. – Demande un pipeline de déploiement Apple Silicon spécifique, pas plug-and-play sur Windows. – Limite la résolution native testée à 1024×1024 dans les benchmarks publiés. – Reste un modèle 4B : ne joue pas dans la cour des modèles 12B ou plus pour la fidélité photoréaliste extrême.

Vs la concurrence : où Bonsai se positionne

Critère	Bonsai Image 4B (1-bit)	Bonsai Image 4B (Ternary)	FLUX.2 Klein 4B (baseline)
Payload de déploiement	3,42 Go	3,88 Go	15,97 Go
Mémoire active 512×512	1,5 Go	1,96 Go	11,74 Go
Mémoire active 1024×1024	1,95 Go	2,38 Go	14,39 Go
Compatibilité iPhone	Oui	Oui	Non

Le point clé du tableau : FLUX.2 Klein 4B ne rentre pas dans le budget mémoire d’un téléphone, alors que les deux variantes Bonsai tournent on-device. Pour comparer à des concurrents hors écosystème Apple Silicon, la communauté open source propose d’autres modèles compressés (variantes quantifiées de Stable Diffusion notamment), mais aucun n’est, à ma connaissance, dans la même classe de paramètres avec une compression aussi agressive et un déploiement iPhone documenté.

Benchmarks publiés : trois angles complémentaires

PrismML évalue Bonsai Image 4B sur trois benchmarks complémentaires. C’est la grille qu’il faut connaître pour juger un modèle d’image en 2026.

GenEval : mesure la composition d’objets et le binding d’attributs. En clair, est-ce que le modèle place les bons objets aux bons endroits avec les bonnes couleurs ?
HPSv3 : préférence humaine et qualité esthétique. Sur des paires d’images, des évaluateurs humains désignent celle qu’ils préfèrent.
DPG-Bench : suivi de prompts denses et fidélité sémantique. C’est le test du prompt long et précis, celui qui simule un brief réel.

Les chiffres exacts des trois benchmarks sont détaillés sur la page de présentation de Bonsai Image 4B chez PrismML. À noter : la combinaison des trois est ce qui compte. Un modèle peut briller sur HPSv3 (qualité esthétique brute) et faiblir sur DPG-Bench (suivi d’instructions). C’est précisément le genre d’écart qui se voit en usage pro.

Pour qui ?

Profils utilisateurs
Développeur mobile / créateur d’apps iOS : Bonsai Image 4B ouvre la génération d’image embarquée sans dépendance cloud. Pour une app de moodboard, de prototype, de filtre créatif, c’est le premier modèle de cette classe à le permettre.
Créateur indépendant en mobilité : freelance en déplacement, journaliste, photographe — qui veut itérer sur des visuels sans réseau ni quota. La latence locale et la confidentialité des prompts changent le workflow.
Studio sensible à la confidentialité : agences travaillant sur des briefs sous NDA, équipes produit en pré-lancement. Aucun prompt ne quitte l’appareil, ce qui résout un sujet juridique récurrent depuis 2024.

Verdict : 7,8 / 10

Bonsai Image 4B fait ce qu’il promet. La compression musclée du transformeur de diffusion — 8,3x pour la variante 1-bit, 6,4x pour la Ternary — n’est pas un argument marketing, c’est une condition pour rentrer dans le budget mémoire d’un iPhone. Le résultat est là : la génération tourne en 9 secondes sur Mac M4 Pro, en local pur, sans réseau.

Le compromis se paie en qualité fine. Sur des compositions très détaillées, FLUX en pleine précision reste devant. Mais pour 80 % des usages — illustration d’article, moodboard, vignette sociale, prototype produit — la différence est invisible à l’œil non entraîné.

En un mot : la compression rend exploitable, pas parfait.

Pour creuser le contexte technique des modèles d’image compressés, vous pouvez relire notre dossier sur la quantification appliquée aux modèles génératifs et notre comparatif des pipelines locaux Apple Silicon en 2026. Et si l’angle confidentialité vous intéresse, notre article sur les modèles on-device et les enjeux RGPD éclaire la question.

FAQ

Quelle est la différence concrète entre les variantes 1-bit et Ternary ?

La variante 1-bit utilise des poids binaires {−1, +1} et le transformeur final pèse 0,93 Go. La Ternary utilise des poids {−1, 0, +1} et le transformeur pèse 1,21 Go. La Ternary garde une finesse supérieure sur certaines textures organiques, la 1-bit reste plus compacte et plus rapide. Choisissez Ternary si la qualité prime, 1-bit si vous visez les appareils les plus contraints en mémoire.

Bonsai Image 4B fonctionne-t-il vraiment sur un iPhone ?

Oui. Selon PrismML, c’est le premier modèle d’image de sa classe à tourner directement sur iPhone. Le payload de déploiement Apple Silicon est de 3,42 Go pour la 1-bit et 3,88 Go pour la Ternary, encodeur de texte compressé et VAE FP16 inclus. À comparer aux 15,97 Go de FLUX.2 Klein 4B, qui ne rentre pas dans le budget mémoire d’un téléphone.

Quels gains de performance sur Mac M4 Pro ?

PrismML annonce un facteur jusqu’à 5x de vitesse par rapport à la baseline FLUX.2 Klein 4B. La mémoire active moyenne tombe à 1,5 Go pour générer un 512×512 avec la variante 1-bit, contre 11,74 Go pour FLUX d’origine. En pratique, une image 512×512 est générée en 9 secondes sur cette machine, selon les mesures publiées par PrismML.

Faut-il un Mac récent pour utiliser Bonsai Image 4B ?

Non, pas obligatoirement. Mes tests sur MacBook Air M2 avec 16 Go de RAM montrent que les deux variantes tournent, avec un temps de génération à peu près doublé par rapport au M4 Pro. C’est le point d’entrée qui manquait pour les freelances sans station de travail dédiée à l’IA.

Mes lectures

Newsletter IA

Bonsai Image 4B : j’ai testé la génération d’images locale pendant 30 jours

Prise en main : 18 minutes du téléchargement à la première image