Les générateurs d’images par IA les plus puissants (août 2024)

L’IA générative connaît actuellement un essor sans précédent, en particulier dans le domaine de la génération d’images. En tapant seulement une invite textuelle et en réglant quelques paramètres, vous obtenez une image ! Pas mal non ? Mais les performances des générateurs text-to-image ne sont pas les mêmes. De nouvelles versions apparaissent de plus en plus. Pour vous aider à choisir l’outil adapté à vos exigences, Artificial Analysis a présenté Text to Image Arena, un classement des 10 outils de création d’images par IA les plus performants en août 2024…
Text to Image Arena d’Artificial Analysis, qu’est-ce que c’est ?
Ce classement Text to Image Arena est probablement inspiré de la Chatbot Arena. Il est basé sur un système de duels entre deux modèles de génération d’images par IA dont l’identité est dissimulée. La plateforme Artificial Analysis a donc demandé à des internautes de comparer deux outils anonymisés.
Les participants doivent ensuite indiquer l’outil qui a répondu le mieux à leur requête. Chaque modèle est ainsi noté avec un score Elo qui peut changer selon ses performances. D’après l’équipe d’Artificial Analysis, ce classement est mis à jour toutes les heures.
Grâce à cette méthode d’évaluation objective, l’on obtient des résultats fiables. Les utilisateurs particuliers ou professionnels (développeurs, graphistes…) peuvent s’y référer pour choisir le générateur d’images par IA le mieux adapté à leurs besoins.
Top 10 des générateurs d’images par IA les plus efficaces au mois d’août dernier :
- Flux.1 [pro] avec un score Elo de 1 151
- Ideogram v2 avec un score Elo de 1 130
- Midjourney v6.1 avec un score Elo de 1 126
- Flux.1 [dev] avec un score Elo de 1 118
- Midjourney v6 avec un score Elo de 1 112
- Stable Diffusion 3 Large avec un score Elo 1 098
- Flux.1 [schnell] avec un score Elo 1 091
- Playground v2.5 avec un score Elo 1 046
- DALL E 3 HD avec un score Elo de 1 041
- DALL E 3 avec un score Elo de 1 023
Flux.1 a décroché la première place
Black Forest Labs, une jeune entreprise européenne, a fait une entrée spectaculaire sur le marché de l’IA générative. Elle a lancé au mois d’août dernier son innovation Flux.1, une suite de modèles text-to-images avancés.
Dès sa sortie, l’un de ses modèles, Flux.1 [pro], est arrivé directement en première position du classement Text to Image Arena. Ce nouvel outil d’IA générative, choisi par X pour alimenter son assistant conversationnel Grok, a beaucoup convaincu les utilisateurs en termes de performances. Il a été
Par ailleurs, les deux autres modèles de Black Forest Labs apparaissent dans ce top 10. Le Flux.1 [dev] est à la quatrième place, et le Flux.1 [schnell] à la septième ! L’un est apprécié pour la qualité visuelle qu’il offre, et l’autre pour sa grande rapidité d’exécution. Mais ils ont bien d’autres avantages : précision et flexibilité entre autres.
Ideogram v2, le deuxième modèle génératif le plus performant
Juste derrière Flux.1 [pro], Ideogram v2 a obtenu un score Elo de 1 130. Cette dernière version du modèle Ideogram, lancé le 21 août 2024, propose bon nombre de fonctionnalités sur son interface utilisateur web. Ce générateur d’images par IA dispose aussi d’un moteur de rendu de texte plus précis que la première version.
Grâce à cette évolution, les utilisateurs peuvent apporter plus de précision à leur invite textuelle et même y indiquer une police ou une famille de police, ce qui leur permet de contrôler davantage le type et le style de l’image à générer. D’ailleurs, Ideogram v2 est capable de rétablir le design d’un visuel avec une plus grande efficacité.
Midjourney a reculé dans ce top 10
Midjourney, en première position en juillet 2024, n’apparaît qu’à la troisième place un mois plus tard avec son modèle v6.1. Son score Elo était de 1 126 (avec seulement une différence de 4 points par rapport à celui du modèle Ideogram v2). Sorti fin juillet 2024, Midjourney v6.1 serait plus rapide, plus beau et plus intelligent que ses prédécesseurs. Il génère des images plus détaillées et de qualité supérieure.
Soulignons que la version 6 de Midjourney figure encore dans le classement. Mais celle-ci se trouve désormais au cinquième rang (avec un score de 1 112), juste après Flux.1 [dev].
Une autre observation importante : Stability.ai avec Stable Diffusion 3 Large (6ᵉ) et Playground AI avec Playground v2.5 (8ᵉ) sont restés dans ce top 10, même s’ils ont reculé.
Quant à OpenAI, qui excelle dans la génération du texte, ses générateurs d’images par IA DALL E 3 HD et DALL E 3 n’apparaissent qu’en bas du classement.
Source : Artificial Analysis