
Gémini : le test des chiens et de la caravane… ben, c’est encore pas ça
Quand les IA génératrices d’images sont apparues je me suis aperçu par hasard en menant un travail d’illustration d’expressions (j’ai traduit visuellement plus de 400 expressions), qu’aucune ne parvenait à illustrer, malgré des centaines (!) de tentatives et descriptions précises et détaillées, formulées en anglais, « les chiens aboient la caravane passe ». C’est donc devenu mon test chaque fois pour juger de la compréhension d’une IA génératrice d’image.
1- elles n’arrivaient pas à diriger les chiens en direction de la caravane.
2- je devais trouver des termes différents pour caravane (caravansérail, file de chameaux…) car il y avait toujours confusion.
3- souvent les chameaux avaient des têtes de chien ou inversement, ou les deux.
J’en ai généré, vraiment, des centaines sur plusieurs IA. Il y a 5/6 mois, enfin, certaines IA ont commencé à distinguer les chiens des chameaux, à parvenir à constituer à peu près la scène. Maintenant, certaines ne connaissent plus le problème.
Gemini qui vient de m’écrire qu’elle crée aussi des images passe le test en partie.
Voici avec un prompt en français.
1ère : je lui ai dit de seulement illustrer l’expression.
2e : je lui ai donné une description détaillée. Elle y est parvenue.
3e : je lui ai demandé la même que la 2e, mais en rendu photographique : elle m’a remis les chiens et chameaux dans de mauvais sens et zéro rendu photographique.