Probablement heu sentit innombrables vegades que quan es tracta de sol·licitar, ja sigui a ChatGPT, MidJourney, Synthesia, Runway ML o qualsevol altra eina d'IA, és clau ser el més precís possible. El primer pas cap a la precisió és el detall. La IA, tal com la coneixem, no és un lector de ment; funciona únicament en funció de la informació que proporcioneu. Només amb aportacions clares i detallades podeu aconseguir els millors resultats.
Aquest principi també s'aplica quan es generen imatges precises. Tanmateix, en aquest cas, quan us demaneu, heu de pensar com un fotògraf, un dissenyador i un escriptor alhora.
En aquest article, explorarem com escriure instruccions efectives per a l'AI Test Kitchen ImageFX de Google per obtenir resultats precisos.
La precisió pot significar la diferència entre un resultat defectuós i una sortida perfectament executada, especialment quan es generen imatges. Les indicacions de text poden oferir resums vagues, però les indicacions d'imatge mal estructurades poden afectar dràsticament el resultat. Si, com jo, estàs creant per a un públic no caucàsic, has de ser extremadament precís. Una indicació vaga probablement produirà resultats genèrics i inutilitzables. Tanmateix, quan es fa correctament, ImageFX destaca per generar sortides específiques de la regió adaptades a les vostres necessitats.
Quan creeu una indicació d'imatge, tingueu en compte aquests tres components clau:
1. Qui és el teu tema?
Suposem que estàs conceptualitzant una imatge d'una "dona en una cafeteria". En aquest cas, la dona és el subjecte. És fonamental definir clarament el teu tema, en funció del públic i de la teva intenció.
Vegeu la diferència entre ambdues indicacions.
Avís 1: una dona en una cafeteria.
Avís 2: una dona nigeriana grassa asseguda en una cafeteria.
2. Sigues descriptiu i detallat
En altres paraules, "mostrar el funcionament". Quines accions fan els personatges? Quina hora del dia és? Quin és l'estat d'ànim? Descriu l'escenari, els vestits dels personatges, els temes secundaris i l'atmosfera general.
Exemple:
Una dona nigeriana grassona asseguda en una cafeteria prenent cafè. A la taula hi ha un llibre i un iPhone i assegut al seu costat hi ha un Pomeranian.
3. Sigueu específics sobre la composició i l'estil
Aquí és on cal pensar com un dissenyador. Tingueu en compte el disseny i l'estil. Vols un estil animat? Si és així, de quin tipus? Voleu que estigui animat i, en cas afirmatiu, quin tipus d'animació: animació tradicional (2D, animació dibuixada a mà) o animació 3D (CGI)? Afortunadament, si voleu adoptar un estil d'animació particular que us agradi, ImageFX us permet experimentar amb diferents estils d'animació.
Avís
Una dona nigeriana grassona asseguda en una cafeteria prenent cafè. A la taula hi ha un llibre i un iPhone i assegut al seu costat hi ha un Pomeranian. Tots estan a l'estil animat de Pixar.
Una dona nigeriana grassona asseguda en una cafeteria prenent cafè. A la taula hi ha un llibre i un iPhone i assegut al seu costat hi ha un Pomeranian. Tots estan a l'estil animat de Simpson.
Per entrar en la mentalitat d'un fotògraf, heu de tenir en compte els angles, la il·luminació i l'enfocament de la fotografia.
Indicacions amb diferents angles:
Imatge de primer pla d'una dona nigeriana grassa aixecant la tassa de cafè cap als llavis, fent un glop lent. La seva cara mostra una expressió relaxada. A la taula davant d'ella, hi ha un llibre obert al costat d'un iPhone, parcialment a la vista. Un Pomeranian s'asseu tranquil·lament al seu costat, mirant al marc.
Fotografiada per sobre de l'espatlla des de darrere d'una dona nigeriana grassa, capturant l'escena des de la seva perspectiva. La taula mostra un llibre obert i el seu iPhone al costat. La Pomerania està asseguda al seu costat, amb l'ambient de la cafeteria visible al fons.
Plana gran angular que mostra tota l'escena de la cafeteria: una dona nigeriana grassa asseguda a una taula, prenent cafè, amb el llibre i l'iPhone al davant. Una Pomerania està asseguda al seu costat, semblant tranquil·la. L'entorn de la cafeteria inclou una il·luminació suau, altres clients i un ambient càlid.
La vista d'ocell des de sobre de la taula mostra tota l'escena: un llibre obert, un iPhone i una tassa de cafè sobre una taula. Una pomerania s'asseu al costat d'una dona nigeriana grassa mentre beu el seu cafè, creant un moment tranquil i content capturat des de dalt.
Plano mitjà des del costat, que mostra una dona nigeriana grassona asseguda còmodament a la cafeteria prenent el seu cafè. Es veu una taula amb el llibre obert i l'iPhone disposats, i un Pomeranian està assegut al seu costat, observant tranquil·lament l'entorn. La càlida il·luminació de la cafeteria augmenta l'ambient.
Imatge de perfil lateral d'una dona nigeriana grassa asseguda a una taula, prenent el cafè, amb un llibre obert davant i l'iPhone col·locat a prop. Un Pomeranian està assegut al seu costat, mirant cap a ella o mirant endavant. L'interior de la cafeteria ofereix un teló de fons suau i acollidor.
Primer pla d'un Pomeranian assegut a la cadira al costat d'una dona, amb aspecte tranquil i content. Al fons borrós, es pot veure una dona nigeriana grassa prenent el seu cafè amb el llibre i l'iPhone a la taula.
Plant d'angle superior que captura la mà d'una dona nigeriana grassa que sosté la tassa de cafè mentre l'aixeca per prendre un glop. Un llibre es troba obert a la taula amb un iPhone al costat, creant una vista de dalt a baix de la configuració de la taula. Només es veu un Pomeranian assegut al seu costat, completant l'escena.
Consulta: "Sóc un nigerià que crea per a un públic nigerià, però alguns detalls estan desactivats". Resposta: la IA no és un lector de ment. Heu d'ajustar els vostres descriptors per obtenir resultats més precisos.
Exemple:
Avís 2: un conductor nigerià de Lagos amb pantalons curts i una samarreta de tirants davant d'un autobús Danfo groc (Volkswagen T3).
Tot i que no necessiteu ser un escriptor prolífic per elaborar indicacions efectives, sí que us heu de prendre el temps per descriure de manera clara i descriptiva el que voleu. No us desanimeu si el resultat no és perfecte al primer intent; seguiu experimentant, afegint o eliminant paraules clau segons sigui necessari.
I amb això us deixo aquestes imatges que vaig conceptualitzar amb ImageFX. Gaudeix.