Estetica dell’IA. La creatività di Dall-e Mini, Midjourney e Stable Diffusion

Mentre l’Intelligenza artificiale (IA) affina la capacità di decodificare immagini, riconoscendo gli oggetti inquadrati con la propria telecamera o dei contenuti sensibili postati sui social network, le sperimentazioni recenti online si stanno concentrando su software detti text-to-image, che partendo da una descrizione testuale generano immagini poggiate su parole chiave e ricorrenze nel web. Stiamo parlando di Dall-e Mini (oggi Craiyon) e di Midjourney, piattaforme aperte agli utenti in versione beta, che rispondono a ‘istruzioni’ testuali con un set di immagini. A queste si è aggiunta più recentemente Dream Studio AI della Stable Diffusion, mentre si attende il rilascio della versione aperta agli utenti di Imagen di Google.

Dall-e Mini è stato creato da Hugging Face, una società per il machine learning, e prende vita da Dall-e, software sviluppato da OpenAI, compagnia fondata da Elon Musk e altri; il nome nasce dalla crasi di Dalì e del robottino Wall-e. La versione a pagamento che OpenAI ha rilasciato quest’estate, Dall-e 2, era riservata solo ad alcuni utenti. La versione attuale, Craiyon, è invece aperta ai navigatori.

Il modello di intelligenza artificiale alla base di Dall-E Mini crea immagini attingendo a modelli statistici ricavati dall’analisi di circa 30 milioni di immagini classificate allo scopo di estrarre connessioni tra parole e pixel.

Wired

La peculiarità di questi sistemi è la creazione di immagini realistiche e visionarie insieme, talvolta irreali e incredibili, che diventano meme sui social network. Che impatto ha e avrà tutto questo nel campo dell’arte? Gli artisti provano a generare immagini finora inimmaginate, se è consentito il gioco di parole, utilizzando gli algoritmi come strumenti.

La pagina del sito OpenAI

 

Come nota Francesco D’Isa su Tascabile

“A differenza dei vari sistemi di apprendimento automatico che producono testo (…) questi che lavorano con le immagini giocano in un campo dove le competenze umane sono minori, perché è più facile aver imparato a scrivere che a disegnare.”

“Imitare un dipinto di Vermeer difficilmente porterà alla nascita di un capolavoro equiparabile a quelli del pittore olandese, ma mescolare il suo stile con quello di altri autori e autrici, dare in pasto alla macchina diverse e inaspettate composizioni di parole chiave, notare nelle creazioni del programma quelle che per qualche colpo di fortuna (o virtuoso errore) non restituiscono un quadro di Vermeer ma qualcosa di decisamente altro, di nuovo, e portarlo avanti in nuove variazioni… insomma, riconoscere e utilizzare gli stilemi e gli errori della macchina nell’obbedire ai comandi porterà le uniche intelligenze in campo, ovvero le nostre, a inventare qualcosa di nuovo.”

 

Abbiamo provato a giocare con queste applicazioni, inserendo in tutti e tre i siti un verso della poesia di Emily Dickinson “Non sapendo quando l’alba arriverà, tengo aperta ogni porta” (Not knowing when the dawn will come, I open every door).

Ecco il risultato su Dall-e Mini

Intorno alle parole ‘alba’ ‘aperta’ e ‘porta’ sembrano assemblarsi le immagini che, ricordiamo, nascono da dati già esistenti in rete. La visione è sfocata, non precisa, voluta per non generare immagini che potrebbero essere diffuse per vere; nel nostro caso enfatizza la poesia dei versi. Lo stesso esperimento su Midjourney ha prodotto vedute più dettagliate e delineate, legate a paesaggi individuabili come quelli americani dell’Hudson River School o del Romanticismo inglese o tedesco, probabilmente i più diffusi nel web e da cui l’IA ha pescato. Stupefacente che entrambe le piattaforme abbiano interpretato la porta aperta della poesia come un affaccio su un panorama, dettaglio non esplicitato.

Questo invece il risultato con Dream Studio, a cui abbiamo lasciato un ampio margine di libertà di interpretazione (cfg scale). Se si aumenta questo valore, compaiono porte, albe e scritte.

 

Gli storici dell’arte possono avere interesse non solo nella generazione di nuove immagini, per cui nasceranno anche categorie, l’estetica dell’IA, ma, inversamente, nella creazione di immagini ‘nello stile di’, individuando i termini più adatti.  Qui vi abbiamo raccontato un esperimento fatto con de Chirico…

Insegnare de Chirico (senza nominarlo) all’Intelligenza artificiale

 

Molteplici le problematicità da affrontare. Le aziende che rilasciano questi algoritmi prendono molto sul serio il rischio di diffondere pregiudizi (bias) e fake news, aspetti che hanno portato Google a ritardare l’uscita del suo software Imagen. Inoltre non è chiaro chi sia l’autore di queste immagini, chi ne detiene i diritti e quali usi sono consentiti.

Ancora D’Isa su questo punto scrive:

“Se in futuro un’autentica intelligenza artificiale diverrà abbastanza autonoma ed evoluta da voler creare un’opera d’arte, è probabile che noi non la capiremo, anzi, forse neanche ce ne accorgeremo, perché se e quando IA come queste avranno una coscienza, è plausibile immaginare che sarà completamente aliena alla nostra, per via delle enormi differenze strutturali che intercorrono tra noi.  Al momento si tratta di strumenti, per quanto evoluti, che in quanto tali sono co-autori tanto quanto lo è il necessario per la pittura ad olio, la macchina fotografica o Photoshop.”

Nuovi problemi per nuovi immaginari.

MSB

(ultimo aggiornamento 17/9/2022)