La nostra guida dedicata a Stable Diffusion non può terminare senza un'analisi chiara dei vantaggi e svantaggi di questa piattaforma per la creazione di immagini a partire da input testuali. Perché quando hai tante soluzioni a portata di mano è sempre difficile scegliere: quale generatore di immagini utilizzare per sfruttare l'Intelligenza Artificiale e i modelli di diffusione? Ci concentriamo sulle funzioni di DALL•E, che ha raggiunto ottimi risultati con la versione 3, o lavoriamo con Midjourney?
È difficile fornire una risposta equilibrata senza avere a portata di mano una valutazione chiara di Stable Diffusion con relativi vantaggi e svantaggi. Che chiaramente possono essere soggettivi ma rappresentano sempre un punto di vista per avere una propria opinione riguardo all'argomento.
Poi bisogna fare qualche test incrociato per avere il polso della situazione. In ogni caso noi iniziamo a elencare i possibili pro e contro di Stable Diffusion per avere una visione d'insieme dei benefici che ci può portare questo strumento per generare immagini eccezionali con l'AI.
Vantaggi a favore di Stable Diffusion
Il primo punto a favore di Stable Diffusion è il fatto che lo puoi usare fin da subito, quando e come vuoi, online. E in forma gratuita. Esistono sì delle soluzioni a pagamento, perfette per chi ha bisogno di risorse extra o di accedere alle API (Application Programming Interface). Ma di sicuro puoi ottenere ottimi risultati anche con la versione base a costo zero (che trovi sul sito Web ufficiale Stablediffusionweb.com).
A quanto detto bisogna poi aggiungere che questo strumento è versatile come pochi altri tool in circolazione perché offre delle opzioni Desktop raffinate, perfette per chi vuole lavorare con la generazione delle immagini artificiali realistiche e dettagliate. I cosiddetti "media sintetici". Anche nella versione online la qualità resta molto elevata grazie alla potenza del modello di apprendimento automatico e all'interfaccia utente user friendly.
Screenshot della dashboard di Stable Diffusion.
Infatti, a differenza di altri tool che gestiscono l'output solo attraverso la scrittura dei prompt, qui puoi intervenire su un pannello di controllo che rende i passaggi ben definiti. Soprattutto se utilizzi la versione Desktop.
A questo dobbiamo aggiungere una buona velocità di esecuzione e un dettaglio riguardante la licenza d'uso che piacerà a molti utenti: è un progetto Open Source.
Inoltre le immagini sono diffuse con licenza Creative Commons CC0 1.0 Universal Public Domain Dedication che ne consente un utilizzo permissivo. Ma ci sono anche dei punti deboli a sfavore di questo tool AI based per la generazione delle immagini?
Gli svantaggi di Stable Diffusion
Tra i vantaggi di Stable Diffusion abbiamo elencato anche la velocità. Ma è una considerazione valida solo per i compiti più semplici: il percorso utilizzato da Stable Diffusion per ottenere l'output può essere impegnativo dal punto di vista tecnico e richiedere in alcuni casi molto tempo. Questo avviene nel momento in cui devi realizzare immagini caratterizzate da molti dettagli e/o di grandi dimensioni.
A me, ad esempio, è capitato di attendere all'infinito nel momento in cui la connessione era particolarmente debole. Problemi simili sono stati riscontrati nelle versioni per i dispositivi Desktop: per i task più impegnativi servono infatti quantitativi importanti di risorse (come del resto è giusto che sia).
Altri difetti da segnalare? Spesso i modelli generativi dei tool di questo tipo sono addestrati partendo da un database enorme di contenuti ma comunque limitato. Ciò significa che non sempre è possibile ottenere dei risultati aderenti alle aspettative perché mancano le informazioni necessarie. Senza dimenticare che, a volte, l'output non è perfettamente aderente alle indicazioni digitate dall'utilizzatore nel proprio prompt.
Quindi, dobbiamo usare Stable Diffusion?
Di sicuro è una soluzione interessante, con dei punti a favore che possono orientare la scelta verso un buon uso di Stable Diffusion per lavori impegnativi. Persino quelli a livello professionale. La natura Open Source del progetto di Stability AI ha permesso uno sviluppo continuo del modello e i difetti elencati (eventuale imprecisione degli output, limite del dataset di riferimento..) possono essere riscontrati anche in realtà differenti come per esempio Bing Image Creator che si basa su DALL•E.
Quindi il consiglio è questo: provare la versione gratuita di SDXL e fare quanta più esperienza possibile. Capire come funziona e valutare se i risultati sono adatti alle proprie esigenze. In questo modo è possibile avere un'idea chiara dei vantaggi e degli svantaggi di Stable Diffusion rispetto ad altri strumenti realizzati per lo stesso scopo.