Nessun risultato. Prova con un altro termine.
Guide
Notizie
Software
Tutorial

Cosa rende un'immagine memorabile? Risponde l'IA!

GANAnalyze è una soluzione basata sull'intelligenza artificiale che ci aiuta a scoprire cosa rende memorabile un'immagine
Cosa rende un'immagine memorabile? Risponde l'IA!
GANAnalyze è una soluzione basata sull'intelligenza artificiale che ci aiuta a scoprire cosa rende memorabile un'immagine
Link copiato negli appunti

È facile convincersi che esistono immagini più "memorabili" di altre. Basti pensare ai grandi capolavori artistici del passato: i girasoli di Van Gogh, la Guernica di Picasso o l'urlo di Munch sono solo alcuni esempi di quadri memorabili, in grado di stupire praticamente qualsiasi osservatore.

Potremmo fare un discorso analogo anche con le foto o le immagini di tutti i giorni: uno scatto di un grande fotografo è spesso in grado di catturare la nostra attenzione e rimanere impresso nella nostra mente per giorni, a differenza dell'ultimo selfie postato su Instagram da nostro cugino.

Ma cos'è che rende un'immagine così memorabile? Quali caratteristiche la rendono tale?

Fino a qualche decennio fa, questo tipo di problemi erano una esclusiva di psicologhi cognitivi ed esperti della mente umana. Oggi, invece, possiamo trovare risposte sorprendenti ricorrendo all'intelligenza artificiale.

Questa idea è proprio ciò che sta alla base di un recente studio condotto dai ricercatori dell'MIT. Già anni fa, a seguito di uno studio condotto raccogliendo le opinioni di vari utenti sulla base di un dataset di circa 60.000 immagini, i ricercatori erano riusciti a sviluppare MemNet, un algoritmo di intelligenza artificiale capace di stimare il grado di memorabilità di una immagine. A partire da questo lavoro, è stato sviluppato un nuovo software, in grado di fare qualcosa di ancora più sofisticato: GANAnalyze.

Come suggerisce il nome, GANAnalyze si basa su una tecnica di machine learning che sfrutta le cosiddette GAN (acronimo che sta per Generative Adversarial Networks). Per farla breve, le GAN sono reti neurali che vengono addestrate in maniera competitiva.

Più in particolare, una di queste reti funge da generatrice, creando dati secondo la distribuzione di quelli presenti all'interno del training set originario.

Al tempo stesso, l'altra rete (detta discriminatrice) ha lo scopo di stabilire se i dati generati possano essere considerati o meno "reali" (o, per essere più precisi, "verosimili").

Questo meccanismo di reti "accoppiate" permette alle GAN correttamente addestrate di apprendere meccanismi così sofisticati da arrivare a generare dati incredibilmente realistici. Abbiamo già visto un esempio di applicazione delle GAN per la generazione di volti umani iperrealistici (ne abbiamo parlato in questo articolo), quindi non c'è da sorprendersi nel vedere tali reti applicate anche in contesti come la stima della memorabilità.

Anche GANAlyze sfrutta le GAN per generare nuove immagini. Esso però unisce la generazione di immagini realistiche (basata sulle GAN), all'output di MemNet, arrivando quindi a generare un insieme di immagini a memorabilità crescente partendo da una singola immagine.

Figura 1. GANAnalyze è in grado di generare immagini a diversi livelli di memorabilità (click per ingrandire)GANAnalyze è in grado di generare immagini a diversi livelli di memorabilità

Lo scopo di GANAnalyze non è solo questo: a partire dall'analisi delle immagini, è infatti possibile inferire le caratteristiche che rendono un'immagine più memorabile di altre. In un ulteriore esperimento, i ricercatori hanno infatti chiesto ad un insieme di utenti di osservare e commentare le immagini così generate, analizzando quindi le risposte di tali utenti.

I risultati di questo studio hanno evidenziato come la presenza di oggetti o entità significative in primo piano rendono l'immagine più memorabile, così come un campo visivo più ristretto sullo sfondo.

È facile immagine in che modi un software come GANAnalyze possa rivelarsi utile in futuro. Tra le possibili applicazioni, potrebbe esserci la quella di identificare ed eventualmente trattare problemi di perdita di memoria, migliorando la memorabilità di certi oggetti per mezzo di sistemi di visione basati sulla realtà aumentata. Tali sistemi potrebbero permettere di rimpiazzare soluzioni farmacologiche anche molto pesanti, riducendo i rischi dovuti ad eventuali effetti collaterali.

Si potrebbe anche pensare ad applicazioni in cui la grafica generata, ad esempio, per un film o un videogioco sia ulteriormente perfezionata grazie alla generazione basata sul suo grado di memorabilità. Infine, l'unione della generazione automatica con la creatività umana potrebbe portare a capolavori forse inimmaginabili.

È evidente come i progressi dell'intelligenza artificiale riescono ancora a stupire. Investire su queste conoscenze diventa quindi cruciale per ogni sviluppatore.

Ti consigliamo anche