GOOGLE AI IMAGEN 2

Dopo un anno dal lancio di DELLE-3, Google ha annunciato, quasi alla fine di dicembre, il rilascio di una nuova versione avanzata dell’intelligenza artificiale per la creazione di immagini, denominata Google AI Imagen 2.

Partendo dalla visione del CEO e Co-fondatore di Google DeepMind, egli sostiene che: 

«L’intelligenza artificiale ha il potenziale per essere una delle tecnologie più importanti e vantaggiose mai inventate».

Possiamo dedurre che Imagen 2 rappresenta una delle tecnologie più avanzate per la trasformazione testo-immagine. Garantisce risultati fotorealistici di alta qualità, attentamente allineati e coerenti con le esigenze degli utenti. La sua capacità di generare immagini più realistiche, conferisce a Imagen 2 un innovativo approccio, evitando uno stile predefinito.

La potente tecnologia text-to-image di Imagen 2 è accessibile a sviluppatori e clienti Cloud tramite l’API Imagen su Google Cloud Vertex AI.

Inoltre, il team di Google Arts and Culture sta attualmente integrando la tecnologia Imagen 2 nel suo esperimento Cultural Icons. Ciò consentirà agli utenti di esplorare, apprendere e mettere alla prova le proprie conoscenze culturali, sfruttando l’intelligenza artificiale di Google in un’esperienza interattiva e informativa.

Le ultime migliorie apportate al modello includono un notevole miglioramento nell’interpretazione del testo, un aspetto che suscita grande interesse tra i designer grafici, dato che la resa accurata della tipografia è stata a lungo una sfida impegnativa per l’intelligenza artificiale. 

Imagen 2 eccelle anche nella creazione di loghi di alta qualità e supporta istruzioni multilingue. Inoltre, introduce un servizio sperimentale di filigrana digitale basato su SynthID di Google DeepMind. Questo innovativo servizio consente agli utenti di generare filigrane invisibili e verificare l’autenticità delle immagini generate da Imagen.

Le nuove funzionalità di Imagen 2 comprendono:

Immagini di alta qualità: produce uscite fotorealistiche di elevata precisione grazie a una migliore comprensione dell’immagine testo e all’implementazione di nuove tecniche di addestramento e modellazione.

Supporto al Rendering del testo: offre un controllo più profondo per branding e messaggistica, assicurando che il testo desiderato sia accuratamente integrato nelle immagini generate.

Generazione di loghi creativi: crea una vasta gamma di loghi realistici, inclusi emblemi, lettermark e loghi astratti.

Didascalie e risposte dettagliate: grazie alle avanzate capacità di comprensione delle immagini, consente la creazione di didascalie descrittive a lungo termine e fornisce risposte dettagliate a domande all’interno delle immagini.

Comandi multilingue: oltre all’inglese, supporta sei lingue in anteprima (cinese, hindi, giapponese, coreano, portoghese, spagnolo), con altre in arrivo nel 2024. Questa caratteristica permette la traduzione tra comandi e output in lingue diverse.

Sicurezza integrata: Imagen 2 adotta precauzioni di sicurezza, incluso il watermarking digitale sperimentale alimentato da SynthID di Google DeepMind. 

Martina Mignolo