Categories: HardwareSoftware

AWS Titan Image Generator: creare e modificare immagini con l’IA

Author: IlSoftware

Anche Amazon si inserisce nell’agone dei generatori text-to-image presentando la sua nuova soluzione Titan Image Generator. Il modello lanciato da AWS non soltanto consente di creare immagini a partire da descrizioni testuali ma permette anche di modificare e ottimizzare quanto prodotto sulla base delle indicazioni dell’utente.

Il nuovo Titan Image Generator si inserisce nel “portafoglio” di soluzioni Amazon Bedrock. Quest’ultimo è un servizio completamente gestito, offerto da AWS, che fornisce una scelta di modelli ad alte prestazioni di importanti aziende impegnate nello sviluppo di piattaforme per l’intelligenza artificiale. I modelli integrati in Amazon Bedrock sono utilizzabili per creare e scalare facilmente applicazioni di IA che generano contenuti. Il tutto è fattibile servendosi di un’apposita API (Application Programming Interface), senza la necessità di gestire l’infrastruttura.

Obiettivo di Amazon Bedrock è democratizzare lo sviluppo di applicazioni che sfruttano l’IA generativa. Gli utenti possono infatti semplicemente caricare i loro dati per addestrare i modelli e personalizzarli secondo le rispettive necessità. Grazie a Bedrock è inoltre possibile creare degli agent in grado di eseguire compiti specifici a partire dai dati aziendali.

Come funziona la generazione di immagini con Titan Image Generator

Titan Image Generator aiuta a creare e perfezionare immagini usando prompt inviati in linguaggio naturale (al momento solo in inglese). Il modello permette quindi ad aziende attive nel campo della pubblicità, dell’e-commerce, dei media e dell’intrattenimento a creare immagini realistiche di alta qualità, in grandi volumi e a basso costo. Il sistema messo a punto da Amazon AWS può comprendere prompt complessi con oggetti multipli e generare immagini rilevanti.

Le funzionalità di modifica delle immagini dà modo di intervenire sui contenuti e sulla resa di ciascuna creatività, utilizzando sempre comandi ad alto livello di tipo testuale. I meccanismi di inpainting e outpainting, direttamente supportati da Titan Image Generator, permettono di manipolare le immagini in modo estremamente efficace.

L’inpainting si riferisce al processo di “riempimento” o riparazione di alcune parti dell’immagine; outpainting è il processo contrario, che estendere o aggiunge contenuto a un’immagine al di là dell’area occupata originariamente. Il modello di Amazon permette ad esempio di estendere o cambiare lo sfondo di un’immagine sulla base delle indicazioni fornite nel prompt di testo.

Come si vede nell’immagine, il modello generativo dapprima ha creato un’immagine seguendo pedissequamente le indicazioni dell’utente e poi ha sostituito la baita con il treno (esempio di inpainting).

Di seguito, Titan Image Generator applica il meccanismo di outpainting per conservare solo il treno rosso e cambiare lo sfondo da una montagna innevata a una foresta pluviale.

Gli ingegneri di Amazon aggiungono che è possibile personalizzare il modello con dati proprietari per generare immagini coerenti con le linee guida del brand o per generare immagini con uno stile specifico, ad esempio, proseguendo sulla strada imboccata durante una precedente campagna di marketing.

Utilizzo di agent per fornire consigli visuali e descrittivi

Come accennato in precedenza, Titan Image Generator può essere sfruttato per creare valore per gli utenti che si servono delle proprie applicazioni. Si può ad esempio chiedere all’intelligenza artificiale di fornire alcune immagini che ritraggono vari modelli di un oggetto (in figura si paragonano alcune tipologie di zaini) per poi chiedere maggiori dettagli su uno in particolare.

Come si vede nell’immagine seguente, Titan Image Generator si attiva per generare una descrizione puntuale dell’oggetto, utilizzabile per svariate finalità.

AWS ha anche presentato Amazon Titan Text Lite e Titan Text Express, LLM (Large Language Models) che supportano una vasta gamma di compiti relativi al testo, tra cui riassunti, traduzioni e chatbot conversazionali. Possono anche generare codice e sono ottimizzati per supportare linguaggi di programmazione popolari, oltre a formati come JSON e CSV.

I nuovi modelli di Amazon sono già utilizzabili dagli utenti in possesso dell’accesso alla piattaforma Bedrock. Alcuni esempi di codice sono disponibili in questo documento.

Credit immagine in apertura: iStock.com/Userba011d64_201

admin

Recent Posts

Il Samsung Galaxy Fold6 Slim è pronto per sfidare Xiaomi

Author: Tom's Hardware Il settore degli smartphone pieghevoli si sta preparando per alcuni importanti aggiornamenti,…

7 Luglio 2024

Perché iRacing è l’unico VERO simulatore di corse automobilistiche sul mercato

Author: GAMEmag iRacing è spesso considerato un colosso nel settore delle simulazioni automobilistiche, distinguendosi per…

7 Luglio 2024

Il porting dei giochi macOS su iOS è molto più semplice grazie ad Apple Game Porting Toolkit 2 | AGEMOBILE

Author: Agemobile Apple lo scorso anno ha introdotto un nuovo Game Porting Toolkit per aiutare…

7 Luglio 2024

5 falsi miti su Linux: non ci credete | IlSoftware.it

Author: IlSoftware Linux ha guadagnato popolarità negli ultimi decenni, specialmente tra sviluppatori, amministratori di sistema…

7 Luglio 2024

Soffiatori per giardino (e non solo): ecco quelli in offerta e come scegliere il più adatto

Author: Hardware Upgrade Guardate con invidia il vicino con il soffiatore per pulire il giardino…

7 Luglio 2024

Halloween-Special von „LOL“: Lachen die Kaulitz-Zwillinge mit?

Author: klatsch-tratsch Bill (l.) und Tom Kaulitz sind angeblich zwei der Promis eines geplanten "LOL"-Specials.…

7 Luglio 2024