Midjourney: guida completa al prompting avanzato

Foto dell'autore

Filippo Zazzi

 

Home > News feed > Competenze e tecnologie > Competenze informatiche > Intelligenza Artificiale > Midjourney: guida completa al prompting avanzato

Midjourney è un tool affascinante nel mondo della creatività digitale, dove l’intelligenza artificiale incontra l’immaginazione umana. In questa guida completa, esploreremo il cuore pulsante di Midjourney: il prompting avanzato. Scopriremo cos’è Midjourney, cosa significa creare un prompt efficace, quali sono i prompt più utilizzati e come sfruttare al meglio i prompt avanzati per trasformare le tue idee in creazioni stupefacenti. Che tu sia un principiante alla ricerca di basi solide o un veterano desideroso di affinare le tue tecniche, questa guida ti fornirà gli strumenti necessari per navigare con sicurezza nel mondo del prompting avanzato.

Cos’è Midjourney

In quanto piattaforma di intelligenza artificiale, Midjourney rappresenta ad oggi una delle migliori alternative in ambito di generazione grafica, offrendo a creativi, artisti, scrittori e curiosi uno strumento potente per esplorare e realizzare le proprie visioni artistiche. Si tratta di una piattaforma avanzata che utilizza algoritmi di IA per generare immagini, testi o contenuti digitali basandosi su istruzioni specifiche, note come prompt, fornite dall’utente.

Il funzionamento di Midjourney è basato sull’interpretazione di questi prompt per creare opere che spaziano dall’arte visiva alla narrativa, passando per soluzioni creative in ambiti inaspettati. Gli utenti inseriscono descrizioni dettagliate di ciò che desiderano realizzare, e l’IA, attraverso un processo di apprendimento profondo e una vasta banca dati di riferimenti culturali e visivi, elabora queste richieste trasformandole in opere d’arte digitali o testi creativi.

Questa piattaforma si distingue per la sua capacità di interpretare richieste complesse e sfumate, in grado di riconoscere e replicare determinati stili, permettendo così una personalizzazione quasi illimitata delle creazioni. Che si tratti di paesaggi immaginari, ritratti futuristici o scenari surreali, Midjourney apre le porte a un mondo dove l’unico limite è l’immaginazione dell’utente. La facilità di utilizzo, unita alla potenza dell’IA, rende Midjourney uno strumento ideale sia per professionisti della creatività che per hobbisti alla ricerca di nuove forme di espressione artistica.

Cos’è un prompt

Un prompt, nel contesto dell’intelligenza artificiale e della creatività digitale, è una sequenza di testo o un insieme di istruzioni fornite a un sistema di IA per guidarlo nella creazione di contenuti specifici, come immagini, testi o qualsiasi altra forma di espressione artistica. La definizione tecnica di un prompt si riferisce alla capacità di questo input di inquadrare il contesto, specificare dettagli e influenzare l’output generato dall’IA, fungendo da catalizzatore per la creazione guidata.

Per essere efficace, un prompt deve possedere diverse caratteristiche chiave:

  • Chiarezza: deve essere formulato in modo chiaro e diretto, minimizzando ambiguità per assicurarsi che l’IA possa comprendere esattamente cosa si sta richiedendo.
  • Dettagli specifici: l’inclusione di dettagli specifici aiuta a guidare l’IA verso la produzione di un risultato che corrisponde più fedelmente alle aspettative dell’utente.
  • Bilanciamento tra specificità e flessibilità: mentre i dettagli sono importanti, è cruciale anche lasciare spazio all’interpretazione creativa dell’IA, permettendo la generazione di risultati unici e sorprendenti.
  • Obiettivi chiari: Il prompt deve riflettere un obiettivo chiaro, sia che si tratti di invocare un’emozione specifica, rappresentare un concetto o esplorare un tema.
  • Linguaggio adatto al contesto: l’uso di un linguaggio e di termini tecnici appropriati al contesto e alla piattaforma assicura che il prompt sia interpretato nel modo corretto.
  • Incorporazione di esempi o analogie: fornire esempi o utilizzare analogie può aiutare l’IA a capire meglio il tipo di output desiderato.
  • Adattabilità: un prompt efficace dovrebbe essere abbastanza flessibile da poter essere adattato o modificato in base ai feedback ricevuti dall’output iniziale dell’IA.

Creare un prompt che incorpori queste caratteristiche può significativamente migliorare la qualità e la rilevanza dei risultati generati, permettendo agli utenti di sfruttare appieno le capacità della piattaforma Midjourney per realizzare le proprie visioni creative.

I prompt più comuni

Nell’universo di Midjourney, alcuni prompt si sono distinti per la loro popolarità e frequenza d’uso, diventando veri e propri punti di riferimento per gli utenti che cercano ispirazione o desiderano ottenere risultati specifici. È bene, tuttavia, sottolineare la differenza tra prompt e parametro:

  • Prompt: fa riferimento all’intera stringa di testo fornita dall’utente, che include l’input per la generazione dell’immagine, e i parametri stessi per definire lo stile.
  • Parametri: fanno riferimento alle indicazioni specifiche fornite dall’utente per indirizzare la creazione dell’immagine.

A seconda dei parametri utilizzati è possibile ottenere risultati completamente differenti. Tra i prompt più utilizzati, due dei più noti sono “–ar” e “–chaos”. Questi prompt agiscono come modificatori che influenzano l’output dell’IA in modi particolari, offrendo agli utenti un maggiore controllo sulla direzione creativa dei loro progetti. Il parametro “–v”, invece, identifica la versione utilizzata, tra quelle disponibili su Midjourney. Vediamo più nel dettaglio cosa indicano tutti questi parametri. 

Il prompt “–ar” (Aspect Ratio)

  • Definizione: Il prompt “–ar” viene utilizzato per specificare il rapporto d’aspetto dell’immagine generata. Il rapporto d’aspetto (aspect ratio) è fondamentale per determinare le dimensioni relative di larghezza e altezza di un’immagine, influenzando così la sua composizione e la percezione visiva.
  • Utilizzo: Aggiungendo “–ar” seguito da un rapporto, come 16:9 o 1:1, l’utente può guidare l’IA nella creazione di immagini che si adattano a specifiche esigenze di formato, come post per social media, copertine di libri, o schermi cinematografici.
  • Esempio pratico: Un prompt che includa “–ar 16:9” produrrà immagini panoramiche, ideali per sfondi di desktop o video, mentre “–ar 1:1” genererà immagini quadrate, perfette per post su Instagram o profili.
Prompt: “Create a cyberpunk scenery with a lot of details, such as veichles and buildings. Use a cyberpunk style, realized with watercolors. –ar 16:9

Il prompt “–c” (chaos)

  • Definizione: il prompt “–c” regola il livello di variabilità e imprevedibilità nell’output generato. Questo modificatore permette di esplorare risultati più astratti, unici o sorprendenti, aumentando la diversità creativa delle immagini.
  • Utilizzo: inserendo “–c” seguito da un valore numerico (generalmente compreso tra 0 e 100), gli utenti possono influenzare direttamente il grado di “audacia” nell’immagine finale. Un valore più alto corrisponde a risultati più imprevedibili e vari, mentre un valore più basso produce output più coerenti e prevedibili.
  • Esempio pratico: utilizzare un prompt con “–c 80” potrebbe generare immagini con elementi sorprendenti o composizioni non convenzionali, perfetto per chi cerca l’ispirazione o vuole rompere gli schemi tradizionali.
Il prompt in questo caso è uguale a quello dell’immagine precedente, ma con l’aggiunta del parametro “c 100”.

Il prompt “–v” (Versione)

  • Definizione: il prompt “–v” indica la versione, e viene utilizzato per selezionare una specifica versione dell’algoritmo di IA di Midjourney utilizzata per generare l’output. Questo consente agli utenti di sperimentare con diversi approcci di generazione, ognuno con le proprie peculiarità e punti di forza, a seconda delle versioni disponibili della piattaforma.
  • Utilizzo: aggiungendo “–v” seguito dal numero della versione desiderata, gli utenti possono influenzare il processo creativo sfruttando le caratteristiche uniche di quella versione. Questo è particolarmente utile per confrontare gli stili di output, sperimentare con tecniche di generazione diverse o utilizzare una versione che si è dimostrata particolarmente efficace per un certo tipo di prompt.
  • Esempio pratico: utilizzando il suffisso “–v 5.2”, l’ultima versione definitiva rilasciata, è possibile risultati con uno stile o una qualità dell’immagine che differiscono da quelli generati con “–v 6”, attualmente in versione alpha, offrendo così la possibilità di sperimentare e trovare la versione che meglio si adatta alle proprie esigenze creative o estetiche.
Immagine realizzata con versione 5.2
Immagine realizzata con versione 6.0

l settaggi base

Tramite il solo prompt “/setting” è possibile chiedere a Midjoruney di aprire il menù creativo in cui vengono indicati i settaggi attualmente impiegati per la realizzazione delle creazioni. Il menù ha questo aspetto:

  • Versione: è possibile selezionare la versione del modello Midjourney per la generazione delle immagini.
  • RAW mode: consente di ridurre l’estetica predefinita di Midjourney per le versioni del modello 5.1 e 5.2, fornendo immagini che possono variare leggermente in stile rispetto a quelle generate con le impostazioni standard.
  • Style: serve a regolare lo stile per influenzare l’aspetto estetico delle immagini generate.
  • Public/stealth: serve ad alternare tra modalità pubblica e stealth per la condivisione delle immagini.
  • Remix: utile per variare prompt, parametri o rapporti d’aspetto nelle variazioni.
  • Variation: usato per scegliere tra variazione alta o bassa per influenzare l’unicità delle immagini generate.
  • Sticky Style: serve per salvare l’ultimo codice di stile usato.
  • Turbo/fast/relax mode: serve per passare tra modalità turbo, veloce e rilassata per influenzare la velocità di generazione (la modalità di creazione “fast” è limitata in base all’abbonamento sottoscritto)

I prompt avanzati

Oltre ai prompt più comunemente utilizzati in Midjourney, esistono diversi parametri avanzati che offrono agli utenti un controllo ancora più fine e dettagliato sulla generazione delle immagini. Questi prompt permettono di esplorare nuove dimensioni creative, affinare specifiche caratteristiche dell’output e sperimentare con tecniche di generazione più sofisticate. Tra questi, «repeat», «iw», e altri, rappresentano strumenti preziosi per chi desidera spingersi oltre i confini della creatività digitale. 

È bene sottolineare che l’utilizzo di Midjourney a livello professionale implica l’utilizzo di tutti i parametri, unitamente a prompt di rilievo, chiari e che identifichino bene il soggetto che si vuole realizzare.

Il prompt “–repeat

  • Definizione: Il parametro “–repeat” in Midjourney permette di creare più lavori (o jobs) dalla stessa descrizione in un singolo prompt. Ciò significa che puoi utilizzarlo per generare più griglie di immagini utilizzando una singola richiesta. Il numero di ripetizioni è limitato dal tipo di abbonamento che hai con Midjourney. Ad esempio, con un abbonamento Basic puoi creare fino a 4 lavori con un unico prompt, con uno Standard fino a 10, e con un Pro fino a 40 lavori .
  • Utilizzo: Aggiungendo «repeat» seguito da un valore numerico, l’utente può specificare il numero di jobs desiderati. Un messaggio di conferma verrà poi richiesto da Midjourney stesso, prima di procedere nell’elaborazione del prompt.
  • Esempio pratico: Un prompt con “–repeat 4” genera 4 jobs da 4 immagini ciascuno. Questo metodo consente di velocizzare il processo creativo, quando ancora non si ha un’idea ben chiara e definita di ciò che si vuole realizzare.

Il prompt “–iw” (Image Weight)

  • Definizione: Il parametro “–iw” sta per Image Weight (peso dell’immagine) e serve a bilanciare l’influenza delle immagini di input rispetto al testo del prompt nella generazione dell’output. Questo parametro è particolarmente utile quando si combinano testi e immagini come input per guidare l’IA.
  • Utilizzo: specificando “–iw” seguito da un valore numerico, l’utente può determinare quanto le immagini di input debbano influenzare il risultato finale. Un valore più alto dà maggiore importanza alle immagini di input, mentre un valore più basso dà maggior peso al testo del prompt.
  • Esempio pratico: utilizzando un prompt con “–iw 75”, l’utente può assicurarsi che le caratteristiche visive delle immagini di input siano predominanti nell’immagine generata, mantenendo al tempo stesso alcuni degli elementi descritti nel testo del prompt.

Il prompt “–seed

Il codice seed di un’immagine è un codice numerico univoco che serve ad identificare quella specifica creazione all’interno di una determinata IA generativa. Ad ogni immagine creata viene associato un codice seed che è possibile farsi recapitare tramite messaggio direttamente sul server di Midjourney:

Copiando ed incollando il codice seed riportato nel messaggio, ed inserendolo nel prompt per la generazione delle immagini successive, tramite il parametro “–seed” (seguito dal codice numerico), è possibile replicare il soggetto dell’immagine per ottenere risultati sempre simili tra loro, evitando che l’IA generi output partendo da zero.

Il multi-prompt

Nei prompt di Midjourney, i separatori doppi due punti :: sono utilizzati per dividere il prompt in parti distinte, consentendo di assegnare un’importanza relativa a ciascuna parte. Questo meccanismo è noto come Multi Prompt e permette a Midjourney di considerare e fondere insieme concetti separati all’interno dello stesso prompt. Ad esempio, separare “space” e “ship” con :: porta Midjourney a considerare i due termini separatamente, generando immagini che possono fondere insieme i concetti di “spazio” e “nave” in maniere creative e inaspettate.

L’uso dei doppi due punti :: differisce dall’uso delle virgole “,” in quanto queste servono principalmente a strutturare il prompt per renderlo più leggibile per l’utente, senza influenzare il modo in cui Midjourney elabora il prompt. Al contrario, i doppi due punti modificano effettivamente il processo di elaborazione del prompt da parte di Midjourney, isolando e interpretando separatamente i frammenti di prompt prima di elaborare l’intero prompt.

Inoltre, è possibile aggiungere un numero immediatamente dopo i doppi due punti per assegnare un peso relativo a quella parte specifica del prompt, influenzando così ulteriormente il risultato finale della generazione dell’immagine. Questo metodo offre un controllo maggiore sull’output, consentendo di enfatizzare o de-enfatizzare specifici elementi del prompt.

Prompt utilizzato: “create a space ship”
Prompt utilizzato: “create a space:: ship”

Lascia un commento