AI Video e Talent Acquisition

Ultimamente stiamo assistendo ad una notevole diffusione dellutilizzo di strumenti di AI generativa per creare contenuti multimediali (immagini, audio e video) partendo da un prompt di poche righe.

Strumenti come Midjourney, ElevenLabs, Runway e Heygen possono essere utilizzati e integrati tra di loro sia per creare contenuti accattivanti che per automatizzare alcune attività legate al Talent Acquisition, risparmiando tempo ed aumentando efficienza ed efficacia.

Quando parliamo di video, nello specifico, uno strumento come Heygen può davvero risultare utile per creare uno story telling innovativo e notevolmente ingaggiante, per dare importanza e visibilità ad una job opportunity particolarmente rilevante all’interno della nostra organizzazione.

Per esempio, supponiamo di far parte di un’organizzazione che ha la sua sede principale in Italia ed alcuni sedi localizzate in Europa, e di dover ricercare e selezionare un profilo specializzato nella gestione di un sales team internazionale. Supponiamo inoltre che il profilo che stiamo ricercando, oltre ad un’esperienza e ad un insieme di competenze specifiche per il ruolo, debba anche avere un’ottima conoscenza di almeno due lingue oltre all’italiano (supponiamo ad esempio francese e inglese) e che non sia fondamentale né essere necessariamente localizzati in Italia né avere una conoscenza della lingua italiana a livello madrelingua.

Questo scenario aprirebbe l’opportunità di creare un contenuto fortemente attrattivo per la figura ricercata, potendo ampliare la mia ricerca in un’area geografica ampia e magari localizzando le informazioni sulla mia job opportunity in ognuna delle lingue citate poco fa.

Certo, potrei fare un bellissimo job post sui canali di comunicazione più efficaci, ma quanto sarebbe ancora più efficace letteralmente “metterci la faccia” e realizzare uno short video, in più lingue, in cui spiego la posizione nei minimi dettagli?

Anche se conoscessi perfettamente, oltre all’italiano, il francese e l’inglese, dovrei comunque investire un certo tempo per registrare il video nelle diverse lingue, mettere in conto un certo tasso di “bloopers” (sì, le “papere” che mi costringono a rifare la scena), trovare una situazione di ripresa adeguata, montare il video…insomma, uno sforzo non indifferente.

Se poi non avessi sufficiente padronanza delle lingue nelle quali vorrei esprimermi, correrei il rischio di essere meno credibile di Matteo Renzi quando si avventura nelle sue ormai epiche interviste in inglese.

Ma ecco che la AI generativa, e l’uso sapiente di alcuni strumenti integrati tra di loro, può offrirmi un aiuto straordinario per produrre i contenuti che mi servono, con un costo trascurabile e soprattutto con una frazione del tempo che mi servirebbe se volessi procedere con metodo, modalità e strumenti…umani :)

Se hai avuto la pazienza di leggere fino a qui, allora continua a leggere perchè la parte davvero interessante inizia adesso: stai per vedere per filo e per segno come poter realizzare un video (anzi, tre video diversi) in cui spieghi nei minimi dettagli la tua posizione super interessante, parlando perfettamente tre lingue diverse.

Iniziamo.

Prendiamo un job post pubblicamente disponibile su LinkedIn alla data di questo post, ad esempio, questo qui (…inutile dirti che non ho nessuna connessione con l’organizzazione che ha effettivamente postato la job opportunity, è solo un esempio :) ).

https://www.linkedin.com/jobs/view/4119553206

Il primo step consiste nel copiare tutto il testo dell’annuncio e tenerlo da parte per qualche secondo (va benissimo se lo incolli in una pagina di note o qualcosa del genere).

Ora, usando uno strumento come ChatGPT, Gemini, Claude, Deepseek, o in ogni caso un chatbot basato su un LLM dalle performance soddisfacenti, puoi usare un prompt specifico per trasformare questo annuncio in un testo dallo stile più informale, colloquiale, come se dovesse essere lo script da leggere per creare un voiceover, cioè un commento vocale ad un video.

Clicca per visualizzare il prompt che ho utilizzato e il testo generato nelle tre lingue

Ora viene la parte divertente: utilizzando i tre script generati nelle tre diverse lingue, puoi utilizzare uno tool text-to-speech basato su AI per generare un vocale fortemente realistico, nel quale puoi effettivamente ascoltare lo script, raccontato da una voce umana. Potrebbe essere anche la tua voce, clonabile in pochi istanti, se usi ad esempio una piattaforma come ElevenLabs.

Puoi ascoltare il risultato, piacevolmente realistico, proprio qui di seguito e ricorda: questa è la mia voce, ma ciò che senti non è mai stato effettivamente “detto” o registrato.

Abbastanza sorprendente vero? Ci potrebbe anche fermare qui ma…perchè limitarsi a generare solo la voce quando possiamo, con un tool come Heygen, generare addirittura un video, di una persona digitale con le nostre sembianze e soprattutto con le nostre movenze, la nostra gestualità tipica, le nostre espressioni facciali per…raccontare con la nostra faccia quanto può essere interessante l’opportunità?


Heygen, come la maggioranza dei (pochi per il momento) tools che permettono di generare un avatar realistico “clonando” le nostre sembianze, ha bisogno di una piccola fase di addestramento, che consiste in un video di pochi minuti (ne bastano due o tre) nel quale parliamo in modo naturale e spontaneo davanti alla telecamera.

Ovviamente più è alto il livello degli strumenti che utilizziamo, migliore sarà il risultato finale, ma è sufficiente anche uno smartphone con un’ottica appena discreta per avere risultati davvero soddisfacenti.

Qui sotto trovi alcuni secondi del video che ho utilizzato per addestrare Heygen e per costruire un “modello” praticamente identico a me, con le mie sembianze e la mia espressività, per poterlo riutilizzare poi infinite volte facendogli “dire” qualsiasi cosa in qualsiasi lingua.

E ora, non mi rimane che importare, per ognuno dei vocali che ho generato - italiano, inglese e francese - il file audio nella piattaforma Heygen ed associarlo all’avatar creato a partire dal video di addestramento.

In pochi minuti, e - ricordalo - senza aver mai acceso il microfono nè tantomeno la telecamera (se non per il video di addestramento, che dovrò registrare una sola volta) avrò un risultato davvero sorprendente:

…in inglese…


in italiano…


…e in francese.


Sai qual è forse la cosa più interessante di quello che abbiamo visto sinora? Tutta questa sequenza può essere automatizzata totalmente, grazie a piattaforme no-code come Zapier o Make, per consentirti non solo di evitare il “copia e incolla” tra un tool a l'altro, ma anche per creare contenuti in modo continuo, efficace ed integrato con un notevole risparmio di tempo e soldi.

Ma magari, di questo parleremo in un altro post.

Thanks for Reading 🙏🚀

Previous
Previous

Amazon: 8 miliardi di $ in AI

Next
Next

DeepSeek, veloce e rischioso