Virtual Presenter Revolution: qual è il futuro dei corsi online?

 

Gli AI video generator sono software o tecnologie che consentono di creare dei video contenenti avatar (o più precisamente “virtual presenter”) per corsi online, tutorial, e altri contenuti digitali. Questi software erano già presenti in passato, ma mai come ora, grazie all’intelligenza artificiale, stanno tracciando una vera svolta nella produzione di courseware. Scopriamo come!

Fondamentalmente, i nuovi software permettono di trasformare in pochi step un testo scritto (in una qualsiasi lingua) in un filmato in cui il virtual presenter recita quel testo. E la parte più succosa, il sogno di ogni publisher, è che se si vuole fare una qualsiasi modifica all’ultimo momento, come cambiare una parola, una frase, il nome di un prodotto o di un sistema o addirittura l’aspetto dello speaker per renderlo coerente al contesto, non occorre più, come in passato, fissare nuove riprese e registrazioni con le diverse maestranze. Oggi in pochi click, la modifica è online.

Rispetto all'impiego di attori e doppiatori umani, la riduzione dei tempi di rilascio e dei costi di produzione è radicale. Ecco perché l’uso dei virtual presenter per le presentazioni video sarà sempre più diffuso. Soppianterà le produzioni di tipo cinematografico o le slide di tipo Powerpoint? Noi preferiamo non ragionare in sottrazione, ma immaginare ancora più ricchezza nella già ampia varietà di formati a disposizione. Ci auspichiamo che non si incorra nel rischio di far fruire intere collane di corsi costituiti solo da un avatar onnipresente a video, senza altri supporti visivi o strumenti che aiutino a variare le modalità di apprendimento. Importanti saranno le competenze di chi sa identificare l'oggetto formativo più adatto a uno o più requisiti specifici e alternare l’esposizione dei contenuti utilizzando diverse tecniche (oltre agli avatar, animazioni, esercitazioni, giochi e quant’altro). È infatti dimostrato che alternare le varie modalità di apprendimento (sia come tipologia di esposizione che come timing di erogazione) aumenta l'efficacia della retention dei contenuti, secondo il principio noto come "spaziatura" o "interleaving" nato nell’ambito dagli studi cognitivi che hanno sviluppato il metodo della "spaziatura delle ripetizioni" (in inglese Spaced Repetition System, SRS).

Ma prima di arrivare a questo punto, dobbiamo ancora abituarci all’uso massivo dei virtual presenter: capiamo allora quali vantaggi ci possiamo aspettare da questa nuova opportunità.

Personalizzazione avanzata

Con i nuovi virtual presenter, diventa molto semplice personalizzare completamente l'aspetto, la voce e il comportamento dell’avatar utilizzato. Addirittura, sarà l’utente stesso a poter scegliere il personaggio che preferisce, con l’aspetto, il tono e il modo di raccontare le cose che più si avvicinano ai suoi gusti. Preferisci un uomo o una donna? E tutto questo contribuisce ad aumentare l'inclusione degli utenti con ricadute positive sull'efficacia dell'apprendimento.

Una migliore accessibilità

I virtual presenter possono essere utilizzati per creare contenuti accessibili a persone con disabilità. Ad esempio, possono essere integrati velocemente i sottotitoli o interpreti di lingua dei segni virtuali per rendere i contenuti accessibili a studenti con difficoltà uditive. Inoltre, dal momento che è possibile regolare la velocità di presentazione, il tono della voce e altri elementi della presentazione, è più facile adattarsi alle preferenze degli studenti con diverse abilità o stili di apprendimento.

Localizzazione e internazionalizzazione

I software di video generator, anche senza avatar, consentono di convertire istantaneamente in diverse lingue sia i contenuti scritti (sottotitoli compresi) sia lo speech stesso dell’avatar. Questa caratteristica porterà ad una trasformazione radicale del business nell’elearning: le aziende potranno raggiungere un target mondiale, di conseguenza aumenterà la concorrenza e la tendenza alla monopolizzazione del mercato da parte di pochi grossi player. 

Interazione 2.0

Alcuni virtual presenter iniziano ad offrire un’interazione avanzata con il pubblico attraverso il riconoscimento vocale o gestuale. In questo modo, il presentatore virtuale può fornire feedback, spiegazioni o informazioni supplementari in base alle interazioni con gli studenti. Inoltre, attraverso l’analisi delle reazioni e del comportamento dell’utente, il sistema può comprendere il suo grado di attenzione e di interazione. Questi dati possono essere utilizzati per migliorare ulteriormente i corsi online e personalizzare l'esperienza di apprendimento.

In particolare, il riconoscimento vocale permette agli utenti di comunicare con il presentatore virtuale utilizzando la propria voce. Il sistema infatti è in grado di convertire le risposte verbali degli studenti in input digitale che può essere interpretato dal software. Il virtual presenter può quindi rispondere alle domande o ai comandi vocali degli studenti in modo simile ad un essere umano. Attenzione: “simile” non significa “uguale” (almeno per il momento). Allo stesso modo, il riconoscimento gestuale impiega telecamere o sensori che catturano i movimenti del corpo e delle mani degli studenti: anche questi gesti possono essere utilizzati per interagire con l’avatar, ad esempio, per rispondere a una domanda o per dare il comando di avanzare le slide di una presentazione.

 

 Vediamo ora qualche esempio di AI video generator: 

 SYNTHESIA

https://www.synthesia.io

È forse l’azienda leader in questo campo, sia perché è arrivata per prima, sia per la ricca community di utenti che è riuscita a raccogliere nel tempo. Il software mette a disposizione più di 60 video template con sfondi personalizzabili con le proprie slide, 140 AI avatar che possono parlare in oltre 120 lingue con più di 400 diversi stili di narrazione o accenti. Il realismo degli avatar è impressionante: sono programmati anche dei micromovimenti che li rendono più credibili e convincenti. Con una spesa aggiuntiva, è possibile anche creare il proprio avatar, con il proprio volto e movimenti. In fase di progettazione, un AI-assisted scriptwriting aiuterà a scrivere e controllare l’esattezza dei testi.

Il software inoltre può essere integrato con più di 30 altre piattaforme, e mette a disposizione una ricca libreria di video realizzati dagli utenti e liberamente ‘clonabili’.

L’unico neo, oltre al prezzo forse troppo esigente per alcuni, è l’impossibilità di scalare i video (ecco il perché di tanta qualità) che sono quindi disponibili solo alla risoluzione di 1920×1080 pixels.

 

COLOSSYAN

https://www.colossyan.com

Anche Colossyan consente di creare video a partire da testi, sempre a scopo di formazione, comunicazione aziendale e marketing. Le opzioni prevedono la scelta fra 70 voci e accenti, 26 lingue, circa 30 avatar AI e la possibilità, con un costo aggiuntivo, di creare un avatar personalizzato o, sempre per i clienti aziendali, di impostare l'età e le emozioni di ciascun avatar con un solo click. Nella stessa scena possono essere presenti più avatar simultaneamente, ed è possibile scalare le dimensioni della finestra video.

Per testare le funzionalità, si può realizzare un video demo di 5 minuti (con trademark).

 

HOURONE

https://hourone.ai

Molto professionale, anche se la qualità video non è paragonabile rispetto a Synthesia, permette di scegliere fra 30 avatar AI (forse un po’ troppo ‘robotici’), 27 video template suddivisi per categorie d’uso (dalla presentazione di prodotto, passando per il marketing, la corporate communication e l’elearning) che possono essere impostati con diverse palette di colore (per uniformarsi al brand aziendale) in 19 lingue. Interessante l’opzione che consente di generare immagini direttamente dal testo digitato all'interno dell'editor.

Dal sito è anche disponibile una demo di creazione del video, per testare direttamente la facilità d’uso del software. Anche qui è disponibile un AI Script Assistant di supporto per la scrittura dei testi.

 

D-ID 

https://www.d-id.com

Mentre tutte le piattaforme già citate (Synthesia, Colossyan, HourOne) si concentrano sulla generazione di testo in video utilizzando avatar AI, D-ID consente anche di creare video da immagini fisse di volti.

L’architettura si basa sulla piattaforma Creative Reality™ Studio, che combina diverse applicazioni di intelligenza artificiale generativa:

  • la generazione di testo con GPT-3
  • la generazione di testo in immagine con l’integrazione con Stable Diffusion (https://stability.ai/stable-diffusion)
  • la propria tecnologia AI per l'animazione del volto

 

Per creare un avatar AI, si può scegliere fra: 

  • gli avatar AI realistici (29 presentatori disponibili nell'editor video, ma solo 4 sono ad "alta qualità", che sembrano persone reali quando sono statiche, mentre la versione animata è piuttosto inquietante)
  • la creazione di un avatar AI da un'immagine fissa frontale
  • la creazione a partire da un cartone animato, completamente generato dall'intelligenza artificiale anche a partire da sole indicazioni testuali

 

I costi di implementazione delle soluzioni sono ancora alti, e, per quanto alcuni avatar raggiungano livelli di rappresentazione sofisticati, ad oggi vi sono limitazioni di espressione, movimento e atteggiamento che vanno messe in conto. È per questo che riteniamo debba essere considerato un prodotto aggiuntivo e non sostitutivo nella cassetta degli attrezzi dei progettisti.

Restiamo in contatto

Newsletter 

Newsletter

Sottoscrivendo la nostra newsletter sarai sempre aggiornato con le ultime novità.

 
Scarica le brochure

Scarica le brochure

 

Visiona il nostro catalogo e tutti i nostri documenti.  

  LISTA COMPLETA 
Lavora con noi

Lavora con noi

 

Inviaci la tua candidatura per far parte del nostro team! 

  CONTATTACI

Questo sito web utilizza i cookie per migliorare l'esperienza dell'utente. Utilizzando il nostro sito l'utente acconsente a tutti i cookie in conformità con la Normativa sui Cookie.

Privacy Policy

Approvo
TOP