Voice Over con Intelligenza artificiale

Voice over con intelligenza artificiale

Voice Over con Intelligenza Artificiale:
il ruolo delle Case di Produzione, Doppiatori, Clienti e i vari scenari della Sintesi vocale con Intelligenza Artificiale.

Loading the Elevenlabs Text to Speech AudioNative Player…

Che il progresso non si possa arrestare è un dato di fatto.
Dicono che tentarci sia come cercare di fermare il vento con le mani.
Molte tecnologie del passato sono state mal viste, inizialmente.
Qualsiasi strumento, è assodato, può essere fonte di criticità semplicemente se usato male.
Qualsiasi alimento può essere dannoso per il nostro organismo, se ingerito in grandi quantità.

Considerando che le tecnologie di Intelligenza Artificiale migliorano in maniera esponenziale giorno dopo giorno, probabilmente è miope cercare di opporsi allo scopo di fermarle. Si tratta, invece, di trovare un modello di business, una quadra, una regolamentazione, seguire principi etici e deontologici che impediscano un utilizzo strumentale e pericoloso di queste tecnologie.

L’uso dell’intelligenza artificiale nel settore del doppiaggio e speakeraggio necessita di una regolamentazione che consenta alle case di produzione e ai doppiatori, da un lato, di trarne un beneficio, e ai clienti di ottenere nuovi servizi di Voice Over con intelligenza artificiale a condizioni favorevoli, dall’altro.

Occorre domandarsi:

Cosa è cambiato nel settore dell’Intelligenza Artificiale applicata alla sintesi vocale?
Se dieci anni fa occorrevano tre anni di registrazioni per comporre la voce virtuale, oggi bastano tre ore. Ma devono essere fatte bene: con le voci migliori, le giuste attrezzature, una corretta regia, una post produzione perfetta. E qui già agenzie e aziende riescono a intuire quanto possa essere determinante il ruolo delle case di produzione.

Perché la Generative AI di sintesi vocale può servire alle imprese. E perché no.

Sicuramente è utile per grandi quantità di materiale. Il Corriere della sera offre il servizio di ascolto dei propri articoli, ma nessuno speaker umano potrebbe mai leggere quattrocento articoli alla sera nella speranza di averli tutti pronti alle cinque del mattino!

Non è utile, al momento, per quelle lavorazioni in cui il calore e il sentimento della voce umana siano fondamentali per creare un determinato stato d’animo negli ascoltatori, come ad esempio nelle pubblicità o in alcuni video istituzionali dove ci si rivolge, con grande afflato, al team e più in generale a una precisa comunità.

Di quali limiti principali dell’AI devono essere consapevoli le aziende utenti, e come possono superarli.

Al momento si può intervenire su alcuni fattori come ad esempio la stabilità, sulla chiarezza, sulla similarità alla voce umana e sull’enfasi maggiore o minore del tono di voce. Tuttavia ancora non è possibile ottenere esattamente tutto ciò che, abitualmente, si pretende dalla voce umana paragrafo per paragrafo.

Tale limitazione può passare abbastanza inosservata in base ai contenuti: news, articoli, approfondimenti, tutorial possono accontentarsi. Ma per altre produzioni il rischio è che tutto risulti eccessivamente freddo e possa così distogliere l’attenzione dai contenuti.

Tempo pochi anni e forse sarà possibile intervenire sull’analisi logica del testo, sulle cesure, sulle cadenza, sul rispetto della punteggiatura e addirittura stabilire dove effettuare una appoggiatura.

Cosa stanno concretamente facendo le aziende e gli operatori italiani con l’Intelligenza Artificiale. Come si compone l’ecosistema ideale di partner tecnologici, competenze e ruoli che le aziende utenti devono ricercare.

Sicuramente c’è molto fermento e numerosi piccoli operatori, esclusivamente per una ragione di tempi e costi, stanno già rivolgendosi all’intelligenza artificiale per alcune lavorazioni.

L’ecosistema ideale, a nostro avviso, sarà quello che vedrà quattro attori con competenze, responsabilità e ruoli differenti, pronti a collaborare assieme per ottenere non solo un miglioramento delle performance, ma anche regolamentare l’uso affinché non si generino conflitti o utilizzi impropri delle voci virtuali.

Questi quattro partner saranno:

     

      • le piattaforme di intelligenza artificiale con i propri algoritmi e con nuovi standard di sicurezza

      • le case di produzione audio che implementeranno queste tecnologie e che si faranno da intermediari tra la AI e le imprese, tutelando i doppiatori.
        Dovranno comportarsi con responsabilità come fossero “enti certificati”. Garantendo cioè un alto livello qualitativo (compatibilmente ai limiti della AI) ai propri clienti da un lato, e mettendo molto chiaramente due paletti ai clienti, dall’altro: solo lavorazioni che non necessitano di interpretazione  e obbligo di corresponsione di diritti d’utilizzo ai doppiatori. 

      • I doppiatori che, in accordo con le case di produzione, offriranno la propria voce ottenendo in cambio i diritti d’utilizzo.

      • I clienti che non dovranno pensare ad altro se non sottoporre semplicemente i testi alle case di produzione audio per ottenerne i propri file audio.

    VOICE OVER con INTELLIGENZA ARTIFICIALE:
    PRO E CONTRO per le IMPRESE

    PRO

        • maggior velocità nell’ottenimento dei propri voice over;

        • contenimento dei costi

        • incentivo a produrre di più

        • enormi vantaggi nelle localizzazioni in lingua

      CONTRO

        • minore sentimento e calore umano

      VOICE OVER con INTELLIGENZA ARTIFICIALE:
      PRO  e CONTRO per i DOPPIATORI

      PRO

        • possibilità di prendere lavori che altrimenti andrebbero inevitabilmente perduti;

        • possibilità di ricevere diritti d’utilizzo e avere comunque più tempo libero per altre lavorazioni;

        • possibilità di ricevere compensi doppi per utilizzo della propria voce virtuale anche in altre lingue (cosa umanamente non possibile).

      CONTRO

        • rischio che la propria voce virtuale venga utilizzata in modo indebito.

      Per ovviare a quest’ultimo inconveniente, ecco che la Casa di Produzione Audio diventa intermediario “certificato” indispensabile, in particolare adottando un codice etico e deontologico che potrebbe anche essere condiviso tra colleghi. Ad esempio stabilendo di non offrire ai doppiatori compensi per uso “perpetuo”.


      Il progresso è come un fiume in continuo movimento, e resistere potrebbe solo portare stagnazione. I doppiatori nel tempo potranno vedere l’intelligenza artificiale come una tecnologia amica in grado di ampliare le loro possibilità e adattarsi così all’evoluzione del settore.

      Le case di produzione potranno sfruttare la sintesi vocale per offrire nuovi servizi collaborando con tecnologie di sintesi vocale per creare esperienze più ricche, affinare le performance, aggiungendo sfumature emotive uniche o creando, ad esempio, voci fantascientifiche. 

      La collaborazione con l’intelligenza artificiale, in sostanza, può aprire nuove opportunità creative e consentire la realizzazione di progetti altrimenti inaccessibili.

      © 2024 Preludio s.r.l – Andrea Thomas Gambetti – tutti i diritti di riproduzione sono riservati