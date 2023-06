YouTube non vuole solo tagliare le parti che non funzionano ma andare oltre i sottotitoli tradotti consentendo ai creatori di doppiare video in altre lingue parlate. Al VidCon, YouTube ha annunciato che sta testando un servizio di doppiaggio basato sull’intelligenza artificiale chiamato Aloud, sviluppato presso l’incubatore Area 120 di Google.

Lo strumento eliminerebbe il tempo e spesso le grandi spese necessarie per doppiare nel solito modo (con traduttori e narratori umani), consentendo ai creatori di raggiungere un pubblico globale più ampio. Ad alta voce promette una “doppiatura di qualità in pochi minuti” utilizzando l’intelligenza artificiale.

Lo strumento crea prima una traduzione basata su testo che i creatori possono controllare e modificare, quindi genera un doppiaggio. Gli utenti possono scegliere diversi narratori, come pubblicare e altro.

Soprattutto per i creators di YouTube, il servizio è disponibile “gratuitamente”, afferma il sito Web di Aloud.

YouTube sta attualmente testando lo strumento con “centinaia” di creatori, ha dichiarato a The Verge il vicepresidente della gestione dei prodotti di YouTube, Amjad Hanif. È attualmente disponibile in inglese e ti consente di doppiare in spagnolo e portoghese con “più lingue in arrivo“, secondo Aloud.

Dal punto di vista dell’utente, l’impostazione appare come un interruttore “Traccia audio” nell’icona a forma di ingranaggio, appena sotto i sottotitoli.

Un esempio di ciò viene dal trailer del canale scientifico di Amoeba Sisters, che utilizza l’inglese come lingua madre, con un’opzione di lingua spagnola soprannominata creata dall’IA di Aloud.

La capacità di doppiare facilmente le lingue può espandere la portata di un creatore senza la necessità di fare nient’altro, ha affermato Google nel suo keynote. Non si sa ancora quando lo strumento di doppiaggio di Aloud sarà disponibile più ampiamente per i creators di YouTube.

In futuro, tuttavia, YouTube “farà ricalcare le tracce audio tradotte come la voce del creatore, con più espressione e sincronizzazione labiale“, ha affermato Hanif.

