Perché i deepfake autorizzati sono un grande affare

Unisciti a noi il 9 novembre per imparare come innovare con successo e raggiungere l’eccellenza migliorando e ridimensionando gli sviluppatori cittadini al Summit Low-Code/No-Code. Registrati qui.


Natalie Monbiot, capo della strategia della società di media sintetici Hour One, non ama la parola “deepfakes”.

“Deepfake implica l’uso non autorizzato di media sintetici e intelligenza artificiale generativa: siamo stati autorizzati fin dall’inizio”, ha detto a VentureBeat.

Ha descritto la Hour One di Tel Aviv e New York come una società di intelligenza artificiale che “ha anche creato un quadro legale ed etico su come interagire con persone reali per creare la loro somiglianza in forma digitale”.

Autorizzato contro non autorizzato. È una definizione importante in un momento in cui i deepfake, o media sintetici in cui una persona in una foto o un video esistente viene sostituita con la somiglianza di qualcun altro, hanno ricevuto molta cattiva stampa, non sorprendentemente, perché sulla connessione di lunga data dei deepfake con il revenge porn e notizie false. Il termine “deepfake” può essere fatto risalire a un utente Reddit nel 2017 chiamato “deepfakes” che, insieme ad altri nella comunità, condivideva video, molti dei quali coinvolgevano volti di celebrità sostituiti con corpi di attori in video pornografici.

Evento

Summit Low-Code/No-Code

Scopri come creare, ridimensionare e gestire programmi low-code in un modo semplice che crei successo per tutti questo 9 novembre. Registrati per il tuo pass gratuito oggi.

Registrati qui

E minacce profonde incombono, secondo un recente documento di ricerca di Eric Horvitz, chief science officer di Microsoft. Questi includono deepfake interattivi, che offrono l’illusione di parlare con una persona reale, e deepfake compositivi, che hanno un cattivo attore che crea più deepfake per compilare una “storia sintetica”.

Di recente, ci sono state molte notizie sui deepfake delle celebrità. C’è la copertura del Wall Street Journal sui deepfake di Tom Cruise, Elon Musk e Leonardo DiCaprio che appaiono non autorizzati negli annunci, così come le voci su Bruce Willis che ha revocato i diritti alla sua somiglianza con il deepfake (non è vero).

Il lato commerciale del profondo dibattito

Ma c’è un altro aspetto nel profondo dibattito, affermano diversi fornitori specializzati nella tecnologia dei media sintetici. Che dire dei deepfake autorizzati utilizzati per la produzione di video aziendali?

La maggior parte dei casi d’uso per i video deepfake, sostengono, sono completamente autorizzati. Possono trovarsi in contesti aziendali, ad esempio per la formazione dei dipendenti, l’istruzione e l’e-commerce. Oppure possono essere creati da utenti come celebrità e leader aziendali che vogliono sfruttare i media sintetici per “esternalizzare” un gemello virtuale.

L’idea, in questi casi, è quella di utilizzare media sintetici, sotto forma di persone virtuali, per affrontare le sfide costose, complesse e non quantificabili della produzione video tradizionale, soprattutto in un momento in cui la fame di contenuti video sembra non divertirsi. Hour One, ad esempio, afferma di aver prodotto 100.000 video negli ultimi tre anni e mezzo, con clienti tra cui il leader dell’apprendimento delle lingue Berlitz e società di media come NBC Universal e DreamWorks.

Una volta che l’IA generativa è diventata parte dello zeitgeist culturale mainstream, il futuro appare roseo per i casi d’uso aziendali dei deepfake. Forrester ha recentemente pubblicato le sue migliori previsioni di intelligenza artificiale per il 2023, una delle quali è che il 10% delle aziende Fortune 500 svilupperà contenuti utilizzando strumenti di intelligenza artificiale. Il rapporto cita startup come Hour One e Synthesia che “utilizzano l’intelligenza artificiale per accelerare la creazione di contenuti video”.

Un altro rapporto prevede che nei prossimi cinque-sette anni, fino al 90% dei media digitali potrà essere generato sinteticamente.

“Sembra troppo forte… forse anche a me”, ha detto Monbiat. “Ma mentre la tecnologia matura e i grandi attori entrano in questo spazio, stiamo assistendo a un’interruzione”.

Il lato commerciale è una parte “grossolanamente sottovalutata” del profondo dibattito, insiste Victor Riparbelli, CEO di Synthesia, con sede a Londra, che si descrive come una “società di creazione di video AI”. Fondata nel 2017, ha più di 15.000 clienti, un team di 135 e “cresce a doppia cifra ogni mese”. I suoi clienti includono giganti del fast food tra cui McDonald’s, la società di ricerca Teleperformance e la holding di pubblicità globale WPP.

“È molto interessante come l’obiettivo sia diventato così stretto su tutte le cose brutte che puoi fare con questa tecnologia”, ha detto Riparbelli. “Penso che quello che abbiamo visto sia più interesse per esso e sempre più casi d’uso”.

Un video dal vivo che puoi sempre modificare

È difficile accedere a contenuti di qualità e la maggior parte delle aziende non ha le competenze per consentire la produzione di contenuti di alto livello, ha affermato Monbiat.

“La maggior parte delle aziende non ha persone con competenze che consentano la creazione di contenuti, per non parlare della creazione di contenuti di alto livello che presentino talenti reali, né hanno la capacità di modificare video o disporre di questo tipo di risorse internamente”, ha spiegato . Hour One è una piattaforma senza codice, quindi anche gli utenti senza precedenti capacità di creazione di contenuti possono scegliere tra una gamma di persone virtuali o diventarlo loro stessi.

Berlitz, uno dei primi clienti aziendali di Hour One, aveva bisogno di trasformarsi digitalmente dopo 150 anni di offerta di apprendimento in classe. “Per mantenere l’istruttore sui contenuti, fanno videoconferenze dal vivo, ma ciò non è davvero scalabile”, ha detto Monbiat. “Anche se hanno tutte le risorse di produzione del mondo, il costo, l’investimento e la gestione di tutti quei file è pazzesco”. Ha aggiunto che con l’IA, i contenuti possono essere costantemente aggiornati e aggiornati. Oggi Berlitz ha oltre 20.000 video in diverse lingue creati con One Hour.

Nel frattempo, Synthesia afferma che la sua IA è addestrata su attori reali. Offre immagini e doppiatori come personaggi virtuali che i clienti possono scegliere per creare video di formazione, apprendimento, conformità e marketing. Gli attori sono pagati per video prodotto con loro.

Per i clienti enterprise, diventa un “live video” su cui possono sempre tornare e modificare, spiega Riparbelli.

Il video di Synthesia

“Penso che in questo momento lavoriamo per quasi tutte le catene di fast food più grandi del mondo”, ha detto. “Devono formare centinaia di migliaia di persone ogni anno, su tutto… come stare al sicuro sul lavoro, come gestire un reclamo dei clienti, come far funzionare la friggitrice”.

In precedenza, ha detto, un’azienda poteva registrare alcuni video, ma sarebbero stati di altissimo livello e evergreen. Tutti gli altri corsi di formazione saranno probabilmente tramite diapositive PowerPoint o PDF. “Non è un buon modo per allenarsi, soprattutto non per le giovani generazioni”, ha detto. Invece, ora creano contenuti video, per sostituire non le riprese video originali, ma le opzioni di testo.

Gli accordi di consenso sono fondamentali

Oras One guida gli utenti attraverso il processo per ottenere la massima qualità di acquisizione video davanti a uno schermo verde. Il metraggio di base diventa i dati di addestramento per l’IA.

“Fondamentalmente creiamo un gemello digitale di quella persona, ad esempio un CEO”, ha affermato Monbiat. “Il CEO firmerà un accordo che ci consentirà di riprendere il filmato e creare un gemello virtuale”. Un’altra parte dell’accordo determinerà chi è autorizzato a creare contenuti con il gemello virtuale.

“Vogliamo che le persone vivano un’esperienza molto positiva, confortevole e piacevole con il nostro contenuto umano virtuale”, ha affermato. “Se le persone sono un po’ confuse o a disagio, ciò crea una mancanza di fiducia, ed è molto antitetico al motivo per cui facciamo quello che facciamo”.

Secondo Synthesia, questo tipo di autorizzazione è comune a tutti i tipi di accordi di licenza esistenti.

“Kim Kardashian ha letteralmente concesso in licenza la sua somiglianza agli sviluppatori di app per creare un gioco che ha fruttato miliardi di dollari”, ha detto Riparbelli. “Ogni artista o celebrità concede in licenza la propria somiglianza”.

Gli influencer offrono le loro immagini in scala

Una società di media sintetici, Deepcake, fa meno affidamento sullo spazio aziendale e più sull’attività di deepfake autorizzati utilizzati da celebrità e influencer per l’approvazione del marchio. Ad esempio, la società ha creato un “gemello digitale” di Bruce Willis da utilizzare in una pubblicità per la società di telecomunicazioni russa MegaFon. Ciò ha portato a voci secondo cui Deepcake possedeva i diritti del gemello digitale di Willis (che non hanno).

“Lavoriamo direttamente con le star con le agenzie di gestione dei talenti, per sviluppare gemelli digitali pronti per essere inseriti in qualsiasi tipo di contenuto, come gli spot pubblicitari per TikTok”, ha affermato il CEO Maria Chmir. “È un nuovo modo di produrre contenuti senza risorse classiche come la ricerca costante di luoghi e un processo di post-produzione molto lungo e costoso”.

Ci sono anche persone completamente sintetizzate che possono diventare ambasciatori del marchio per poche decine di dollari, ha aggiunto. Gli utenti inseriscono semplicemente il testo che questi caratteri dovrebbero dire.

“Ovviamente non puoi clonare il carisma e far improvvisare qualcuno, ma lo facciamo”, ha detto.

Il futuro dei deepfake autorizzati

Synthesia dice che aggiungerà emozioni e movimento ai suoi video nei prossimi mesi. Hour One ha recentemente rilasciato ambienti 3D per creare un’esperienza “veramente coinvolgente”.

“Se pensi alla maturità della tecnologia di intelligenza artificiale, ogni volta che saliamo su quella scala, apriamo più casi d’uso”, ha affermato Riparbelli. “Quindi il prossimo anno, penso che vedremo molti contenuti di marketing, come gli annunci di Facebook. In generale, vedremo meno testo e più video e audio nella comunicazione che utilizziamo ogni giorno”.

I casi d’uso aziendali sui “deepfake” dei media sintetici sono solo all’inizio, ha detto Monbiat, aggiungendo: “Ma questa economia è già iniziata”.

La missione di VentureBeat sarà una piazza cittadina digitale per i decisori tecnici per acquisire conoscenze sulla tecnologia e sulle transazioni aziendali trasformative. Scopri i nostri Briefing.

Leave a Reply

Your email address will not be published. Required fields are marked *