Nvidia, cel mai mare furnizor de cipuri și software utilizate pentru crearea sistemelor AI, a declarat că nu intenționează să lanseze public această tehnologie în viitorul apropiat. Tehnologia poartă numele de Fugatto, o abreviere pentru Foundational Generative Audio Transformer Opus 1.
Această tehnologie se alătură altor soluții similare prezentate de startup-uri precum Runway sau de companii mai mari, cum ar fi Meta Platforms (META.O), care pot genera audio sau video pe baza unor descrieri text.
Modelul dezvoltat de Nvidia, cu sediul în Santa Clara, California, poate genera efecte sonore și muzică pornind de la o descriere textuală, inclusiv sunete inedite, cum ar fi transformarea sunetului unei trompete într-un lătrat de câine.
O abordare inovatoare în modificarea sunetelor existente
Ce face ca tehnologia Nvidia să fie diferită de alte modele AI este capacitatea sa de a prelucra și modifica sunete existente. De exemplu, poate transforma o linie melodică interpretată la pian într-o linie cântată de o voce umană sau poate schimba accentul și starea emoțională a unei înregistrări vocale.
„Dacă ne gândim la sunetele sintetice din ultimii 50 de ani, muzica sună diferit astăzi datorită computerelor și sintetizatoarelor,” a declarat Bryan Catanzaro, vicepreședinte al departamentului de cercetare aplicată în deep learning la Nvidia. „Cred că AI-ul generativ va aduce capabilități noi în muzică, jocuri video și pentru oamenii obișnuiți care vor să creeze lucruri.”
Provocările etice și riscurile asociate AI generative
În timp ce companii precum OpenAI negociază cu studiourile de la Hollywood utilizarea AI în industria divertismentului, relația dintre industria tech și Hollywood rămâne tensionată. Recent, actrița Scarlett Johansson a acuzat OpenAI că i-a imitat vocea.
Noul model Nvidia a fost antrenat pe date open-source, iar compania încă dezbate dacă și cum va face tehnologia accesibilă publicului.
„Orice tehnologie generativă vine cu anumite riscuri, deoarece oamenii o pot folosi pentru a crea lucruri pe care am prefera să nu le creeze,” a spus Catanzaro. „Trebuie să fim precauți, motiv pentru care nu avem planuri imediate de lansare.”
Companiile care dezvoltă modele AI generative încă explorează metode de a preveni utilizarea abuzivă a tehnologiei, precum generarea de dezinformări sau încălcarea drepturilor de autor prin imitarea personajelor protejate de copyright.
La fel ca Nvidia, OpenAI și Meta (META.O) nu au anunțat încă date concrete pentru lansarea publică a modelelor lor de generare audio și video.
CEO-ul Nvidia, Jensen Huang, a subliniat recent: „Epoca AI a început.”
Fiți la curent cu ultimele noutăți. Urmăriți DCBusiness și pe Google News
Ţi s-a părut interesant acest articol?
Urmărește pagina de Facebook DCBusiness pentru a fi la curent cu cele mai importante ştiri despre evoluţia economiei, modificările fiscale, deciziile privind salariile şi pensiile, precum şi alte analize şi informaţii atât de pe plan intern cât şi extern.