Noua tehnologie AI va dizolva granițele de comunicare prin traducerea în voce.
Cercetătorii de la Microsoft continuă să dezvăluie noi dezvoltări bazate pe inteligența artificială (AI), chiar dacă produsele din colaborarea sa cu Open AI sunt lansate utilizatorilor din întreaga lume. De data aceasta, viitoarea tehnologie AI a gigantului tehnologic din Redmond va permite utilizatorilor să vorbească într-o limbă străină cu propria lor voce.
La începutul acestui an co-fondatorul Microsoft, Bill Gates, a spus că AI este următorul lucru important în industria tehnologiei și va aduce cele mai mari schimbări în următorii ani. În noiembrie anul trecut OpenAI și-a lansat chatbot-ul conversațional, iar restul este istorie. ChatGPT face acum parte din produsele Microsoft existente. Modelul lingvistic mare este scalat pentru a ajunge la milioane de utilizatori în fiecare lună.
Chiar dacă Microsoft se apropie de succesul OpenAI, pe care l-a finanțat, cercetătorii companiei nu trec pe un loc din spate când vine vorba de cercetarea AI. În ianuarie anul acesta, compania a dezvăluit progresul pe care la în ceea ce privește AI-ul său text-to-speech, VALL-E.
Îndepărtându-se de abordările convenționale, cum ar fi manipularea formelor de undă pentru a genera vorbire, cercetătorii Microsoft au oferit inteligenței artificiale capacitatea de a genera codecuri audio discrete din text și prompturi audio. Echipa a reușit, de asemenea, să reducă durata promptului audio la doar trei secunde și să obțină totuși o vorbire precisă care se potrivește cu vocea utilizatorului.
Odată cu dezvoltarea recentă, cercetătorii au dus cu siguranță AI mai departe, permițând utilizatorilor să comunice în limbi străine folosind propria voce, chiar dacă nu le vorbesc. Acest lucru ar putea ajuta în mare măsură oamenii să comunice mai eficient peste granițe, reducând obstacolele în comunicare.
AI-ul este, de asemenea, capabil să înfățișeze corect mai multe emoții, făcându-l și mai realist.
Microsoft este, de asemenea, conștientă de dezavantajele și potențiala utilizare greșită a acestei tehnologii și prin urmare, nu a lansat-o încă publicului. Interesant este că VALL-E a fost instruit pe setul de date LibriLight, care a fost creat de Meta a lui Mark Zuckerberg, care pariază pe metavers ca viitorul internetului.
Interesting Engineering a raportat recent că gigantul motoarelor de căutare Google lucrează și la ambițioasa sa IA care ar putea ajuta utilizatorii să traducă peste 1.000 de limbi vorbite pe tot globul.
Articol de Răzvan Lupu