Inovatie in domeniul AI: Realtime TTS-2, modelul care interpretează starea emoțională a vorbitorului
Cel mai recent sistem al startup-ului din Mountain View, Realtime TTS-2, analizează indicii vocali precum tonul, ritmul și înălțimea vocii pentru a deduce în timp real starea emoțională a vorbitorului. Acest model AI de tip voce ajustează dinamic propria voce și modul de livrare pentru a crea interacțiuni mai naturale și mai sensibile emoțional, conform Business Insider.
Pe măsură ce modelele AI de voce devin tot mai realiste, utilizarea și nivelul de implicare ar putea cunoaște o creștere semnificativă. Conversația vocală cu modele și chatboturi este considerată un mod mai natural de a folosi această tehnologie, comparativ cu modelele bazate pe text sau generarea de imagini.
CEO-ul Inworld, Kylan Gibbs, subliniază importanța componentei emoționale pentru evoluția acestei tehnologii. El evidențiază că interacțiunea umană în timp real reprezintă viitorul, iar adaptarea AI-ului pentru a reflecta această realitate poate crește angajamentul utilizatorilor.
Lansarea Realtime TTS-2 marchează o schimbare de direcție pentru companie, care a primit finanțare de peste 100 de milioane de dolari de la investitori precum Founders Fund, Intel și Microsoft. Modelul anterior al Inworld a fost deja recunoscut pentru calitatea vocii, depășind competitori importanți din industrie.
Noul model TTS-2 combină mai multe capabilități pentru a oferi o experiență vocală cât mai autentică. Acesta înțelege contextul unei conversații, detectează semnale emoționale din vorbirea umană în timp real și ajustează răspunsurile AI-ului pentru a corespunde stării utilizatorului și stării agentului.
Inworld poziționează Realtime TTS-2 ca infrastructură pentru dezvoltatori, oferindu-l prin intermediul unui API care se conectează la sisteme AI existente. Această abordare permite dezvoltatorilor să creeze aplicații personalizate, fără a concura direct cu clienții lor.
Prin combinarea tehnologiei avansate cu conștientizarea emoțională, Realtime TTS-2 deschide noi posibilități în domeniul interacțiunii om-mașină, având potențial aplicații în diverse domenii precum serviciile pentru clienți, sănătatea, educația și companiile AI.
