Inovatie in domeniul AI: Realtime TTS-2, modelul care interpretează starea emoțională a vorbitorului

hotfax.ro-favicon
2 Minute de lectură

Inovatie in domeniul AI: Realtime TTS-2, modelul care interpretează starea emoțională a vorbitorului

Cel mai recent sistem al startup-ului din Mountain View, Realtime TTS-2, analizează indicii vocali precum tonul, ritmul și înălțimea vocii pentru a deduce în timp real starea emoțională a vorbitorului. Acest model AI de tip voce ajustează dinamic propria voce și modul de livrare pentru a crea interacțiuni mai naturale și mai sensibile emoțional, conform Business Insider.

Pe măsură ce modelele AI de voce devin tot mai realiste, utilizarea și nivelul de implicare ar putea cunoaște o creștere semnificativă. Conversația vocală cu modele și chatboturi este considerată un mod mai natural de a folosi această tehnologie, comparativ cu modelele bazate pe text sau generarea de imagini.

CEO-ul Inworld, Kylan Gibbs, subliniază importanța componentei emoționale pentru evoluția acestei tehnologii. El evidențiază că interacțiunea umană în timp real reprezintă viitorul, iar adaptarea AI-ului pentru a reflecta această realitate poate crește angajamentul utilizatorilor.

Lansarea Realtime TTS-2 marchează o schimbare de direcție pentru companie, care a primit finanțare de peste 100 de milioane de dolari de la investitori precum Founders Fund, Intel și Microsoft. Modelul anterior al Inworld a fost deja recunoscut pentru calitatea vocii, depășind competitori importanți din industrie.

Noul model TTS-2 combină mai multe capabilități pentru a oferi o experiență vocală cât mai autentică. Acesta înțelege contextul unei conversații, detectează semnale emoționale din vorbirea umană în timp real și ajustează răspunsurile AI-ului pentru a corespunde stării utilizatorului și stării agentului.

Inworld poziționează Realtime TTS-2 ca infrastructură pentru dezvoltatori, oferindu-l prin intermediul unui API care se conectează la sisteme AI existente. Această abordare permite dezvoltatorilor să creeze aplicații personalizate, fără a concura direct cu clienții lor.

Prin combinarea tehnologiei avansate cu conștientizarea emoțională, Realtime TTS-2 deschide noi posibilități în domeniul interacțiunii om-mașină, având potențial aplicații în diverse domenii precum serviciile pentru clienți, sănătatea, educația și companiile AI.

Share This Article
Niciun comentariu