ChatGpt adauga comunicarea prin voce si imagini

OpenAI, compania din spatele celebrului chatbot AI ChatGPT, a făcut un pas important în evoluția acestuia. Până acum, ChatGPT era doar un instrument de text cu care puteai comunica prin tastare. Acum acesta învață să înțeleagă întrebările în moduri noi și inovatoare.

Compania OpenAI lansează o nouă versiune a serviciului care îți permite să interacționezi cu acest bot AI nu doar tastând propoziții într-un tab de text, ci și vorbind sau încărcând o imagine. Aceste caracteristici noi vor fi disponibile pentru utilizatorii care plătesc pentru ChatGPT în următoarele două săptămâni, iar ceilalți vor avea acces la ele „în curând”, conform anunțului OpenAI.

Partea de comenzi vocale este destul de familiară: apeși un buton și rostești întrebarea ta, ChatGPT o convertește în text și o trimite modelului de limbaj mare, primește un răspuns, îl convertește înapoi în vorbire și îl pronunță cu voce. Ar trebui să se simtă la fel ca și cum vorbești cu Alexa, Google Assistant sau Siri, doar că OpenAI speră ca răspunsurile să fie mai bune datorită tehnologiei subiacente îmbunătățite. Se pare că majoritatea asistenților virtuali sunt reconstruiți pentru a se baza pe modele mari de limbaj, iar OpenAI este în avans în acest joc.

Modelul Whisper excelent al OpenAI realizează mult din munca de convertire a vorbirii în text, iar compania lansează un nou model de text-to-speech pe care afirmă că poate genera „sunet similar cu cel uman din doar text și câteva secunde de înregistrare vocală de probă”. Vei putea să alegi vocea ChatGPT din cinci opțiuni, dar OpenAI pare să creadă că modelul are mult mai mult potențial decât atât. OpenAI lucrează cu Spotify pentru a traduce podcast-urile în alte limbi, păstrând totuși sunetul vocii podcasterului. Există multe utilizări interesante pentru vocile sintetice, iar OpenAI ar putea juca un rol important în această industrie.

Faptul că poți construi o voce sintetică capabilă cu doar câteva secunde de înregistrare vocală deschide și ușa pentru tot felul de utilizări problematice. Asta duce la riscuri noi, cum ar fi posibilitatea ca actori malefici să impersonalizeze figuri publice sau să comită fraude. OpenAI spune că modelul nu este disponibil pentru utilizarea largă tocmai din acest motiv. Va fi mult mai controlat și restrâns pentru cazuri de utilizare specifice și parteneriate.

Căutarea de imagini, pe de altă parte, este asemănătoare cu Google Lens. Faci o fotografie a a ceea ce te interesează, iar ChatGPT va încerca să înțeleagă despre ce este vorba și să răspundă în consecință. Desigur ca si căutarea de imagini are și potențiale probleme. Una dintre ele este ceea ce ar putea să se întâmple când întrebi un chatbot despre o persoană. OpenAI afirmă că a limitat intenționat capacitatea lui ChatGPT de a analiza și de a face declarații directe despre oameni atât din motive de precizie, cât și din motive de confidențialitate. Asta înseamnă că una dintre cele mai controversate functii care implica – capacitatea de a identifica diverse persoane pe baza unor imagini nu va veni prea curând. Ceea ce este probabil o veste bună.

Nu pot sa nu remarc faptul ca pe măsură ce tot mai mulți oameni folosesc controlul vocal și căutarea de imagini, și pe măsură ce ChatGPT se apropie tot mai mult de a deveni o asistentă virtuală cu adevărat multimodală și utilă, va deveni tot mai dificil să păstrăm limitele de siguranță.

ChatGpt Adauga voce si imagini la functiile sale

Abonează-te la Blogman.ro pe WhatsApp

Urmareste-ma pe Google News

ChatGpt adauga comunicarea prin voce si imagini

Pe aceași temă

Lasă un comentariu Anulează răspunsul

Trimite pe:

Pe aceași temă

Lasă un comentariu Anulează răspunsul