Kurumsal Ses Asistanlarında Yeni Dönem: OpenAI'ın Gerçek Zamanlı Modeliyle Doğal ve İfadeli Sesler

Gerçek Zamanlı Ses Modeliyle Daha İnsan Gibi Sesler
Ses yapay zekası pazarının giderek daha rekabetçi hale gelmesiyle birlikte, OpenAI, kurumsal kullanıcıların benimsemesi için talimat takip etme ve ifadeli konuşma özelliklerine odaklanıyor. Ses yapay zekası, müşteri hizmetleri görüşmeleri veya gerçek zamanlı çeviri gibi kullanım alanları bulundukça, gerçekçi sesler sunan ancak kurumsal güvenlik standartlarını da karşılayan ses yapay zekası modelleri için talep artıyor.
OpenAI, yeni gpt-realtime modeli ile daha insan benzeri sesler sunduğunu iddia ediyor ancak ElevenLabs gibi rakipleriyle de rekabet etmek zorunda. Model, şirketin Realtime API'sinde kullanıma sunulacak. OpenAI, gpt-realtime modelinin yanı sıra Cedar ve Marin adlı yeni sesler de yayınladı ve diğer seslerini de güncelledi.
Talimat Takibi ve Duygusal Sesler
OpenAI, gpt-realtime modelini, müşteri desteği ve akademik danışmanlık gibi gerçek dünyadaki senaryolara göre eğitti. Model, daha duygusal ve doğal sesler üretebiliyor ve geliştiricilerin teknolojiyi nasıl kullandıklarına daha iyi uyum sağlıyor.
Gpt-realtime, konuşma-konuşma çerçevesinde çalışıyor, böylece sözel komutları anlayabiliyor ve sesli yanıt verebiliyor. Bu tür modeller, bir kişinin bir uygulamayla etkileşime girdiği gerçek zamanlı yanıtlar için idealdir.
Daha Karmaşık Talimatları Takip Edebilen Model
OpenAI, gpt-realtime modelinin talimat takip yeteneğini geliştirdi ve modelin talimatlara daha etkili şekilde uymasını sağladı. Yeni model, MultiChallenge ses değerlendirmesinde %30,5 puan aldı.
Realtime API'ye Yeni Özellikler
OpenAI, yeni modeli ve kurumların uygulamalarına gerçek zamanlı AI yeteneklerini entegre etmelerini desteklemek için Realtime API'ye birkaç yeni özellik ekledi. API artık MCP'yi destekliyor ve görüntü girişlerini tanıyabiliyor, böylece kullanıcılara gerçek zamanlı olarak ne gördüğünü bildirebiliyor.
Realtime API ayrıca Oturum Başlatma Protokolü'nü (SIP) de işleyebiliyor. SIP, uygulamaları telefon şebekesine veya masa üstü telefonlara bağlıyor, böylece daha fazla müşteri hizmetleri kullanım durumu açılıyor.