सैम अल्टमैन-रन ओपनई ने परिष्कृत और अनुकूलन योग्य वॉयस एजेंट बनाने के लिए डेवलपर्स को सशक्त बनाने के लिए अपने एपीआई में उन्नत स्पीच-टू-टेक्स्ट और टेक्स्ट-टू-स्पीच मॉडल पेश किए हैं। इन स्पीच-टू-टेक्स्ट मॉडल में पिछले कानाफूसी मॉडल की तुलना में ट्रांसक्रिप्शन सटीकता और भाषा मान्यता में सुधार करने के लिए GPT-4O-Transcribe और GPT-4O-Mini-Transcribe शामिल हैं। इसके अतिरिक्त, GPT-4O-MINI-TTS मॉडल का लॉन्च बढ़ाया स्टीयरबिलिटी का परिचय देता है। यह डेवलपर्स को मॉडल को उपयोग करने के लिए अनुकूलित अनुभवों की पेशकश करने के लिए निर्देश देने की अनुमति देगा। एलोन मस्क और सैम अल्टमैन-रन ओपनईआई ने लाभ के लिए ट्रायल में तेजी लाने के लिए सहमति व्यक्त की।
API में Openai ऑडियो मॉडल
एपीआई में तीन नए अत्याधुनिक ऑडियो मॉडल:
🗣 दो स्पीच-टू-टेक्स्ट मॉडल- फुसफुसाते हुए फुसफुसाते हुए
💬 एक नया टीटीएस मॉडल- आप इसे निर्देश दे सकते हैं * कैसे * बोलने के लिए
🤖 और एजेंट एसडीके अब ऑडियो का समर्थन करते हैं, जिससे वॉयस एजेंटों का निर्माण करना आसान हो जाता है।
अब tts की कोशिश करो https://t.co/mbtolnyyca।
– Openai डेवलपर्स (@openaidevs) 20 मार्च, 2025
।