सैम अल्टमैन-रन ओपनई ने परिष्कृत और अनुकूलन योग्य वॉयस एजेंट बनाने के लिए डेवलपर्स को सशक्त बनाने के लिए अपने एपीआई में उन्नत स्पीच-टू-टेक्स्ट और टेक्स्ट-टू-स्पीच मॉडल पेश किए हैं। इन स्पीच-टू-टेक्स्ट मॉडल में पिछले कानाफूसी मॉडल की तुलना में ट्रांसक्रिप्शन सटीकता और भाषा मान्यता में सुधार करने के लिए GPT-4O-Transcribe और GPT-4O-Mini-Transcribe शामिल हैं। इसके अतिरिक्त, GPT-4O-MINI-TTS मॉडल का लॉन्च बढ़ाया स्टीयरबिलिटी का परिचय देता है। यह डेवलपर्स को मॉडल को उपयोग करने के लिए अनुकूलित अनुभवों की पेशकश करने के लिए निर्देश देने की अनुमति देगा। एलोन मस्क और सैम अल्टमैन-रन ओपनईआई ने लाभ के लिए ट्रायल में तेजी लाने के लिए सहमति व्यक्त की।

API में Openai ऑडियो मॉडल





Source link

कोई जवाब दें

कृपया अपनी टिप्पणी दर्ज करें!
कृपया अपना नाम यहाँ दर्ज करें