أوبن إيه آي تكشف عن GPT-5 Pro وSora 2 ونموذج صوتي جديد في تحديثات API لمؤتمر المطورين
جاري التحميل...

أوبن إيه آي تكشف عن GPT-5 Pro وSora 2 ونموذج صوتي جديد في تحديثات API لمؤتمر المطورين
كشفت OpenAI عن تحديثات جديدة لواجهة برمجة التطبيقات (API) في مؤتمرها للمطورين (Dev Day) يوم الاثنين، مقدمةً نموذجها اللغوي الأحدث GPT-5 Pro، ونموذجها الجديد لتوليد الفيديو Sora 2، بالإضافة إلى نموذج صوتي أصغر وأقل تكلفة.
كانت هذه التحديثات جزءًا من سلسلة من الإعلانات التي تهدف إلى جذب المطورين إلى بيئة OpenAI، بما في ذلك إطلاق أداة لبناء الوكلاء والقدرة على بناء تطبيقات داخل ChatGPT.
قد يروق إضافة GPT-5 Pro للمطورين الذين يبنون تطبيقات في قطاعات المالية والقانون والرعاية الصحية وهي صناعات تتطلب "دقة عالية وعمقًا في التفكير"، وفقًا لسام ألتمان، الرئيس التنفيذي لشركة OpenAI.
وأشار ألتمان أيضًا إلى أن القدرات الصوتية ستكون ضرورية في المستقبل حيث سرعان ما تصبح إحدى الطرق الأساسية التي يستخدمها الناس للتفاعل مع الذكاء الاصطناعي. تحقيقًا لهذه الغاية، تطلق OpenAI نموذج "gpt-realtime mini"، وهو نموذج صوتي أصغر وأقل تكلفة في واجهة برمجة التطبيقات (API) يدعم التفاعلات الصوتية والكلامية المتدفقة بزمن استجابة منخفض. النموذج الجديد أرخص بنسبة 70% من نموذج OpenAI الصوتي المتقدم السابق ولكنه يعد بـ "نفس جودة الصوت والتعبيرية".
أخيرًا، يمكن للمبدعين المشاركين في بيئة مطوري OpenAI الآن الاستفادة من Sora 2 في معاينة عبر واجهة برمجة التطبيقات (API). أطلقت OpenAI نموذج Sora 2، أحدث مولد للصوت والفيديو لديها، الأسبوع الماضي جنبًا إلى جنب مع تطبيق Sora، وهو منافس لتطبيق TikTok مليء بمقاطع الفيديو القصيرة التي تم إنشاؤها بواسطة الذكاء الاصطناعي. يتيح تطبيق Sora للمستخدمين إنشاء مقاطع فيديو لأنفسهم أو لأصدقائهم أو لأي شيء بناءً على موجه، ومشاركتها عبر موجز خوارزمي على غرار TikTok.
قال ألتمان: "أصبح لدى [المطورين] الآن إمكانية الوصول إلى نفس النموذج الذي يدعم مخرجات الفيديو المذهلة لـ Sora 2 مباشرةً في تطبيقاتهم الخاصة".
يعتمد Sora 2 على جيله السابق بتقديم مشاهد أكثر واقعية ومتسقة فيزيائيًا مع صوت متزامن وتحكم إبداعي أكبر بدءًا من توجيه الكاميرا المفصل وصولاً إلى المرئيات الأنيقة.
قال ألتمان: "على سبيل المثال، يمكنك أخذ عرض iPhone ومطالبة Sora بتوسيعه إلى لقطة سينمائية واسعة وشاملة. ولكن أحد أكثر الأشياء إثارة التي عملنا عليها هو مدى جودة هذا النموذج الجديد في مزاوجة الصوت مع المرئيات، ليس فقط الكلام، بل أيضًا المشاهد الصوتية الغنية، والصوت المحيط، والمؤثرات المتزامنة التي تستند إلى ما تراه".
يُقدم Sora 2 كأداة لتطوير المفاهيم، سواء كانت نقطة انطلاق بصرية لإعلان بناءً على الأجواء العامة لمنتج، أو مصممًا في Mattel يحول رسمًا تخطيطيًا إلى مفهوم لعبة وهو مثال قدمه ألتمان في مؤتمر المطورين (Dev Day) يلقي الضوء على صفقة OpenAI مع صانعة باربي لإدخال الذكاء الاصطناعي التوليدي في خط إنتاج الألعاب.
