Logo

Cover Image for مجموعات الذكاء الاصطناعي الصينية تبتكر لخفض تكلفة النماذج

مجموعات الذكاء الاصطناعي الصينية تبتكر لخفض تكلفة النماذج


ابق على اطلاع بالتحديثات المجانية

ما عليك سوى الاشتراك في ملخص الذكاء الاصطناعي myFT – الذي يتم تسليمه مباشرة إلى صندوق الوارد الخاص بك.

وتعمل شركات الذكاء الاصطناعي الصينية على خفض التكاليف من أجل إنشاء نماذج تنافسية، في ظل مواجهتها للقيود الأميركية على الرقائق وميزانياتها الأصغر من نظيراتها الغربية.

ونجحت الشركات الناشئة مثل 01.ai وDeepSeek في خفض الأسعار من خلال تبني استراتيجيات مثل التركيز على مجموعات بيانات أصغر لتدريب نماذج الذكاء الاصطناعي وتوظيف مهندسي كمبيوتر رخيصين ولكن ماهرين.

كما انخرطت مجموعات التكنولوجيا الأكبر مثل Alibaba وBaidu وByteDance في حرب تسعير لخفض تكاليف “الاستدلال”، وهو ثمن استدعاء نماذج لغوية كبيرة لتوليد الاستجابة، بنسبة تزيد على 90 في المائة وبنسبة ضئيلة من تلك المقدمة. من قبل نظرائهم الأمريكيين.

هذا على الرغم من اضطرار الشركات الصينية إلى التغلب على الحظر الذي فرضته واشنطن على صادرات رقائق Nvidia AI المتطورة، والتي يُنظر إليها على أنها ضرورية لتطوير أحدث النماذج في الولايات المتحدة.

وقالت شركة 01.ai ومقرها بكين، بقيادة لي كاي فو، الرئيس السابق لشركة جوجل في الصين، إنها خفضت تكاليف الاستدلال من خلال بناء نموذج تم تدريبه على كميات أصغر من البيانات التي تتطلب قوة حاسوبية أقل وتحسين أجهزتها.

وقال لي لصحيفة فاينانشيال تايمز: “إن قوة الصين تكمن في صنع محركات استدلال بأسعار معقولة، ثم السماح للتطبيقات بالانتشار”.

هذا الأسبوع، جاء نموذج Yi-Lightning الخاص بشركة 01.ai في المركز الثالث بين شركات LLM جنبًا إلى جنب مع Grok-2 من شركة x.AI، ولكن خلف OpenAI وGoogle في تصنيف أصدره باحثون في جامعة كاليفورنيا في بيركلي SkyLab وLMSYS.

تعتمد التقييمات على المستخدمين الذين يسجلون إجابات نماذج مختلفة على الاستعلامات. كما تسللت شركات صينية أخرى، بما في ذلك ByteDance وAlibaba وDeepSeek، إلى لوحات تصنيف LLMs.

تبلغ تكلفة الاستدلال في Yi-Lightning من 01.ai 14 سنتًا لكل مليون رمز، مقارنة بـ 26 سنتًا لنموذج GPT o1-mini الأصغر من OpenAI. وفي الوقت نفسه، تبلغ تكاليف الاستدلال لـ GPT 4o الأكبر حجمًا من OpenAI 4.40 دولارًا لكل مليون رمز مميز. يعتمد عدد الرموز المميزة المستخدمة لإنشاء الاستجابة على مدى تعقيد الاستعلام.

وقال لي أيضًا إن Yi-Lightning تكلف 3 ملايين دولار “للتدريب المسبق”، وهو نموذج تدريب أولي يمكن بعد ذلك ضبطه أو تخصيصه لحالات استخدام مختلفة. وهذا جزء صغير من التكلفة التي ذكرتها أمثال OpenAI لنماذجها الكبيرة. وأضاف أن الهدف ليس الحصول على “أفضل نموذج”، بل نموذج تنافسي “أقل تكلفة بخمس إلى عشر مرات” للمطورين لاستخدامه في بناء التطبيقات.

وقد تبنت العديد من مجموعات الذكاء الاصطناعي الصينية، بما في ذلك 01.ai، وDeepSeek، وMiniMax، وStepfun ما يسمى بنهج “نموذج الخبراء”، وهي استراتيجية نشرها لأول مرة باحثون أمريكيون.

بدلا من تدريب “نموذج كثيف” واحد في وقت واحد على قاعدة بيانات واسعة استخرجت البيانات من الإنترنت ومصادر أخرى، يجمع هذا النهج بين العديد من الشبكات العصبية المدربة على بيانات خاصة بالصناعة.

ينظر الباحثون إلى منهج نموذج الخبير باعتباره وسيلة رئيسية لتحقيق نفس المستوى من الذكاء كنموذج كثيف ولكن مع قوة حاسوبية أقل. لكن هذا النهج يمكن أن يكون أكثر عرضة للفشل حيث يتعين على المهندسين تنسيق عملية التدريب عبر “خبراء” متعددين بدلاً من نموذج واحد.

ونظرا للصعوبة في تأمين إمدادات ثابتة ووافرة من رقائق الذكاء الاصطناعي المتطورة، تنافست شركات الذكاء الاصطناعي الصينية على مدار العام الماضي لتطوير مجموعات البيانات الأعلى جودة لتدريب هؤلاء “الخبراء” لتمييز أنفسهم عن المنافسة.

وقال لي إن 01.ai لديه أساليب لجمع البيانات تتجاوز الطريقة التقليدية لمسح الإنترنت، بما في ذلك مسح الكتب ضوئيًا والزحف إلى المقالات على تطبيق المراسلة WeChat الذي لا يمكن الوصول إليه على الويب المفتوح.

وقال: “هناك الكثير من العمل الجاد” الذي يقوم به المهندسون لتسمية البيانات وتصنيفها، لكنه أضاف أن الصين – مع مجموعتها الهائلة من المواهب الهندسية الرخيصة – في وضع أفضل للقيام بذلك من الولايات المتحدة.

وقال لي: “إن قوة الصين لا تكمن في إجراء أفضل الأبحاث المتقدمة التي لم يقم بها أحد من قبل حيث لا حدود للميزانية”. “إن قوة الصين تكمن في البناء الجيد، والبناء السريع، والبناء الموثوق، والبناء الرخيص.”

تقارير إضافية من كريستينا كريدل في سان فرانسيسكو



المصدر


مواضيع ذات صلة