وادى السيليكون يراهن على البيئات التدريبية لتطوير وكلاء الذكاء الاصطناعى - الأول نيوز

0 تعليق ارسل طباعة تبليغ حذف

تسابق شركات التكنولوجيا الكبرى في وادي السيليكون الزمن لتطوير وكلاء ذكاء اصطناعي قادرين على استخدام البرامج والتطبيقات وإنجاز المهام بشكل مستقل، لكن التحدي الأكبر يكمن في كيفية تدريب هذه النماذج على مهام متعددة الخطوات.

وهنا تبرز تقنية البيئات التدريبية (Reinforcement Learning Environments – RL) باعتبارها حجر الأساس للجيل القادم من الذكاء الاصطناعي.

تشبه هذه البيئات ألعاب الفيديو البسيطة، لكنها مخصصة لتدريب الوكلاء على مهام عملية، مثل محاكاة متصفح كروم وطلب منتج من أمازون، حيث يحصل الوكيل على “إشارة مكافأة” عند إنجاز المهمة بنجاح، هذا النهج يتيح للنماذج اختبار قراراتها في بيئة تفاعلية بدلاً من الاعتماد على بيانات ثابتة فقط.

شركات ناشئة وتمويل ضخم

بحسب تقرير TechCrunch، تتسابق شركات ناشئة مثل Mechanize Work وPrime Intellect لتقديم بيئات تدريبية متقدمة، فيما تستثمر شركات ضخمة مثل Surge وMercor مبالغ طائلة لتلبية الطلب المتزايد من مختبرات الذكاء الاصطناعي الكبرى مثل OpenAI وAnthropic وGoogle، وتشير تقارير إلى أن Anthropic تدرس استثمار أكثر من مليار دولار في هذا المجال خلال العام المقبل.

السوق يتوسع والتحديات قائمة

شركات مثل Scale AI، التي قادت سابقًا مجال تمييز البيانات، تحاول اللحاق بالركب عبر بناء بيئات تدريبية، لكنها تواجه منافسة شديدة بعد خسارة عقودها مع Google وOpenAI، في المقابل، تعرض Mechanize Work رواتب تصل إلى 500 ألف دولار للمهندسين لبناء بيئات أكثر قوة، في إشارة إلى شراسة المنافسة وارتفاع سقف التوقعات.

فرص للمطورين المستقلين

إلى جانب اللاعبين الكبار، أطلقت Prime Intellect مؤخرًا “مركز بيئات تدريبية”، يشبه منصة Hugging Face، لإتاحة هذه الأدوات لمجتمع المصادر المفتوحة مع توفير خدمات حوسبة مدفوعة لتدريب النماذج.

ورغم الحماس الكبير، يشكك بعض الباحثين في قدرة هذه التقنية على التوسع بكفاءة، محذرين من مشكلات مثل “التحايل على المكافآت” حيث قد يتعلم الوكيل خداع النظام بدلًا من إنجاز المهام المطلوبة. مع ذلك، يرى آخرون أن هذه البيئات قد تكون الطريق الأمثل لدفع قدرات الوكلاء إلى مستويات غير مسبوقة، خاصة مع تراجع فعالية أساليب التدريب التقليدية.

0 تعليق