ساحة لعب متغيرة باستمرار تعلم الذكاء الاصطناعي كيفية تعدد المهام

العقل العميق



قامت شركة DeepMind بتطوير ملف ملعب افتراضي واسع بألوان الحلوى التي تعلم المهارات العامة للذكاء الاصطناعي عن طريق تغيير المهام التي تحددها لهم بلا نهاية. بدلاً من تطوير المهارات اللازمة لحل مهمة معينة فقط ، يتعلم الذكاء الاصطناعي التجريب والاستكشاف ، واكتساب المهارات التي يستخدمونها بعد ذلك لتحقيق النجاح في المهام التي لم يروها من قبل. إنها خطوة صغيرة نحو الذكاء العام.

ما هذا؟ XLand هو عالم ثلاثي الأبعاد يشبه ألعاب الفيديو يشعر به لاعبو الذكاء الاصطناعي بالألوان. تتم إدارة الملعب بواسطة منظمة العفو الدولية المركزية التي تحدد للاعبين مليارات المهام المختلفة عن طريق تغيير البيئة وقواعد اللعبة وعدد اللاعبين. يستخدم كل من اللاعبين ومدير الملعب التعلم المعزز للتحسين عن طريق التجربة والخطأ.





الذكاء العام الاصطناعي: هل نحن قريبون ، وهل من المنطقي المحاولة؟

كانت الآلة التي يمكن أن تفكر مثل الإنسان هي الرؤية التوجيهية لأبحاث الذكاء الاصطناعي منذ الأيام الأولى - ولا تزال الفكرة الأكثر إثارة للانقسام.

أثناء التدريب ، يواجه اللاعبون أولاً ألعابًا بسيطة للاعب واحد ، مثل العثور على مكعب أرجواني أو وضع كرة صفراء على أرضية حمراء. يتقدمون إلى ألعاب متعددة اللاعبين أكثر تعقيدًا مثل إخفاء العلم والبحث عنه أو الاستيلاء عليه ، حيث تتنافس الفرق لتكون أول من يكتشف ويمسك علم الخصم. ليس لمدير الملعب هدف محدد ولكنه يهدف إلى تحسين القدرة العامة للاعبين بمرور الوقت.

لماذا هذا رائع؟ لقد هزمت أنظمة الذكاء الاصطناعي مثل AlphaZero من DeepMind أفضل لاعبي الشطرنج البشريين في العالم. لكن يمكنهم تعلم لعبة واحدة فقط في كل مرة. كما قال مؤسس DeepMind شين ليغ عندما تحدثت إليه العام الماضي ، كان الأمر كذلك الاضطرار إلى تبديل عقلك في الشطرنج بعقلك Go في كل مرة تريد تبديل الألعاب.



يحاول الباحثون الآن بناء أنظمة ذكاء اصطناعي يمكنها تعلم مهام متعددة في وقت واحد ، مما يعني تعليمهم مهارات عامة تسهل عليهم التكيف.

فيديو لوكلاء الذكاء الاصطناعي وهم يجربون في بيئة افتراضية

بعد أن تعلمت التجربة ، ارتجلت هذه الروبوتات منحدرًا

العقل العميق

أحد الاتجاهات المثيرة في هذا الاتجاه هو التعلم المفتوح ، حيث يتم تدريب الذكاء الاصطناعي على العديد من المهام المختلفة دون هدف محدد. من نواحٍ عديدة ، هكذا يبدو أن البشر والحيوانات الأخرى يتعلمون من خلال اللعب بلا هدف. لكن هذا يتطلب كمية هائلة من البيانات. يقوم XLand بإنشاء هذه البيانات تلقائيًا ، في شكل تدفق لا نهاية له من التحديات. انه ايضا مشابه شاعر ، دوجو للتدريب على الذكاء الاصطناعي حيث يتعلم الروبوت ذو الأرجل كيفية تجاوز العقبات في مشهد ثنائي الأبعاد. ومع ذلك ، فإن عالم XLand أكثر تعقيدًا وتفصيلاً.

XLand هو أيضًا مثال على تعلم الذكاء الاصطناعي ليصنع نفسه ، أو ما جيف كلون ، الذي ساعد في تطوير POET وقيادة الفريق العمل في هذا الموضوع في OpenAI ، تستدعي خوارزميات إنشاء الذكاء الاصطناعي (AI-GAs). يقول كلون إن هذا العمل يدفع حدود AI-GAs. من المثير جدا أن نرى.



يتعلم الذكاء الاصطناعي كيف يصنع نفسه

كافح البشر لصنع آلات ذكية حقًا. ربما نحتاج إلى السماح لهم بمواصلة الأمر بأنفسهم.

ماذا تعلمو؟ لعبت بعض XLand AIs من DeepMind 700000 لعبة مختلفة في 4000 عالم مختلف ، وواجهت 3.4 مليون مهمة فريدة في المجموع. بدلاً من تعلم أفضل ما يمكن فعله في كل موقف ، وهو ما تفعله معظم أنظمة الذكاء الاصطناعي القائمة على التعلم المعزز ، تعلم اللاعبون التجريب - تحريك الأشياء لمعرفة ما حدث ، أو استخدام كائن واحد كأداة للوصول إلى كائن آخر أو إخفاء خلف - حتى يتغلبوا على مهمة معينة.

في مقاطع الفيديو ، يمكنك رؤية عناصر الذكاء الاصطناعي وهي تقوم برمي الأشياء حولها حتى تعثر على شيء مفيد: قطعة كبيرة ، على سبيل المثال ، تصبح منحدرًا لمنصة. يقول الباحثون إنه من الصعب معرفة ما إذا كانت كل هذه النتائج هي حوادث متعمدة أو سعيدة. لكنها تحدث باستمرار.

تتمتع أنظمة الذكاء الاصطناعي التي تعلمت التجربة بميزة في معظم المهام ، حتى تلك التي لم يروها من قبل. وجد الباحثون أنه بعد 30 دقيقة فقط من التدريب على مهمة جديدة معقدة ، تكيفت XL و AI معها بسرعة. لكن أنظمة الذكاء الاصطناعي التي لم تقض وقتًا في XLand لم تستطع تعلم هذه المهام على الإطلاق.

يخفي

التقنيات الفعلية

فئة

غير مصنف

تكنولوجيا

التكنولوجيا الحيوية

سياسة التكنولوجيا

تغير المناخ

البشر والتكنولوجيا

وادي السيليكون

الحوسبة

مجلة Mit News

الذكاء الاصطناعي

الفراغ

المدن الذكية

بلوكشين

قصة مميزة

الملف الشخصي للخريجين

اتصال الخريجين

ميزة أخبار معهد ماساتشوستس للتكنولوجيا

1865

وجهة نظري

77 Mass Ave

قابل المؤلف

ملامح في الكرم

شوهد في الحرم الجامعي

خطابات الخريجين

أخبار

انتخابات 2020

فهرس With

تحت القبه

خرطوم الحريق

قصص لانهائية

مشروع تكنولوجيا الوباء

من الرئيس

غلاف القصه

معرض الصور

موصى به