البودكاست: كيف تعلم الألعاب الذكاء الاصطناعي أن يتعلم بنفسه

تاريخ ألعاب الذكاء الاصطناعي

السيدة تك | Unsplash



من الشطرنج إلى لعبة Jeopardy إلى الرياضات الإلكترونية ، يتفوق الذكاء الاصطناعي على البشر بشكل متزايد في ألعابهم الخاصة. لكن هذا لم يكن أبدًا الهدف النهائي. في هذه الحلقة الأولى من الموسم الثالث من In Machines We Trust ، نتعمق في العلاقة التكافلية بين الألعاب والذكاء الاصطناعي. نلتقي باللاعبين الكبار في الفضاء ، ونقوم برحلة إلى صالة ألعاب رياضية.

في هذه الحلقة نلتقي:

  • جوليان توجيليوس ، أستاذ مشارك ، قسم علوم وهندسة الحاسوب ، جامعة نيويورك
  • ويل دوجلاس هيفين ، محرر أول في منظمة العفو الدولية ، إم آي تي ​​تكنولوجي ريفيو
  • ديفيد سيلفر ، عالم الأبحاث الرئيسي في DeepMind ، أستاذ في جامعة كوليدج لندن.
  • ديفيد فهري ، باحث رئيسي ، Open AI

لعمل هذه الحلقة ، تحدثنا أيضًا إلى ناتاشا ريجان ، الخبيرة الاكتوارية في RPC Tyche ، Chess WIM والمؤلفة المشاركة لـ 'Game Changer'.





أصوات من:

الاعتمادات:

تم الإبلاغ عن هذه الحلقة من قبل جينيفر سترونج وويل دوجلاس هيفين ومن إنتاج أنتوني جرين وإيما سيليكنز وكارين هاو. تم تحريرنا بواسطة نيال فيرث ومايكل رايلي ومات هونان. مهندس المزيج لدينا هو Garret Lang. تصميم الصوت والموسيقى لجاكوب جورسكي.

استيقاظ وجنازات غريبة

نسخة كاملة:

[معرف TR]

[الصوت المتزامن مع اللقطات: Jeopardy تعلن عن تحدي Watson]



تريبيك: نعلن اليوم عن مسابقة Jeopardy على عكس أي منافسة قدمناها من قبل.

جينيفر: قبل عشر سنوات ، كشف برنامج المسابقات التليفزيوني Jeopardy عن لاعب جديد ...

تريبيك: إنها مباراة استعراضية يشارك فيها اثنان من أعظم اللاعبين المحفوفين بالمخاطر في التاريخ ... منافسهم؟ حسنًا ، اسمه واطسون.

مذيع وثائقي: [موسيقى] Watson هو كمبيوتر IBM مصمم لتشغيل Jeopardy. يفهم واطسون اللغة الطبيعية بكل غموضها وتعقيدها.



جينيفر: وربما ليس من المستغرب ... بالنظر إلى أن لعب Jeopardy هو الشيء تم تصميمه للقيام ... كان Watson جيدًا. حقا جيد.

[الصوت المتزامن مع اللقطات: مونتاج إجابات واتسون جيوباردي.]

تريبيك: واتسون.

واتسون: ما هي اسطنبول.

تريبيك: أنت على حق.

تريبيك: واتسون.

واتسون: ما هو Parlement.

تريبيك: حق.

تريبيك: واتسون.

واتسون: ما هي اليونانية القديمة.

تريبيك: واتسون ، نعود إليك.

جينيفر: بعد ثلاث ليالٍ من ذلك ، فاز واتسون ... بفوزه على أفضل لاعبين في تاريخ عرض الألعاب ... من الشطرنج إلى لعبة الجوباردي إلى الرياضة الإلكترونية ... يتفوق الذكاء الاصطناعي على البشر في ألعابهم الخاصة ... (إذا جاز التعبير) ... لكن ذلك لم يكن أبدًا الهدف الرئيسي. يحاول الباحثون بناء أنظمة ذكية تكون مفيدة وذات غرض عام أكثر من أي شيء لدينا.

ديفيد سيلفر: إذا كان العقل البشري قادرًا على حل جميع أنواع المهام المختلفة ، فهل يمكننا بناء برامج يمكنها أن تفعل الشيء نفسه؟

جينيفر: أنا جينيفر سترونج وفي هذه الحلقة نتعمق في العلاقة التكافلية بين الألعاب والذكاء الاصطناعي. لأنه طالما كان هناك بحث حول الذكاء الاصطناعي ، كانت الألعاب جزءًا منه. نلتقي باللاعبين الكبار في الفضاء ... ونقوم برحلة إلى صالة ألعاب رياضية.

{أصوات الألعاب}

كارين هاو: بطريقة ما ، الألعاب لديها قدرات ذكاء اصطناعي مبالغ فيها قليلاً ، لأن ..

جينيفر: هذا هو زميلي كارين هاو ...

كارين هاو: يعتقد الكثير من الناس الآن أن الذكاء الاصطناعي أكثر قدرة مما هو عليه في الواقع ، لكن الألعاب هي في الواقع دليل على الذكاء الضيق بشكل لا يصدق. ونحن الآن محاصرون نوعًا ما في هذه الدورة حيث يسير بحث الذكاء الاصطناعي على وجه التحديد في هذا المسار الذي يضم المزيد والمزيد من الألعاب المتقدمة دون الانتقال فعليًا إلى المزيد والمزيد من المواقف والبيئات الواقعية المعقدة والمعقدة ... وهو ما نحتاجه بالفعل.

{أصوات الألعاب}

[إظهار معرف]

OC: ... لقد وصلت إلى وجهتك.

جوليان توجيليوس: كانت الألعاب جزءًا من الذكاء الاصطناعي منذ أن بدأ الذكاء الاصطناعي ، أو ما شابه ذلك منذ أن بدأت فكرة الذكاء الاصطناعي.

جينيفر: جوليان توجيليوس أستاذ وعالم كمبيوتر يعيش في مدينة نيويورك ...

جوليان توجيليوس: أنا أعمل على الذكاء الاصطناعي لتحسين الألعاب وأيضًا الألعاب لتحسين الذكاء الاصطناعي.

جينيفر: إنه يعطيني درسًا تاريخيًا حول هذه العلاقة بين الألعاب والذكاء الاصطناعي ... وبطريقة ما ، تمكن من القيام بذلك أثناء لعب بعض ألعاب الفيديو التي كان يعمل معها.

جوليان توجيليوس: أنا أعمل بشكل خاص مع ألعاب الفيديو ونوع من ألعاب الفيديو الحديثة لأن لعبة الشطرنج والانطلاق حقًا وكل ذلك ... أعني ، لقد انتهينا نوعًا ما من ذلك. إنه مثل ، أعني ، [ضحك] عدم تثبيط عزيمة الأشخاص الذين يحبون لعب الشطرنج ولعب Go أو البوكر من أجل التحدي العقلي. هذا جيد. لكن كما تعلم ، هناك الكثير من الاحتمالات ، والعديد من التحديات المثيرة للاهتمام في الألعاب الأخرى.

جينيفر: كيف دخلت هذا المجال؟

جوليان توجيليوس: بلى. لذلك عندما أعطت أمي قطتي بعيدًا ، [ضحك] هذا صحيح! أعني ، إنها مصابة بالحساسية ، فماذا ستفعل؟ لذا أعطتني جهاز كمبيوتر قبل الكومودور 64 ، وبدأت ألعب كل هذه الألعاب وقد فتنت حقًا بهذه العوالم الصغيرة الصغيرة. ثم كبرت ... حسنًا ، أكثر أو أقل. [ضحك] آه ، لقد نشأت ، أنهيت دراستي الثانوية. بدأت دراسة الفلسفة وعلم النفس. كنت مهتمًا ، كيف يعمل العقل؟ ما علاقة الوعي بالذكاء وكيف يحدث كل ذلك؟

جينيفر: قادته هذه الأسئلة إلى ورقة بحثية مبكرة لعالم الكمبيوتر الرائد آلان تورينج ... لقد كان أول من أثبت أن بناء جهاز كمبيوتر كان ممكنًا حتى من الناحية الرياضية.

جوليان توجيليوس: هذه الورقة تدور حول الألعاب إلى حد كبير. يتعلق الأمر بلعبة التقليد ، ما يسمى الآن باختبار تورينج ، حيث تحاول معرفة ما إذا كان شخص ما تدردش معه بشكل أساسي - لم يكن يطلق عليه الدردشة في الخمسينيات - سواء كان الشخص الذي تتحدث إليه عبر رسالة نصية هو جهاز كمبيوتر أو إنسان. إنه يتعلق أيضًا بالشطرنج. لأن لعبة الشطرنج أصبحت في وقت مبكر جدًا من مجالات التركيز الأساسية لأبحاث الذكاء الاصطناعي.

جينيفر: نعتقد أن الأشخاص الذين يلعبون الشطرنج يتمتعون بمستوى معين من الذكاء ... وهكذا أصبحت اللعبة وسيلة لقياس مدى ذكاء الآلات أيضًا.

و ... حقيقة ممتعة؟ تمت كتابة أول برنامج للعب الشطرنج قبل كان الكمبيوتر موجودًا حتى لتشغيله. لعبها تورينج في عام 1950 ... باستخدام خوارزمية عملت على الورق.

(لم تعمل بشكل جيد.)

لكن الناس استمروا في تطوير هذا البحث لعقود.

وبعد ذلك ، في عام 1997 ، تغلب كمبيوتر ديب بلو الخاص بشركة آي بي إم على غاري كاسباروف ... بطل العالم في لعبة الشطرنج.

[سوت] - ديب بلو يتفوق على غاري كاسباروف في اللعبة السادسة عبر يوتيوب

المعلق 2: هل نفتقد شيئًا ما على رقعة الشطرنج الآن كما يراه كاسباروف؟ لا ينظر .. في الحقيقة يبدو مشمئزا.

المعلق 1: قف!

المعلق 2: ازرق غامق! استقال كاسباروف بعد تحرك C4!

[تصفيق]

جوليان توجيليوس: وكان هذا حدثًا فكريًا ضخمًا كان الناس يفكرون فيه ، حسنًا ، ماذا الآن؟ هل حللنا للتو الذكاء الاصطناعي؟ واتضح أنه لا ، لم تفعل ذلك لأن برنامج لعب الشطرنج هذا لا يمكنه حتى لعب لعبة الداما بدون إعادة برمجة كبيرة. لا يمكن أن تلعب Go. لا يمكن أن تلعب الكثير من الأشياء. وحتى أكثر من ذلك ، لم تستطع ربط رباط حذائها. لم يستطع طهي المعكرونة. لا تستطيع كتابة قصيدة حب. لم تستطع الخروج وشراء جريدة. لم تستطع فعل أي من هذه الأشياء التي يفعلها البشر طوال الوقت. يمكن فعلاً فعل شيء واحد فقط. يمكن أن تلعب الشطرنج. لقد كانت جيدة جدًا في ذلك ، لكنها كانت تلعب الشطرنج فقط.

جينيفر: لذا ، حل البشر ما كان يعتقد أنه التحدي الأكبر في خلق الذكاء ... ولكن عندما نظرت تحت غطاء البرنامج ... قال إنه كان في الأساس مجرد نوع من البحث.

جوليان توجيليوس: ماذا لو اتخذت هذه الخطوة؟ وبعد ذلك ، ماذا لو اتخذ خصمي هذه الخطوة ، فماذا إذا اتخذت هذه الخطوة؟ لذلك قمنا ببناء شجرة من الاحتمالات والاحتمالات المضادة وحسابنا من ذلك. كان الأمر في الواقع أكثر تعقيدًا من ذلك بكثير ، لكن هذا هو جوهر ما كان يفعله. ونظر الناس إلى الأمر وكأنه لا يبدو مثل أي شيء مثل طريقة عمل أدمغتنا. أعني ، نحن لا نعرف حقًا كيف تعمل أدمغتنا ، لكن ، كل ما يفعلونه ، ليس هذا. [يضحك]

جينيفر: لكنها ليست مستخدمة فقط لممارسة الألعاب ضد البشر ... يظهر الذكاء الاصطناعي في الألعاب بشتى الطرق. خاصة لجعلها أكثر إثارة للاهتمام وتحديا.

فمثلا…. يغير الذكاء الاصطناعي أجزاءً من ألعاب الفيديو ... بحيث تختلف في كل مرة نلعب فيها ، وهذا هو الحال منذ الثمانينيات من القرن الماضي.

جوليان توجيليوس: وهذا المبدأ ، مثل ، دائمًا إنشاء شيء جديد ... وفي كل مرة تلعب فيها اللعبة يكون جديدًا ... وقد نجا في الكثير من الألعاب المختلفة. على سبيل المثال ، تعتمد سلسلة ألعاب ديابلو على ذلك ، أو سلسلة ألعاب الحضارة الإستراتيجية. في كل مرة تلعب فيها ، يكون لديك عالم جديد تمامًا وهذا هو جوهر اللعبة. لن يكون الأمر هو نفسه إذا لم تفعل ذلك.

جينيفر: سبب آخر للقيام بذلك هو التخزين ... ويقول إن لعبة تسمى Elite أصبحت معلمًا مهمًا ... عندما تم إتاحتها لأجهزة الكمبيوتر الشخصية ، بما في ذلك Commodore 64.

جوليان توجيليوس: لا يمكن احتواؤها في الذاكرة في هذا الكمبيوتر. لذا فإن نسخة واحدة بها 4096 نظام نجمي مختلف. الآن ، إذا كان لديك 64000 بايت فقط من الذاكرة وتخيلت ، فكر في مدى ضآلة ذلك ، أي جزء من المليون من جهاز الكمبيوتر الذي يمكنك شراؤه اليوم. لذلك ، كان عليهم إعادة إنشاء نظام النجوم في كل مرة تصل فيها إلى هناك. قم ببنائه من الصفر.

جينيفر: ولا يزال هذا هو الحال الآن. بالتأكيد ، لدينا مساحة تخزين أكبر بكثير. لكن الألعاب أيضًا أكبر بكثير وأكثر تعقيدًا.

جوليان توجيليوس: لعبة No Man's Sky ، التي صدرت عام 2016 ، لكنهم يواصلون تحديثها - فهي تزداد إثارة للإعجاب. يحتوي على كواكب أكثر مما يمكنك زيارته في أي وقت مضى ، ولكنه يناسب جهاز الكمبيوتر الخاص بك بطريقة ما لأنه يتم إعادة إنشائه في كل مرة تراها.

جينيفر: في غضون ذلك ، استمر الباحثون أيضًا في بناء لعبة تلعب بها أنظمة الذكاء الاصطناعي ... ويقول توجيليوس ، أن أحد التحديات التالية في هذا الفضاء هو أن يلعبوا العديد من الألعاب في وقت واحد ... لأن تعدد المهام هو شيء يقوم به البشر جيدًا ... ولكن هذا ليس هو الحال بالنسبة هذه الأنظمة.

لذا ، كيف ننتقل من هذه البيئات شديدة التنظيم مع الكثير من القدرة على التنبؤ ... إلى شيء أقرب إلى الحياة الواقعية ، وهو فوضوي وفوضوي ولا يمكن التنبؤ به على الإطلاق.

له ولغيره من الباحثين…؟ نلعب المزيد من الألعاب.

كيف تعمل بدلة الفضاء

جوليان توجيليوس: إذا كان لدينا نظام يمكنه اللعب بشكل موثوق به ، مثل بعض الكفاءة ، أفضل مائة لعبة على قائمة ألعاب الكمبيوتر ، مثل Steam أو AppStore أو شيء من هذا القبيل ، فسنحصل على شيء مشابه للذكاء العام.

جينيفر: لذا ، من بعض النواحي ... ما زلنا نوعًا ما حيث كنا منذ نصف قرن ... نعتقد أننا قد نجد مفتاح الذكاء العام باستخدام أنظمة الذكاء الاصطناعي التي يمكنها التغلب على البشر في لعبتهم الخاصة.

[إيقاع / موسيقى]

لكننا نمزج أيضًا بين الألعاب والذكاء الاصطناعي بجميع أنواع الطرق الأخرى ... مثل مساعدتنا في بيانات التدريب.

قبل بضع سنوات التقيت بفريق في برينستون يحاولون جعل إشارات التوقف أكثر وضوحًا للسيارات ذاتية القيادة ... باستخدام لعبة Grand Theft Auto.

قد يبدو هذا غريبًا ... إنه عملي جدًا عندما تفكر في عدد الطرق المختلفة التي قد يصادف فيها السائق لافتة توقف في العالم الحقيقي ... سواء كانت على عصا في الأرض ... معلقة في الهواء ... أو مرسومة عليها الرصيف ... ونواجههم في كل نوع من الضوء والطقس ... وأحيانًا يختبئون جزئيًا بفروع الأشجار ... أو في ظلام الليل.

يمكن للباحثين البحث عن أمثلة لكل إشارات التوقف هذه ... أو يمكن لألعاب الفيديو فقط توليد أمثلة لا حصر لها.

نحن نستخدم الألعاب أيضًا لفهم كيفية اتخاذ الخوارزميات للقرارات بشكل أفضل.

[ابدأ في جلب الأصوات من Arcade. * تبدأ الموسيقى واللعب في موضوع Frogger ، تبديل الحركات *]

جينيفر: نحن في أركيد كلاسيكي في بوسطن ... لأنه يحتوي على العديد من ألعاب الفيديو القديمة التي تُستخدم لتدريب أنظمة الذكاء الاصطناعي.

ويل دوجلاس هيفين: مرحبًا ، أنا ويل دوغلاس هيفين. أنا محرر أول للذكاء الاصطناعي في Technology Review ... ولا يمكنني لعب Frogger.

ويل دوجلاس هيفين: ظهر Frogger مؤخرًا في بعض أبحاث الذكاء الاصطناعي المختلفة حيث كانوا يحاولون الحصول على ذكاء اصطناعي لشرح نفسه وشرح ما يفعله. لقد علموا ... لقد دربوا ذكاءً اصطناعيًا للعب هذه اللعبة وأنت تعرف Frogger ... يمكنك أن تسمع من الضوضاء ، فأنا أفشل باستمرار.

إذن Frogger هي هذه اللعبة حيث تكون ضفدعًا صغيرًا في الأسفل وعليك عبور طريق به سيارات تتحرك نوعًا ما عبر الشاشة يمينًا ويسارًا ، وعليك المراوغة نوعًا ما بينهما. وبعد ذلك تصل إلى نهر وتقفز على ظهر السلاحف وجذوع الأشجار للوصول إلى الجانب الآخر دون الوقوع كما فعلت هناك. على أي حال ، إنها لعبة بها الكثير من الإجراءات المحددة التي تتخذها في كل خطوة. ولذا عندما دربوا الذكاء الاصطناعي على القيام بذلك ، في كل مرة يتخذ فيها إجراءً ، جعلوه يشرحون ، نوعًا ما ، بمصطلحات مفهومة للإنسان لماذا فعل ذلك.

[* تستمر أصوات اللعبة *]

جينيفر: في الأساس ، تلعب منظمة العفو الدولية اللعبة ... ومع مرور الوقت ، فإنها تعمل على كيفية تحقيق النجاح. التحركات العشوائية تتطور إلى إستراتيجيات معقدة ... حتى البعض الذي لم نكن نعرفه.

[متابعة أصوات الألعاب الموجودة أسفل VO أعلاه وأيضًا في هذا الجزء الصوتي]

ويل دوجلاس هيفين: لقد ألقوا الذكاء الاصطناعي على هذه الألعاب القديمة وأظهروا لهم الشاشات التي لم تكن لديهم أدنى فكرة عن كيفية اللعب. لقد كانت مجرد بكسلات على الشاشة ، حدثت أشياء. لقد جربوا الأشياء وفي بعض الأحيان كانوا ينفجرون. في بعض الأحيان أطلقوا النار على السفن الفضائية. وباستخدام نوع من المكافآت التي تعرفها فقط عندما فعلوا شيئًا ما ، صحيح ، ارتفعت النتيجة ، لقد عملوا ببطء على كيفية لعب اللعبة. وقد تحولوا من الفهم ، لا شيء ، في كثير من الحالات ، إلى نوع من التغلب على الدرجات العالية لأفضل اللاعبين البشريين. وحتى بعض الأمثلة الرائعة حقًا حيث وجدوا طرقًا للتغلب على اللعبة التي لم يكتشفها البشر.

جينيفر: أحد الأمثلة على ذلك يأتي من لعبة تسمى Q * Bert ، والتي تضع اللاعبين في هرم من المربعات.

ويل دوجلاس هيفين: أعني أن الفكرة الأساسية هي أن لديك هذا الرجل الصغير الذي يقفز أسفل الهرم من أعلى هبوط في المربعات. وعندما تقوم بتغيير المربعات كلها إلى نفس اللون ، يمكنك الانتقال إلى المستوى التالي. لكن الذكاء الاصطناعي ، على ما أعتقد ، في المستوى الأول ، غير كل ألوان المربعات ثم استمر في القفز لأعلى ولأسفل المربعات بدلاً من الانتقال إلى المستوى التالي. ووجدت بعض الأخطاء في اللعبة والتي سمحت لها بالحصول على درجة لا نهائية في فترة زمنية قصيرة حقًا. وحتى مصممو اللعبة كانوا كما لو أنني لم أر هذا الخطأ من قبل.

جينيفر: بعد الفاصل ... سنلتقي ببعض الرواد وراء اختراقات كبيرة في هذا المجال. لكن أولاً ، أود أن أخبركم عن حدث يسمى CyberSecure في نوفمبر. إنه مؤتمر الأمن السيبراني التابع لـ Tech Review وسأكون هناك مع زملائي. يمكنك معرفة المزيد في Cyber ​​Secure M-I-T dot com.

سنعود حالا ... بعد هذا.

[ميدرول]

ديفيد سيلفر: اسمي ديفيد سيلفر. أنا أعمل على الذكاء الاصطناعي وأقوم بتطبيقه على الألعاب. أعمل في شركة تسمى DeepMind وهدفنا هو محاولة استخدام الذكاء الاصطناعي لمحاولة بناء نظام يحتوي على بعض الذكاء الموجود داخل الدماغ البشري.

جينيفر: DeepMind هو مركز هذا العمل مع الألعاب. إنه معمل أبحاث يعد جزءًا من أبجدية Google.

ديفيد سيلفر: إذا كان العقل البشري قادرًا على حل جميع أنواع المهام المختلفة ، فهل يمكننا بناء برامج يمكنها أن تفعل الشيء نفسه؟

جينيفر: إنه الباحث الرئيسي وراء بعض أفضل أنظمة الذكاء الاصطناعي المعروفة التي أتقنت كيفية ممارسة الألعاب ... بدءًا من ألعاب الطاولة ، (بما في ذلك لعبة الإستراتيجية الصينية القديمة Go.)

ديفيد سيلفر: قمنا بتطوير نظام يسمى AlphaGo ، والذي كان أول برنامج قادر على لعب لعبة Go على مستوى أفضل اللاعبين المحترفين من البشر. وفي الواقع ، تمكنت من التغلب على بطل العالم لي سيدول.

ديفيد سيلفر: وهناك مساحة ضخمة من الألعاب ، العديد منها لها هذه الخصائص الجميلة التي تسمح لنا بالغوص وفهم ، كما تعلمون ، قطعة واحدة من العالم في عزلة دون الاضطرار إلى التعامل مع كل التعقيدات الهائلة للعالم الحقيقي كله مره و احده.

جينيفر: تعلم AlphaGo كيفية لعب ألعاب الطاولة بناءً على طريقة لعب الأشخاص.

نظام AlphaZero التالي لـ Silver ، تعلم ممارسة ألعاب الطاولة وألعاب الفيديو بطريقة مختلفة ... من خلال تعلم قواعد اللعبة ثم لعب نفسها مرارًا وتكرارًا.

ديفيد سيلفر: بعد AlphaGo ، حاولنا أن نتخذ الخطوة التالية وأن نجعل شيئًا أكثر عمومية ، وهو أن نكون قادرين على لعب ليس فقط لعبة واحدة ، ولكن العديد من الألعاب باستخدام نفس التكنولوجيا. وهذه نقطة انطلاق كبيرة لأنها تحاول فعلاً القيام بأحد الأشياء التي يمكننا ، كما يستطيع الناس القيام بها ، وهي حل العديد من المشكلات ، باستخدام نفس أنواع الآلات بالداخل.

جينيفر: هو - هي يكون علامة فارقة في جعل الذكاء الاصطناعي أكثر غرضًا عامًا ... ولكن مع تحذير مهم. لا تستطيع الخوارزمية تعلم لعب هذه الألعاب دفعة واحدة. يبدو الأمر كما لو أنها تبني أدمغة منفصلة لكل لعبة. لذلك يجب عليها تبديل عقل الشطرنج قبل لعب Go.

من الآمن أن نقول إن الباحثين ما زالوا يحاولون اكتشاف كيفية جعل الألعاب اختبارًا للحياة الواقعية. لأن الألعاب لها قواعد يمكن تعريفها ... ولا أحد يعرف حقًا القواعد التي يعمل بها العالم.

ديفيد سيلفر: العالم حقا مكان فوضوي. كما تعلمون ، هناك ديناميكيات غنية بشكل لا يصدق ، كل أنواع التفاصيل في الطريقة التي تتحرك بها الأشياء. الطريقة التي ترتبط بها الأشياء التي نراها بالأشياء التي نلمسها. هناك فقط هذا الثراء المذهل والتعقيد في العالم الحقيقي. ولا يمكننا أن نأمل في معالجة ذلك بالطريقة التي تعامل بها الناس تاريخيًا مع الألعاب. إذن ما نحتاجه هو شيء يمكنه فهم العالم بنفسه بطريقة يفهمها هذا النوع من الأنماط بطريقة تفيده في اتخاذ قرارات ذات مغزى في الواقع في المساعدة على تحقيق أهدافه.

جينيفر: يسمى مشروعه الأخير MuZero. إنها تتفوق في العديد من الألعاب مثل AlphaZero ... (بالإضافة إلى مجموعة كاملة من ألعاب الفيديو).

... لكن هذا النظام يكتشف كيفية اللعب دون إعطاء أي قواعد على الإطلاق.

ديفيد سيلفر: لذا فقد تم إطلاقه حقًا. كانت قادرة على لعب مباريات ضد نفسها. وكل ما حصلت عليه في نهاية اللعبة كان إشارة تقول ، مرحبًا ، لقد فزت أو خسرت. ومن هذه الإشارة ، تمكنت من بناء فهم لنفسها لقواعد اللعبة بما يكفي لتتخيل نوعًا ما ما سيحدث في المستقبل .. وبمجرد أن امتلكت هذه القدرة على التخيل في المستقبل ، كان قادرًا على البحث والبدء في التطلع إلى المستقبل والبدء في التفكير في المستقبل والقول ، آه ، الآن أفهم كيف يعمل هذا العالم. يمكنني أن أتخيل ما سيحدث إذا لعبت هذه الحركة أو اتخذت هذا الإجراء. ولذا فهذه حقًا خطوة أساسية نحتاجها وشيء نعتقد أنه مهم جدًا للمضي قدمًا في مستقبل الذكاء الاصطناعي.

جينيفر: يقول إن الأمر لا يختلف عن رضيع يتعامل مع العالم من حوله ... يبني مهارات حل المشكلات والمهارات الإبداعية بمرور الوقت.

ديفيد سيلفر: أعتقد أننا نرى بالفعل أمثلة حيث ، ضمن المجالات المقيدة ، نرى خوارزميات إبداعية لجميع المقاصد والأغراض. أعني ، ما هو الإبداع بعد كل شيء بخلاف القدرة على اكتشاف فكرة جديدة لنفسه. وأعتقد أن هذا هو جوهر الإبداع. جوهر الإبداع هو ما تفعله خوارزمياتنا ، وهو اكتشاف شيء جديد خطوة بخطوة والتعلم من خلال تجربتهم أن هذه الفكرة الجديدة التي توصلوا إليها هي في الواقع شيء قوي ويساعدها على تحقيقها الأهداف. لذلك أعتقد أنه في المستقبل ، سنرى المزيد والمزيد من الإبداع في هذا النموذج. سنرى ، كما تعلمون ، آلات قادرة على اكتشاف الأفكار بأنفسهم التي تساعدهم على تحقيق الأهداف. ليس لأن شخصًا ما أخبرهم أن هذا هو الشيء الذي تحتاجه لتحقيق هذا الهدف ، ولكن لأنهم توصلوا إليه بأنفسهم.

جينيفر: و .. قاد هذا الإبداع AlphaZero لاكتشاف أشياء جديدة حول كيفية لعب الشطرنج. الآن…. يقوم اللاعبون البشريون بتبنيه في ألعابهم الخاصة ... يطلقون عليه .. 'لعب حركة ألفا صفرية'.

[سوت: كيف تلعب مثل AlphaZero]

لماذا التكنولوجيا سيئة في الفصول الدراسية

يستضيف: مرحبًا بكم في إصدار آخر من How to Attack مثل AlphaZero! أتمنى أن تكون مستعدًا لدرس اليوم….

جينيفر: يحدث هذا أيضًا مع الرياضات الإلكترونية ... وهي مسابقات ألعاب فيديو يتم لعبها غالبًا أمام جمهور مباشر ... على غرار حدث رياضي ... مع جمهور عالمي يبلغ ما يقرب من نصف مليار مشاهد يتابعون مشاهدة ألعابهم المفضلة التي يتم لعبها من قبل بعض أفضل اللاعبين في العالم.

هنا أيضًا ، يتم استخدام الذكاء الاصطناعي بعدة طرق ... مثل أدوات التدريب لمساعدة الأشخاص على اللعب بشكل أفضل ... و (مرة أخرى) ، يهدف الباحثون أيضًا إلى استخدام الرياضات الإلكترونية لجعل أنظمة الذكاء الاصطناعي الخاصة بهم أكثر ذكاءً ...

ديفيد فارحي: نتخيل أنه في مرحلة ما ستكون هناك أنظمة ذكاء اصطناعي عامة يمكنها حل المشكلات بسرعة ، ويمكن أن تتعلم ربما على مستوى البشر.

جينيفر: ديفيد فارحي هو باحث رئيسي في Open AI ... مختبر البحث الذي أسسه Elon Musk ومجموعة من الشخصيات البارزة في Silicon Valley.

لقد ابتكر النظام الأول للفوز على أبطال العالم في لعبة رياضية إلكترونية.

تسمى هذه اللعبة Defense of the Ancients 2 ، والتي يسميها الجميع Dota 2 ... وهناك فيلم وثائقي جديد حول هذا الفوز ... يسمى Artificial Gamer.

[مقطع من المقطع الدعائي لألعاب اصطناعية]

[موسيقى وأصوات مثيرة من لعبة Dota 2]

المتحدث 1: عندما تنظر إلى لعبة Dota ، هناك أكثر من 10000 متغير في كل لحظة يجب أن يستوعبها نظامك.

المتحدث 2: يتعلم الذكاء الاصطناعي بطريقة مختلفة تمامًا عن البشر.

المتحدث 3: يلعب ضد نسخ من نفسه. مرات عديدة في السحاب ..

جينيفر: أشرف فهري على مشروع Dota 2 ، المسمى Open AI Five ... وقد أوضح كيف يعمل في مؤتمر الذكاء الاصطناعي التابع لـ Tech Review ، EmTech Digital ...

[أصوات عبر لعبة Dota 2 موقع YouTube. [00:03 - 00:15] تلاشى للداخل ، ثم النوم تحت خيار فارحي التالي. * القتال بالسيف وخطوات الأقدام وموسيقى المعارك الدرامية. *]

ديفيد فارحي: في الزاوية اليمنى العليا من هذه الشاشة. نرى منظرًا كبيرًا جدًا ، ومُصغرًا ، لعالم Dota بالكامل ، في الزاوية اليسرى السفلية توجد قاعدة فريق واحد. في الزاوية اليمنى العليا توجد قاعدة فريق آخر. يحاول كل فريق تحريك شخصياته ، وإلقاء التعاويذ مع شخصياتهم ، ومهاجمة الأعداء وما إلى ذلك لغزو وتدمير قاعدة الفريق الآخر في نهاية المطاف.

ديفيد فارحي: هذه الأنظمة الأكثر تعقيدًا مثل الروبوتات وألعاب الفيديو لها طابع مختلف عنها لأنك تحصل على ملاحظة لحالة اللعبة ، ثم تختار إجراءً لتتخذه. ثم تتغير حالة اللعبة بطريقة ما ، اعتمادًا على الإجراء الذي اتخذته. وبعد ذلك لديك ملاحظة جديدة ويمكنك اختيار إجراء جديد وتحدث هذه الحلقة مرارًا وتكرارًا. ولذا عليك اتخاذ قرارات لها عواقب بعيدة المدى في المستقبل. لذا فإن الطريقة التي نقوم بها بهذا بسيطة نسبيًا. من الناحية المفاهيمية على الأقل. لدينا عملاء يبدأون اللعب بشكل عشوائي تمامًا. وعلينا فقط أن نلعبهم ضد أنفسهم ، استنساخًا لأنفسهم مرارًا وتكرارًا.

جينيفر: وإذا كنت تعتقد أن هذا قد يستغرق وقتًا طويلاً حقًا مع مثل هذه اللعبة المعقدة؟ أنت لست مخطئًا ... لكن قدرة Open AI على تشغيله على 200 ألف جهاز في وقت واحد ... تساعد.

في الأساس ... يمكنه اكتساب حوالي 250 عامًا من الخبرة يوميًا.

وإذا كان النظام يفعل شيئًا ما يعمل ... يتم تحديثه للقيام بهذا الشيء أكثر ... وإذا حدث شيء سيء ولم ينجح ، فإنه لا يفعل ذلك الشيء.

ديفيد فارحي: بدأنا بنسخة محدودة من اللعبة. تمكنا في النهاية من التغلب على فريق المطورين لدينا ، الأمر الذي كان ممتعًا للغاية. ثم أضفنا المزيد من أجزاء اللعبة. عدنا وتدربنا لفترة أطول. وكنا قادرين على التغلب على بعض الهواة ثم بعض البشر شبه المحترفين. في النهاية قررنا الذهاب إلى بطولة كبيرة مثل هذه اللعبة ..

[أصوات من The International 3 (بطولة Dota) عبر YouTube. * هتاف الجماهير ، المعلقون الرياضيون يهتفون بحماس ، لعبة Dota. *]

المذيع الرياضي: يمكن أن يكون موقفهم الأخير. [غير مسموع]

المذيع الرياضي: سيحاول التركيز على الجميع ولكن هناك الكثير من الأشياء.

المذيع الرياضي: ليس هناك المزيد من المقاطع المتوفرة. وصولا إلى ما يقرب من نصف حصان.

المذيع الرياضي: ربع حصان. أسد يحيط من جميع الجهات! بنك المعرفة المصري! المذيع الرياضي: لقد فازوا بالجولة! سيفعلون ذلك!

المذيع الرياضي: ملوك الشمال! انتصار التحالف! لقد فازوا في TI 3.

المذيع الرياضي: لقد ربح التحالف للتو 1.4 مليون دولار!

المذيع الرياضي: إنهم أبطالك الدوليون الثلاثة!

ديفيد فارحي: إذن فهذه اللعبة بها ملايين المستخدمين البشريين الذين يتنافسون في هذه البطولات للحصول على جوائز كبيرة ، مما يضمن أننا نعرف أن هناك بشرًا يلعبون بمستوى عالٍ جدًا من المهارة. في أغسطس 2018 ، اصطحبنا وكيلنا إلى هذه البطولة.

جينيفر: لعب الذكاء الاصطناعي الخاص بهم ضد فريقين محترفين تم إقصاؤهم بالفعل من البطولة ... وخسروا بصعوبة. لكن في العام التالي ، مع مزيد من التدريبات ، تمكن الذكاء الاصطناعي من التغلب على أبطال العالم السابقين 2-0.

ديفيد فارحي: لذلك تم تدريب OpenAI Five مع عدم وجود بشر في عملية التدريب ، لذا فهي تلعب ضد نفسها في هذه الخوادم السحابية مرارًا وتكرارًا. وبعد ذلك عندما نريد أن نلعبها ضد إنسان ، نأخذ لقطة من السحابة ونلعبها ضد الإنسان ، لكننا لا نعيد هذه البيانات مرة أخرى إلى عملية التدريب.

[موسيقى]

جينيفر: ولكن لا يزال هناك سؤال حول ما إذا كانت الألعاب يمكن أن تساعدنا في تدريب الذكاء الاصطناعي ليكون أكثر فائدة.

في الوقت الحالي ، لدينا أنظمة جيدة للغاية في شيء واحد. لكن ليس لدينا حتى الآن نماذج يمكنها القيام بالكثير من الأشياء في وقت واحد.

مرة أخرى ، زميلي ويل دوغلاس هيفين.

ما لا تستطيع أجهزة الكمبيوتر فعله

ويل دوجلاس هيفين: ستتمثل الحيلة ، كما أعتقد ، في التراجع عن بناء ذكاء اصطناعي يتفوق في استراتيجيات أو تقنيات محددة ، أو أن يكون لديك حل رائع لهذه القاعدة أو التحرك ، كما تعلمون ، نوع الشيء الذي رأيناه في هذه الذكاء الاصطناعي الذي يمكنه تعلم ممارسة الألعاب.

جينيفر: لفهم المرحلة التالية من هذا البحث حقًا ... قد يكون من المفيد التفكير في طريقة لعب الأطفال في الملعب.

ويل دوجلاس هيفين: إنهم لا يلعبون لعبة بها أي نوع من القواعد الحقيقية المحددة. أعني ، قد يصنعونها أثناء تقدمهم ، لكن ، كما تعلمون ، هم فقط يستكشفون ، ويجربون الأشياء بطريقة طبيعية جدًا ومفتوحة. وليس هناك أي هدف محدد يعملون من أجله. وأعتقد أن هذا النوع من التقنية ، والذي لا يزال نوعًا من اللعب ، الذي سنرى ، كما تعلمون ، دفع الأشياء إلى الأمام حقًا عندما نتحدث عن الذكاء العام. Deepmind ، على سبيل المثال ، أطلق منذ بضعة أشهر ملعبًا افتراضيًا. إنه يشبه إلى حد ما عالم ألعاب فيديو يسمى X Land. وهي مأهولة بمجموعة من الروبوتات الصغيرة. والشيء الرائع هنا هو أن X Land نفسها يتم التحكم فيها بواسطة الذكاء الاصطناعي أو نوعًا ما مثل سيد الألعاب الذي يعيد ترتيب البيئة ، ويعيد ترتيب العوائق والكتل والكرات التي تلعب بها الروبوتات الصغيرة ، وأيضًا يأتي بأشكال مختلفة القواعد على الطاير. لذا ، فإن الألعاب البسيطة مثل الوسم أو الاختباء والبحث ، وعلى الروبوتات فقط أن تتدرب ، كما تعلم ، كيف تلعبها. أنت تعرف ما هي الأشياء الموجودة في هذا العالم الافتراضي ستساعدهم على القيام بذلك. وهم يتعلمون مهارات عامة مثل الاستكشاف ، وتجربة الأشياء فقط وأعتقد أن هذا النوع من الاستكشاف المفتوح سيكون مفتاحًا للجيل القادم من الذكاء الاصطناعي. ومن المثير أن [00:09:00] الموجة التالية من الذكاء الاصطناعي ، الذكاء الاصطناعي الذي سيكون جيدًا في أشياء متعددة ، [00:09:03] لا يزال بإمكاننا الوصول إلى هناك من خلال الألعاب مرة أخرى. لذا فإن الألعاب لا تسير في أي مكان. كانت الألعاب مع الذكاء الاصطناعي منذ البداية. كما تعلم ، من الجيد أن ترى أن اللعب ربما لا يزال أفضل طريقة للتعلم.

[الائتمانات]

جينيفر: تم الإبلاغ عن هذه الحلقة أنا وويل دوغلاس هيفين… ومن إنتاج أنتوني جرين وإيما سيليكنز وكارين هاو. تم تحريرنا بواسطة نيال فيرث ومايكل رايلي ومات هونان. مهندس المزيج لدينا هو Garret Lang… مع تصميم الصوت والموسيقى لجاكوب جورسكي.

شكرًا على الاستماع ، أنا جينيفر سترونج.
[معرف TR]

يخفي

التقنيات الفعلية

فئة

غير مصنف

تكنولوجيا

التكنولوجيا الحيوية

سياسة التكنولوجيا

تغير المناخ

البشر والتكنولوجيا

وادي السيليكون

الحوسبة

مجلة Mit News

الذكاء الاصطناعي

الفراغ

المدن الذكية

بلوكشين

قصة مميزة

الملف الشخصي للخريجين

اتصال الخريجين

ميزة أخبار معهد ماساتشوستس للتكنولوجيا

1865

وجهة نظري

77 Mass Ave

قابل المؤلف

ملامح في الكرم

شوهد في الحرم الجامعي

خطابات الخريجين

أخبار

انتخابات 2020

فهرس With

تحت القبه

خرطوم الحريق

قصص لانهائية

مشروع تكنولوجيا الوباء

من الرئيس

غلاف القصه

معرض الصور

موصى به