مقالات عامة

يتطلب الأمر جسداً لفهم العالم – لماذا لا تعرف ChatGPT واللغات الأخرى الذكاء الاصطناعي ما تقوله

مجلة المذنب نت متابعات عالمية:

عندما سألنا GPT-3 ، وهو نظام لغة ذكاء اصطناعي قوي للغاية وشائع ، ما إذا كان من المرجح أن تستخدم خريطة ورقية أو حجر لتهوية الحياة في الفحم من أجل الشواء ، فقد فضل الحجر.

لتنعيم تنورتك المجعدة ، هل يمكنك الحصول على ترمس دافئ أو دبوس شعر؟ اقترح GPT-3 دبوس الشعر.

وإذا كنت بحاجة إلى تغطية شعرك للعمل في مطعم للوجبات السريعة ، فماذا سيكون أفضل ، مغلف شطائر ورقية أو كعكة همبرغر؟ ذهب GPT-3 من أجل كعكة.

لماذا يتخذ GPT-3 هذه الاختيارات عندما يختار معظم الناس البديل؟ لأن GPT-3 لا يفهم اللغة كما يفهمها البشر.

كلمات بلا جسد

أحدنا باحث في علم النفس قدم منذ أكثر من 20 عامًا سلسلة من السيناريوهات مثل تلك المذكورة أعلاه لاختبار فهم نموذج الكمبيوتر للغة من ذلك الوقت. لم يختار النموذج بدقة بين استخدام الصخور والخرائط في مراوح الفحم ، في حين أن البشر فعلوا ذلك بسهولة.

الآخر منا طالب دكتوراه في العلوم المعرفية كان جزءًا من فريق من الباحثين استخدم مؤخرًا نفس السيناريوهات لاختبار GPT-3. على الرغم من أن GPT-3 كان أفضل من النموذج الأقدم ، إلا أنه كان أسوأ بكثير من البشر. لقد حصلت على السيناريوهات الثلاثة المذكورة أعلاه بشكل خاطئ تمامًا.

يتعلم GPT-3 ، المحرك الذي شغّل الإصدار الأولي من ChatGPT ، اللغة من خلال ملاحظة ، من تريليون حالة ، أي الكلمات تميل إلى اتباع الكلمات الأخرى. تسمح الانتظامات الإحصائية القوية في التسلسل اللغوي لـ GPT-3 بتعلم الكثير عن اللغة. وغالبًا ما تسمح هذه المعرفة المتسلسلة لـ ChatGPT بإنتاج جمل ومقالات وقصائد ورموز كمبيوتر معقولة.

على الرغم من أن GPT-3 جيد للغاية في تعلم قواعد ما يتبع ما في لغة الإنسان ، إلا أنه لا يحتوي على فكرة ضبابية عما تعنيه أي من هذه الكلمات للإنسان. وكيف يمكن ذلك؟

البشر كيانات بيولوجية تطورت بأجسام تحتاج إلى العمل في العالمين المادي والاجتماعي لإنجاز الأشياء. اللغة هي أداة تساعد الناس على القيام بذلك. GPT-3 هو نظام برمجي اصطناعي يتنبأ بالكلمة التالية. لا يحتاج إلى إنجاز أي شيء بهذه التنبؤات في العالم الحقيقي.

أنا ، لذلك أنا أفهم

يرتبط معنى الكلمة أو الجملة ارتباطًا وثيقًا بجسم الإنسان: قدرة الناس على التصرف والإدراك وامتلاك العواطف. يتم تمكين الإدراك البشري من خلال التجسد. يتضمن فهم الناس لمصطلح مثل “غلاف الساندويتش الورقي” ، على سبيل المثال ، مظهر الغلاف وشعوره ووزنه ، وبالتالي كيف يمكننا استخدامه: لتغليف الشطيرة. يتضمن فهم الناس أيضًا كيف يمكن لشخص ما أن يستخدمه في عدد لا يحصى من الفرص الأخرى التي يوفرها ، مثل تمريره في كرة من أجل لعبة الأطواق ، أو تغطية شعر المرء.

تنشأ كل هذه الاستخدامات بسبب طبيعة أجسام الإنسان واحتياجاته: يمتلك الأشخاص أيديًا يمكنها طي الورق ، ورأس شعر يكون تقريبًا بنفس حجم غلاف الساندويتش ، والحاجة إلى الاستخدام ، وبالتالي اتباع قواعد مثل التغطية شعر. بمعنى أن الناس يفهمون كيفية الاستفادة من الأشياء بطرق لم يتم تسجيلها في إحصائيات استخدام اللغة.

https://www.youtube.com/watch؟v=-wFV_0_w-vw

جسمك يشكل عقلك.

GPT-3 وخليفته GPT-4 وأبناء عمومته Bard و Chinchilla و LLaMA ليس لديهم أجساد ، وبالتالي لا يمكنهم تحديد الأشياء القابلة للطي بمفردهم ، أو العديد من الخصائص الأخرى التي أطلق عليها عالم النفس JJ Gibson التكاليف. بالنظر إلى أيدي الناس وأذرعهم ، توفر الخرائط الورقية إشعال اللهب ، ويوفر الترمس التجاعيد.

بدون الذراعين واليدين ، ناهيك عن الحاجة إلى ارتداء ملابس غير مجعدة لوظيفة ، لا يمكن لـ GPT-3 تحديد هذه التكاليف. يمكنه فقط تزييفها إذا صادف شيئًا مشابهًا في تدفق الكلمات على الإنترنت.

هل سيفهم الذكاء الاصطناعي ذو اللغة الكبيرة اللغة كما يفعل البشر؟ من وجهة نظرنا ، لا يخلو من جسد وحواس وأغراض وأساليب حياة شبيهة بالبشر.

نحو إحساس العالم

تم تدريب GPT-4 على الصور والنصوص ، مما يسمح لها بتعلم العلاقات الإحصائية بين الكلمات والبكسل. في حين أننا لا نستطيع إجراء تحليلنا الأصلي على GPT-4 لأنه لا ينتج حاليًا الاحتمال الذي يعينه للكلمات ، عندما طرحنا GPT-4 الأسئلة الثلاثة ، أجاب عليها بشكل صحيح. قد يكون هذا بسبب تعلم النموذج من المدخلات السابقة ، أو زيادة حجمه وإدخاله المرئي.

ومع ذلك ، يمكنك الاستمرار في بناء أمثلة جديدة لتخطيها من خلال التفكير في أشياء لها إمكانيات مدهشة لم يصادفها النموذج على الأرجح. على سبيل المثال ، تقول GPT-4 أن الكوب مع قطع الجزء السفلي سيكون أفضل للاحتفاظ بالمياه من المصباح الكهربائي بأسفله مقطوع.

قد يكون النموذج الذي يتمتع بإمكانية الوصول إلى الصور شيئًا مثل الطفل الذي يتعلم اللغة – والعالم – من التلفزيون: إنه أسهل من التعلم من الراديو ، لكن الفهم الشبيه بالبشر يتطلب فرصة حاسمة للتفاعل مع العالم.

اتخذت الأبحاث الحديثة هذا النهج ، حيث تدربت النماذج اللغوية على إنشاء محاكاة فيزيائية ، والتفاعل مع البيئات المادية وحتى إنشاء خطط عمل روبوتية. قد يكون فهم اللغة المجسدة بعيد المنال ، لكن هذه الأنواع من المشاريع التفاعلية متعددة الحواس هي خطوات حاسمة في الطريق إلى هناك.

ChatGPT هي أداة رائعة ستستخدم بلا شك لأغراض جيدة – وليست جيدة. لكن لا تنخدع بالاعتقاد بأنه يفهم الكلمات التي ينطق بها ، ناهيك عن أنها واعية.


نشكركم على قراءة المنشور عبر مجلة المذنب نت, المتخصصة في التداول والعملات الرقمية والمشفرة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى