التكنولوجيا

لحظة مفصلية في تاريخ الذكاء الاصطناعي.. GPT-4.5 يتفوق على البشر في اختبار تورينج

2025-04-07

مُؤَلِّف: محمد

أظهرت دراسة جديدة أن نموذج الذكاء الاصطناعي GPT-4.5، الذي طورته شركة OpenAI، لم يكتفِ بتجاوز اختبار تورينج فحسب، بل استطاع أيضًا التفوق على البشر في إقناع المشاركين بأنه إنسان. وهذا الاكتشاف، الذي نُشر في ورقة بحثية أولية ينتظر مراجعة الأقران، يمثل تحولًا جذريًا في العلاقة بين الإنسان والآلة، مما يثير تساؤلات جوهرية حول مستقبل الذكاء الاصطناعي ومكانته في المجتمع.

اختبار تورينج

اختبار تورينج، الذي صممه عالم الحوسبة البريطاني آلان تورينغ عام 1949، يُعد معيارًا كلاسيكيًا لقياس مدى "تشابه" الآلة بالإنسان. يعتمد الاختبار على قدرة الذكاء الاصطناعي في إجراء محادثة مع شخص دون أن يتمكن المتلقي من تحديد ما إذا كان يتحدث مع آلة أم إنسان.

منهجية الدراسة

في هذه الدراسة، أجري بحثون من جامعة كاليفورنيا نسخة مُحدثة من اختبار تورينج، حيث تفاعل المشاركون مع كلٍ من إنسان حقيقي ونموذج ذكاء اصطناعي، ثم طُلب منهم تحديد من هو الإنسان.

نتائج الدراسة

عندما مُنح GPT-4.5 شخصية محددة لتتقمصها، مثل "شخص مثقف وواعٍ ثقافيًا"، اعتقد المشاركون أنه إنسان في 73% من الحالات. وترتبط هذه النتيجة بتفوق كبير بالمقارنة مع النسبة المتوقعة، والتي تبلغ 50%.

ومع ذلك، فإن الأداء انخفض إلى 36% فقط عندما لم يُمنح النموذج أي "شخصية"، مما يبرز أهمية السياق والتمثيل السردي في تقنيات الذكاء الاصطناعي الحديثة. بالمقابل، سجل النموذج GPT-4o من OpenAI نسبة 21% فقط، بينما حصل الروبوت ELIZA، الذي يعود إلى ستينيات القرن الماضي، على 23% بحسب مجلة "نيوزويك".

تعليقات الخبراء

وفي سياق التعليق، ذكر كارستين يونغ، رئيس قسم الاقتصاد الكلي والذكاء الاصطناعي في معهد أبحاث السياسات العامة، أن "الذكاء الاصطناعي قد وصل إلى مستوى لم يعد الناس قادرين فيه على تمييزه عن البشر في المحادثات النصية. ومع ذلك، تظهر هذه الدراسة أن الآلة قد تبدو أكثر إنسانية من الإنسان نفسه".

ويضيف: "لقد تجاوزنا 'المرحلة الغريبة' التي كانت فيها الروبوتات تشبه البشر بشكل غير مريح، وندخل مرحلة جديدة تمامًا. الذكاء الاصطناعي بات يُستخدم اليوم في العلاج والدعم النفسي وحتى الرفقة، وقد يغير جذريًا طريقة تواصلنا عبر الإنترنت".

كما تابع يونغ أن السياسات الحكومية لا تزال متأخرة عن هذا التطور المتسارع، مؤكدًا على الحاجة إلى تحديثات تشريعية وتنظيمية تتماشى مع قدرات الذكاء الاصطناعي الحديثة.

وفي تعليق منفصل، كتب الباحث كاميرون جونز عبر منصة X: "تظهر هذه النتائج أن أنظمة الذكاء الاصطناعي قد تتمكن من أداء مهام بشرية مثل تقديم الاستشارات القانونية أو التفاعل الاجتماعي دون أن يدرك الآخرون أنهم لا يتحدثون مع شخص حقيقي".

وحذر جونز من أن هذا التقدم قد يؤدي إلى تغييرات جذرية في سوق العمل، وزيادة خطر هجمات الهندسة الاجتماعية، وحتى اضطرابات اجتماعية واسعة.

كيف يعمل اختبار تورينج؟

إذاً، كيف يعمل اختبار تورينج؟ يتم وضع إنسان حكم في محادثة نصية مع طرفين مخفيين: أحدهما إنسان والآخر آلة (ذكاء اصطناعي). إذا لم يتمكن الحكم من التمييز بدقة بين الآلة والإنسان بناءً على المحادثة، فإن الآلة تُعتبر "ذكية" حسب معايير الاختبار.

الاستنتاجات النهائية

تعتبر نتائج اختبار GPT-4.5 إنجازًا تاريخيًا، حيث إن أي نموذج سابق لم يتجاوز البشر في هذا الاختبار. في المجال النفسي والاجتماعي، أصبح الناس يرون الذكاء الاصطناعي أكثر "إنسانية" مما هو عليه عندما يتم تقييمه بالشكل المناسب.

تقنيًا، يُظهر أهمية تصميم السياق والشخصيات في أداء الذكاء الاصطناعي. أمنيًا، قد يؤدي استخدام الذكاء الاصطناعي في الهندسة الاجتماعية أو التلاعب النفسي إلى نتائج سيئة للغاية.