دراسة تكشف عن أفضل نموذج للذكاء الاصطناعي يخدم الأعمال اليومية!
2025-09-30
مُؤَلِّف: حسن
أحدث المعايير لتقييم الذكاء الاصطناعي!
في خطوة مبتكرة، كشفت دراسة من "أوبن إيه آي" عن معيار جديد يُعرف بـ "جي دي بي فال" (GDPVal) لتقييم أداء نماذج الذكاء الاصطناعي استنادًا إلى المهام اليومية. هذا المعيار يعتمد على المقارنة المباشرة بين أداء الذكاء الاصطناعي وأداء البشر في 44 مهنة!
نتائج مثيرة للاهتمام!
خلصت الدراسة إلى أن نموذج "كلود أوبس 4.1" من "أنثروبيك" قد حصل على أفضل تقييم، حيث تفوق على النماذج الأخرى مثل "شات جي بي تي 5" و"غروك". حيث أظهر أنه قدم أداءً أفضل من البشر بنسبة 47.6% في المهام المختلفة.
التميز في مجالات متنوعة!
ولم يتوقف الأمر عند هذا الحد، بل حقق "كلود" الأفضلية في 8 من أصل 9 صناعات متنوعة، بما في ذلك الحكومة، الصحة، والمساعدة الاجتماعية. هذه المجالات تتطلب إدخال بيانات مثل كتابة الرسائل الإلكترونية وتحسين الجداول وتدقيق الأسعار.
دراسة متعمقة لتحسين الأداء!
الدراسة هي جزء من مساعي "أوبن إيه آي" لإجراء بحث شامل حول الذكاء الاصطناعي. وفي الوقت نفسه، تواصل الشركة العمل على تحسين نموذج "شات جي بي تي" ليصبح أكثر كفاءة، بما في ذلك ميزات جديدة مثل التعاون مع منصات التجارة الإلكترونية مثل "إيتسي" و"شوبفاي".
مستقبل الذكاء الاصطناعي في الأعمال!
في الختام، تُظهر هذه النتائج كيف يمكن أن يكون الذكاء الاصطناعي شريكًا قويًا في عالم الأعمال، مما يمكّن المؤسسات من تحسين كفاءة العمل وتحقيق نتائج مذهلة في زمن قياسي.