تحدث المهندس محمد ذكري، المدرس المساعد بكلية الهندسة بجامعة بني سويف، عن مشاركته في تطوير اختبار “Humanity’s Last Exam” الذي يعد من أصعب الاختبارات العالمية لقياس قدرات نماذج الذكاء الاصطناعي، وأوضح أنه مصمم لقياس مستوى الفهم العميق والاستدلال لدى هذه النماذج وليس فقط قدرتها على توليد نصوص صحيحة لغويًا.

كلية الهندسة تقدم دعمًا كبيرًا للباحثين في المجالات الحديثة

أشار ذكري، خلال مداخلة عبر برنامج “هذا الصباح” المذاع على قناة اكسترا نيوز، إلى أن جامعة بني سويف، وخاصة كلية الهندسة، تقدم دعمًا كبيرًا للباحثين في المجالات الحديثة، وعلى رأسها الذكاء الاصطناعي، بما يتماشى مع استراتيجية الدولة للتحول الرقمي ومتطلبات الثورة الصناعية الرابعة، وأشاد بدور إدارة الجامعة في تعزيز الشراكات مع المؤسسات الصناعية والتكنولوجية لدعم البحث العلمي.

وأوضح ذكري أن فكرة الاختبار جاءت بهدف معرفة ما إذا كانت نماذج الذكاء الاصطناعي الحالية قد وصلت إلى مستوى الخبرة البشرية المتخصصة، مضيفًا أن المعايير السابقة لقياس أداء هذه النماذج أصبحت سهلة نسبيًا، خاصة بعد أن تمكنت النماذج الحديثة من حل ما يقرب من 90% من الأسئلة، مما جعلها غير مناسبة لقياس التقدم الحقيقي في قدرات التحليل والاستدلال.

2500 سؤال في 100 تخصص علمي

وأشار إلى أن الاختبار الجديد يضم نحو 2500 سؤال تغطي 100 تخصص علمي مختلف، وتم إعدادها بواسطة خبراء أكاديميين من جامعات ومؤسسات بحثية حول العالم بالتعاون مع شركات تعمل في تدريب نماذج الذكاء الاصطناعي، موضحًا أن الأسئلة تعتمد على الاستدلال متعدد الخطوات وتتطلب مستوى عميقًا من التحليل لحلها.