في حين أن Dębiak فاز 500،000 ين ونجا محنته بشكل أفضل من سائق الصلب الأسطوري ، فإن نهائيات جولة Atcoder World تدفع البشر ونماذج الذكاء الاصطناعى إلى حدودها من خلال تحديات التحسين المعقدة التي ليس لها حل مثالي – فقط أفضل.
ترميز ماراثون يختبر القدرة على التحمل البشري ضد كفاءة الذكاء الاصطناعي
تمثل نهائيات Atcoder World Tour واحدة من أكثر الأحداث الحصرية للبرمجة التنافسية ، حيث تدعو فقط أفضل 12 مبرمجًا في جميع أنحاء العالم بناءً على أدائهم طوال العام السابق. يركز التقسيم الإرشادي على “np-hard“مشاكل التحسين. في البرمجة ، فإن الأساليب هي تقنيات لحل المشكلات التي تجد حلولًا جيدة بما يكفي من خلال الاختصارات والتخمينات المتعلمة عندما تستغرق الإجابات المثالية وقتًا طويلاً.
اقتصر جميع المنافسين ، بما في ذلك Openai ، على الأجهزة المتطابقة التي قدمتها Atcoder ، مما يضمن حدوث ملعب مستوي بين المتسابقين من الإنسان والمنظمة العفوية. وفقا ل قواعد المسابقة، يمكن للمشاركين استخدام أي لغة برمجة متوفرة على Atcoder ، مع عدم وجود عقوبة لإعادة القبول ولكن الانتظار الإلزامي لمدة خمس دقائق بين التقديمات.

أظهرت نتائج المسابقة النهائية الانتهاء من PSYHO برصيد 1،812،272،558،909 نقطة ، في حين سجل طراز Openai (المدرج على أنه “Openaihc”) 1،654،675،725،406 نقطة – هامش حوالي 9.5 في المائة. الوافد الاصطناعي في Openai ، العادة نموذج التفكير المحاكاة على غرار O3 ، المركز الثاني بشكل عام ، قبل 10 من المبرمجين البشريين الآخرين الذين تأهلوا من خلال تصنيفات لمدة عام.
تميزت Openai بالمركز الثاني بأنه علامة فارقة لنماذج الذكاء الاصطناعى في البرمجة التنافسية. وقال متحدث باسم الشركة في رسالة بريد إلكتروني إلى ARS Technica: “نماذج مثل O3 Ranning من بين أفضل 100 في مسابقات الترميز/الرياضيات ، ولكن على حد علمنا ، هذا هو أول موضع أعلى 3 في مسابقة ترميز/رياضيات رائدة”. “تمنحنا أحداث مثل Atcoder طريقة لاختبار مدى جودة النماذج التي يمكن أن تسببها بشكل استراتيجي ، وتخطيط آفاق زمنية طويلة ، وتحسين الحلول من خلال التجربة والخطأ – تمامًا مثل الإنسان”.
اترك تعليقاً