
عندما كنا نرغب في الماضي في معرفة الفريق الفائز بكأس العالم، كنا نلجأ إلى العرّافين، أو نقرأ أوراق الشاي، أو ننتظر أن يخبرنا الأخطبوط «بول» بما سيحدث. لكن علم البيانات الحديث يوفر بديلاً أفضل.
وبصفتي عضواً في فريق من الإحصائيين، فقد ساعدتُ في تطوير وتدريب خوارزمية تعلم آلي، للتنبؤ بالمسار الأكثر ترجيحاً للبطولة، كما كتب الدكتور أكيم زيليس (*).
تعمل الخوارزمية التي طورناها على مرحلتين. في المرحلة الأولى، تُدمج نماذج إحصائية متطورة مع رؤى الخبراء من مكاتب المراهنات وأسواق الانتقالات الرياضية لتحديد نقاط قوة جميع الفرق ولاعبيها. أما في المرحلة الثانية، فتُقرر خوارزمية التعلم الآلي أفضل طريقة لدمج تقديرات القوة مع معلومات أخرى عن الفرق.
ينتج عن ذلك تنبؤ احتمالي لكل مباراة محتملة في البطولة. يمكن تشبيه الأمر بزوج من زهر الطاولة في لعبة النرد المُعدَّل: فبدلاً من أن تحمل الأرقام من 1 إلى 6 احتمالات متساوية، يحمل هذان النردان المُعدَّلان احتمالات مختلفة لعدد الأهداف التي يسجلها كل فريق.
على سبيل المثال، وفقاً لتوقعاتنا، يُظهر النرد أن المكسيك ستسجل 1.9 هدف في المتوسط في المباراة الافتتاحية، بينما يبلغ متوسط أهداف جنوب أفريقيا 0.7 هدف فقط. لكن هذا لا يعني بالضرورة فوز المكسيك. بل إن فوز المكسيك هو النتيجة الأكثر ترجيحاً بنسبة 65 في المائة. أما التعادل فهو أقل ترجيحاً (21 في المائة)، وفوز جنوب أفريقيا هو النتيجة الأقل ترجيحاً (14 في المائة).

وباستخدام أزواج مختلفة من زهر الطاولة المُعدَّل، يمكن محاكاة نتيجة كل مباراة في كأس العالم. وقد أخذنا في الاعتبار قرعة البطولة الرسمية وجميع قواعد «فيفا»، بما في ذلك إمكانية اللجوء إلى الوقت الإضافي وركلات الترجيح. أجرينا المحاكاة 100000 مرة لتحديد المسار الأكثر ترجيحاً للبطولة.
تُظهر النتائج أن إسبانيا هي المرشحة الأبرز للفوز باللقب بنسبة 14.5 في المائة، تليها إنجلترا وفرنسا بنسبة 12.4 في المائة لكل منهما، ثم ألمانيا بنسبة 11.2 في المائة.
ونظراً لتوسيع البطولة - حيث تضم هذه البطولة من كأس العالم 48 منتخباً وخمس جولات في الأدوار الإقصائية - فإن المنافسة بين المرشحين للفوز متقاربة للغاية. كما أن للبرتغال والأرجنتين فرصاً جيدة للفوز باللقب، بنسبة 8.9 في المائة، و8.2 في المائة على التوالي.
أما الولايات المتحدة، فلديها فرصة جيدة لبلوغ دور الـ32 بنسبة 78 في المائة، وهي الأعلى في مجموعتها التي تضم ثلاثة فرق أخرى. إلا أن احتمالات تأهل المنتخب الأميركي في الأدوار الإقصائية، حيث كل مباراة مصيرية، تتضاءل بسرعة نسبية. وتبلغ احتمالية فوز المنتخب الأميركي على أرضه في المباراة النهائية على ملعب ميتلايف في نيوجيرسي في 19 يوليو (تموز) واحداً في المائة.
تعتمد خوارزمية التعلم الآلي لدينا، وما يتبعها من عمليات محاكاة، على البيانات وخبرات الخبراء والنماذج الإحصائية.
* أولاً قوة الفرق: تُشكّل جميع مباريات المنتخبات الوطنية خلال السنوات الثماني الماضية أساساً لتقدير «استرجاعي» لقوة الفرق.
* ثانياً تقديرات مستقبلية: يُستخلص تقدير «مستقبلي» لقوة الفرق من احتمالات الفوز المعلنة من مختلف وكلاء المراهنات الدوليين، ما يعكس آراء خبرائهم حول البطولة المقبلة.
* ثالثاً تصنيف اللاعبين: يُصنّف اللاعبون بناءً على مساهماتهم في تسجيل الأهداف على مستوى الأندية والمنتخبات الوطنية.
* رابعاً إمكانات اللاعبين: تعكس الجودة الحالية والإمكانات المستقبلية للاعبين في قيمهم السوقية المتوقعة. هذه القيم متاحة على موقع «Transfermarkt» الإلكتروني، الذي يستخدم أسلوب «حكمة الجمهور» لتقدير القيم السوقية الحقيقية غير المعروفة.
تُدمج هذه المتغيرات الأربعة مع مجموعة واسعة من المدخلات الأخرى ذات الصلة التي تعكس الوضع الحالي للفرق المختلفة والدول التي تنتمي إليها. ويشمل ذلك تفاصيل خاصة بكل فريق، مثل تصنيفه في «فيفا» وعدد اللاعبين في نصف نهائي دوري أبطال أوروبا لهذا العام. أخذنا في الاعتبار أيضاً العوامل الاجتماعية والاقتصادية الخاصة بكل دولة، مثل نصيب الفرد من الناتج المحلي الإجمالي.
ولتحديد مدى أهمية هذه العوامل في نتائج كأس العالم، وكيفية تأثيرها، استخدمنا خوارزمية تعلّم آلي. في هذه الخوارزمية، يتم تدريب ما يُسمى «الغابة العشوائية»، وهي عبارة عن مجموعة من أشجار القرار التي تُغطي مجموعات فرعية مختلفة قليلاً من البيانات. وقد تم تدريب الخوارزمية على جميع المباريات التي أجريت في بطولات كرة القدم الكبرى منذ كأس العالم 2006. وبذلك، تربط الخوارزمية بين قوة الفريق وقيمته السوقية وعوامل أخرى وعدد الأهداف المُسجلة في مباريات كأس العالم. هذه هي المعلومات التي تُشكّل أساس عمليات المحاكاة لدينا.
ليست هذه المرة الأولى التي نتعاون فيها أنا وفريقنا، الذي يضم أندرياس غرول وروفين ميشيلز والزملاء في جامعة دورتموند التقنية بألمانيا، ولارس ماغنوس هفاتوم من جامعة مولده بالنرويج، وغونتر شاوبرغر من جامعة ميونيخ التقنية، للتنبؤ بنتائج كأس العالم.
في كأس العالم للسيدات 2019، توقعنا فوز الولايات المتحدة بشكل صحيح. أما في كأس العالم للسيدات 2023 وكأس العالم للرجال 2022، فلم يكن الفائزان - إسبانيا والأرجنتين على التوالي - من بين المرشحين المفضلين لدينا، مع أننا توقعنا أنهما من أبرز المنافسين.
خلاصة القول إن التوقعات تعتمد على الاحتمالات، إذ لن يتنبأ برنامجنا بالفائز بنسبة 100 في المائة، لكنه قد يكون أكثر دقة من الأخطبوط ذي الأطراف الثمانية.
* أستاذ في الإحصاء بجامعة إنسبروك - مجلة «فاست كومباني»
aawsat.com