Μπορεί το xG να χρησιμοποιηθεί για κέρδος στο στοίχημα;
Κατηγορία:
Στρατηγική
Ημερομηνία:
11-04-2024
Ο στοιχηματισμός, τουλάχιστον για όσους τον βλέπουν ως κάτι περισσότερο από ένα χόμπι, έχει συσχετιστεί την ιδέα της αναμενόμενης αξίας.
Στοιχήματα κερδίζονται και χάνονται, αλλά πολλά από όσα συμβαίνουν είναι απλώς συνέπεια της τύχης.
Ωστόσο, στο μακροπρόθεσμο, η γνώση της αναμενόμενης αξίας επιτρέπει σε έναν παίκτη να εκτιμήσει τι μπορεί να περιμένει να κερδίσει από ένα μεγαλύτερο δείγμα στοιχημάτων. Η λέξη "αναμενόμενο" είναι απλώς άλλος όρος για τον "αριθμητικό μέσο" ή τον "μέσο όρο".
Πιο πρόσφατα, η έννοια της προσδοκίας βρήκε τον δρόμο της στο ποδόσφαιρο μέσω της έννοιας των αναμενόμενων γκολ, ή xG. Τα αναμενόμενα γκολ χρησιμοποιούνται ως μετρική απόδοσης για την αξιολόγηση της επίδοσης ομάδων και παικτών στο ποδόσφαιρο, αποδίδοντας μια πιθανότητα σε μια ευκαιρία που μπορεί να οδηγήσει σε γκολ.
Αυτό υπολογίζεται χρησιμοποιώντας ιστορικά δεδομένα για ισοδύναμες ευκαιρίες και το ποσοστό μετατροπής γκολ. Έτσι, το xG για μία ευκαιρία θα είναι μεταξύ 1 και 0.
Επιπλέον, η συνάθροιση των xG σε ένα παιχνίδι με αρκετές ευκαιρίες για γκολ θα δώσει το xG για το ίδιο το παιχνίδι, ή πιο συνηθισμένα, το xG για κάθε ομάδα σε ένα παιχνίδι.
Θεωρητικά, το xG προσφέρει μια πιο ακριβή αναπαράσταση της ποιότητας παιχνιδιού των ομάδων σε έναν αγώνα, και της ανωτερότητας μιας ομάδας έναντι μιας άλλης, από ό,τι τα πραγματικά γκολ.
Τα γκολ σημειώνονται με αρκετή τύχη (όπως λένε οι στατιστικολόγοι 'θόρυβος'), και η χρήση ενός πραγματικού σκορ για να προβλέψει κανείς τι μπορεί να κάνει μια ομάδα στον επόμενο αγώνα της μπορεί να είναι λιγότερο αξιόπιστη από τη χρήση του xG της.
Με έναν τρόπο, τα γκολ είναι σαν τις νίκες και τις ήττες στο στοίχημα, ενώ τα αναμενόμενα γκολ είναι σαν την αναμενόμενη αξία. Αν αυτό ισχύει, μπορούμε να χρησιμοποιήσουμε το xG αντί για γκολ για να προβλέψουμε το αποτέλεσμα αγώνων ποδοσφαίρου.
Γκολ έναντι xG
Ο μαθηματικός και συγγραφέας του "Soccermatics: Mathematical Adventures in the Beautiful Game" David Sumpter παράσχει κάποιες οδηγίες σχετικά με τη χρησιμότητα των γκολ έναντι του xG κατά την προσπάθεια πρόβλεψης του αποτελέσματος μελλοντικών αγώνων. Ο Sumpter απεικονίζει με συνοπτικό τρόπο τη δυσκολία της εύρεσης μιας προβλεπτικής σήμανσης από τα δεδομένα των γκολ.
"Από στατιστική άποψη, το αποτέλεσμα ενός αγώνα ποδοσφαίρου είναι τόσο θόρυβος όσο είναι και σήμα. Μια μαθηματική εξήγηση γι' αυτό μπορεί να βρεθεί απευθείας από την κατανομή Poisson. Τα γκολ στο ποδόσφαιρο υπάγονται στην κατανομή Poisson και οι ομάδες σκοράρουν περίπου 1.4 γκολ κατά μέσο όρο. Η διακύμανση και ο μέσος όρος είναι ίσοι στην κατανομή Poisson. Έτσι, η τυπική απόκλιση είναι η τετραγωνική ρίζα του 1.4, που είναι 1.18. Έτσι, ο θόρυβος (1.18) είναι λίγο μικρότερος από το σήμα (1.4)."
Το xG, αντίθετα, είναι ένα μέτρο των δημιουργημένων ευκαιριών, και έτσι προσφέρει ένα καλύτερο μέτρο της ποιότητας μιας ομάδας κατά τη διάρκεια ενός αγώνα απ' ότι τα γκολ.
Τυπικά περιέχει λιγότερο θόρυβο και περισσότερο σήμα. Τόσο για τα γκολ όσο και για τα xG, η ποσότητα του θορύβου στα αποτελέσματα των αγώνων μειώνεται όσο αυξάνεται το πλήθος των αγώνων που μελετώνται. Ωστόσο, ο ρυθμός μείωσης είναι αρχικά απότομοτερος για τα xG παρά για τα γκολ.
Ο Sumpter χρησιμοποιεί αυτές τις πληροφορίες για να συστήσει ποιου είδους δεδομένα θα πρέπει να επικεντρωθούμε όταν προσπαθούμε να κάνουμε προβλέψεις για μελλοντικούς αγώνες. Για έναν ή δύο αγώνες, είναι η ίδια η αναφορά του αγώνα που παρέχει τις πιο χρήσιμες πληροφορίες.
Από την άλλη πλευρά, για δείγματα περισσότερων από 15 παιχνιδιών, ή το μεγαλύτερο μέρος μισής σεζόν, τα δεδομένα των γκολ θα μπορούσαν πιθανώς να είναι εξίσου αξιόπιστα με τα xG.
Ο θόρυβος θα είναι ακόμα λίγο μεγαλύτερος, αλλά η διαφορά είναι μικρή. Επιπλέον, τα γκολ απεικονίζουν την πραγματικότητα – τι συνέβη – ενώ το xG είναι ένα πιθανοτικό μοντέλο των ευκαιριών για σκοράρισμα. Αν είναι ανακριβές, μπορεί πράγματι να αποδειχθεί λιγότερο αξιόπιστο από τα δεδομένα των γκολ.
Μεταξύ αυτών των δύο ακραίων βρίσκεται ένας συναρπαστικός τομέας από την άποψη της χρήσης του xG ως εργαλείου πρόβλεψης. Ο Sumpter υποστηρίζει ότι το xG θα είναι πιο χρήσιμο μεταξύ τριών και έξι παιχνιδιών, ενώ επτά έως δεκαπέντε παιχνίδια θα μπορούσαν να εξυπηρετηθούν καλύτερα από μια σύγκριση μεταξύ γκολ και xG.
Για αυτό το άρθρο, δημιούργησα ένα μοντέλο πρόβλεψης xG που χρησιμοποίησε τα πιο πρόσφατα έξι παιχνίδια που έπαιξε μια ομάδα για να αξιολογήσει αν θα μπορούσε να χρησιμοποιηθεί για να παράγει κέρδος.
Μοντέλο Dixon-Coles
Η πιο καλά τεκμηριωμένη προσέγγιση για την πρόβλεψη αγώνων ποδοσφαίρου δημοσιεύθηκε από τον Mark Dixon και τον Stuart Coles (του Πανεπιστημίου Lancaster) στο Journal of Applied Statistics το 1997.
Γνωστό ως μοντέλο Dixon-Coles, αναπτύσσει την έννοια της επιθετικής και αμυντικής δύναμης, συγκρίνοντας την ικανότητα των ομάδων να σκοράρουν και να δέχονται γκολ με τους μέσους όρους της λίγκας κατά τον προηγούμενο αριθμό παιχνιδιών.
Αυτές οι δυνάμεις χρησιμοποιούνται στη συνέχεια για να εκτιμηθεί το αναμενόμενο πλήθος γκολ που θα σκοράρει κάθε ομάδα στον επόμενο αγώνα της.
Τέλος, η κατανομή Poisson χρησιμοποιείται για να υπολογιστούν οι πιθανότητες των ατομικών αποδόσεων γκολ, όπου το αναμενόμενο πλήθος γκολ είναι ο μέσος όρος της κατανομής.
Πώς να υπολογίσετε την κατανομή Poisson
Εδώ, το μοντέλο έχει προσαρμοστεί ώστε να χρησιμοποιεί xG αντί για γκολ, υπολογίζοντας τις επιθετικές και αμυντικές δυνάμεις χρησιμοποιώντας τα έξι πιο πρόσφατα εντός ή εκτός έδρας παιχνίδια. Το δείγμα δεδομένων μου περιλάμβανε παιχνίδια που έγιναν στις Αγγλικές, Γαλλικές, Γερμανικές, Ιταλικές, και Ισπανικές Πρέμιερ κατηγορίες κατά τις σεζόν 2015/16 έως 2019/20.
Οι πιθανότητες πρόβλεψης για αποτελέσματα νίκης της έδρας, ισοπαλίας, και νίκης των φιλοξενούμενων μετατράπηκαν σε υποτιθέμενες δίκαιες αποδόσεις στοιχηματισμού, και στη συνέχεια συγκρίθηκαν με τις τελικές τιμές.
Όπου οι τελευταίες ήταν μεγαλύτερες, αυτό αποτελούσε τη θεωρητική αξία του μοντέλου πρόβλεψης. Τα value bets στη συνέχεια συγκρίθηκαν με τα αποτελέσματα.
Πιθανή Ακυρότητα του Μοντέλου
Ίσως το πρώτο στοιχείο στην αποτυχία αυτού του μοντέλου να βρίσκεται στον αριθμό της μέσης αναμενόμενης αξίας.
Με μέσες αποδόσεις 4.69, ένας αριθμός σχεδόν 40% για τη μέση αναμενόμενη αξία που αποτελούν περισσότερο από ένα τρίτο όλων των δυνατών ευκαιριών θα υποδήλωνε σίγουρα μια τεράστια διακύμανση στις υποτιθέμενες δίκαιες αποδόσεις στοιχηματισμού σε σύγκριση με τις πραγματικές τιμές.
Ένα διάγραμμα συσχέτισης μεταξύ των προβλεπόμενων τιμών xG του μοντέλου και των πραγματικών τιμών xG που καταγράφηκαν για τον προβλεπόμενο αγώνα επιβεβαιώνει το σημείο.
Υπάρχει πολύ θόρυβος; το μοντελοποιημένο xG δεν κάνει ιδιαίτερα καλή δουλειά στην ακριβή πρόβλεψη του πραγματικού xG μιας ομάδας για έναν αγώνα.
Η πηγή της αποτυχίας του μοντέλου μπορεί να είναι δυσκολότερο να αποκωδικοποιηθεί, καθώς υπάρχουν πιθανώς τουλάχιστον τέσσερα προβλήματα με αυτό. Πρώτον, η χρήση ενός μοντέλου Dixon-Coles για πρόβλεψη σκορ ποδοσφαίρου μπορεί να είναι από μόνη της ελαττωματική. Η κατανομή Poisson στην καρδιά της υποθέτει ότι το σκοράρισμα γκολ είναι ανεξάρτητο; δηλαδή, ένα γκολ δεν προκαλεί άλλο.
Ωστόσο, αυτό αγνοεί την επιρροή της ψυχολογίας των παικτών και των ομάδων. Ομάδες που χάνουν μπορεί να γίνουν πιο κινητοποιημένες από ό,τι ήταν προηγουμένως για να ανακτήσουν την ισορροπία, ενώ ομάδες που φτάνουν στην ισοπαλία μπορεί να είναι πιο κινητοποιημένες για να προχωρήσουν.
Τι είναι καλή ROI στον στοιχηματισμό στα αθλήματα;
Αν αυτό ισχύει, η ιδέα ότι τα γκολ απλώς μπαίνουν τυχαία πρέπει σίγουρα να αμφισβητηθεί.
Οι Dixon και Coles ανέφεραν οι ίδιοι ότι το αρχικό τους μοντέλο πρόβλεψης υποεκτίμησε τα αποτελέσματα χαμηλού σκορ (0-0, 1-0, 0-1 και 1-1).
Είναι σαφές ότι υπάρχουν λιγότερα πραγματικά χαμηλά xG σκορ από ό,τι προβλέπει το μοντέλο, ενώ υπάρχουν περισσότερα υψηλά xG σκορ από ό,τι θα έπρεπε.
Αυτό που βρήκαν ο Dixon και ο Coles για τα γκολ φαίνεται επίσης ότι ισχύει και για τα xG, ένα εύρημα όχι ολότελα απροσδόκητο δεδομένης της καλής συσχέτισης μεταξύ των γκολ και των xG σε μεγάλα δείγματα δεδομένων.
Δεδομένου ότι το Dixon-Coles είναι ένα καλά τεκμηριωμένο μοντέλο, και το xG τώρα ένα ευρέως χρησιμοποιημένο μετρικό, είναι πιθανό ότι όλες οι πληροφορίες που φέρνει ένα τέτοιο προβλεπτικό προσέγγιση έχουν ήδη ενσωματωθεί στις αποδόσεις των στοιχηματικών οίκων.
Ένας Διαγωνισμός Σχετικών Δεξιοτήτων
Ο στοιχηματισμός είναι πολύ σαν τα ανταγωνιστικά αθλήματα στα οποία βασίζεται. Εμπλέκει έναν διαγωνισμό σχετικών δεξιοτήτων μεταξύ δύο ή περισσότερων πλευρών, ανταγωνιζόμενων για να δουν ποιος είναι ο καλύτερος στην πρόβλεψη του μέλλοντος.
Ο καλύτερος προγνώστης, ο πιο αξιόπιστος και έγκυρος στην αξιολόγηση των πραγματικών πιθανοτήτων αποτελέσματος (και άρα των αποδόσεων στοιχηματισμού), θα είναι. Τα λάθη τιμωρούνται με οικονομικές ποινές.
Σχετικά με το εάν τα δεδομένα xG μπορούν να χρησιμοποιηθούν αποτελεσματικά για να κερδίσουν χρήματα από την αγορά στοιχημάτων στο ποδόσφαιρο, το ζήτημα είναι το εξής. Οι αποδόσεις που παρέχει ένα μοντέλο πρόβλεψης αντανακλούν την ποιότητα των πληροφοριών που εισάγονται σε αυτό.
Το xG μπορεί πράγματι να προσφέρει ένα χρήσιμο πόρο δεδομένων για τη δημιουργία ενός μοντέλου πρόβλεψης.