Jump to content

xΓνωμούλες - Στατιστικά, Κουμπιουτερς και Αριθμοί


Atlas21
 Share

Recommended Posts

Πολύ ωραία ιδέα! Θα με ενδιέφερε να δω το αντίστοιχο ΜΟ διαθεσιμότητας για ομάδες που μας ανταγωνίζονται, τόσο εντός συνόρων όσο και εκτός. Να μετρηθεί πόσο μεγαλό ήταν το ζήτημα των τραυματισμών.

Link to comment
Share on other sites

Ωραία η ιδέα του @thodoris19. Θα είχε ενδιαφέρον να σταθμισουμε κάπως από ποιο ποσοστό διαθεσιμότητας και κάτω θεωρείται αισθητή για την ομάδα η απουσία ενός παίχτη. Όπως διαβάζω το γράφημα, θα έλεγα χοντρικά από το 80% και κάτω, αλλά θα είχε ενδιαφέρον να το σταντάρουμε με περισσότερη ακρίβεια.

  • Δικεφαλάκι 1
Link to comment
Share on other sites

1. Καλό θα ήταν να υπήρχαν διαθεσιμα raw data της opta. Θα γινει σαφως καλυτερη αναλυση και χρηση αυτων των δεδομενων. Σε καμια περιπτωση δεν εμπιστευομαι οχι μονο τους αρδ που τα αναλυουν και τα δινουν μασημενα απο το στομα τους αλλα ουτε τις αναλυσεις τις ιδιας της opta.

2. Free data με πολλα στοιχεια εδω https://www.football-data.co.uk/greecem.php, καταλληλα για μοντε καρλο. Ωστοσο, για ενα comprehensive μοντελο θες και στατιστικα παικτων.

 

EDIT

Επίσης, όσοι εχουν τη διαθεση να ασχοληθουν, χρσηιμοποιηστε κατανομη Poisson για τα γκολ. Το λαμδα της κατανομης να μεταβαλλεται αναλογα με την ομαδα. Η συγκεκριμενη τιμη πρεπει να προκυψει με καταλληλη αναλυση των σταστιτικων. πχ, μεσος αριθμος γκολ που σκοραρει μια ομαδα στο 90λεπτο ή 95λεπτο (και αντιστοιχα μεσος αριθμος γκολ που δεχεται για το ποσα θα δεχθει σε ενα ματς)

  • Δικεφαλάκι 3
Link to comment
Share on other sites

Είπαμε να ασχοληθούμε με στατιστικα αλλά εσείς το έχετε πάει στο Θεό. Μπραβο ρε μάγκες, είστε απίστευτοι! 

Link to comment
Share on other sites

27 minutes ago, Skepastos said:

Είπαμε να ασχοληθούμε με στατιστικα αλλά εσείς το έχετε πάει στο Θεό. Μπραβο ρε μάγκες, είστε απίστευτοι! 

Το θεμα δεν ειναι αυτο. Το θεμα ειναι τι θα γινει οταν η κοινωνια συνειδητοποιησει οτι ο δυτικός κυριως κοσμος κρεμεται σε ενα απλο excel που εχει φτιαξει ενας intern της Ernst & Young.

Στο θεμα μας, υπαρχουν δημοισευμενοι οι τροποι με τoυς οποιους μπορεις να υπολογισεις πχ xGoals, ακομα και να φτιαξεις τα raw data απο την TV (ορεξη και αργομισθια να εχεις). Αμφιβάλλω αν πανω απο το 2% οσων ασχολουνται με ποδοσφαιρο μπορουν να καταλαβουν πληρως τη διαδικασία και αν πανω απο το 0.1% μπορει να κανει implementation αυτή τη διαδικασία για να παραξει κατι χειροπιαστό (πχ ενα πληρες μοντελο που θα σου κανει predict πρωταθλητη, η νικητη η οτιδηποτε). Θα εμπιστευτω πολυ περισσοτερο την transparent μεθοδο του @Yossarian , με το απλο αρχικο scriptακι σε python πχ που ξερεις τα limitations και πως θα τα φτιαξεις για να πας παρακατω παρα τις παπατζες που δημοσιευονται σε αθλητικα πορδοsite και που στην πραγματικοτητα δεν ξερεις απο πιο κωλο βγηκαν

  • Δικεφαλάκι 7
Link to comment
Share on other sites

3 hours ago, flavius said:

1. Καλό θα ήταν να υπήρχαν διαθεσιμα raw data της opta. Θα γινει σαφως καλυτερη αναλυση και χρηση αυτων των δεδομενων. Σε καμια περιπτωση δεν εμπιστευομαι οχι μονο τους αρδ που τα αναλυουν και τα δινουν μασημενα απο το στομα τους αλλα ουτε τις αναλυσεις τις ιδιας της opta.

2. Free data με πολλα στοιχεια εδω https://www.football-data.co.uk/greecem.php, καταλληλα για μοντε καρλο. Ωστοσο, για ενα comprehensive μοντελο θες και στατιστικα παικτων.

 

EDIT

Επίσης, όσοι εχουν τη διαθεση να ασχοληθουν, χρσηιμοποιηστε κατανομη Poisson για τα γκολ. Το λαμδα της κατανομης να μεταβαλλεται αναλογα με την ομαδα. Η συγκεκριμενη τιμη πρεπει να προκυψει με καταλληλη αναλυση των σταστιτικων. πχ, μεσος αριθμος γκολ που σκοραρει μια ομαδα στο 90λεπτο ή 95λεπτο (και αντιστοιχα μεσος αριθμος γκολ που δεχεται για το ποσα θα δεχθει σε ενα ματς)

H Opta χρεώνει για ακριβως τα καλα της δεδομένα και την ανάλυση τους. Τώρα ο Yossarian μου εβαλε μια φυτιλιά με το MC, και θα θελα να κανω κατι απλο. Comprehensive δεν γίνεται να γίνει με τον χρονο που σκοπευω να διαθέσω. Ούτε γκολ, ουτε σκορ, ουτε τίποτα, μόνο σημείο. Το μόνο που σκόπευα να κάνω είναι να χρησημοποιήσω το υπάρχoν xGD για να μετατρέψω το "σε ντερμπι όλα τα σημεία παίζουν" σε κάτι ελαφρώς πιο εξεζητημένο.

Μεγάλη αλήθεια για το Εξελ στο βάθος της δυτικής οικονομίας. Κάπου υπάρχει και ένα καταγώγι που ασχολούνται με COBOL, και όταν κοπεί το ρεύμα εκεί θα γκρεμιστεί η γη.

  • Δικεφαλάκι 1
Link to comment
Share on other sites

Τι λέτε βρε μαλάκες και κυρίως πως συνεννοειστε μεταξύ σας;

  • Δικεφαλάκι 1
  • Hahaha 19
Link to comment
Share on other sites

6 minutes ago, stavros 9-11 said:

Τι λέτε βρε μαλάκες και κυρίως πως συνεννοειστε μεταξύ σας;

ΧΑΧΧΑΑΧΧΑΧΑΑΧΑΧΧΑΑΧ αυτο παρτο και βαλτο 

 

KM SAYS 

  • Δικεφαλάκι 1
Link to comment
Share on other sites

4 hours ago, flavius said:

Το θεμα δεν ειναι αυτο. Το θεμα ειναι τι θα γινει οταν η κοινωνια συνειδητοποιησει οτι ο δυτικός κυριως κοσμος κρεμεται σε ενα απλο excel που εχει φτιαξει ενας intern της Ernst & Young.

Στο θεμα μας, υπαρχουν δημοισευμενοι οι τροποι με τoυς οποιους μπορεις να υπολογισεις πχ xGoals, ακομα και να φτιαξεις τα raw data απο την TV (ορεξη και αργομισθια να εχεις). Αμφιβάλλω αν πανω απο το 2% οσων ασχολουνται με ποδοσφαιρο μπορουν να καταλαβουν πληρως τη διαδικασία και αν πανω απο το 0.1% μπορει να κανει implementation αυτή τη διαδικασία για να παραξει κατι χειροπιαστό (πχ ενα πληρες μοντελο που θα σου κανει predict πρωταθλητη, η νικητη η οτιδηποτε). Θα εμπιστευτω πολυ περισσοτερο την transparent μεθοδο του @Yossarian , με το απλο αρχικο scriptακι σε python πχ που ξερεις τα limitations και πως θα τα φτιαξεις για να πας παρακατω παρα τις παπατζες που δημοσιευονται σε αθλητικα πορδοsite και που στην πραγματικοτητα δεν ξερεις απο πιο κωλο βγηκαν

Γενικα συμφωνώ. Απλα δεν νομιζω οτι υπαρχει κοινώς αποδεκτό και μάλιστα οχι δημοσιευμένο το μοντέλο για τα xgoals. Πχ στην opta, εως προσφατα δεν είχαν ως μεταβλητή στα xgoals, την θέση του  τερματοφυλακα αλλα μονο το που εκτελεί  ο επιτιθέμενος (πχ https://www.fantasyfootballscout.co.uk/2022/03/30/changes-to-optas-expected-goals-xg-stats-explained/). Θέλω να πω αυτο που λεμε xgoals, αλλάζει ανα εταιρία, ανα διάστημα και βασίζεται στο δικο τους μοντέλο, ειναι μια πρόβλεψη.

Μεχρι πριν κανενα χρόνο ειχα διαθέσιμα λόγω δουλειάς τα δεδομένα της opta για το ελληνικό πρωτάθλημα, αλλα πλεον οχι. Αν τύχει στο μέλλον και ξαναεχω, θα τα στείλω σε όποιον ενδιαφέρεται, γιατι βλέπω υπαρχει ενδιαφέρον. 

Link to comment
Share on other sites

Πριν πλακώσουν τα μεγάλα όπλα (Monte Carlo, etc), προλαβαίνω να βάλω μερικά πινακάκια που έφτιαξα πρόσφατα με το στήριγμα της δυτικής κοινωνίας... 🤣 Μην με παρεξηγήσετε, δικός σας είμαι, αλλά μέχρι εκεί αντέχω πλέον.

Λοιπόν το πρώτο πινακάκι έχει τα παιγνίδια της κανονικής περιόδου που έπαιξαν μεταξύ τους οι 6 ομάδες των playoff. Σε κάθε παιγνίδι έβαλα από εδώ τις στοιχηματικές αποδόσεις και τα αντίστοιχα ποσοστά νίκης γηπεδούχου, ισοπαλίας και νίκης φιλοξενούμενου που προκύπτουν από τις αποδόσεις:

image.jpeg.f8ce27133390df774f191068aa1475a4.jpeg

Από αυτά τα data έφτιαξα τρία πινακάκια που αφενός με βοηθά να αναλύσω τα δεδομένα με τη μέθοδο "Μόντε κοιτάζω" και αφετέρου υπολογίζω τους αναμενόμενους βαθμούς για κάθε ομάδα και αποτέλεσμα με βάση τις αποδόσεις.

image.jpeg.76a2bb6e04646aa2a69db4af9375bfdb.jpeg

Και ένας συγκεντρωτικός πίνακας που τα μαζεύει όλα μαζί και τα συγκρίνει με τα πραγματικά αποτελέσματα. Φαίνεται ότι η ΑΕΚ φέτος έχει σαφώς περισσότερους από τους αναμενόμενους βαθμούς ενώ αντίθετα ο γάβρος έχει σαφώς λιγότερους. Τι μπορεί να σημαίνει; Μπορεί απλώς να σημαίνει ότι οι άλγοριθμοι των στοιχηματικών την πατήσανε ή έχουνε bias από το παρελθόν... ή ότι πράγματι η ΑΕΚ (και η Λαμία) κάνει καλύτερη σεζόν από την αναμενόμενη... ή ότι δεν υπάρχει καμιά σχέση μεταξύ τους. 

image.jpeg.d6b522adcd348600881b07d3ad5afeb2.jpeg

ΥΓ Μπορεί να μου πει κάποιος πώς βάζουμε HTML σε τούτον τον editor για να μην βάζω screenshots? @Papatsakalos21πώς φτιάχνεις τα απίδια του basket??

  • Δικεφαλάκι 9
  • Μπομπίτσα 1
Link to comment
Share on other sites

Δημοσιευση σχετικη ειναι αυτή που λεει στην πραγματικοτητα πως φτιαχνεις τα δεδομενα (για να υπολογισεις μετα ό,τι θες) και δινει και free βάσεις δεδομενων για τα 5 τοπ ευρωπαικα

https://www.nature.com/articles/s41597-019-0247-7

Το βασικο ειναι να φτιαξεις καλα, καθαρα data. Μετά κάνεις παπαδες (δηαλδη τα αναλύεις οπως γουσταρεις, γι αυτό λεω οτι το scriptaki του @Yossarian ειναι μια καλή αρχή). Υπαρχουν και αλλα papers που αναφέρονται μέσα.

Για τα xGoals συγκεκριμενα υπάρχουν επίσης διαφορα, https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0282295, https://www.sciencedirect.com/science/article/pii/S2773186323000282, (συνεδριακό: http://rua.ua.es/dspace/bitstream/10045/68771/1/jhse_Vol_12_N_proc2_S514-S529.pdf)

 

Αλλα ναι γενικα, δεν ειναι γραμμενα σε πετρα. Εννοειται οτι ο καθενας μπορει να τα υπολιζει όπως θεωρεί καλύτερο.

 

@panos42Excel κι αγιος ο Θεος :D :D αλλα όντως τα screenshot δε βοηθανε. Εγω λεω οτι όποιος εχει χρονο και όρεξη να ασχοληθει, μονο καλο θα κανει, πρωτα στον εαυτό του και μετα στους υπολοιπυς. ακομα και λαθος να τα κανει που λεει ο λογος (δεν υπαρχουν λαθη)

 

 

  • Δικεφαλάκι 5
Link to comment
Share on other sites

Το ότι θα κατέβαζα άρθρα από το ΚΜ δεν το είχα φανταστεί. Thanks @flavius!

  • Δικεφαλάκι 1
Link to comment
Share on other sites

31 minutes ago, panos42 said:

Πριν πλακώσουν τα μεγάλα όπλα (Monte Carlo, etc), προλαβαίνω να βάλω μερικά πινακάκια που έφτιαξα πρόσφατα με το στήριγμα της δυτικής κοινωνίας... 🤣 Μην με παρεξηγήσετε, δικός σας είμαι, αλλά μέχρι εκεί αντέχω πλέον.

Λοιπόν το πρώτο πινακάκι έχει τα παιγνίδια της κανονικής περιόδου που έπαιξαν μεταξύ τους οι 6 ομάδες των playoff. Σε κάθε παιγνίδι έβαλα από εδώ τις στοιχηματικές αποδόσεις και τα αντίστοιχα ποσοστά νίκης γηπεδούχου, ισοπαλίας και νίκης φιλοξενούμενου που προκύπτουν από τις αποδόσεις:

image.jpeg.f8ce27133390df774f191068aa1475a4.jpeg

Από αυτά τα data έφτιαξα τρία πινακάκια που αφενός με βοηθά να αναλύσω τα δεδομένα με τη μέθοδο "Μόντε κοιτάζω" και αφετέρου υπολογίζω τους αναμενόμενους βαθμούς για κάθε ομάδα και αποτέλεσμα με βάση τις αποδόσεις.

image.jpeg.76a2bb6e04646aa2a69db4af9375bfdb.jpeg

Και ένας συγκεντρωτικός πίνακας που τα μαζεύει όλα μαζί και τα συγκρίνει με τα πραγματικά αποτελέσματα. Φαίνεται ότι η ΑΕΚ φέτος έχει σαφώς περισσότερους από τους αναμενόμενους βαθμούς ενώ αντίθετα ο γάβρος έχει σαφώς λιγότερους. Τι μπορεί να σημαίνει; Μπορεί απλώς να σημαίνει ότι οι άλγοριθμοι των στοιχηματικών την πατήσανε ή έχουνε bias από το παρελθόν... ή ότι πράγματι η ΑΕΚ (και η Λαμία) κάνει καλύτερη σεζόν από την αναμενόμενη... ή ότι δεν υπάρχει καμιά σχέση μεταξύ τους. 

image.jpeg.d6b522adcd348600881b07d3ad5afeb2.jpeg

ΥΓ Μπορεί να μου πει κάποιος πώς βάζουμε HTML σε τούτον τον editor για να μην βάζω screenshots? @Papatsakalos21πώς φτιάχνεις τα απίδια του basket??

Αγαπώ Εξελάκι, συνχαρητήρια για την δουλειά σου. Νομίζω μια ικανοποιήτικη εξήγηση για τα over και under perform είναι πως οι στοιχηματικές στοχεύουν στο μακροπρόθεσμο κέρδος. Αν έκανες το ίδιο πινακάκι με όλα τα ματς, δεν νομίζω να ξέφευγες πολύ.

  • Δικεφαλάκι 1
Link to comment
Share on other sites

Μιας και πιάσαμε αυτά, να πω εδώ ότι κάποια στιγμή θα ήθελα να κάνω ένα network visualization μέσω Gephi για όλα όσα γράφονται στο Τουίτερ στα βασικά hashtag της ΑΕΚ. Δυστυχώς δεν έχω καθόλου χρόνο αυτή την εποχή και επιπλέον θα πρέπει να διαβάσω για να το χρησιμοποιήσω. Ωστόσο πιστεύω ότι θα έχει ενδιαφέρον τόσο οπτικά όσο και στα αποτελέσματα που θα δώσει, πχ μπορεί να δούμε λογαριασμούς φαινομενικά άσχετους μεταξύ τους να συνδέονται για να χτυπήσουν την ΑΕΚ.

Αν κάποιος έχει ασχοληθεί, ας γράψει δύο κουβέντες.

  • Δικεφαλάκι 1
Link to comment
Share on other sites

1 hour ago, panos42 said:

μέθοδο "Μόντε κοιτάζω"

Αξίζει να αναβαθμιστεί σε ταγκ στο τοπικ αυτό νομίζω 😁

  • Hahaha 1
Link to comment
Share on other sites

1 hour ago, flavius said:

Δημοσιευση σχετικη ειναι αυτή που λεει στην πραγματικοτητα πως φτιαχνεις τα δεδομενα (για να υπολογισεις μετα ό,τι θες) και δινει και free βάσεις δεδομενων για τα 5 τοπ ευρωπαικα

https://www.nature.com/articles/s41597-019-0247-7

Το βασικο ειναι να φτιαξεις καλα, καθαρα data. Μετά κάνεις παπαδες (δηαλδη τα αναλύεις οπως γουσταρεις, γι αυτό λεω οτι το scriptaki του @Yossarian ειναι μια καλή αρχή). Υπαρχουν και αλλα papers που αναφέρονται μέσα.

Για τα xGoals συγκεκριμενα υπάρχουν επίσης διαφορα, https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0282295, https://www.sciencedirect.com/science/article/pii/S2773186323000282, (συνεδριακό: http://rua.ua.es/dspace/bitstream/10045/68771/1/jhse_Vol_12_N_proc2_S514-S529.pdf)

 

Αλλα ναι γενικα, δεν ειναι γραμμενα σε πετρα. Εννοειται οτι ο καθενας μπορει να τα υπολιζει όπως θεωρεί καλύτερο.

 

@panos42Excel κι αγιος ο Θεος :D :D αλλα όντως τα screenshot δε βοηθανε. Εγω λεω οτι όποιος εχει χρονο και όρεξη να ασχοληθει, μονο καλο θα κανει, πρωτα στον εαυτό του και μετα στους υπολοιπυς. ακομα και λαθος να τα κανει που λεει ο λογος (δεν υπαρχουν λαθη)

 

 

O θρύλος με αυτά τα πλοτ rathke βλεπω κανει γαμω τις δουλειες, μια αποσταση ειναι ολα σε αυτη τη ζωή. Εν γένει, σαφώς έχεις δίκιο οτι το εν αρχή είναι τα δεδομένα.

Yossarian, εισακούστηκες.

  • Δικεφαλάκι 1
Link to comment
Share on other sites

Μετά την τρομερή φυτιλιά που μου έβαλε ο @Yossarian, έκατσα και έκανα ένα απλό Monte Carlo. Παραθέτω τον κώδικα, αλλά το μοντέλο συνοπτικά:

Τρέχει εκατό χιλιάδες φορές το πρωτάθλημα, υποθέτωντας

  • Τα 3 σημεία είναι ισοπίθανα στα μάτς μεταξύ των διεκδηκτών.
  • Ενάντια στον Άρη οι διεκδικητές έχουν 65% νίκη - 25% Χ -10% ήττα (πηγή αριθμών: ο κώλος μου)
  • Ενάντια στην Λαμία οι διεκδικητές έχουν 80% - 15% - 5%
  • Η βαθμολογία είναι ως έχει σήμερα, εμείς -1, γαύρος -3, βάζελος -4

Όταν σκεφτώ πως να το κάνω, θα ήθελα να εισάγω μια διαφοροποίηση στο πρώτο bullet, βάση της διαφοράς xG στα ντέρμπυ που παρουσίασε ο Καίσαρης. Το implementation είναι έτοιμο, αλλά θέλουν λίγη σκέψη τα μαθηματικά εδώ.

Συμπέρασμα: Άμα πιάσουμε τους 77 βαθμούς, είμαστε καλά.

mc_v1.png

playoff_montecarlo.py

  • Δικεφαλάκι 2
  • Μπομπίτσα 2
Link to comment
Share on other sites

Εγώ απλά πέρασα να πω ότι σήμερα στο 365 γράφεται ότι ο Καλενς είναι μαζί με το Ρετσο τα 2 καλύτερα στόπερ σε μπιλν απ βάσει αριθμών. Συνεχιστε ότι κάνετε, γουστάρουμε 

  • Hahaha 1
Link to comment
Share on other sites

7 hours ago, flavius said:

Το θεμα δεν ειναι αυτο. Το θεμα ειναι τι θα γινει οταν η κοινωνια συνειδητοποιησει οτι ο δυτικός κυριως κοσμος κρεμεται σε ενα απλο excel που εχει φτιαξει ενας intern της Ernst & Young.

Στο θεμα μας, υπαρχουν δημοισευμενοι οι τροποι με τoυς οποιους μπορεις να υπολογισεις πχ xGoals, ακομα και να φτιαξεις τα raw data απο την TV (ορεξη και αργομισθια να εχεις). Αμφιβάλλω αν πανω απο το 2% οσων ασχολουνται με ποδοσφαιρο μπορουν να καταλαβουν πληρως τη διαδικασία και αν πανω απο το 0.1% μπορει να κανει implementation αυτή τη διαδικασία για να παραξει κατι χειροπιαστό (πχ ενα πληρες μοντελο που θα σου κανει predict πρωταθλητη, η νικητη η οτιδηποτε). Θα εμπιστευτω πολυ περισσοτερο την transparent μεθοδο του @Yossarian , με το απλο αρχικο scriptακι σε python πχ που ξερεις τα limitations και πως θα τα φτιαξεις για να πας παρακατω παρα τις παπατζες που δημοσιευονται σε αθλητικα πορδοsite και που στην πραγματικοτητα δεν ξερεις απο πιο κωλο βγηκαν

its all greek to me....

Link to comment
Share on other sites

Μόντε Κάρλο θυμάμαι να κάνω σε κάτι προσομοίωσεις LNA 15+ χρόνια πριν 😢

Είστε καϊλες, συνεχίστε!

Link to comment
Share on other sites

25 minutes ago, Atlas21 said:

θα ήθελα να εισάγω μια διαφοροποίηση στο πρώτο bullet

Xgoals σε συνδυασμό με τα ματς των τεσσάρων την τελευταία διετία; Ή/και xgoals των μεταξύ τους; Τα δύο τελευταία χρόνια αρκούν, αφού οι δύο πρώτοι έχουν και βαθμολογική αβάντα για να καθορίσουν την έκβαση αλλά και το πλεονέκτημα των ίδιων προπονητών. Το αυτό και με Άρη και Λαμία, και θα έβαζα και τυχόν ματς κυπέλλου για περισσότερα data.

Link to comment
Share on other sites

stat1819.jpg.578452883edd2ea6b2e902611eb6b6f3.jpg'

 

Τι μοντε καρλο διαβαζω? Ανταρκτικη ρε γατακια...

  • Sad 1
  • Hahaha 4
  • Μπομπίτσα 5
Link to comment
Share on other sites

Please sign in to comment

You will be able to leave a comment after signing in



Sign In Now
 Share

×