Jump to content

xΓνωμούλες - Στατιστικά, Κουμπιουτερς και Αριθμοί


Atlas21
 Share

Recommended Posts

9 minutes ago, Skepastos said:

Αν υπάρξει ενδιαφέρον αξίζει να κάνουμε μια προσπάθεια νομίζω…Να δούμε τα κόστη τουλάχιστον. Εκτός αν κάποιο από τα παιδιά γνωρίζει ήδη τι παίζει και μας διαφωτίσει 

Ναι, να το συζητήσουμε. Για τέτοια κόστη εγώ είμαι μέσα γενικά. Όπως έχετε καταλάβει τα κάνω ερασιτεχνικά, αλλά το να ασχολείται κανείς και να μαθαίνει είναι ωραίο, ιδιαίτερα όταν εμπεριέχει ΑΕΚ όλο αυτό. Θα είναι σίγουρα και μια επένδυση στο ίδιο το φορουμ αν γίνει και προσωπικά πιστεύω ότι αξίζει τον κόπο, άσχετα με το πόσο θα μπορώ να ασχοληθώ λόγω χρόνου. Πιστεύω ότι παιδιά που ασχολούνται περισσότερο ή/και επαγγελματικά, σίγουρα θα επωφεληθούν. Αξίζει.

  • Δικεφαλάκι 1
Link to comment
Share on other sites

1. Αν κάποιος θέλει όντως να κάνει xG, η statsbomb, που συμπληρώνει την τριάδα μαζι με opta και Wyscout, έχει πολύ πράγμα εδώ: https://github.com/statsbomb/open-data. Δυστυχώς δεν έχει ΑΕΚ...

2. Το Twitter είναι ένας βόθρος σε κάθε επίπεδο. Τεχνικό, κοινωνικό, ότι θες. Δεν ξέρω αν έχει ουσία σαν πρότζεκτ.

Όμως όσοι ενδιαφέρεστε μπορείτε να γράψετε scrapper στο χέρι και κάνετε stagger τα request. Δηλαδή, εφόσον υπάρχει όριο στα ποσά ποστ βλέπει κάποιος χωρίς συνδρομή, μπορείτε να παίρνετε όσα σας αφήνει κάθε μέρα μέχρι να συμπληρωθεί dataset.

Για τα λεπτά που έκανα πχ, έχω γράψει scrapper για το transfermarkt στο χέρι. Δεν ξέρω καν αν έχουν API. Τώρα δεν μπορώ να συγκρίνω μια ημι-στατικη σελίδα με τα τρία κιλά σπαγγέτι που είναι το Twitter αλλά εικάζω πως θα πρέπε να γίνεται.

Link to comment
Share on other sites

45 minutes ago, Yossarian said:

 Θα είναι σίγουρα και μια επένδυση στο ίδιο το φορουμ αν γίνει και προσωπικά πιστεύω ότι αξίζει τον κόπο, άσχετα με το πόσο θα μπορώ να ασχοληθώ λόγω χρόνου. Πιστεύω ότι παιδιά που ασχολούνται περισσότερο ή/και επαγγελματικά, σίγουρα θα επωφεληθούν. Αξίζει.

Τρέχουν κάποια άλλα του φόρουμ πιο επείγων αλλά όταν τελειώσουμε με αυτά  και υπάρχει συμμετοχή και ενδιαφέρων εδώ είμαστε να το δούμε και γιατί όχι να το κάνουμε και αυτό για την επόμενη σεζόν. 

  • Δικεφαλάκι 3
Link to comment
Share on other sites

4 hours ago, Skepastos said:

@firebirdνομιζω ότι στις πλατφόρμες αυτές μπορεις να δηλώσεις ότι είσαι independent scout πχ και να κανεις συνδρομή. Επίσης αν έχεις ένα σάιτ, η ένα μπλογκ μπορει να θεωρείσαι και «δημοσιγραφος». Δεν ξέρω τι ζητάνε σε δεύτερη φάση, αν δηλαδή απαιτούνται αποδείξεις για την επαγγελματική σου ενασχόληση αλλά θα άξιζε να το ψάξουμε εκτός και αν ήδη το ξερεις ότι δεν γίνεται 

Δεν νομίζω ότι ζητάνε κάτι περισσότερο. Το θέμα είναι ότι για να πληρώσεις πρέπει να δώσεις την κάρτα σου (άρα έχουν τα στοιχεία σου) και σε βάζουν να δηλώσεις ότι το θες για επαγγελματική χρήση. Δεν ξέρω ποιες είναι οι πιθανότητες να σε κυνηγήσουν, αλλά αν το κάνουν θα είσαι εσύ (ή έστω εμείς/το ΚΜ) απέναντι στο Wyscout, δλδ καλό κουράγιο απλά και μόνο από τα SLAPP.
Τα υπόλοιπα πλην Wyscout θέλουν να τους στείλεις mail ως site/εταιρεία και να συζητήσετε τι data θα σου δώσουν και σε ποια τιμή, οπότε δεν ξέρω καν για τι ποσό μιλάμε, πόσο μάλλον αν θα είναι διατεθειμένοι να τα δώσουν σε εμάς που απλά θέλουμε να κάνουμε την καβλάντα μας.

Link to comment
Share on other sites

1 hour ago, firebird said:

Δεν νομίζω ότι ζητάνε κάτι περισσότερο. Το θέμα είναι ότι για να πληρώσεις πρέπει να δώσεις την κάρτα σου (άρα έχουν τα στοιχεία σου) και σε βάζουν να δηλώσεις ότι το θες για επαγγελματική χρήση. Δεν ξέρω ποιες είναι οι πιθανότητες να σε κυνηγήσουν, αλλά αν το κάνουν θα είσαι εσύ (ή έστω εμείς/το ΚΜ) απέναντι στο Wyscout, δλδ καλό κουράγιο απλά και μόνο από τα SLAPP.
Τα υπόλοιπα πλην Wyscout θέλουν να τους στείλεις mail ως site/εταιρεία και να συζητήσετε τι data θα σου δώσουν και σε ποια τιμή, οπότε δεν ξέρω καν για τι ποσό μιλάμε, πόσο μάλλον αν θα είναι διατεθειμένοι να τα δώσουν σε εμάς που απλά θέλουμε να κάνουμε την καβλάντα μας.

Επειδή δεν το ξέρω, απλά αναρωτιέμαι τι διαφορά έχει ένα ειδησεογραφικό σάιτ πχ από ένα σάιτ - φόρουμ οπαδών. Ακόμα και έτσι να είναι θεωρώ ότι υπάρχουν λύσεις, φτιάχνεις ένα μπλογκ και το ονομάζεις ειδησεογραφικό όπου γράφουν χρήστες από εδώ και απλά γίνεται κοινοποίηση στο φόρουμ. Τελως πάντων νομίζω ότι είναι αρκετα «προχωρημένη» σκεψη, δεν ξέρω καν αν και πόσοι θα ενδιαφέρονταν και σίγουρα θα πρέπει να υπάρξει έγκριση από τα παιδιά που τρέχουν αυτό το χώρο. Εγώ το καταθέτω ως σκεψη και αν κάποια στιγμή πιστεύει κάποιος ότι γίνεται να υλοποιηθεί εγώ διατίθεμαι να βοηθήσω έστω και οικονομικά 

Link to comment
Share on other sites

Αν και ψοφαω για καλής ποιότητας δεδομένα, θεωρώ πως υπάρχουν πολλά που μπορούμε να κάνουμε χομπιστικα χωρίς αυτά. Αν του χρόνου υπάρχει τόσο ενδιαφέρον που δεν ζούμε χωρίς ακριβή χωροχρόνικα δεδομένα κάθε πασάς του Λαζάρου Ρότα, το συζητάμε.

Link to comment
Share on other sites

Είμαι χαοτικά μακρυά πλέον από το να καταλάβω έστω και το 20% της συζήτησης, όμως επειδή είδα κάτι για αγωγές παραπάνω, να πω ότι αν είναι να κάνουμε κάτι σαν φόρουμ (από συναλλακτικής και νομικής άποψης, δηλαδή στο όνομα μου), εγώ δεν είμαι κότα να σας πω ξεχαστε το. Αρκεί να κατανοήσω ακριβώς τι θέλετε να κάνουμε. Καλό κουράγιο με αυτό, μπλέξατε.

Αν μιλάμε όντως για SLAPP μη μασάτε, τους έχουμε 

  • Δικεφαλάκι 1
Link to comment
Share on other sites

Δεν έχει Ελλάδα φυσικά αλλά για όποιον ψήνεται να δει καλύτερα τι παίζει και να ασχοληθει μόνος του με ελεύθερα δεδομένα από statsbomb και wyscout παλαιοτερων  σεζόν προτείνω εδώ . Έχει επίσης πολύ και απλό έτοιμο κώδικα που μπορείς απλά να τον μοντάρεις πχ κατά τα γούστα σου . 
 

https://soccermatics.readthedocs.io/en/latest/gettingstarted.html

  • Δικεφαλάκι 1
Link to comment
Share on other sites

Ανεβάζω μια προσομοιώση των po που έκανα χθες με κώδικα, βασισμένος σε πράγματα που διάβασα εδώ και στο ίντερνετ γενικότερα.

Καταρχάς, έφτιαξα μια φόρμουλα που πρακτικά φτιάχνει αποδόσεις για ένα ματς. Για να προκύψουν οι αποδόσεις αυτές πρέπει να εκτιμήσεις τα xG κάθε ομάδας για το ματς και να κάνεις μια ψιλό πρόβλεψη. Για να υπολογίσω τα xGoals έδωσα βαρύτητα σε 3 πράγματα: 1) την εικόνα της ομάδας στην κανονική διάρκεια, 2) την εικόνα της ομάδας κόντρα στις ομάδες των πλει-οφ και 3) το αντίστοιχο ματς της κανονικής διάρκειας. (παραθέτω λινκ - ψιλό αναλύει την κατανομή poisson https://www.thepunterspage.com/poisson-distribution-betting/ )

Στη συνέχεια έτρεξα 1000 simulations Monte Carlo των πλει-οφ και πήρα τα παρακάτω αποτελέσματα:

image.png.c36cb55655aae9ed848090ce5a3497b7.png

image.png.73c2024d133c912e2fc3f1d643500053.png

 

Δεν μπορείς να πάρεις πολύ σοβαρά τα αποτελέσματα αλλά σου δίνει μια 1η εικόνα. Το μοντέλο προφανώς δεν μπορεί να προβλέψει την πιθανή κατάρευση του παοκ ή την απότομη άνοδο της ΑΕΚ καθώς η εικόνα του στην κανονική διάρκεια δεν μπορεί να το δικαιολογήσει καθαρά.

Το πιο σημαντικό νούμερο για μένα πάντως είναι ο μέσος όρος βαθμολογίας του πρωταθλητή που είναι 80 βαθμοί. Με λίγα λόγια με άλλους 18 βαθμούς μπορούμε να βγούμε πρώτοι , -3 με λαμία μας κάνει 15 βαθμούς σε διπλά παιχνίδια με τους άλλους 4. Εμένα αυτό μου δείχνει ότι πρέπει να υπερασπιστούμε την έδρα μας και τίποτα άλλο.

Μπορεί να τα ξαναδώ αυτά στο τέλος των po και να γελάμε αλλά ποτέ δεν ξέρεις.

Βάζω και τον κώδικα για όποιον ψυχάκια θέλει να τον κοιτάξει.

 

 

Program.cs

  • Δικεφαλάκι 2
  • Μπομπίτσα 3
Link to comment
Share on other sites

Εγώ δεν πιστεύω ότι μπορούν με simulations ανάδειξης πρωταθλητή αυτή τη στιγμή να βγουν συμπεράσματα τα οποία να έχουν αξία.

Το αποτέλεσμα μίας προσομοίωσης είναι τόσο καλό όσο οι παράμετροι που την ταΐζεις. Το στατιστικό δείγμα που έχουμε από παιχνίδια της ΑΕΚ φέτος είναι πολύ μικρό για να οδηγήσει σε ικανή παραμετροποίηση, αλλά επιπλέον η χρησιμότητα του στατιστικού δείγματος μικραίνει από τις ειδικές συνθήκες κάθε αγώνα (πχ τραυματισμοί παιχτών, τιμωρίες γηπέδων, περίοδοι φορμαρίσματος/ντεφοραμαρίστματος κλπ) και σίγουρα από τον τρόπο παιχνιδιού του κάθε αντιπάλου, οι οποίοι μπορεί και να έχουν αλλάξει όχι μόνο σημαντικούς παίχτες στο ρόστερ αλλά ακόμα και προπονητή σε σχέση με τις τελευταίες φορές που τους αντιμετωπίσαμε. Αυτά είτε θα τα παραμετροποιήσεις κατά περίπτωση, είτε θα τα προσεγγίσεις με κάποιον γενικό τρόπο που θα λαμβάνει υπόψη μέσους όρους. Όμως για την πρώτη περίπτωση δεν έχεις επαρκές εύρος δεδομένων και για την δεύτερη περίπτωση δεν έχεις τρόπο να ελέγξεις ποιες προσεγγίσεις έχουν αξία και ποιες όχι. Αναγκαστικά καταλήγεις σε μοντέλα τόσο αφαιρετικά και με τόσες πολλές προσεγγίσεις (οι οποίες μάλλον είναι και αυθαίρετες) ώστε το τελικό αποτέλεσμα είναι άνευ νοήματος στον πραγματικό κόσμο.

Δεν τα λέω αυτά απλά για να βγάλω μίρλα και αρνητικότητα, το λέω ειλικρινά ότι μου φτιάχνει τη διάθεση το μεράκι σε αυτό το τόπικ. Απλά θέλω να πω ότι ένα simulation για το ποιος θα σηκώσει πρωτάθλημα σε δέκα αγωνιστικές ίσως είναι υπερβολικά φιλόδοξο αυτή τη στιγμή ενώ άλλα, πολύ πιο περιορισμένα σενάρια ίσως έχουν λίγο περισσότερο νόημα (πχ το πόσοι βαθμοί απαιτούνται για να πάρει κάποιος πρωτάθλημα ή αναλύσεις ισοβαθμιών κλπ).

Link to comment
Share on other sites

10 hours ago, thodoris19 said:

Ανεβάζω μια προσομοιώση των po που έκανα χθες με κώδικα, βασισμένος σε πράγματα που διάβασα εδώ και στο ίντερνετ γενικότερα.

Καταρχάς, έφτιαξα μια φόρμουλα που πρακτικά φτιάχνει αποδόσεις για ένα ματς. Για να προκύψουν οι αποδόσεις αυτές πρέπει να εκτιμήσεις τα xG κάθε ομάδας για το ματς και να κάνεις μια ψιλό πρόβλεψη. Για να υπολογίσω τα xGoals έδωσα βαρύτητα σε 3 πράγματα: 1) την εικόνα της ομάδας στην κανονική διάρκεια, 2) την εικόνα της ομάδας κόντρα στις ομάδες των πλει-οφ και 3) το αντίστοιχο ματς της κανονικής διάρκειας. (παραθέτω λινκ - ψιλό αναλύει την κατανομή poisson https://www.thepunterspage.com/poisson-distribution-betting/ )

Στη συνέχεια έτρεξα 1000 simulations Monte Carlo των πλει-οφ και πήρα τα παρακάτω αποτελέσματα:

image.png.c36cb55655aae9ed848090ce5a3497b7.png

image.png.73c2024d133c912e2fc3f1d643500053.png

 

Δεν μπορείς να πάρεις πολύ σοβαρά τα αποτελέσματα αλλά σου δίνει μια 1η εικόνα. Το μοντέλο προφανώς δεν μπορεί να προβλέψει την πιθανή κατάρευση του παοκ ή την απότομη άνοδο της ΑΕΚ καθώς η εικόνα του στην κανονική διάρκεια δεν μπορεί να το δικαιολογήσει καθαρά.

Το πιο σημαντικό νούμερο για μένα πάντως είναι ο μέσος όρος βαθμολογίας του πρωταθλητή που είναι 80 βαθμοί. Με λίγα λόγια με άλλους 18 βαθμούς μπορούμε να βγούμε πρώτοι , -3 με λαμία μας κάνει 15 βαθμούς σε διπλά παιχνίδια με τους άλλους 4. Εμένα αυτό μου δείχνει ότι πρέπει να υπερασπιστούμε την έδρα μας και τίποτα άλλο.

Μπορεί να τα ξαναδώ αυτά στο τέλος των po και να γελάμε αλλά ποτέ δεν ξέρεις.

Βάζω και τον κώδικα για όποιον ψυχάκια θέλει να τον κοιτάξει.

 

 

Program.cs 12.19 kB · 1 download

Αυτό ακριβώς έκανε και το 538 πέρσυ. Ωραία δουλειά.

  • Δικεφαλάκι 1
Link to comment
Share on other sites

5 minutes ago, Evolve said:

Εγώ δεν πιστεύω ότι μπορούν με simulations ανάδειξης πρωταθλητή αυτή τη στιγμή να βγουν συμπεράσματα τα οποία να έχουν αξία.

Το αποτέλεσμα μίας προσομοίωσης είναι τόσο καλό όσο οι παράμετροι που την ταΐζεις. Το στατιστικό δείγμα που έχουμε από παιχνίδια της ΑΕΚ φέτος είναι πολύ μικρό για να οδηγήσει σε ικανή παραμετροποίηση, αλλά επιπλέον η χρησιμότητα του στατιστικού δείγματος μικραίνει από τις ειδικές συνθήκες κάθε αγώνα (πχ τραυματισμοί παιχτών, τιμωρίες γηπέδων, περίοδοι φορμαρίσματος/ντεφοραμαρίστματος κλπ) και σίγουρα από τον τρόπο παιχνιδιού του κάθε αντιπάλου, οι οποίοι μπορεί και να έχουν αλλάξει όχι μόνο σημαντικούς παίχτες στο ρόστερ αλλά ακόμα και προπονητή σε σχέση με τις τελευταίες φορές που τους αντιμετωπίσαμε. Αυτά είτε θα τα παραμετροποιήσεις κατά περίπτωση, είτε θα τα προσεγγίσεις με κάποιον γενικό τρόπο που θα λαμβάνει υπόψη μέσους όρους. Όμως για την πρώτη περίπτωση δεν έχεις επαρκές εύρος δεδομένων και για την δεύτερη περίπτωση δεν έχεις τρόπο να ελέγξεις ποιες προσεγγίσεις έχουν αξία και ποιες όχι. Αναγκαστικά καταλήγεις σε μοντέλα τόσο αφαιρετικά και με τόσες πολλές προσεγγίσεις (οι οποίες μάλλον είναι και αυθαίρετες) ώστε το τελικό αποτέλεσμα είναι άνευ νοήματος στον πραγματικό κόσμο.

Δεν τα λέω αυτά απλά για να βγάλω μίρλα και αρνητικότητα, το λέω ειλικρινά ότι μου φτιάχνει τη διάθεση το μεράκι σε αυτό το τόπικ. Απλά θέλω να πω ότι ένα simulation για το ποιος θα σηκώσει πρωτάθλημα σε δέκα αγωνιστικές ίσως είναι υπερβολικά φιλόδοξο αυτή τη στιγμή ενώ άλλα, πολύ πιο περιορισμένα σενάρια ίσως έχουν λίγο περισσότερο νόημα (πχ το πόσοι βαθμοί απαιτούνται για να πάρει κάποιος πρωτάθλημα ή αναλύσεις ισοβαθμιών κλπ).

Μα γι'αυτό είναι και το πιο ωραίο σπορ, γιατί δεν μπορούμε να να το προβλέψουμε. Αν μπορούσαμε, δεν θα το βλεπαμε.

Εξάλλου νομίζω θυμόμαστε όλοι πέρσυ πως το μοντέλο του 538 με κάθε μικρή αλλαγή στην βαθμολογία άλλαζε τελείως, επειδή θεωρούσε τις ομάδες λίγο πολύ ισοδύναμες.

Προφανώς, GIGO. Γι'αυτό και τουλαχιστον εγώ έχω βάλει priors μόνο στην Λαμία και τον Αρη. Εμένα το αποτέλεσμα που με ενδιέφερε και βγήκε σε γενικές γραμμές είναι το πόσοι βαθμοί χρειάζονται.

  • Δικεφαλάκι 1
Link to comment
Share on other sites

20 minutes ago, Evolve said:

Εγώ δεν πιστεύω ότι μπορούν με simulations ανάδειξης πρωταθλητή αυτή τη στιγμή να βγουν συμπεράσματα τα οποία να έχουν αξία.

Το αποτέλεσμα μίας προσομοίωσης είναι τόσο καλό όσο οι παράμετροι που την ταΐζεις. Το στατιστικό δείγμα που έχουμε από παιχνίδια της ΑΕΚ φέτος είναι πολύ μικρό για να οδηγήσει σε ικανή παραμετροποίηση, αλλά επιπλέον η χρησιμότητα του στατιστικού δείγματος μικραίνει από τις ειδικές συνθήκες κάθε αγώνα (πχ τραυματισμοί παιχτών, τιμωρίες γηπέδων, περίοδοι φορμαρίσματος/ντεφοραμαρίστματος κλπ) και σίγουρα από τον τρόπο παιχνιδιού του κάθε αντιπάλου, οι οποίοι μπορεί και να έχουν αλλάξει όχι μόνο σημαντικούς παίχτες στο ρόστερ αλλά ακόμα και προπονητή σε σχέση με τις τελευταίες φορές που τους αντιμετωπίσαμε. Αυτά είτε θα τα παραμετροποιήσεις κατά περίπτωση, είτε θα τα προσεγγίσεις με κάποιον γενικό τρόπο που θα λαμβάνει υπόψη μέσους όρους. Όμως για την πρώτη περίπτωση δεν έχεις επαρκές εύρος δεδομένων και για την δεύτερη περίπτωση δεν έχεις τρόπο να ελέγξεις ποιες προσεγγίσεις έχουν αξία και ποιες όχι. Αναγκαστικά καταλήγεις σε μοντέλα τόσο αφαιρετικά και με τόσες πολλές προσεγγίσεις (οι οποίες μάλλον είναι και αυθαίρετες) ώστε το τελικό αποτέλεσμα είναι άνευ νοήματος στον πραγματικό κόσμο.

Δεν τα λέω αυτά απλά για να βγάλω μίρλα και αρνητικότητα, το λέω ειλικρινά ότι μου φτιάχνει τη διάθεση το μεράκι σε αυτό το τόπικ. Απλά θέλω να πω ότι ένα simulation για το ποιος θα σηκώσει πρωτάθλημα σε δέκα αγωνιστικές ίσως είναι υπερβολικά φιλόδοξο αυτή τη στιγμή ενώ άλλα, πολύ πιο περιορισμένα σενάρια ίσως έχουν λίγο περισσότερο νόημα (πχ το πόσοι βαθμοί απαιτούνται για να πάρει κάποιος πρωτάθλημα ή αναλύσεις ισοβαθμιών κλπ).

Συμφωνώ σε αυτό που λες γι'αυτό και εγώ λεω μια 1η εικόνα και τίποτα παραπάνω. Απλά δεν μπορείς να βάλεις σαν παράμετρο ότι θα τα γαμήσει όλα η ΑΕΚ ή θα βαρεσει κανόνι ο γαύρος, οπότε δουλεύεις με ότι έχεις (την κανονική διάρκεια του πρωταθλήματος).

  • Δικεφαλάκι 1
Link to comment
Share on other sites

Αποτελεσματικότητα εκτέλεσης: Σύγκριση 900 ομάδων

Το CIES Football Observatory κατατάσσει ομάδες από 54 πρωταθλήματα σε όλο τον κόσμο σύμφωνα με την αποτελεσματικότητα με βάση τρεις μεταβλητές από την Wyscout: τα xGoals (χωρίς όμως να συμπεριλαμβάνονται τα πέναλτι), τον αριθμό των σουτ στο στόχο και τον αριθμό των συνολικών σουτ.
Με 0,69 περισσότερα γκολ από τα αναμενόμενα ανά παιχνίδι, ο παοκ έχει τον μεγαλύτερο θετικό συντελέστη απο τις 900 ομάδες. Η Sporting Λισαβόνας (+0,59), η Roma (+0,52), η Jagiellonia Bialystok (+0,51) και η Sion (+0,49) ακολουθούν. 
Όσον αφορά τα αρνητικά, με 0,63 λιγότερα γκολ από τα αναμενόμενα ανά παιχνίδι, η Melbourne City βρίσκεται στην κορυφή της λίστας, μπροστά από τέσσερις ιδιαίτερα αναποτελεσματικές ομάδες: OGC Nice (-0,56), Olympique Lyonnais (-0,49), Rayo Vallecano (-0,48) και Montpellier (-0,47). 

Πηγή: https://football-observatory.com/WeeklyPost455

Η κατάταξη των ελληνικών ομάδων:

image.png.5a58d8137e049ffd6097b3b70a37e69b.png

Πράγματι αποτελεσματικότερος ή απλώς πιο κωλόφαρδος μέχρι τώρα???

  • Δικεφαλάκι 6
Link to comment
Share on other sites

Εμείς πάντως ανεβήκαμε πολύ εδώ . Πέρσι τα γκολ μας ήταν λιγότερα από τα expected αν θυμάμαι καλά. Σίγουρα βοήθησε πολύ από όταν άρχισε να παστελωνει ο Πόνσε. Καλό θα ήταν να είχε και αντίστοιχο δείκτη  μόνο για τα παιχνίδια του top 5.

Link to comment
Share on other sites

Μπραβο @thodoris19, πολυ καλη προσπάθεια. (γιατι c# ? )

Ακολουθει σεντονι.

Σε σχεση με την κριτικη που έκανε ο @thodoris19 στο μοντελο του και ο @Evolve γενικότερα. Θεωρω οτι προσεκτικά επιλεγμενα δεδομενα σε συνδυασμο με κατάλληλα κατασκευασμενο μοντελο μπορουν να σου δώσουν παρα πολυ μεγάλη ακριβεια.

Και επειδη αυτο που εγραψα θα μπορουσε να το ειχε γραψει και ο καρπετοπουλος, το κάνω πιο συγκεκριμένο:

1. Προσεκτικα επιλεγμενα δεδομενα. Τι ερώτησεις μπορει να κάνει κάποιος στον εαυτό του για να διαλεξει μια-δυο πιθανες προσεγγισεις, να τις "τρεξει" και να δει τι βγαίνει απο το καπελο του Μοντε Καρλο: Χρειαζομαστε δεδομενα για όλη τη διαρκεια της κανονικης περιόδου ή μονο για τα παιχνδίδια μεταξύ των 6 ομαδων των playoff? αν είναι λίγα με πιο τροπο μπορουμε να εμπλουτισουμε τα δεδομενα; Μηπως να χρησιμοποιησουμε και δεδομενα απο τους παικτες για να εκτιμήσουμε καλύτερα το συντελεστη της κατανομης Poisson? πχ αν παιξει ο γκαρσια, το σκοραρισμα και η δημιουργία ευκαιριων αυξανονται με ενα συντελεστη πχ 1.1 και 1.3 αντιστοιχα, τα οποια υπολογιζονται απο τα ματς που επαιξει ο γκαρσια και τις ευκαιριες και τα γκολ που δημιουργησε η ομαδα οταν επαιξε. Οταν επαιζε ο πινεδα η ομαδα ειχε 1.5 περισσοτερες ολοκληρωμενες πάσες σε σχεση με όταν ηταν εξω. Οταν παιζει ο μουκουντι η ομαδα δεχεται 1.05 γκολ λιγοτερα. Ελπιζω να γινομαι κατανοητος και επισης ποσο δυσκολο ειναι να καταληξεις στο τι ειναι καλυτερο. Εγω παντως, σε μια αρχικη προσεγγιση, θα εβαζα μεσα τους παικτες και το πως επηρεαζουν την επιθετικη και αμυντικη λειτουργια της ομαδας αντι για τα αποτελεσματα και τα xGoals, χωρις να σημαινει οτι θα ηταν η σωστη προσεγγιση.

 

2. Καταλληλα κατασκευασμενο μοντελο. Τι σημαινει πρακτικα αυτό; πχ. μπορει το μοντελο να ανανεωνεται καθως πραγματοποιει τις προσομειωσεις? ,δηλαδη να αλλαζει μονο του δυναμικα τον συντελεστη της κατανομης αναλογα με το αποτελεσμα; Με αυτόν τον τροπο η εξομοιωση νικης ή πολλων γκολ αλλαζει τον συντελεστη, οπως θα γινοταν με πραγματικα δεδομενα, και ταυτοχρονα ριχνει τους συντελεστες της αντιπαλης ομαδας. Υπάρχει εξομοιωση τραυματισμων παιχτων που ειναι key για την ομαδα (παλι με Poisson Μπορει να γινει αυτό); λαμβανει υποψη του το μοντελο την επιδραση των αλλαγων σε ενα ματς; Παλι το point εδω ειναι ότι μπορεις να το εξαντλησεις και να μην εισαι ικανοποιημενος.

Όπως εγραψα σε προηγουμενο ποστ, οποιος έχει πραγματικα όρεξη και χρονο, μπορει να κανει παπαδες αν με καποιο τροπο έχει προσβαση σε raw data.

 

  • Δικεφαλάκι 5
Link to comment
Share on other sites

7 hours ago, flavius said:

Μπραβο @thodoris19, πολυ καλη προσπάθεια. (γιατι c# ? )

Ακολουθει σεντονι.

Σε σχεση με την κριτικη που έκανε ο @thodoris19 στο μοντελο του και ο @Evolve γενικότερα. Θεωρω οτι προσεκτικά επιλεγμενα δεδομενα σε συνδυασμο με κατάλληλα κατασκευασμενο μοντελο μπορουν να σου δώσουν παρα πολυ μεγάλη ακριβεια.

Και επειδη αυτο που εγραψα θα μπορουσε να το ειχε γραψει και ο καρπετοπουλος, το κάνω πιο συγκεκριμένο:

1. Προσεκτικα επιλεγμενα δεδομενα. Τι ερώτησεις μπορει να κάνει κάποιος στον εαυτό του για να διαλεξει μια-δυο πιθανες προσεγγισεις, να τις "τρεξει" και να δει τι βγαίνει απο το καπελο του Μοντε Καρλο: Χρειαζομαστε δεδομενα για όλη τη διαρκεια της κανονικης περιόδου ή μονο για τα παιχνδίδια μεταξύ των 6 ομαδων των playoff? αν είναι λίγα με πιο τροπο μπορουμε να εμπλουτισουμε τα δεδομενα; Μηπως να χρησιμοποιησουμε και δεδομενα απο τους παικτες για να εκτιμήσουμε καλύτερα το συντελεστη της κατανομης Poisson? πχ αν παιξει ο γκαρσια, το σκοραρισμα και η δημιουργία ευκαιριων αυξανονται με ενα συντελεστη πχ 1.1 και 1.3 αντιστοιχα, τα οποια υπολογιζονται απο τα ματς που επαιξει ο γκαρσια και τις ευκαιριες και τα γκολ που δημιουργησε η ομαδα οταν επαιξε. Οταν επαιζε ο πινεδα η ομαδα ειχε 1.5 περισσοτερες ολοκληρωμενες πάσες σε σχεση με όταν ηταν εξω. Οταν παιζει ο μουκουντι η ομαδα δεχεται 1.05 γκολ λιγοτερα. Ελπιζω να γινομαι κατανοητος και επισης ποσο δυσκολο ειναι να καταληξεις στο τι ειναι καλυτερο. Εγω παντως, σε μια αρχικη προσεγγιση, θα εβαζα μεσα τους παικτες και το πως επηρεαζουν την επιθετικη και αμυντικη λειτουργια της ομαδας αντι για τα αποτελεσματα και τα xGoals, χωρις να σημαινει οτι θα ηταν η σωστη προσεγγιση.

 

2. Καταλληλα κατασκευασμενο μοντελο. Τι σημαινει πρακτικα αυτό; πχ. μπορει το μοντελο να ανανεωνεται καθως πραγματοποιει τις προσομειωσεις? ,δηλαδη να αλλαζει μονο του δυναμικα τον συντελεστη της κατανομης αναλογα με το αποτελεσμα; Με αυτόν τον τροπο η εξομοιωση νικης ή πολλων γκολ αλλαζει τον συντελεστη, οπως θα γινοταν με πραγματικα δεδομενα, και ταυτοχρονα ριχνει τους συντελεστες της αντιπαλης ομαδας. Υπάρχει εξομοιωση τραυματισμων παιχτων που ειναι key για την ομαδα (παλι με Poisson Μπορει να γινει αυτό); λαμβανει υποψη του το μοντελο την επιδραση των αλλαγων σε ενα ματς; Παλι το point εδω ειναι ότι μπορεις να το εξαντλησεις και να μην εισαι ικανοποιημενος.

Όπως εγραψα σε προηγουμενο ποστ, οποιος έχει πραγματικα όρεξη και χρονο, μπορει να κανει παπαδες αν με καποιο τροπο έχει προσβαση σε raw data.

 

ARXEIDIA

  • Sad 1
  • Hahaha 1
Link to comment
Share on other sites

9 hours ago, flavius said:

Μπραβο @thodoris19, πολυ καλη προσπάθεια. (γιατι c# ? )

Ακολουθει σεντονι.

Σε σχεση με την κριτικη που έκανε ο @thodoris19 στο μοντελο του και ο @Evolve γενικότερα. Θεωρω οτι προσεκτικά επιλεγμενα δεδομενα σε συνδυασμο με κατάλληλα κατασκευασμενο μοντελο μπορουν να σου δώσουν παρα πολυ μεγάλη ακριβεια.

Και επειδη αυτο που εγραψα θα μπορουσε να το ειχε γραψει και ο καρπετοπουλος, το κάνω πιο συγκεκριμένο:

1. Προσεκτικα επιλεγμενα δεδομενα. Τι ερώτησεις μπορει να κάνει κάποιος στον εαυτό του για να διαλεξει μια-δυο πιθανες προσεγγισεις, να τις "τρεξει" και να δει τι βγαίνει απο το καπελο του Μοντε Καρλο: Χρειαζομαστε δεδομενα για όλη τη διαρκεια της κανονικης περιόδου ή μονο για τα παιχνδίδια μεταξύ των 6 ομαδων των playoff? αν είναι λίγα με πιο τροπο μπορουμε να εμπλουτισουμε τα δεδομενα; Μηπως να χρησιμοποιησουμε και δεδομενα απο τους παικτες για να εκτιμήσουμε καλύτερα το συντελεστη της κατανομης Poisson? πχ αν παιξει ο γκαρσια, το σκοραρισμα και η δημιουργία ευκαιριων αυξανονται με ενα συντελεστη πχ 1.1 και 1.3 αντιστοιχα, τα οποια υπολογιζονται απο τα ματς που επαιξει ο γκαρσια και τις ευκαιριες και τα γκολ που δημιουργησε η ομαδα οταν επαιξε. Οταν επαιζε ο πινεδα η ομαδα ειχε 1.5 περισσοτερες ολοκληρωμενες πάσες σε σχεση με όταν ηταν εξω. Οταν παιζει ο μουκουντι η ομαδα δεχεται 1.05 γκολ λιγοτερα. Ελπιζω να γινομαι κατανοητος και επισης ποσο δυσκολο ειναι να καταληξεις στο τι ειναι καλυτερο. Εγω παντως, σε μια αρχικη προσεγγιση, θα εβαζα μεσα τους παικτες και το πως επηρεαζουν την επιθετικη και αμυντικη λειτουργια της ομαδας αντι για τα αποτελεσματα και τα xGoals, χωρις να σημαινει οτι θα ηταν η σωστη προσεγγιση.

 

2. Καταλληλα κατασκευασμενο μοντελο. Τι σημαινει πρακτικα αυτό; πχ. μπορει το μοντελο να ανανεωνεται καθως πραγματοποιει τις προσομειωσεις? ,δηλαδη να αλλαζει μονο του δυναμικα τον συντελεστη της κατανομης αναλογα με το αποτελεσμα; Με αυτόν τον τροπο η εξομοιωση νικης ή πολλων γκολ αλλαζει τον συντελεστη, οπως θα γινοταν με πραγματικα δεδομενα, και ταυτοχρονα ριχνει τους συντελεστες της αντιπαλης ομαδας. Υπάρχει εξομοιωση τραυματισμων παιχτων που ειναι key για την ομαδα (παλι με Poisson Μπορει να γινει αυτό); λαμβανει υποψη του το μοντελο την επιδραση των αλλαγων σε ενα ματς; Παλι το point εδω ειναι ότι μπορεις να το εξαντλησεις και να μην εισαι ικανοποιημενος.

Όπως εγραψα σε προηγουμενο ποστ, οποιος έχει πραγματικα όρεξη και χρονο, μπορει να κανει παπαδες αν με καποιο τροπο έχει προσβαση σε raw data.

 

I beg to differ. Τέτοια μοντέλα είναι πρακτικά αδύνατο να έχουν ακρίβεια γιατί είναι πάρα πάρα πάρα πολλές οι μεταβλητές. Δεν έχει σημασία αν θα κάνεις σωστή χρήση αυτών που βλέπεις γιατί είναι τόσα αυτά που δεν ξέρεις που δεν έχει νόημα. Για παράδειγμα και χωρίς πολλή σκέψη:

  1. Προπονήσεις: Αν αύριο ο Πελάδο αποφασίσει να ρίξει την ένταση στην προπόνηση, πόσο κάτι τέτοιο θα επηρεάσει την πιθανότητα τραυματισμών; Πόσο θα επηρεάσει την ένταση που βγάζει η ομάδα στους αγώνες; Πόσο θα επηρεάσει την φυσική της κατάσταση και άρα την διάρκειά της στον αγώνα;
  2. Τακτικές: Πόσο δουλεμένη είναι η τακτική που θα επιλεγεί; Πώς θα αλλάξει στην διάρκεια του αγώνα με βάση την προσαρμογή του αντιπάλου; Πως θα αλλάξει σε κάποιον πιθανό τραυματισμό; Πως θα αλλάξει με βάση την διακύμανση του σκορ;
  3. Ψυχολογία: Πόσο επηρεάζει το ότι έχουμε 9 αγώνες να απομένουν και δεν είμαστε στην κανονική διάρκεια την αντίδραση σε μια μεγάλη νίκη/ήττα; Πόσο επηρεάζουν σε αυτό οι άνθρωποι της ομάδας; Πόσο το ότι ο επόμενος αγώνας είναι 3 μέρες μετά όχι 1 βδομάδα;
  4. Ελλαδάρα: Πως μπορείς να υπολογίσεις "μεθυσμένους Πολωνούς" και το effect που θα έχουν; Σε πόσους αγώνες;

Κι αν για την ΑΕΚ έχεις ίσως λίγο μια αίσθηση ή μπορείς να μάθεις παραπάνω, θα πρέπει να τα κάνεις και για τους άλλους 3.

Σε γενικές γραμμές, νομίζω ότι τα data ήδη παιγμένων αγώνων μπορούν να σου "αποκαλύψουν" πράγματα που δεν παρατήρησες και να σε βοηθήσουν να βγάλεις συμπεράσματα. Τα ίδια data όταν μιλάμε για μελλοντικούς αγώνες, νομίζω ότι είναι λιγότερο χρήσιμα από το eye test.

  • Δικεφαλάκι 2
Link to comment
Share on other sites

Συμφωνώ με τον χρήστη φλογόπουλο, είναι τεράστια η πολυπλοκότητα του συστήματος και χρειάζεσαι πολύ περισσότερα δεδομένα από όσα έχεις για να την προσομοιώσεις. Και να προσθέσω ότι όταν εγώ έκανα λόγο για έλλειψη επαρκών δεδομένων δεν εννοούσα ότι πχ δεν έχουμε πρόσβαση στην opta. Εννοούσα ότι ούτε η opta έχει επαρκή δεδομένα, γιατί απλά η ομάδα δεν έχει παίξει αρκετά παιχνίδια σε σταθερές συνθήκες για να έχεις επαρκές στατιστικό δείγμα.

Πχ φέτος έως τώρα έχουμε παίξει με τον βάζελο ΔΥΟ ματς. Στο ένα είχανε προπονητή Γιοβάνοβιτς και αμύνονταν με Μπρινιόλι-Σένκεφελντ-Μάγκνουσον και στο άλλο είχανε Τερίμ και αμύνονταν με Λοντίγκιν-Αράο-Γεντβάι. ΟΚ, και πάλι μπορείς να βγάλεις χρήσιμα συμπεράσματα όπως λέει και ο σύντροφος ιρλανδόφιλος Άτλαντας, αλλά να στήσεις με τόσο λίγα Inputs ολόκληρο simulation για το ποιος θα το σηκώσει στο τέλος μου φαίνεται εξαιρετικά δύσκολο.

  • Δικεφαλάκι 3
Link to comment
Share on other sites

Στο ποδόσφαιρο υπάρχουν αγώνες που κρίνονται κόντρα στη ροή και κόντρα σε όσα έλεγαν όλες οι πληροφορίες, όλα τα ακατέργαστα δεδομένα του κόσμου. Αυτά μπορούν να σου προβλέψουν μέχρι και το μονότερμα. Από εκεί και πέρα, έχουμε δει τόσες φορές ματς που ήταν για 4-0 να γίνεται 0-1 στο 86'.

Βέβαια, αν η πρόβλεψη αφορά πολλά ματς (μια λίγκα πχ) τότε η πρόβλεψη για αυτόν που θα μαζέψει περισσότερους βαθμούς γενικά και αόριστα, μάλλον έχει μια ισχυρή βάση

 

Link to comment
Share on other sites

Κοιταξτε, παλιοτερα, με πολυ απλα δεδομενα, ειχα τρεξει 1εκ εξομοιωσεις αποτελσματος ενος αγωνα. εννοειτε οτι το πραγματικο αποτελεσμα του αγωνα είχε βγει στην εξομοιωση με χαμηλη πιθανοτητα (ηταν 6-1 νομιζω, κατι τετοιο). οποτε, το αποτελσμα μεσω εξομοιωσης, θα το δειτε να βγαινει, το προβηλμα ειναι το confidence και αυτό ειναι που όλοι προσπαθουν να φτιαξουν με τη χρηση ολο και περισσοτερο πιο "καθαρων" δεδομενων. Ειναι το αντιστοιχο που υπαρχει και σε AI μοντελα. Ενα σουπερ μοντελο ειναι τοσο καλο οσο τα δεδομενα του.

Μπορεις δηλαδη αν εχεις πραγματικα @@ να φτιαξεις δυο (και παραπανω) παραλληλα μοντελα.  Ενα να σου δινει το σκορ και ενα αλλο να σου δινει, τελικες, πασες ο,τι γουσταρεις γενικα οτι εσυ θεωρεις οτι σε κανει να καταλαβεις τη ροη του αγωνα και να σου βγαζει ενα conditional probability. Οποτε το αποτέλεσμα κοντρα στη ροη, θα το παρεις και αυτο ως μια πιθανοτητα.

Γενικα ρε σεις, οπως εχω γραψει πολλακις, δωστε τα δεδομενα και τα γυριζεις οπως θες. Θα βγαλουμε οτι η ΑΕΚ επρεπε να ειχε κερδισει το πρωταθλημα τη χρονια της πεσαδας.

Link to comment
Share on other sites

Τα κάνουν οι στοιχηματικες αυτά και στα σερβίρουν ως απόδοση σκορ, κατάκτησης κλπ. Για μένα το ζουμί των analytics ειναι στις μετρικες στο γηπεδο , στο scouting, στους χώρους κλπ. 

Link to comment
Share on other sites

"Η εβδομαδιαία ανάρτηση του Παρατηρητηρίου Ποδοσφαίρου CIES παρουσιάζει τους δέκα παίκτες με την υψηλότερη εκτιμώμενη μεταγραφική αξία σε 66 πρωταθλήματα παγκοσμίως (εκτός των Big-5). Η κατάταξη καταρτίστηκε βάσει ενός στατιστικού μοντέλου ιδιοκτησιακής ανάλυσης, το οποίο εξηγεί πάνω από το 80% των διαφορών στις τιμές που παρατηρήθηκαν για περίπου 6.200 μεταγραφές που πραγματοποιήθηκαν την τελευταία δεκαετία. Ένα επιστημονικό άρθρο που αναφέρεται μόνο στις μεταγραφές προς τους συλλόγους των Big-5 πρωταθλημάτων είναι διαθέσιμο σε ανοικτή πρόσβαση εδώ."
-- Πηγή

Η κατάταξη για το ελληνικό πρωτάθλημα είναι:

image.jpeg.0766cdf04faa86c8b2349a4ee5a43984.jpeg

Πού είναι ο Λιβάι??

Link to comment
Share on other sites

Please sign in to comment

You will be able to leave a comment after signing in



Sign In Now
 Share

×