quote:
Op donderdag 26 november 2020 15:48 schreef Generationalpha het volgende:[..]
Dat jij het verkeerde interpretaties vindt betekent niet dat het ook verkeerde interpretaties zijn. Ik heb al vaker genoeg nuances aangebracht in het verhaal (XG plots etc.) maar jij lijkt gewoon pertinent tegen die data te zijn.
Graag hoor ik bij deze van jou wat je koppig vindt of welke uitleg of nuances je mist.
Simpel gezegd maak je de fout om gebruik te maken van één case ( in dit geval wedstrijd) om conclusies te trekken over toekomstige cases. De dynamiek achter een voetbalwedstrijd en het ontstaan van xG maakt het echter op een enkele case een zeer onbetrouwbare statistiek. Je geeft het zelf wel aan maar iedere wedstrijd gebeuren er genoeg dingen die schommelingen veroorzaken in de score (rebounds, blocked shots en penalties bijvoorbeeld). Wat ik wil zeggen: speel je 50 simulaties van hetzelfde duel onder dezelfde omstandigheden, dan krijg je iedere keer een ander xG, waarop vermoedelijk gezien kan worden dat er een flink hoge standaardafwijking is bij de xG van een individuele ploeg in een bepaalde wedstrijd. Deze exacte statistieken kunnen we onmogelijk bepalen maar bij het opstellen van een individuele xG over twee teams in wedstrijden is er een ontzettend hoge betrouwbaarheidsinterval. Dat betekent dat een verschil tussen twee ploegen zeer groot moet zijn om van een significant verschil te spreken op basis van xG in één individuele wedstrijd.
Echter, doordat dit verschil zo groot moet zijn is dit in vrijwel alle situaties, wanneer het verschil significant is, het met het blote oog ook op te merken. Als wij allemaal het duel gezien hebben is het dus simpelweg irrelevant om de xG nog te noemen, en het is dan interessanter om conclusies te trekken waarom we dan bijvoorbeeld met een veel lagere xG hebben gewonnen of met een veel hogere xG hebben verloren dan andersom denken (we hebben verloren, maar onze xG was hoger, dus het lag niet aan ons). Vervolgens zegt deze xG weinig over toekomstige wedstrijden omdat die onder geheel andere omstandigheden gespeeld worden waardoor zelfs die relevantie vervalt. Als individuele statistiek is het echt compleet onbetrouwbaar.
Over de langere termijn kan xG wel relevant zijn, met name om te kijken of je over de langere termijn onder - of overpresteert op basis van gemaakte doelpunten en doelpunten tegen. Een statistiek wordt namelijk een stuk betrouwbaarder als je over een langere periode bekijkt.
Dit bovenstaande is wel met de voorwaarde dat xG valide is opgesteld (waar ik ook mijn vraagtekens over heb), maar ik denk niet dat er een betere manier is om het objectief te meten dus voor een globale dataset over veel wedstrijden is het wel ok.
Dit is enkel nog een uitleg waarom xG een onbetrouwbare statistiek is over een individueel duel, waarom xG niet valide is kan ik ook nog een uitleg over geven maar liever niet hier want er staat nu wel genoeg rotzooi hier van mij over dit onderwerp dus dat doe ik dan wel via DM als ik er tijd/zin in heb.
Ik hoop dat je mij volgt maar tldr:
- xG is te onbetrouwbaar om over één wedstrijd te meten en er conclusies uit te trekken.
- wanneer het verschil wel significant is heeft de statistiek geen tot nauwelijks toegevoegde waarde boven de wedstrijd gewoon kijken
- je trekt de conclusies de verkeerde kant op (je ziet de statistiek als leidend terwijl de statistiek ondersteunend moet zijn, dus je moet juist zoeken waarom de statistiek anders is dan de uitslag)
Hoop dat het duidelijk is, dit is verder echt basic statistiek.
[ Bericht 0% gewijzigd door GurneyIsBestOke op 26-11-2020 16:29:44 ]