PDO – Tur, otur och etymologisk förvirring

Såhär i bloggens uppstartstider har ett gäng inlägg redan ägnats åt att introducera och förklara diverse mått såsom TSR (andelen skott ett lag tar av alla skott i lagets matcher), SoTR (som TSR fast för skott på mål), Scoring% (andelen av ett lags skott på mål som konverteras till mål) samt Save% (andelen av ett lags skott på mål man släpper till som konverteras till mål).

Det har visat sig att TSR och allra främst SoTR korrelerar i hög utsträckning med vunna poäng, medans Save% och Scoring% inte gör det. De sistnämnda fluktuerar dessutom kraftigt både över kortare och längre tidsperioder.

Ett lag med en hög Save% eller Scoring% över en säsong (eller en halv, eller en tredjedels eller vilken tidsperiod man nu föredrar använda) har således i princip inte större chans att uppvisa en hög Save% eller Scoring% under nästa säsong (eller nästa halva säsong, eller nästa tredjedels säsong eller vilken tidsperiod man väljer att använda) än vilket annat lag som helst. Måttet kan därför inte sägas drivas av skicklighet i speciellt stor utsträckning, eftersom bättre lag i sådana fall kontinuerligt hade uppvisat högre siffror för dessa mått än de sämre lagen, vilket helt enkelt inte är fallet. Över längre tidsperioder är det förvisso sannolikt att bättre lag kommer uppvisa något högre värden för dessa mått än sämre lag, men skillnaden är väldigt mycket mindre än man intuitivt förväntar sig.

Anledningen är ett statistiskt fenomen vid namn ”regression to the mean”, vilket förenklat betyder att ett värde kommer att röra sig mot medelvärdet ju fler upprepningar som sker. Det klassiska exemplet är slantsingling, där man givet ett rättvist mynt vet att medelvärdet är 0.5 klave. Ponera att man singlar ett mynt fem gånger och bara får 1 klave, ett medelvärde på 0.2 klave. Ju fler slantsinglingar man genomför desto närmare medelvärdet på 0.5 kommer man så småningom att landa, eftersom skicklighetsmomentet i en slantsingling = 0. Ju större skicklighetsmoment, desto mindre ”regression to the mean”. Mått som TSR och SoTR som drivs av skicklighet rör sig inte alls mot medelvärdet på samma sätt som de mer variationsdrivna Scoring% och Save%.

Detta leder oss in på ett nytt mått, nämligen PDO. Ironiskt nog, bland alla dessa förvirrande förkortningar och uttryck, är inte PDO en förkortning överhuvudtaget (åtminstone inte som har med fotboll att göra). Måttet kommer ursprungligen från ishockeyns analytikerkretsar, och PDO var helt enkelt ett användarnamn på ett hockeyforum, nämligen namnet på den användaren som först myntade uttrycket och måttet. I efterhand har folk försökt få det till en förkortning, bland annat har ”percentage driven output” förekommit och till och med letat sig in i en tidningsartikel, men ursprungligen har PDO ingen officiell, idrottslig betydelse.

Efter den trassliga förklaringen, kommer den, lyckligtvis, betydligt enklare formeln för grunden i PDO:

PDO = Scoring% + Save%

Eftersom varje skott på mål antingen räddas eller går i mål är en ligans medelvärde för PDO alltid 100. Olika analytiker använder (för att krångla ännu lite till) olika former på sina PDO-mått, vissa väljer att multiplicera talet för att få större tal, andra väljer att använda decimalform så att ligans medelvärde är 1, men eftersom grundpelarna måttet bygger på är procenttal föredrar jag att uttrycka medelvärdet för en liga som 100. Eftersom PDO är ett mått bestående av två mått som båda bygger väldigt lite på skicklighet och desto mer på tur/otur och därför i hög utsträckning rör sig mot medelvärdet (regression to the mean), kommer PDO i ännu högre utsträckning röra sig motligans medelvärdet på 100. Här kommer den allsvenska tabellen för 2014, men med TSR, SoTR, Scoring%, Save% och PDO för kontext.

alls2014pdo

Bristen på skicklighetsmoment i Scoring%, Save% och PDO är fascinerande tydlig. Gefle på 14:e plats i tabellen har exakt samma Save% som mästarna Malmö FF, och endast en ynka procent sämre Score%. Elfsborg var ett av ligans sämsta lag på att konvertera sina skott på mål då man endast lyckades kruta dit 23% av sina skott på mål. Samma siffra delades av Mjällby på femtonde plats, som dessutom hade en bättre Save% än Elfsborg men ändå hamnade i andra änden av tabellen. Ännu ett mycket tydligt bevis för att det är volymen lägen som är av största vikt snarare än andelen av lägen som faktiskt konverteras.

I två relativt krångliga och långa inlägg har nu Save%, Scoring% och PDO avhandlats. Mått som alltså fluktuerar kraftigt över tid och inte säger mycket alls om ett lags faktiska skicklighet. Den uppmärksamma läsaren kanske undrar varför i hela friden man ska använda de här måtten överhuvudtaget om de nu säger så lite om ett lags skicklighet?

Svaret är Aston Villa. Eller Borussia Dortmund.

Efter fyra omgångar i årets Premier League hade Aston Villa 10 av 12 möjliga poäng, efter bland annat bortasegrar mot både Stoke och Liverpool. Ägaren Randy Lerner fick ett sånt glädjefnatt av att titta på tabellen att han i yran beslutade sig för att förlänga manager Paul Lamberts kontrakt med fyra år på stubben, men kanske skulle han tittat lite mer på de underliggande siffrorna bakom Villas ”form” innan han förlängde med skotten. Vill hade lyckats med konststycket att göra 80% av målen i de fyra inledande matcherna, samtidigt som man visade upp TSR på 0.4 och SoTR på 0.375, siffror som mer liknar ett lag som slåss för överlevnad än ett som slåss i toppen, vilket var exakt vad Villa gjorde efter fyra omgångar. med Scoring% på 67% (genomsnitt ca 30%) och Save% på 90% (genomsnitt ca 70%)  landade lagets PDO efter fyra omgångar på 157, att jämföra med ligans genomsnitt på 100. Eftersom vi vet att alla dessa mått kraftigt rör sig mot ligans medelvärde kunde man lätt konstatera att Villas form med stor sannolikhet var en kortvarig fluga och att man snart skulle återgå till att vara det bottenlag som skottstatistiken visade, och mycket riktigt fick till Paul Lambert till slut sparken efter en räcka usla resultat & insatser. Mål är väldigt sällsynta händelser i fotboll, och därför väldigt varierande över korta tidsperioder. Skott är betydligt vanligare, och tidigt på säsongen är ofta mått som baseras på skott betydligt bättre indikatorer på framtida resultat än vad mål och resultat i de få första matcherna man hunnit spela är. Men säg det till Randy Lerner den som vågar.

Villa

För Dortmund var scenariot det helt omvända. Under hela höstsäsongen visade man upp skottstatistik som talade om ett av ligans absolut bästa lag, men en perfekt storm av brända lägen och smått surrealistiska försvarstavlor ledde till en PDO på dryga 80*** och en plats under strecket efter halva säsongen. Här hade ledningen betydligt mer is i magen än i fallet Aston Villa, gav Klopp fortsatt förtroende och så sakteliga börjar nu också lagets PDO hämta sig, vilket syns tydligt i tabellen samt på resultaten då man är obesegrade i ligan sedan förlusten mot Augsburg den fjärde februari. Tyvärr går inte återhämtningen i den takt som hade krävts för att eventuellt utmana om en Champions league-plats, utan Dortmund lär få lägga den här säsongen till handlingarna som ett lag i övre mitten av tabellen med en Europa League-plats som bästa tänkbara utfall och surt konstatera att variation inom idrott kan vara en jäkla plåga emellanåt.

***För att sätta lite i sammanhang hur låg en PDO på 80 är kan nämnas att jag i min databas bestående av samtliga säsonger från 08/09-13/14 i Premier League, Bundesliga, Serie A och LaLiga endast har noterat ett enda värde för PDO under en hel säsong som är under 82 (Real Betis 13/14) och endast 6% av värden för PDO ligger under 90.

Annonser
Taggad , ,

5 tankar om “PDO – Tur, otur och etymologisk förvirring

  1. […] var det lag med allra bäst underliggande skottsiffror 2014, och torde således vara en av de största utmanarna till guldet, men här känns de förlorade […]

    Gilla

  2. […] Liknande slutsatser har också dragits på lagnivå, genom tidigare inlägg som går att läsa här, här, och här. […]

    Gilla

  3. […] i att kontinuerligt vara bättre än genomsnittet på dessa mått, men vi vet också sedan detta inlägg att dessa mått är till stor del drivna av varians och det kan därför vara svårt att urskilja […]

    Gilla

  4. […] IFK Göteborg kan tacka en PDO på över 120 för sin ledning, de underliggande siffrorna vittnar ännu inte om några […]

    Gilla

  5. […] och lagets Save% är ligans näst högsta (efter West Ham). Som vi vet sedan det HÄR och det HÄR inlägget är dessa mått högst varierande över tid och är drivna av variation i högre […]

    Gilla

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Google+-foto

Du kommenterar med ditt Google+-konto. Logga ut /  Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s

Annonser
%d bloggare gillar detta: