Expected Goals – En introduktion

Den här bloggen handlar väldigt mycket om skott, eller avslut för att vara helt korrekt. Ratios såsom SoTR och TSR är mått på lagnivå som korrelerar med framgång över tid och dessutom drivs av skicklighet i större utsträckning än variation. Eftersom mål är så väldigt sällsynta i fotboll kan ett lag drabbas av positiv eller negativ variation över väldigt lång tid, varför de underliggande siffrorna är väldigt intressanta att följa då de kan avslöja huruvida ett lags framgång är hållbar i längden eller om ett lag faktiskt är så dåligt som resultaten visar.

Dessa mått har dock en gemensam svaghet, nämligen att de behandlar alla skott likadant. Ett skott är ett skott, oavsett om det tas från mittlinjen eller mitt i straffområdet, oavsett om det är en nick från ett inlägg eller ett skott från en målvaktsretur. TSR och SoTR behandlar endast volymen skott & skott på mål som ett lag skapar och släpper till, utan någon hänsyn till kvalitén. Trots detta korrelerar de tydligt med inspelade poäng vilket i sig är fascinerande, men de berättar inte alltid hela historien. För att tackla detta problem har hobbyanalytikerna skapat ett mått som kallas ”Exptected Goals”.

Vad är Expected Goals?

Expected Goals, eller ExpG, är en statistisk modell som försöker sätta ett teoretiskt värde på varje skott. Olika modeller kan vara mer eller mindre avancerade och ta hänsyn till många olika variabler, men den gemensamma nämnaren för alla modeller är att man tar hänsyn till varifrån skottet avlossats. Modellerna bygger i regel på tiotusentals skott som har undersökts, delats in i olika zoner på planen, varpå man undersökt hur ofta ett skott från varje specifik zon leder till ett mål. En väldigt enkel ExpG-modell skulle kunna vara att tilldela alla skott utanför straffområdet ett visst värde, runt 0.03, och alla skott innanför straffområdets linjer ett betydligt större värde, runt 0.15.

Modellen som jag kommer att använda mig av är framarbetad tillsammans med Martin Sutton (Twitter: @stats4footy ) och är starkt inspirerad av en modell som Michael Caley (Twitter: @MC_of_A ) skapat och som beskrivs utförligt av honom själv på hans blogg (Caley är en av få som varit helt öppen med sin metod och vilka variabler modellen tar hänsyn till): http://cartilagefreecaptain.sbnation.com/2014/9/11/6131661/premier-league-projections-2014#methoderology

Det finns vissa subtila skillnader mellan Caleys modell och den som jag och Martin Sutton producerat, men grunden är densamma. Modellen använder sig av data från Opta och använder sig av information om varifrån skottet avlossats, vilken typ av skott (nick eller skott, frispark) det är, hur det assisterats (cross, genomskärare, vanlig assist) och om det föregicks av exempelvis en dribbling eller en målvaktsretur. Beroende på vilka av dessa variabler som är uppfyllda tilldelas skotten olika ekvationer som räknar ut ett teoretiskt värde för varje enskilt skott. Ett skott efter en dribbling eller genomskärare värderas högre än en nick från ett inlägg, då dessa skott konverteras till mål i högre utsträckning än vad nicken gör i genomsnitt. Ju närmre mål skottet avlossas desto bättre, men modellen tar även stor hänsyn till vinkeln för skottet, rakt framifrån är i regel klart att föredra framför skott från kanterna.

I slutändan är det viktigt att komma ihåg att ExpG  är en modell, och alla modeller är som bekant felaktiga, det är bara en fråga om hur felaktiga de är. Ett skotts ExpG-värde är en uppskattning om en skotts värde, men ibland kommer dessa vara uppenbart felaktiga. Exempelvis har vi i dagsläget ingen möjlighet att ta direkt hänsyn till var de försvarande spelarna befinner sig, då Optas data enbart behandlar boll-händelser och inte berättar något om var de försvarande spelarna befinner sig i relation till bollen. Vi kan försöka komma runt detta något genom våra variabler, exempelvis är det defensiva trycket antagligen klart mindre vid en genomskärare än vid en crossboll, och målvakten är sannolikt oftare ur position vid en retur än vid ett vanligt skott, varför dessa skottyper också värderas högre av modellen. En annan svaghet är att vi enbart mäter skott som faktiskt blir av. Farliga situationer som inte utmynnar i något skott förbises helt av modellen.

På det stora hela taget kommer en ExpG-modell förhoppningsvis berätta en betydligt mer nyanserad historia än råa skottsiffror, med all den information vi nu har om varje unikt skott (ca 10 000 skott per liga och säsong).

Vad kan ExpG användas till?

Expected Goals har många användningsområden. Varje skott har inte bara information om vilket lag som skjutit, utan faktiskt även om vilken spelare som skjutit, och vem som eventuellt har assisterat skottet. Måttet är således användbart både på lagnivå och spelarnivå. På lagnivå kan vi undersöka vilken typ av chanser ett lag skapar och släpper till samt identifiera eventuell över och underprestation. På spelarnivå kan vi nu inte bara undersöka hur många avslut en spelare kommer till, utan även bedöma kvaliteten på dessa avslutslägen. Eventuellt kan vi även identifiera spelare som skapat bra lägen men haft ett orimligt dåligt utfall och därför utgör ett kap på transfermarknaden, eller vice versa. Utöver det kan vi även titta närmare på assisterande av skott och inte bara se hur många skott en spelare assisterat, utan även vilken kvalité det är på de skott som spelaren i fråga skapar åt sitt lag.

muncross

Ovan syns alla skott Manchester United skjutit under innevarande säsong. Liknande karta går givetvis att göra för de skott ett lag släppt till, eller för att visa varje skott som en enskild spelare skjutit eller assisterat.

Nedan en tabell över Expected Goals och faktiska mål, samt skillnaden i förväntad målskillnad (ExpGD) och faktisk målskillnad (GD) över de 35 första omgångarna i Premier League (Arsenal & Sunderland har endast spelat 34 matcher).

expGpl35

Slutligen kan vi även se på expG-kartor från lösryckta matcher och bilda oss en uppfattning om vilken typ av chanser de båda lagen skapade. Här får man iaktta viss försiktighet då en modell som sagt är en modell och inget facit, men man får ändå en bra översiktsbild över positionerna från vilka lagen kom till avslut. Nedan en expG-karta över gårdagens Championes League-semifinal mellan Juventus och Real Madrid.

juvereal

Som fotnot kan nämnas att Moratas mål (avslut från väldigt kort håll efter målvaktsretur) hade ett expG-värde på väldigt höga 0.84, Ronaldos mål (nick efter vanlig assist från nära håll) 0.56 och James ribbnick (crossbolls-assisterad nick från nära håll) ett värde på 0.41. Tevez straff har ett stereotypiskt straffvärde på ca 0.77 och det skott som hade lägst värde på hela matchen tilldelades ett värde på 0.013, men dessa värden är som sagt modellerade värden och inget facit, och sett över en enskild match kan dessa såklart slå fel åt något håll. Över längre tidsperioder är förhoppningen att dessa diskrepanser ska jämna ut sig hyfsat väl och ge en rättvisande bild av verkligheten, åtminstone en mer rättvisande bild än råa skottratios såsom TSR och SoTR.

Dessa är bara några av användningsområdena för expG, som i stort sett är oändliga. Jag kommer att inkorporera expG så mycket som möjligt i mina kommande analyser vare sig det gäller spelare, lag eller managers, men tyvärr finns, mig veterligen, ingen data liknande Opta-data gällande allsvenskan, varför expG-analyser uteslutande kommer beröra de större europeiska ligorna där data finns att tillgå.

Annonser
Taggad ,

2 tankar om “Expected Goals – En introduktion

  1. […] & assisterat använder jag mig av min nya Expected Goals-modell (läs gärna mer om den HÄR). Modellen tilldelar varje skott ett teoretiskt värde baserat på avstånd från mål, vinkel, typ […]

    Gilla

  2. […] som underpresterat gentemot den förväntade målskörden (läs mer om Expected Goals-modellen HÄR), och det rejält med en underprestation på 35%. I andra änden av spektrat är det tydligt att […]

    Gilla

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Google+-foto

Du kommenterar med ditt Google+-konto. Logga ut /  Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s

Annonser
%d bloggare gillar detta: