Blogi

IBM SPSS Modeler laittaa futisverkot tötterölle

Jalkapallohuuma on vallannut lajista enemmän ja vähemmän kiinnostuneet kuukauden ajaksi. Iso ilmiö saa miettimään, miten datasta voisi tehdä kiinnostavia löydöksiä. Olen blogannut IBM SPSS Modeler -analytiikkatyökalusta ja esitellyt sitä asiakkaillemme. Nyt haluan kuitenkin videon muodossa konkreettisesti näyttää, miten jalkapallodataa voi murskata SPSS Modelerin avulla.

Koska kuluvat kisat ovat vielä alkutaipaleellaan, niputan lähtökohdaksi yhteen edellisen MM-turnauksen eli Brasilian kisadatan vuodelta 2014. Maiden loppusijoituksia, pelaajien kaupallista arvoa ja FIFA-ranking-pisteytystä hyödyntäen klusteroin joukkueet viiteen ryhmään. FIFA-ranking kuvaa, miten kunkin maan edelliset pelit ovat menneet. Pelaajien markkina- ja siirtoarvot haen analyysia varten statista.com -sivustolta ja FIFA-ranking-pisteet football-rankings.info -sivustolta.

Klusterointi yhdistettynä pelaajien palkkoihin ja siirtokorvauksiin antaa kuvan siitä, millainen pelaajamateriaali kullakin maalla lähtökohtaisesti on kasassa. Tähtisikermä sekä onnistuneet karsinta- ja harjoituspelit luovat kukin omat paineensa isojen jalkapallomaiden menestymisodotuksille.

Tavoitteenani on löytää nippuja, joissa maat ovat keskenään samankaltaisia ja niput menestyksen ja ennakko-odotusten mukaan keskenään erilaisia. Vielä konkreettisemmin: ketkä alisuoriutuvat tai ylisuoriutuvat ja ketkä pelaavat kisassa omalla tasollaan.

Katso videolta, miten analyysi suoritetaan IBM SPSS Modelerilla. Jos haluat nähdä vain ryhmittelyn lopputuloksen, kelaa videon loppuun.

https://youtube.com/watch?v=5onIAHW8NiA

Tutustu paremmin SPSS Modeleriin tästä tai lue edellinen kirjoitus aiheesta tästä.