Czy XAI pomoże wygrać nam Mistrzostwa Europy?



Czytam właśnie książkę Malcolma Gladwella "Poza schematem". Autor zastanawia się co jest potrzebne do odniesienia sukcesu. Nikogo nie zaskoczę, że według autora ważne są nie tylko talent i praca. Wskazuje też inne przyczyny - niektóre bardzo zaskakujące.


Analizując składy drużyn hokejowych zauważa, że jest nieproporcjonalnie dużo graczy urodzonych w styczniu, lutym i marcu. Daje też przykład młodzieżowej reprezentacji Czech, finalisty MŚ juniorów 2007, w której składzie 75% zawodników urodziło się w tych miesiącach.


Według Gladwella wynika to z tego, że sportowe systemy szkolenia w dużej mierze opierają się na grupach dzieci z tego samego rocznika. W przypadku kilkuletnich dzieci kilka miesięcy więcej oznacza statystycznie znaczącą przewagę fizyczną i intelektualną. Dlatego urodzeni na początku roku lepiej grają niż ich o kilka miesięcy młodsi koledzy. Trenerzy wyłapują właśnie starszych jako tych z większym talentem. Przenoszą ich do bardziej zaawansowanych grup, tam dzieci stają się coraz lepsze i to dalej się nakręca. A ci urodzeni pod koniec roku, nawet jeśli mają taki sam talent, nie zostają zauważeni przez trenerów, nie trafiają do lepszych drużyn, a na końcu się zniechęcają i rezygnują z uprawiania sportu. Sport to w gruncie rzeczy zabawa. Gorzej, że taki proces dotyczy też na przykład nauki w szkole i oceniania uczniów. A to już dużo poważniejsza sprawa.


Spróbowałem zweryfikować tę tezę na danych piłkarzy występujących w Mistrzostwach Europy w piłce nożnej w 2016 i 2020 (odbywających się w tym roku).

Poniżej liczba zawodników w podziale na miesiąc urodzenia oraz dodatkowo wykres urodzeń w Polsce w 2018 roku.



Widać, że urodzenia rozkładają się w miarę równo.

Natomiast piłkarze biorący udział w ME zdecydowanie częściej urodzili się na początku roku niż na końcu. Gdy pokażemy dane o urodzeniach piłkarzy nie po miesiącach ale po kwartałach widać to jeszcze lepiej. Wygląda na to, że stawiana w książce teza faktycznie się potwierdza.



W przypadku polskiej reprezentacji na odbywających się właśnie mistrzostwach liczba urodzonych zawodników w kolejnych kwartałach to: 7, 12 (6 zawodników urodziło się w kwietniu), 4, 2. Więc w gruncie rzeczy reguła kolejny raz się potwierdza.

Więc gdyby się rozejrzeć za zawodnikami urodzonymi w drugiej połowie roku i wciągnąć ich do reprezentacji to jej poziom się podniesie i może na kolejnych mistrzostwach zostaniemy wreszcie mistrzami? Oczywiście żartuję. Zaraz wygramy z Hiszpanią (piszę to przed tym meczem), potem wygramy pięć kolejnych meczy i Mistrzem Europy zostaniemy już za parę tygodni. 😉



Explainable ArtificialI Intelligence (XAI)


Analiza takich danych pokazuje, jak ważne w obszarze Data jest zrozumienie tego co się robi. Zastanówmy się co by było, gdyby ktoś w szkółce piłkarskiej zrobił model prognozujący zostanie świetnym piłkarzem na podstawie danych zbieranych o młodych piłkarzach z tej szkółki. Co by było gdyby na zrobieniu takiego modelu zatrzymał się?

Być może model uwzględniałby miesiąc urodzenia. Taki model nie tylko dyskryminowałby urodzonych w końcówce roku małych piłkarzy, ale także działał na niekorzyść samej szkółki (do dalszego szkolenia model nie wskazuje wszystkich najlepszych piłkarzy).


Widać, że po zbudowaniu modelu konieczne jest zrozumienie jak on działa. Na przykład przy użyciu metod XAI oraz krytyczne przyjrzenie się wynikom takiej analizy. Czyli w naszym przypadku, zastanowienie się dlaczego osobom urodzonym na początku roku model daje większe szanse na sukces.

Wyjaśnianie modeli predykcyjnych jest konieczne nie tylko dla takiego modelu ale i dla każdego innego budowanego przy użyciu metod uczenia maszynowego. Jest to niezbędny etap w każdym takim projekcie.


Model budowane przy użyciu metod ML/AI to często rozwiązania typu czarne skrzynki (black box). Model podejmuje decyzję, ale nie wiadomo dlaczego taką, a nie inną. XAI czyli eXplainable Artificial Intelligence (czasami też zwane Responsible AI) to metody służące do wyjaśnienia jak działają modele. Zastąpienie „czarnej skrzynki” „skrzynką szklaną” (glass box), w której widać wszystkie szczegóły. Chętnych do pogłębienia wiedzy w tym zakresie odsyłam na przykład do publikacji P. Biecka i T. Burzykowskiego „Explanatory Model Analysis: Explore, Explain, and Debug"

(https://pbiecek.github.io/ema).



Andrzej Szczechla

BI/BigData Architect w BitPeak

andrzej.szczechla@bitpeak.pl



115 wyświetlenia

Ostatnie posty

Zobacz wszystkie