Spis treści

     

    Opis tworzenia Rankingu

    Wprowadzenie

    Celem przeprowadzonych prac i analiz było wypracowanie narzędzi umożliwiających porównywanie poziomu jakości życia w polskich miastach. Podstawowym założeniem przy konstrukcji rankingu było zapewnienie wysokich standardów metodologicznych i minimalizacja wpływu uznaniowości.

    W odróżnieniu od poprzedniej edycji rankingu tygodnika POLITYKA:

    https://www.polityka.pl/niezbednik/1597651,1,indeks-jakosci-zycia-mieszkancow-miast.read

    zastosowana metodyka budowy wskaźnika jest zgodna z aktualnymi rekomendacjami OECD i JRC Komisji Europejskiej w przedmiotowym zakresie. Do analiz wykorzystano wyłącznie obiektywne z założenia i ogólnodostępne dane statystyczne zbierane w sposób systematyczny. Zrezygnowano z uwzględniania danych subiektywnych, np. wyników sondaży czy nawet reprezentatywnych badań opinii.

    Jakość życia to zjawisko wielowymiarowe. Mają na nie wpływ zarówno czynniki materialne (np. warunki mieszkaniowe czy poziom płac), jak też niematerialne (edukacja, zdrowie, stan środowiska czy bezpieczeństwo). Z tego powodu w ramach prac nad indeksem jakości życia dokonano wyboru czynników w oparciu o zalecenia zawarte w zbliżonych tematycznie raportach i rankingach opracowanych w innych krajach europejskich przy jednoczesnym uwzględnieniu dostępności wiarygodnych danych statystycznych dla miast na prawach powiatu w Polsce. Wybrane czynniki zebrano w 10 kategorii tematycznych ("podindeksów", "podocen"). Przy wyliczaniu „podindeksów” oraz indeksu zbiorczego (kompozytowego) użyto wyłącznie wag wyznaczonych metodami statystycznymi rekomendowanymi przez OECD i JRC Komisji Europejskiej, co pozwoliło na znaczne zminimalizowanie niepożądanego wpływu arbitralności.

    Indeks jakości życia, będący średnią ważoną z 10 podocen dla kategorii tematycznych, należy traktować czysto informacyjnie, ze świadomością ograniczeń związanych z jego naturą. Powodem może być chociażby nie zawsze pożądana cecha kompensowalności tak uzyskiwanego wskaźnika kompozytowego - względnie wysoki wynik dla niektórych kategorii może kompensować niskie wyniki dla większości innych kategorii (na przykład miasto wysoko rozwinięte gospodarczo, w którym łatwo o atrakcyjną pracę może cechować bardzo zły stan środowiska). Należy więc pamiętać, że choć opracowany ranking jest źródłem cennych i wiarygodnych informacji, szczególnie w zakresie wspomagania procesu zarządzania rozwojem miasta, to jednocześnie podobnie jak każdy inny wskaźnik kompozytowy nie odzwierciedla on doskonale jakości życia w miastach.

    Interpretując wagi przypisywane poszczególnym podocenom podczas wyznaczania oceny kompozytowej należy pamiętać, że nie odzwierciedlają one znaczenia poszczególnych podkategorii, a jedynie pozwalają wyznaczyć czynniki najbardziej istotne dla różnicowania pozycji miast w kompozytowym rankingu. Na wyniki rankingu należy więc patrzeć uwzględniając poczynione założenia oraz wyniki analizy wrażliwości uzyskanej końcowej klasyfikacji. Z tego względu rekomendujemy, aby interpretować wyniki rankingu przez pryzmat wyznaczania grup podobnie ocenianych miast, a nie traktować wskaźników liczbowych literalnie i bezrefleksyjnie czy nadawać interpretację zupełnie nieznaczącym różnicom między wartościami indeksu dla różnych miast.

    Biorąc dodatkowo pod uwagę typowy dla analizy wielokryterialnej brak jednoznaczności interpretacyjnej wskaźnika kompozytowego, rekomendujemy, by podstawowe znaczenie nadać „podrankingom” dla każdej z 10 kategorii tematycznych. W oparciu o podoceny dla kategorii każdy zainteresowany może stworzyć własny ranking, przydzielając kategoriom wagi stosownie do swoich preferencji (procedura zwana w literaturze „metodą alokacji budżetu”). Aby umożliwić stosowanie takiego narzędzia partycypacyjnego, został udostępniony ten interaktywny portal internetowy. Dzięki możliwości nadawania przez użytkownika wag kategoriom wedle indywidualnych preferencji, portal będzie pozwala zarówno na tworzenie indywidualnych rankingów przez każdego zainteresowanego, jak i badanie opinii publicznej poprzez agregację wyników zebranych od respondentów. Tak uzyskane wyniki są prezentowane w formie interaktywnego wykresu na stronie www.

    Metody

    Wybór procedury analitycznej

    Zasadniczo zastosowaną metodologię oparto na ogólnodostępnych zaleceniach OECD dotyczących konstrukcji wskaźników kompozytowych. Głównym źródłem wiedzy był poradnik metodologiczny OECD:

    http://www.oecd.org/els/soc/handbookonconstructingcompositeindicatorsmethodologyanduserguide.htm

    Procedura wyliczania wskaźnika jakości życia w miastach została oparta na 10-etapowym schemacie wyznaczania wskaźników kompozytowych praktykowanym i rekomendowanym przez analityków Komisji Europejskiej:

    https://ec.europa.eu/jrc/en/coin/10-step-guide/overview

    Dobór zmiennych

    Doboru zmiennych dokonano w oparciu o szczegółową analizę listy zmiennych wykorzystywanych w zbliżonych tematycznie raportach dotyczących rankingów jakości życia publikowanych w innych krajach europejskich, w szczególności w Szwajcarii:

    https://www.bfs.admin.ch/bfs/en/home/statistics/cross-sectional-topics/city-statistics.assetdetail.1401994.html

    Biorąc pod uwagę dostępność danych statystycznych dla polskich miast na prawach powiatu, a także wnioski wynikające z wieloetapowej dyskusji prowadzonej przez naukowców z AGH oraz przedstawicieli działu naukowego tygodnika POLITYKA, w badaniach wykorzystano ostatecznie 53 zmienne ilościowe przydzielone do 10 kategorii tematycznych. W przypadku każdej zmiennej większe wartości odpowiadały wyższej mierze jakości życia w danym wymiarze. W ramach analizowania każdej z 10 kategorii wykorzystano od 5 do 7 zmiennych. Źródłem danych statystycznych był w głównej mierze Bank Danych Lokalnych (GUS), jednak w przypadku części kategorii wykorzystano dane pochodzące z GIOŚ, MRPPS, UKE oraz Związku Miast Polskich.

    Wstępna obróbka danych

    Na wstępie wyselekcjonowane zmienne zostały przeanalizowane pod kątem występowania obserwacji brakujących i symetrii rozkładu empirycznego. W przypadku części zmiennych dotyczących zanieczyszczenia powietrza dokonano uzupełnienia obserwacji brakującej dla danego miasta przez uśrednienie danych z geograficznie najbliżej położonych miast o kompletnych rekordach. W przypadku danych o rozkładach silnie skośnych zastosowano transformacje symetryzujące rozkład (np. transformację logarytmiczną).

    Wyznaczanie podocen w kategoriach

    W kolejnym kroku dla każdej z 10 kategorii wyznaczono podocenę składową, którą obliczono jako średnią ważoną z zestandaryzowanych zmiennych składowych. Wagi wykorzystane w sumowaniu wyznaczono w oparciu o pracę:

    Nicoletti G., Scarpetta S. and Boylaud O. (2000), Summary indicators of product market regulation with an extension to employment protection legislation, OECD, Economics department working papers No. 226, ECO/WKP(99)18.

    Mówiąc w uproszczeniu, zastosowany algorytm wyznaczania wag wykorzystuje ładunki i proporcje objaśnionej wariancji wynikające z analizy składowych głównych (z ang. principal component analysis, PCA) z rotacją varimax przeprowadzonej dla zestandaryzowanych zmiennych w obrębie każdej z 10 kategorii. Zasadnicza przewaga algorytmu rekomendowanego przez OECD nad wyborem arbitralnym wynika w głównej mierze z tego, że algorytm OECD uwzględnia możliwość wystąpienia silnego skorelowania części zmiennych między sobą. Dzięki temu można uniknąć problemu niezamierzonego i niekontrolowanego wzrostu wpływu silnie skorelowanych zmiennych na ostateczny kształt rankingu miast w obrębie danej kategorii. Przykładowo, problem taki występuje przy zastosowaniu równych wag (a więc obliczaniu średniej arytmetycznej, co zwykle było dotychczasową praktyką stosowaną przy wyznaczaniu rankingów jakości życia w miastach) w przypadku zestawu zmiennych, spośród których chociaż dwie są silnie skorelowane.

    Wyznaczanie wskaźnika kompozytowego

    Indeks jakości życia w miastach wyznaczono jako średnią ważoną obliczoną z 10 zestandaryzowanych podocen składowych. Wagi wykorzystane w sumowaniu (dalej w tekście oznaczane jako „wagi główne”) wyznaczono analogicznie jak w przypadku wyznaczania podocen w kategoriach.

    Ze względu na statystyczne cechy zbioru podocen oraz zestawu wskaźników kompozytowych, tj. statystycznie istotną zgodność tych danych z rozkładem normalnym, w celu ułatwienia interpretacji uzyskanego rankingu zastosowano skalowanie ocen w zakresie 0 - 100 bazujące na wykorzystaniu dystrybuanty stosownego rozkładu normalnego. Dzięki takiej procedurze matematycznej wartość przeskalowanego wskaźnika kompozytowego można bezpośrednio interpretować w języku prawdopodobieństwa. Przykładowo, wskaźnik kompozytowy równy 26 dla miasta A sugeruje, że statystyczne prawdopodobieństwo istnienia miasta o niższej ocenie kompozytowej wśród wszystkich polskich miast na prawach powiatu, obliczone na bazie posiadanych danych i informacji, wynosi 0,26.

    Analiza wrażliwości

    Badanie wrażliwości wykonano w oparciu o poniższe zalecenia Komisji Europejskiej w przedmiotowym zakresie:

    https://ec.europa.eu/jrc/en/publication/eur-scientific-and-technical-research-reports/environmental-performance-index-2014-jrc-analysis-and-recommendations

    Mówiąc w uproszczeniu, przeprowadzone badanie polegało na niezależnym wylosowaniu 5000 zestawów wag głównych z rozkładów jednostajnych scentrowanych na oryginalnym wektorze wag o symetrycznym rozstępie ±20%.W ten sposób przy założeniu dopuszczalnego zakresu zmian (± 20%) w wagach głównych uzyskano zestaw 5000 alternatywnych rankingów jakości życia w miastach, co pozwoliło z kolei wyznaczyć 95%-owy przedział ufności rozpięty wokół pozycji każdego miasta w oryginalnym (pierwotnie obliczonym) rankingu. Mając na uwadze przystępność prezentacji wyników rankingu na interaktywnej stronie internetowej przedziały ufności nie zostały uwzględnione w wizualizacji.

    Uwagi końcowe

    W celu ustawicznego udoskonalania zaprezentowanego narzędzia niezbędne są dalsze prace. Szczególnie cenna może być współpraca z kompetentnymi środowiskami i ekspertami przy doborze kategorii oraz przypisanych im zmiennych, a także pozyskiwaniu wiarygodnych danych. Wiele może również wnieść informacja zwrotna pochodząca od mieszkańców miast zebrana za pomocą tworzonego narzędzia internetowego. Istotnym zagadnieniem jest także prowadzenie głębszej analizy wrażliwości oraz próba analizy problemu agregacji podocen w ujęciu teoretycznym i praktycznym, w tym uwzględnienie zagadnienia kompensacji i substytucji poszczególnych wymiarów oceny kompozytowej.

     

    O zespole

    Prace nad Rankingiem zestały zrealizowane dzięki wsparciu Rektora AGH prof. dr hab. inż. Tadeusza Słomki.

    Zespół naukowy

    • dr hab. Jacek Gądecki - kierownik Katedry Socjologii Ogólnej i Antropologii Społecznej WH AGH
    • dr hab. inż. Marek Kisiel-Dorohinicki, prof. n. - kierownik Katedry Informatyki WIEiT AGH
    • dr Sławomir Kopeć - dyrektor Centrum Zaawansowanych Technologii Miasta Przyszłości AGH
    • dr Łukasz Lach - adiunkt w Pracowni Zastosowań Matematyki w Ekonomii WZ AGH

    Zespół wykonawczy aplikacji internetowej

    Aplikacja powstała w Katedrze Informatyki AGH. Opiekę nad zespołem sprawował dr inż. Jacek Dajda. W pracach uczestniczyli:

    • Mateusz Małek
    • Joanna Orzeł
    • Agnieszka Rudnicka
    • Izabella Szlósarczyk
    • Aleksandra Urbańczyk
    • Małgorzata Witkowska

    Zespół redakcyjny z ramienia POLITYKI

    • Edwin Bendyk
    • Urszula Schwarzenberg-Czerny

     

    Licencje

    Opisy miast zostały zaczerpnięte z polskiej Wikipedii, na podstawie licencji CC-BY-SA.

    Aplikacja została stworzona w języku programowania Python z wykorzystaniem frameworka Django.