Krzysztof Jurek

Statystyka jako narzędzie nadużyć i manipulacji

Garść refleksji z praktyki

Rys. Sławomir Makal

Warto zwrócić uwagę, że analiza statystyczna to jedno, a interpretacja wyników i ich prezentacja to drugie. Obszarem nadużyć lub manipulacji w tym obszarze może być zbyt pochopne wyciąganie wniosków z uzyskanych wyników bądź ich nadinterpretacja.

Niniejszy tekst jest refleksją, która zrodziła się po przeczytaniu wytycznych Komisji Etyki Zawodowej Amerykańskiego Stowarzyszenia Statystycznego na temat etyki w praktyce statystycznej (Ethical Guidelines for Statistical Practice; Prepared by the Committee on Professional Ethics of the American Statistical Association Approved by the ASA Board in April 2018). Autorzy dokumentu zwracają uwagę, że statystyka łączy zdolność obserwacji ze zdolnością do zbierania dowodów, podejmowania decyzji, przez co przyczynia się do budowania bardziej świadomego społeczeństwa. To wielka odpowiedzialność, stąd też praktycy statystyki mają obowiązek pracować w sposób etyczny, profesjonalny, kompetentny, pełen szacunku. Przy lawinowym przyroście wiedzy naukowej, którego jesteśmy świadkami, problem etyki w praktyce statystycznej staje się tym bardziej doniosły. Artykuły naukowe, zwłaszcza w zakresie nauk społecznych, pełne są danych statystycznych. W gąszczu tabel, wykresów, liczb łatwo można się pogubić. Zrozumienie wielu tekstów wymaga od czytelnika przynajmniej elementarnej wiedzy statystycznej, tak by odróżnić tekst „dobry” od „złego”.

Brytyjski polityk Benjamin Disraeli mawiał rzekomo, że są trzy rodzaje kłamstwa: kłamstwa zwykłe, kłamstwa wierutne i statystyki (w oryginale: „Lies, damned lies, and statistics”). Dlaczego statystyka (Disraeli miał na myśli dane liczbowe) jest kłamstwem „największym”, skąd ta ocena? W życiu politycznym statystyki, np. sondaże społeczne, mają wielkie znaczenie – gdy są dla polityków sprzyjające, to ci chętnie się na nie powołują, jednak gdy są niekorzystne, wówczas podważa się ich wartość i znaczenie. Ale dotyczy to nie tylko polityków. Wiele grup zawodowych posługuje się danymi statystycznymi w komunikacji z opinią publiczną. Wyniki rzetelnych badań, na które się powołują, odpowiadają na wiele pytań, weryfikują stawiane hipotezy, demaskują przypuszczenia, powszechne, obiegowe opinie. Można na nich polegać w procesie budowania wiedzy. Dzięki metodom statystycznym badacz jest w stanie nie tylko wyjaśniać otaczającą rzeczywistość, ale może rozwiązywać wiele praktycznych problemów. Co się dzieje jednak, gdy statystyka staje się narzędziem nadużyć, a nawet manipulacji? Opinia Disraelego nie wzięła się przecież znikąd.

Potwierdzenie z góry założonej tezy

Statystykę należy rozumieć szeroko, są to nie tylko dane liczbowe (sondaże). Metody statystyczne obejmują także takie działania (etapy) jak: projektowanie badań i budowa narzędzia badawczego, metody analizy danych (np. estymacja, weryfikowanie hipotez i generalnie to, co określamy jako statystykę indukcyjną), formy prezentacji danych w postaci wykresów, tabel, diagramów czy w końcu sposoby ich interpretacji oraz formułowanie wniosków na podstawie uzyskanych wyników. Na każdym etapie można się spotkać z nadużyciami badaczy, zwłaszcza gdy celem projektu badawczego staje się potwierdzenie z góry założonej tezy. Dzieje się to na wiele sposobów. Chciałbym w ramach niniejszego tekstu zasygnalizować kilka z nich.

W każdym „poważnym” badaniu społecznym powinna pojawić się informacja na temat doboru próby i jej reprezentatywności. Najprościej mówiąc, próba jest reprezentatywna wtedy, gdy jej struktura jest zbliżona do struktury zbiorowości ogólnej. Stan ten zostanie osiągnięty, kiedy próba zostanie wylosowana, ale nie byle jak, lecz z zachowaniem odpowiednich procedur. Teoretycznie chodzi to, że każdy element populacji powinien mieć szansę wejścia do próby, czyli prawdopodobieństwo znalezienia się w niej powinno być dla wszystkich takie samo. Potrzebny jest zatem wykaz jednostek analizy (np. osób), które mogłyby się znaleźć w próbie. W wielu przypadkach to zadanie pozostawia się wyspecjalizowanym instytutom badawczym, które dysponują bazami danych identyfikujących respondentów, im też pozostawia się zazwyczaj proces zbierania danych, np. za pomocą ankiet. Oczywiście rozwiązanie to jest najlepsze w przypadku dużych projektów badawczych, na dużą skalę, wiąże się ono bowiem z dużymi nakładami finansowymi. Już na tym etapie projektowania badań można doszukiwać się nadużyć. Chodzi tu nie tylko o sytuacje, w których badacze pomijają wymóg reprezentatywności albo, co gorsza, twierdzą, że zadanie to spełnia dobór celowy próby, ale przede wszystkim o „błędy” w sposobie dotarcia do badanych. Często jest to kontakt wyłącznie telefoniczny lub mailowy, a wyniki mimo wszystko są uogólniane na całą zbiorowość. Tym można tłumaczyć na przykład różnice w sondażach przedwyborczych, które tak zadziwiają i polityków, i głosujących. Komunikacja zapośredniczona, z użyciem środków telekomunikacyjnych, powoduje, że dochodzi do tzw. nadreprezentatywności próby, a zatem wyniki można „rozciągać” na zbiorowość ogólną, ale są nią kolejno posiadacze telefonów oraz osoby mające dostęp do komputera podłączonego do sieci internet. W wielu artykułach autorzy zdawkowo wyjaśniają procedury doboru próby lub – co gorsza – całkowicie pomijają ten problem.

Wyczerpywać wszystkie możliwe sytuacje

Ustalenie celu badań, jego zakresu podmiotowego i przedmiotowego, to jedno, kolejną kwestią pozostaje pytanie, za pomocą czego dokonać badania? Jedną z najczęściej stosowanych technik w naukach społecznych jest ankieta. Dwie podstawowe zasady, które trzeba wziąć pod uwagę przy jej budowaniu, to wyczerpywalność i rozłączność kafeterii (kategorii odpowiedzi). Pierwsza zasada w praktyce polega na zbudowaniu takiej listy odpowiedzi, która powinna (do czego badacz dąży) wyczerpywać wszystkie możliwe sytuacje. Kafeterie dysjunktywne, czyli takie, w których respondent może wtedy wskazać tylko jedną z możliwych odpowiedzi, powinny być bezwzględnie rozłączne, tj. nie powinny nakładać się nawzajem. Zasady te z pewnością były obce twórcom ankiety na temat „wrażeń”, które towarzyszyły klientom LOT-u, lecącym Boeingiem 787 (Dreamliner). W pokładowym systemie komputerowym oczom klientów ukazały się pytania radykalnie tendencyjne, np. jak opiszesz swoje wrażenia z lotu B787? Odpowiedzi, których mogli udzielić, były następujące: wspaniałe, wyjątkowe, niezapomniane. Należy sądzić, że ocena lotu była w 100% pozytywna.

Zazwyczaj jest tak, że statystyka opisowa, czyli arytmetyka zebranych danych, jest wstępem do kolejnych, bardziej zaawansowanych analiz statystycznych. Badaczowi chodzi bowiem o to, by powiedzieć o próbie coś więcej niż wskazanie kilku opisujących ją faktów statystycznych (średnia, modalna czy mediana), to znaczy badacz chce wnioskować o populacji, mając dane z próby.

Wiele nadużyć dotyczy procedury testowania hipotez statystycznych. Jest to dział wnioskowania, który pozwala badaczom na podjęcie decyzji o istnieniu bądź nie zależności stochastycznej (probabilistycznej) między zmiennymi. Należy wyraźnie podkreślić, że hipotezy formułuje się przed badaniem, nie w jego trakcie lub co gorsza po zrobieniu analiz. Wprawdzie są sytuacje, kiedy stawia się hipotezy statystyczne na podstawie zebranego materiału statystycznego, ale później konieczne jest zebranie nowego, niezależnego materiału statystycznego do przeprowadzenia sprawdzenia postawionej hipotezy. Wykorzystywanie tego samego materiału statystycznego do formułowania i weryfikowania hipotezy jest błędem, który może prowadzić do uzyskania z góry założonego wyniku.

Kendall i Buckland definiują hipotezę statystyczną jako „każdą hipotezę dotyczącą parametrów albo w postaci funkcyjnej rozkładu prawdopodobieństwa dla określonej populacji, lub ogólnie, mechanizmu probablistycznego, co do którego wysuwane jest przypuszczenie, że generuje obserwacje”. Hipoteza więc to sąd, twierdzenie o populacji, co do której nie mamy pełnej wiedzy. Badacz stawia dwie hipotezy: zerową i alternatywną. Pierwsza z nich zakłada, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. Hipoteza alternatywna, inaczej badawcza, jest tą, którą skłonni jesteśmy przyjąć po odrzuceniu hipotezy zerowej. Celem procedury testowania hipotez jest więc podjęcie decyzji (i tylko podjęcie decyzji), tzn. weryfikacja hipotez nie ma nic wspólnego z prawdziwością postawionych hipotez statystycznych (czy liczby mogą mieć wpływ na to, co „mówią” hipotezy?).

Poznanie istoty zjawiska

Warto zwrócić uwagę, że analiza statystyczna to jedno, a interpretacja wyników i ich prezentacja to drugie. Obszarem nadużyć lub manipulacji w tym obszarze może być zbyt pochopne wyciąganie wniosków z uzyskanych wyników, bądź ich nadinterpretacja. Stanley Feldman i Vincent Marks w książce Panic Notion, w rozdziale zatytułowanym The Misuse of Numbers („Nadużycia liczb”), wskazują na przykłady niewłaściwego wykorzystania danych statystycznych w mediach, ekonomii, medycynie. Rozdział zaczyna się od wskazania tytułu, który pojawił się w jednej z gazet: Thirty thousand people die each year from eating too much fat („Trzydzieści tysięcy ludzi umiera corocznie z powodu jedzenia zbyt dużej ilości tłuszczu”). Autorzy pytają prowokacyjnie: Czy ludzie ci żyliby wiecznie, gdyby nie jedli tłuszczu, czy też umarliby z powodu czegoś innego? Czy chociaż jedna osoba, nie mówiąc już o 30 tysiącach ludzi, jako przyczynę śmierci miała w akcie zgonu: jedzenie zbyt wielkiej ilości tłuszczu? Słusznie zauważają, że wskazana statystyka, jak i wiele innych, jest wynikiem czystej spekulacji. Jeden z artykułów opublikowanych w „The Times” w sierpniu 2004 r. podawał, że przypuszczalnie 40 tysięcy pacjentów rocznie umiera z powodu skutków ubocznych stosowania leków. Liczbę tę otrzymano poprzez ekstrapolację z badania 28 pacjentów jednego szpitala, którzy zmarli po zażywaniu leków. Nie wzięto pod uwagę, że na bazie obserwacji tak małej próby rozciąganie wyników na cały kraj jest niezasadne, nie wzięto też pod uwagę składu populacji tego konkretnego szpitala, a w populacji było wyjątkowo dużo ludzi bardzo starych i chorych. Polem nadużyć jest również sposób prezentacji wyników. Zagadnienie to w niezwykle interesujący (i zabawny) sposób opisał i zobrazował (z pomocą Irvinga Geisa) Darell Huff w książce How To Lie With Statistics.

Statystyka jest powszechnie obecna w życiu człowieka – w sondażach opinii publicznej, prognozach giełdowych, wyborczych, diagnozach społecznych, w prognozach pogody, polityce, ekonomii itd. Statystyka pozwala ocenić skalę danego zjawiska, jego charakterystykę, wskazuje trendy. Jej celem jest bowiem poznanie istoty zjawiska, głębsze jego zrozumienie. Tymczasem w wielu przypadkach metody statystyczne są źródłem manipulacji i nadużyć badaczy (lub osób, które wykorzystują dane statystyczne), stając się narzędziem, za pomocą którego kreuje się „swoją” wiedzę (a raczej niewiedzę). Paradoksalnie dzieje się to również nieświadomie, z braku wiedzy na temat zastosowania określonych metod. Statystyka zamiast być dyscypliną pomocniczą, zaczyna odgrywać pierwszoplanową, negatywną rolę.

Warto też pamiętać, że dane statystyczne same w sobie nie są kłamstwem, po prostu są takie, a nie inne (średnia arytmetyczna wynika z takiej, a nie innej formuły matematycznej), niemniej jednak mogą one być wykorzystywane np. przy prezentacji wyników w taki sposób, by „ukrywać” prawdę, pokazywać pewne informacje tendencyjnie czy w końcu tak, by w zamierzony sposób kształtować opinię publiczną.

Statystyka jest umiejętnością systematycznego opisu i zwięzłej charakterystyki różnorakich zjawisk społecznych. Umiejętność ta jest tym bardziej cenna, że nowoczesne społeczeństwa podlegają dynamicznym, czasem nieprzewidywalnym zmianom, a ich szybkie zrozumienie może mieć duże znaczenie w życiu społecznym, ekonomicznym czy politycznym. Pandemia związana z COVID-19 jest tego świetną egzemplifikacją. W naukach społecznych statystyka nie jest dziedziną bezwzględnie autonomiczną, ma charakter „służebny” wobec poszczególnych dyscyplin. Nie jest przypadkiem, że uczą się jej studenci socjologii, psychologii, ekonomii, dziennikarstwa i innych nauk humanistycznych (rzecz jasna, że również nauk ścisłych).

Dr Krzysztof Jurek jest adiunktem w Katedrze Socjologii Kultury, Religii i Migracji Wydziału Nauk SpołecznychKatolickiego Uniwersytetu Lubelskiego Jana Pawła II.

Wróć