logo
FA 10/2021 z laboratoriów

Remigiusz Żulicki

Sztuczna inteligencja to slajd w powerpoincie

Sztuczna inteligencja to slajd w powerpoincie 1

Sztuczna inteligencja jako opakowanie dla działalności świata data science – żartobliwa sentencja
Źródło: https://www.linkedin.com/feed/update/urn:li:activity:6501030890754314240/

Jako naukowcy, konsumenci i obywatele nie używajmy terminu „sztuczna inteligencja”. Chyba że w kontekście krytycznym. Mówmy o automatyzacji, a nawet o algorytmach, ewentualnie o ML, jeżeli mamy pewność, że zastosowane są właśnie takie metody.

Czy sztuczna inteligencja pozbawia nas pracy? Algorytmy przejmują władzę nad światem? Czy big data sprawia, że jesteśmy bezustannie inwigilowani? Czy ogromna ilość danych zastępuje ekspertów i naukowców? Cokolwiek sądzimy na te tematy, jedno jest pewne – istnieje heterogeniczne środowisko ludzi, zajmujących się tzw. sztuczną inteligencją czy tzw. big data od strony technicznej i metodologicznej. Pole ich działania nazywane jest data science (dalej DS), a oni data scientists. Moja socjologiczna rozprawa doktorska Data science w Polsce. Etnografia społecznego świata poświęcona była właśnie im, polskiemu środowisku DS, które traktowałem jako świat społeczny, wzorując się głównie na podejściu Adele E. Clarke. Celem głównym pracy był opis etnograficzny polskiego społecznego świata data science.

Rezultatem pracy osób zajmujących się data science są elementy systemów technologicznych nazywane potocznie „algorytmami” lub „sztuczną inteligencją”, a bardziej technicznie – modelami uczenia maszynowego. Wraz z miliardami ludzi na całym świecie stykamy się z tymi modelami na co dzień, często nieświadomie, w trakcie korzystania z takich narzędzi i usług jak zakupy przez internet (np. Allegro, Amazon), media społecznościowe (Facebook, Twitter, LinkedIn), serwisy streamingowe (Netflix, Spotify), wyszukiwarka internetowa Google lub aparat fotograficzny w smartfonie. Prawie zawsze, gdy dostajemy automatyczną, spersonalizowaną rekomendację czy odpowiedź, „pod spodem” działa model uczenia maszynowego wytrenowany na dużej ilości danych historycznych.

Modele budowane są m.in., aby automatyzować procesy, zwiększać efektywność, zmniejszać koszty, skalować rozmaite przedsięwzięcia. Sukces biznesowy takich gigantów, jak Netflix czy Amazon, w dużej mierze bazuje na wczesnym i umiejętnym wdrożeniu takich automatyzacji. Tym samym data science może być działalnością przynoszącą ogromne zyski i sowicie wynagradzaną. Już w 2012 została na łamach „Harvard Business Review” nazwana najbardziej seksownym zawodem XXI w. i od tego czasu wielokrotnie w mediach portretowano DS jako niezwykle atrakcyjną ścieżkę kariery. W raporcie Ministerstwa Nauki i Szkolnictwa Wyższego ws. rekrutacji na studia na rok akademicki 2017/2018 kierunek odpowiadający DS, inżynieria i analiza danych, pojawił się po raz pierwszy i zajął pierwszą lokatę z 54,6 zgłoszeniami na jedno miejsce.

Obraz środowiska

Data science to jednak nie tylko praca w sferze komercyjnej i nie tylko w branży nowoczesnych technologii. W 2018 opinia publiczna głównego nurtu zauważyła zastosowanie analizy i modelowania danych w marketingu politycznym. Afera Cambridge Analytica, firmy wspierającej sztab Donalda Trumpa i zwolenników brexitu w targetowaniu reklamy, spowodowała lawinę komentarzy o „big data” zagrażającej demokracji. Nieco wcześniej licznych przykładów krzywd i dyskryminacji spowodowanych wdrażaniem pozornie obiektywnej analizy i modelowania danych m.in. w administracji publicznej, ochronie zdrowia, sądownictwie czy ubezpieczeniach dostarczyła krytyczna książka byłej data scientystki Cathy O’Neil Broń matematycznej zagłady. W naukach społecznych i humanistycznych poświęca się od tamtego czasu sporo miejsca temu, czy sztuczna inteligencja pozbawia nas pracy, czy algorytmy przejmują władzę nad światem, czy big data sprawia, że jesteśmy bezustannie inwigilowani, czy ogromna ilość danych zastępuje ekspertów i naukowców. Mało miejsca poświęca się zaś środowisku ludzi, którzy pisząc kod w językach programowania mają bezpośrednią styczność i sprawczość względem „sztucznej inteligencji”, „algorytmów” czy „big data”. To środowisko to właśnie świat społeczny data science.

Polski świat społeczny DS koncentruje się w największych miastach przy silnej dominacji Warszawy. Świat ten składa się w 80-90% z mężczyzn. Zespoły DS w firmach komercyjnych są kilkuosobowe, więc jeżeli w zespole pracuje kobieta, prawie zawsze jest to jedyna kobieta. Ogółem dominują osoby w wieku 25-34 lat (około 50%), osoby posiadające wykształcenie magisterskie (50-60%) i te wykształcone na kierunkach informatycznych (30-50%). Nieco rzadziej są to ludzie z wykształceniem matematycznym/statystycznym (10-15%) i medycznym/przyrodniczym (około 10%). W 2019 r. w Polsce działało ponad 260 firm zajmujących się DS. Około jedna trzecia z nich uzyskiwała dochód głównie ze zleceń zagranicznych. Zarobki początkujących data scientystów w firmach komercyjnych to około 4-8 tys. złotych brutto miesięcznie. Stawki osób z większym doświadczeniem zawodowym to kilkanaście tysięcy złotych. Wynagrodzenia 30-50 tys. zł uzyskują osoby pracujące zdalnie, z Polski, w ramach kontraktów zagranicznych.

Najciekawszym i najważniejszym wynikiem moich badań jest to, że osoby zajmujące się DS traktują tak niesamowicie fascynujące laików pojęcie „sztucznej inteligencji” jako coś nieswojego, nietechnicznego. Jest to jedynie marketingowa otoczka ich rzeczywistej pracy. Termin „sztuczna inteligencja” bywa wręcz przedmiotem żartów. Pokażę niżej jeden z najpopularniejszych i moim zdaniem najbardziej znaczących środowiskowych żartów o sztucznej inteligencji – AI (artificial intelligence). By zrozumieć, dlaczego takie żarty są dla data scientystów śmieszne, a dla nas mają kolosalne znaczenie, zacznijmy od tego, co oni/one właściwie robią. W języku teorii społecznych światów nazywa się to działaniem podstawowym, rozumianym jako oczywista aktywność, wyróżniająca świat społeczny jako całość. Na podstawie rekonstrukcji tworzonych przez uczestników społecznego świata DS definicji działania podstawowego – działania odróżniającego data scientystów od tych, którzy nimi nie są – proponuję ujęcie: działaniem podstawowym jest pisanie kodu do przetwarzania, analizy i modelowania danych. Chodzi o dane cyfrowe i kod w językach programowania.

Technologie umożliwiające wykonanie działania podstawowego pełnią różne role w odniesieniu do zachodzących w społecznym świecie procesów, m.in. wyznaczania granic społecznego świata, legitymizacji i zaświadczania o autentyczności oraz segmentacji – profesjonalizacji. Przybliżę te procesy w kolejnych akapitach.

Granice społecznego świata DS ogólnie wyznacza wykonywanie działania podstawowego w językach programowania: przede wszystkim w pythonie i w mniejszym stopniu w R. Pozostając przy języku python, można wskazać na szereg narzędzi i metod uznawanych w badanym świecie za właściwe. Jest to np. anaconda – dystrybucja pythona do zastosowań DS, a wraz z nią notatnik jupyter i repozytorium conda. Do przetwarzania, analizy danych są to m.in. pakiety pandas, numpy, matplotlib, a także narzędzie apache spark, czyli zunifikowana technologia do rozproszonego przetwarzania danych. Do modelowania metodami tzw. tradycyjnego uczenia maszynowego służy najczęściej pakiet scikit-learn. Głównie do metod uczenia głębokiego za właściwe uznawane są pakiety tensor flow (TF), pytorch oraz narzędzie keras, zwane nakładką, ułatwiające korzystanie z TF. Zidentyfikowałem także dyskursywne odgraniczanie się od obszarów bliskich DS poprzez wskazywanie na odmienne wartości. I tak świat IT, a szczególnie mylona z DS inżynieria oprogramowania, jest uznawany za nudny, zaś DS za ciekawe. Nasz świat nauki akademickiej jest z perspektywy DS ciekawy, ale w przeciwieństwie do DS mało sprawczy i bywa nazywany sztuką dla sztuki. Oczywiście do świata DS rekrutują się obecni, byli i niedoszli naukowcy.

Zaświadczanie o autentyczności uczestnictwa odbywa się w badanym świecie DS poprzez odwołanie do używania właściwych narzędzi i metod, tzn. jestem data scientystą, bo buduję modele uczenia maszynowego używając języka python oraz pakietów pytorch i scikit-learn. Inne praktyki owego zaświadczania to powołanie się na doświadczenie w „rozwiązywaniu realnych problemów” i na cechy osobiste, np. bycie zainteresowanym matematyką lub informatyką od dziecka. Ogólnie o autentyczności zaświadcza bycie tzw. osobą techniczną. Osoba techniczna może oznaczać różny miks zainteresowań, zdolności, wiedzy, umiejętności matematycznych i informatycznych. Ten miks musi być taki, by pozwalał na efektywne i samodzielne wykonywanie działania podstawowego – pracy na danych cyfrowych za pomocą własnoręcznie pisanego kodu w językach programowania.

Ogólną legitymizację DS, jako przyjęte i odtwarzane przez jego uczestników uzasadnienie istnienia tego świata, stanowi narracja o jego powstaniu. Otóż DS powstało ponieważ z uwagi na gwałtownie rosnącą ilość dostępnych danych cyfrowych i rozwój mocy obliczeniowej komputerów, przy jednoczesnym spadku ich kosztów (zarówno danych, jak i mocy), możliwe, a zarazem opłacalne stało się rozwiązywanie realnych problemów z wykorzystaniem metod uczenia maszynowego.

Powstają subświaty/segmenty świata DS, głównie w sensie profesjonalizacji i zmiany zakresu wybranych aspektów działania podstawowego. Wyróżniłem inżynierię danych (data engineering), badania nad uczeniem maszynowym (ML research), inżynierię uczenia maszynowego (ML engineering) i analitykę danych. Działania podstawowe, jak i właściwe technologie są dla nich inne niż dla świata DS. Potocznie można by nazwać te segmenty specjalizacjami w obszarze DS nieco poszerzającymi jego zakres. Inżynieria danych jest bliska tradycyjnie rozumianemu IT i koncentruje się na rozwiązaniach z zakresu infrastruktury przechowywania danych, dostępu do nich oraz przygotowania danych do dalszych analiz i modelowania. Badania nad uczeniem maszynowym to segment najbliższy akademickiej matematyce i informatyce, skoncentrowany na rozwijaniu i testowaniu metod ML. Inżynieria uczenia maszynowego dotyczy problemów wdrożenia gotowych, tzw. wytrenowanych modeli ML do praktyki biznesowej, „na produkcję”, jak mawia się w DS i ogólnie w branży IT. Analityka danych, najmniej prestiżowy i relatywnie niżej niż wymienione wynagradzany segment, to problematyka eksploracji danych, wykorzystania statystyki opisowej i testowania hipotez, tworzenia raportów i wizualizacji danych.

Siedem wartości i społeczne światy

Opisałem siedem wartości uczestników świata DS: efektywność, sprawczość, samorozwój, samodzielność, ciekawość, swobodę i racjonalność. Za centralną wartość badanego świata uznałem efektywność. To wartości merytokratyczne, charakterystyczne dla późnonowoczesnego neoliberalizmu i wywodzące się z jednej strony z tzw. światopoglądu technokratycznego, z drugiej zaś z etosu naukowca akademickiego wg. R.K. Mertona.

Jako jedną z aren sporu, w który zaangażowany jest świat DS, widzę modelowanie metodami ML. Model ML traktują jako obiekt graniczny, wokół którego toczy się spór o władzę, zasoby, wartości, o przetrwanie i rozwój każdego z zaangażowanych światów. W tę arenę zaangażowane są społeczne światy DS, biznesu, akademii, IT, mediów, polityki i prawa. Dostęp do obiektu granicznego (szczególnie jeżeli zawęzić ujęcie do produkcyjnie wdrażanych modeli ML) mają światy techniczne, czyli DS i IT, oraz te światy nietechniczne, które dysponują władzą nad wpływowymi aktorami na arenie. Jest to świat biznesu (aktor – pieniądze) i świat prawa (regulacje prawne, jak np. RODO). Podkreślam rolę gigantów technologicznych, jak Google, Facebook, Amazon, we wspieraniu rozwoju ważnych na arenie technologii, także tych „wolnych” (open source). Dość znaczący na arenie jest też świat polityki jako najbardziej sprawczy w zakresie kształtowania regulacji prawnych, ale nie ich egzekwowania, oraz obszar nauk ścisłych i przyrodniczych jako subświat nauki akademickiej, kształtujący metody ML, publikujący teksty i pakiety dotyczące modelowania. Niemniej te światy nie mają bezpośredniego dostępu do obiektu granicznego. Jeszcze mniej wpływowe na arenie są światy mediów oraz obszar nauk społecznych i humanistycznych jako subświat nauki akademickiej.

Istnieją różnice w dyskursach zaangażowanych w arenę światów. Światy DS, IT oraz subświat nauk ścisłych i przyrodniczych traktują obiekt graniczny w kategorii „uczenia maszynowego”. Świat prawa posługuje się zarówno tą kategorią, jak i „sztuczną inteligencją”. Pozostałe światy posługują się głównie nietechnicznym pojęciem „sztucznej inteligencji”, stanowiącym opakowanie dla modeli ML (i wielu innych technologii). Te światy laików, nasze światy, pozostają pod wpływem praktyk celowo stosowanych przez biznesowych rzeczników świata DS i IT (głównie marketingu i HR), częściowo także pod wpływem popkulturowych ujęć AI, które można traktować jako tło dla areny. Uczestnicy świata DS postrzegają realizowane przez siebie projekty, których małą częścią jest budowanie modeli ML, jako majsterkowanie, podczas gdy z perspektywy nietechnicznej zarówno ich praca, jak i samo działanie modeli ML jest tak przedstawiane, jak i widziane w kategorii magii. Stąd popularny w świecie DS żart: jeżeli to jest napisane w pythonie, to prawdopodobnie uczenie maszynowe; jeżeli jest napisane w powerpoincie, prawdopodobnie to AI.

Dlaczego ten żart jest śmieszny dla data scientystów? Jest to śmiech technicznych profesjonalistów, pomieszany z zażenowaniem i poczuciem wyższości, zarówno wobec własnych biznesowych rzeczników przygotowujących owe piękne slajdy w powerpoincie, jak i wobec klientów, którzy tymi slajdami się zachwycają. Jest to śmiech wywołany celnie sportretowanym kontrastem – kod w pythonie jest tym, co rzeczywiście działa, czymś prawdziwym, zaś slajdy nie działają (w technicznym sensie), są tylko kolorowym obrazkiem, fasadą, opakowaniem, reklamą, przesadzoną obietnicą czegoś, co nie ma odzwierciedlenia w rzeczywistości. Pewnie tak samo roześmiałbym się jako socjolog, gdyby ktoś chciał sprzedawać usługę przeprowadzenia jakościowych wywiadów swobodnych pod hasłem czytania ludziom w myślach i odkrywania ostatecznej prawdy o społeczeństwie.

Dlaczego ten żart ma kolosalne znaczenie dla nas, laików? Dlatego, że pozwala nam odróżnić realne możliwości techniczne od praktyk marketingowych. Pomaga spojrzeć krytycznie, trzeźwo, bez skojarzeń z obrazami sci-fi, bez lęku i bez nadmiernych oczekiwań na otaczające nas systemy, których elementem są modele uczenia maszynowego. Dlatego proszę – jako naukowcy, konsumenci i obywatele nie używajmy terminu „sztuczna inteligencja”. Chyba, że w kontekście krytycznym. Mówmy o automatyzacji, a nawet o algorytmach, ewentualnie o ML, jeżeli mamy pewność, że zastosowane są właśnie takie metody.

Zwracam uwagę także na to, że zarówno my, jako użytkownicy końcowi systemów bazujących na modelach ML, osoby wykonujące niskopłatne i niewykwalifikowane zadania (tzw. klikacze, mogą np. etykietować dane źródłowe na potrzeby trenowania modeli nadzorowanego ML), jak i środowisko naturalne obciążane energochłonną infrastrukturą obliczeniową (a w wybranych przypadkach marketingowo zwaną „chmurą”), to aktorzy słabo obecni na opisywanej arenie, traktowani nierzadko przedmiotowo, niczym zasoby do zużywania.

Dr Remigiusz Żulicki, Katedra Metod i Technik Badań Społecznych, Instytut Socjologii Uniwersytetu Łódzkiego

Wróć