logo
FA 3/2024 życie akademickie

Marek Misiak

Ghost in the machine

Ghost in the machine 1

Rys. Sławomir Makal

Niedopuszczalne jest, by autorzy traktowali narzędzia SI jako rodzaj „czarnej skrzynki”, którą karmimy danymi, ona coś generuje, a my nie wiemy, skąd dokładnie wziął się rezultat, gdyż takie postępowanie zaprzeczałoby innej ważnej kategorii w nauce – możliwości powtórzenia tej samej sekwencji czynności w tych samych warunkach i sprawdzenia, czy da to takie same lub przynajmniej zbliżone rezultaty.

W 1970 roku Alvin Toffler opisał w Szoku przyszłości stan psychiczny jednostek i grup (a nawet całych społeczeństw) w okresie przyśpieszenia zmian społecznych. Nowe instytucje społeczne czy nowe technologie mogą się rozwijać w tempie uniemożliwiającym rozumienie ich i przystosowywanie się do nich na bieżąco, co wywołuje napięcie psychiczne, ale też realne problemy, gdy niezrozumienie i nieprzystosowanie utrudniają funkcjonowanie społeczne lub zawodowe. Rozwój zarówno nauki, techniki, jak i społeczeństw nie odbywa się w jednostajnym tempie, a zmiany tego tempa mogą być trudne do przewidzenia. Szok przyszłości bywa wyraźnie widoczny w funkcjonowaniu konkretnych instytucji (państwowych, prywatnych, pozarządowych) czy konkretnych branż, gdy obowiązujące tam reguły lub szczegółowe, ale ważne, procedury przestają przystawać do szybko zmieniającego się świata. Dobrym przykładem są liczne regulacje prawne, które do teraz w niewielkim tylko stopniu uwzględniają to, jak bardzo życie ludzi w państwach rozwiniętych przeniosło się do cyberprzestrzeni, a szczególnie do mediów społecznościowych.

Redakcje czasopism naukowych – nawet jeśli nie są „miejscem” w fizycznym sensie – adaptowały się do niedawna do zmian na ogół z opóźnieniem i w nierównym tempie. Opory i sprzeciw wzbudzały open access, czasopisma wyłącznie elektroniczne, repozytoria czy preprinty (te ostatnie są zresztą przedmiotem kontrowersji do dziś). Jednak udostępnienie płatnych i bezpłatnych wersji narzędzi operujących różnymi postaciami sztucznej inteligencji, takimi jak choćby ChatGPT, sprawiło, że szok przyszłości dotarł także tu. Pojawiają się już artykuły naukowe, w których znaczna część treści została nie tyle napisana, co wygenerowana, a jednocześnie nie ma jeszcze narzędzi, które umożliwiałyby z wysoką skutecznością odróżnianie takich treści od tych napisanych przez człowieka od A do Z. Przede wszystkim zaś panuje głęboka konfuzja co do tego, jak odnieść się do tego zjawiska na poziomie wartości i wypływających z nich ogólnych reguł, szczególnie etycznych. Podczas ich omawiania będę posługiwał się ogólnym sformułowaniem „narzędzia SI”, w literaturze przedmiotu często spotykane jest pojęcie dużych modeli językowych (large language models – LLMs), ale nie chcę posługiwać się fachową terminologią, nie mając pewności, że używam jej poprawnie.

SI jako podmiot?

Najważniejsza kontrowersja związana jest z zagadnieniem autorstwa: jeśli jakaś część artykułu została wygenerowana przez narzędzie SI (i potem ewentualnie jedynie nieznacznie zmieniona przez ludzi), to czy narzędzie (np. ChatGPT) można traktować jako współautora na równi z „białkowymi” autorami? Na tym etapie debaty wydaje się dominować pogląd, że nie, gdyż autorstwo jest również kategorią prawną i wiąże się z odpowiedzialnością za własne działania, zarówno naukową, prawną, jak i moralną (po angielsku używane są tu pojęcia responsibility i accountability o innych zakresach znaczeń, to drugie oznacza przede wszystkim odpowiedzialność w rozumieniu prawnym). Tymczasem narzędzia nie można pociągnąć do odpowiedzialności, gdyż nie jest ono samoświadome, a zatem nie jest w stanie kierować swoim postępowaniem i odpowiadać za swoje czyny (z tego m.in. powodu istnieją kategorie osób, którym nikt nie odmawia bycia ludźmi, ale których nie można pociągnąć do odpowiedzialności ani karnej, ani cywilnej). Jest to rzecz jasna problem filozoficzny, przed którym prędzej czy później nasza cywilizacja stanie w różnych kontekstach: czy SI może być samoświadoma, a zatem czy może być podmiotem, w tym moralnym?

Z tego samego powodu kwestionowane jest też podawanie informacji o korzystaniu z pomocy narzędzia lub narzędzi SI w podziękowaniach (acknowledgements), gdyż pojawienie się w takim miejscu pracy naukowej również oznacza jakiś zakres odpowiedzialności za jej kształt, choć daleko mniejszy niż w przypadku współautorów. Czasem wysuwany jest argument, że za współautorów lub odbiorców podziękowań mogą być uznawane instytucje, ale taka analogia jest bardzo powierzchowna, gdyż instytucje mogą mieć osobowość prawną (a zatem można je pociągnąć do odpowiedzialności), a ponadto nie są abstrakcjami, ale grupami ludzi, którzy ponoszą odpowiedzialność zespołowo lub indywidualnie. Ryzykowne jest także sugerowanie, by informację o użyciu narzędzia SI umieszczać w odniesieniach bibliograficznych, gdyż istotą pozycji piśmiennictwa jest możliwość odnalezienia (w formie elektronicznej lub papierowej) treści, na którą powołuje się autor – takie narzędzia nie są stabilnym źródłem, a sama informacja o użyciu narzędzia bez szczegółów nic nie mówi i nie umożliwia żadnej weryfikacji. American Psychological Association (APA) opublikowało już wskazówki, jak powoływać w piśmiennictwie ChatGPT (ogólnie: podobnie jak oprogramowanie), być może z czasem bardziej popularne narzędzia SI doczekają się takich regulacji, a sposób notacji bibliograficznej do nich się odnoszący upowszechni się.

Chodzi o to, by uniemożliwić sytuację, w której autor artykułu spycha odpowiedzialność na narzędzie i powstaje rodzaj luki prawnej, gdyż od narzędzia nie uzyskamy wyjaśnień (przynajmniej na tym etapie rozwoju SI). Niedopuszczalne jest także, by autorzy traktowali narzędzia SI jako rodzaj „czarnej skrzynki”, którą karmimy danymi, ona coś generuje, a my nie wiemy, skąd dokładnie wziął się rezultat, gdyż takie postępowanie zaprzeczałoby innej ważnej kategorii w nauce: możliwości powtórzenia tej samej sekwencji czynności w tych samych warunkach i sprawdzenia, czy da to takie same lub przynajmniej zbliżone rezultaty. Tymczasem narzędzia SI cały czas ewoluują i nie ma żadnej pewności, że po kilku miesiącach efekt będzie porównywalny.

Można zabronić, ale…

Nie chcę wchodzić w te problemy głębiej, rozważam je z punktu widzenia redaktora, a zatem mając na uwadze politykę, jaką powinna przyjąć redakcja czasopisma naukowego wobec fenomenu narzędzi SI stosowanych na różnych etapach powstawania pracy naukowej. Ujmując rzecz ogólnie, możliwe są cztery podejścia:

– zakazać w wytycznych dla autorów generowania tekstu za pomocą narzędzi SI (przy umożliwieniu stosowania SI na wcześniejszych etapach; w kwestii użycia SI w trakcie samych badań wypowiadać się mogą specjaliści w danej dziedzinie, nie redaktorzy);

– zezwolić na uznawanie narzędzi SI za współautorów;

– wymagać umieszczania informacji o użyciu narzędzia SI w podziękowaniach;

– wymagać zamieszczania takiej informacji w precyzyjnie wskazanej sekcji artykułu (np. Material and methods lub Ethical considerations).

Pierwsza możliwość pozwala nie zastanawiać się (przynajmniej na razie) nad dalszymi implikacjami problemu, ale dostępne narzędzia weryfikacji oryginalności tekstów nie wykryją, że danego fragmentu nie napisał człowiek (o ile narzędzie SI nie wykorzysta słowo w słowo fragmentu materiałów, do których ma dostęp), a naprawdę skutecznych narzędzi wykrywających takie pochodzenie tekstu jak dotąd nie ma (choć niektóre są tak reklamowane). Można zatem zabronić, ale nie będzie możliwości wyegzekwowania takiego zakazu, a może to prowadzić do rozwijania przez mniej uczciwych autorów technik maskowania udziału SI. Natomiast ostatnia opcja wymaga przede wszystkim precyzyjnego zdefiniowania: o jakie zastosowania narzędzi SI chodzi, w jakim stałym miejscu w artykule o ustalonej strukturze ma się znaleźć ta informacja oraz co konkretnie należy ujawnić, czyli np. do czego użyto SI, nazwę narzędzia i jego wersję oraz dokładną datę zastosowania (z uwagi na szybką ewolucję takich narzędzi).

Ostatni punkt prowokuje jednak kolejne pytanie: Jak szczegółowych informacji wymagać? Różnorodność narzędzi SI sprawia, że te same dane będzie można podać w odniesieniu do niektórych, a przy innych już nie. Warto też mieć na uwadze możliwości autorów – muszą to być informacje, do których ma dostęp zwykły użytkownik danego narzędzia. Pozostaje rzecz jasna pytanie, co redaktor ma potem z taką informacją zrobić. Nie wypracowano jak dotąd kryteriów, które pozwalałyby transparentnie podejmować decyzje, jakie zastosowanie narzędzi SI jest dopuszczalne, a jakie stanowi już profesjonalne i/lub etyczne nadużycie. Proste zabranianie jest przeciwskuteczne i takie kryteria trzeba będzie sformułować, podobnie jak organizacje takie jak COPE (Committee on Publication Ethics) wypracowują uniwersalne kryteria etyczne w publikowaniu naukowym, wciąż je doprecyzowując i dostosowując do zmian w świecie nauki.

SI zamiast nauki angielskiego

W publikacjach na temat zastosowania narzędzi SI przy tworzeniu publikacji naukowych pojawia się jednak jeden argument, który mnie osobiście – jako redaktora – bardzo niepokoi. Regularnie powtarzana jest teza, że możliwość generowania tekstu za pomocą takich narzędzi umożliwi pełniejsze uczestnictwo w światowym obiegu naukowym badaczom nieznającym biegle angielskiego. Przede wszystkim należałoby tu odróżnić, czy mówimy o narzędziach sprawdzających poprawność gramatyczną i leksykalną anglojęzycznego tekstu, czy o tych, które do pewnego stopnia napiszą niektóre partie pracy za autora, który będzie modyfikował tak wytworzony tekst, a nie pisał go w takim sensie, w jakim ja piszę teraz ten artykuł. Ta pierwsza możliwość to ważne ułatwienie, choć i ono pociąga za sobą pewne pułapki (o czym niżej). Druga opcja zaś związana jest z niebezpieczeństwem, jakie pociągają za sobą wszelkie sztuczne ułatwienia: jeśli są źle pomyślane, będą utrwalać braki, które mają kompensować, a nie zawsze jest możliwość funkcjonowania w odpowiednio zaaranżowanym środowisku, gdzie poziom wymagań jest dostosowany do poziomu naszych umiejętności. Autor, który zbyt ekstensywnie będzie korzystać z narzędzi SI zamiast nauki angielskiego, a nie oprócz takiej nauki, nie będzie potem w stanie choćby poprawiać błędów w swoim tekście, które mu wskażę, gdyż tego narzędzie SI może już za niego nie zrobić. Jest to sytuacja podobna do tej, gdy autorzy zlecają różne aspekty powstawania ich artykułu zewnętrznym podmiotom, jednak usługa nie obejmuje swoistej rękojmi, czyli współpracy we wprowadzaniu poprawek recenzentów czy redaktorów językowych. Najczęściej chodzi tu albo o korzystanie z usług zewnętrznych statystyków, albo z oferty firm zajmujących się scientific writing. Gdy redaktor statystyczny lub językowy żądają poprawek, okazuje się, że autor nie umie ich wprowadzić albo nawet nie rozumie ich treści.

Jeśli artykuł jest napisany poprawną, choć nieidealną angielszczyzną, a autor komunikuje się ze mną angielszczyzną nieporadną, często na granicy zrozumiałości, jest to dowód braku wyobraźni lub orientacji w mechanizmach publikowania w czasopismach naukowych. Nie można zakładać, że przygotujemy daną pracę, także pod względem językowym, tak dobrze, że nie będzie wymagała żadnych istotnych korekt. Na tym etapie ich rozwoju żadne narzędzia SI takiego tekstu nie wygenerują. To, że istnieją narzędzia SI, z którymi możemy komunikować się w języku naturalnym (angielskim lub innym), nie znaczy, że sami możemy zaniedbywać naukę języków naturalnych i staranne z nich korzystanie. Użyję teraz sfomułowania dość kategorycznego, ale precyzyjnie oddaje ono to, co chcę wyrazić: nadal nie ma ucieczki przed nauką języków obcych i jeszcze długo nie będzie. Aplikacje rozpoznające mowę i tłumaczące ją, bezpłatne i płatne translatory dostępne w Internecie czy wreszcie narzędzia SI mogą nas wspomóc, ale prawdziwe komunikowanie się w innym języku naturalnym wymaga jego dobrej znajomości, gdyż tylko wtedy będziemy rozumieć wieloznaczności, niepełną odpowiedniość wyrazów i wyrażeń w różnych językach czy konteksty kulturowe. Nic nie zwolni nas z rozumienia tekstu, który tworzymy, nawet jeśli częściowo go piszemy, a częściowo generujemy. Jeśli nie rozumiemy w stu procentach tego, pod czym się podpisujemy, to zarówno responsibility, jak i accountability stają się równie niepełne, jak nasze rozumienie. Dlatego argumenty, jakoby używanie tego rodzaju narzędzi sprzyjało promowaniu sprawiedliwości (equity) w nauce, uważam za trafne tylko wówczas, gdy chodzi o instrumenty kontrolujące poprawność językową; te zastępujące w pisaniu zniechęcają do rozwijania kompetencji. Trzeba to sobie jasno powiedzieć: dobra znajomość angielskiego, tj. umożliwiająca samodzielne pisanie prac naukowych w tym języku, jest niezbędną umiejętnością u każdego badacza, który chce uczestniczyć w światowym obiegu nauki.

Nie mam temperamentu futurologa i nie wiem, na ile prawdopodobne są wizje nieżyczliwych, że rozwój SI sprawi, iż redaktorzy językowi staną się niepotrzebni, gdyż artykuły naukowe będą pisane, sprawdzane, a częściowo również czytane wyłącznie przez SI. Już teraz rocznie publikowanych jest przecież tyle prac, że wielu z nich nie tylko nikt nie cytuje, ale też najprawdopodobniej nikt nie zapoznaje się z ich treścią. Narzędzia SI mogą pomóc w przygotowaniu artykułu, dopóki jednak to człowiek prowadzi badania, a SI pełni taką lub inną funkcję służebną, odpowiedzialność za kształt tekstu – zarówno merytoryczny, jak i językowy – także musi wziąć na siebie człowiek.

Wróć