logo
FA 11/2023 z laboratoriów

Rozmowa z prof. Piotrem Müldnerem-Nieckowskim, autorem "Wielkiego słownika frazeologicznego języka polskiego"

Od słownika do sztucznej inteligencji

Od słownika do sztucznej inteligencji 1

Piotr Müldner-Nieckowski jest doktorem habilitowanym nauk humanistycznych, językoznawcą, emerytowanym profesorem Uniwersytetu Kardynała Stefana Wyszyńskiego, doktorem nauk medycznych, lekarzem chorób wewnętrznych. Poeta, prozaik, autor dramatów radiowych, wydawca, wiceprezes Stowarzyszenia Pisarzy Polskich. Stały felietonista „Forum Akademickiego”. Fot. Krzysztof Dubiel „Nowe Książki”

We frazeologii wyrazu „niebo” obok możliwych produktów językowych istnieje jednak, według naszego słownika, aż 37 utrwalonych zestawień, frazeologizmów, z wojennym „czystym niebem” ‘czasem bez nalotów bombowych’ na czele. Najprawdopodobniej wszystkie pierwotnie były produktami językowymi, ale ludziom się spodobały i zaczęto ich używać tylko w określonych sytuacjach.

Co zawiera i do czego służy słownik frazeologiczny? Oczywiście wszyscy to wiemy, ale przypomnijmy i uporządkujmy.

Słownik frazeologiczny zawiera istotne utrwalone w języku wielowyrazowe jednostki języka. Nazywamy je związkami frazeologicznymi albo frazeologizmami. Choć są wielowyrazowe, zachowują się nieco podobnie do pojedynczych wyrazów, ale nie tak samo. O ile wyrazy tworzą w języku system, o tyle każdy związek frazeologiczny jest mikrosystemem i do żadnego systemu nie należy.

Nasz słownik zawiera nie tylko wykaz rodzimych albo zapożyczonych wielowyrazowców. Podaje także ich budowę, gramatykę, definicję znaczenia lub znaczeń i sugeruje sposoby użycia w czasie mówienia i (albo) pisania. Zawiera też na wstępie wprowadzenie edukacyjne do frazeologii oraz na końcu potężny indeks, który pozwala znaleźć szukany związek wyrazów.

 

W słowniku przedstawiamy wielowyrazowce, które są używane przez większość Polaków i w języku dzisiejszym, mniej więcej do 20 lat wstecz. Frazeologizmy są tworzone przez użytkowników każdego języka na Ziemi, wciąż ich przybywa, ale wiele z nich się starzeje i zanika. Są też takie, które mają nawet po kilka tysięcy lat, na przykład biblijne, mitologiczne, naukowe, literackie. Andrzej Bogusławski ocenia, że w języku polskim jest ponad 5 milionów takich trwałych połączeń wyrazowych, które znajdują się w pamięci ludzi, w tekstach i nagraniach mowy, z tym że na co dzień w Polsce w użyciu jest ich – według z kolei moich obliczeń – nieco ponad 200 tysięcy, dokładnie 207. Oczywiście jest to suma ogólna, przeciętny Polak czynnie posługuje się, pisze i mówi, może tysiącem, może dwoma tysiącami, a dobrze wykształcony i oczytany zna sens, choć niekoniecznie użyje w piśmie czy mowie, do kilkunastu tysięcy frazeologizmów. Wszystkie frazeologizmy zawarte w słowniku są mniej lub bardziej aktualne, chyba że w ich opisie zaznaczono inaczej. Niektóre od czasu do czasu są odświeżane, przywracane do życia, bo ktoś może po nie sięga, a inny podchwyci ten ruch i też zastosuje. Jest też pewna liczba takich, które są używane rzadko, ale wciąż ktoś z nich korzysta. Ze względu na ograniczone miejsce w książce musieliśmy pominąć wielowyrazowce gwarowe, naukowe, środowiskowe, zawodowe, specjalistyczne.

Ciekaw jestem przykładów takich frazeologizmów, które powstały w ciągu ostatnich dwudziestu lat.

W oczy zawsze rzucają się elementy zapożyczone, zwłaszcza takie, które na wzór „weekendu” ‘końcowe dni tygodnia’, zaakceptowanego w latach 40. XX w. przez Witolda Doroszewskiego, zachowują nie tylko swoją ortografię, ale i wymowę. Do nich, zupełnie nowych w języku polskim ogólnym, należy „fake news” ‘fałszywa, kłamliwa informacja, szczególnie prasowa’. Jest trochę związków dodanych do polszczyzny przez przybyszów, imigrantów i przedstawicieli obcych firm, na przykład „ktoś oddaje fartucha” ‘rezygnuje z pełnionej funkcji, granej roli itp.’. Jest sporo takich, które się pojawiły jako dopełnienie zasobów dosadnego słownictwa, zwłaszcza w prasie i telewizji, w reklamie, na przykład „szału nie ma” ‘nic ciekawego, nic zaskakującego’, i jeszcze kilkudziesięciu podobnych, w tym na przykład obsceniczny zwrot „stawiać klocek” ‘wypróżniać się’. Zwraca uwagę to, że brzmi on i działa na odbiorcę mocniej niż dotychczasowe wulgarne „srać”, którego dosadność wyraźnie się stępiła, szczególnie po celebryckich wystąpieniach pewnej zadufanej w sobie aktorki. Podobnie zaskakujące obraźliwością było wyrażenie „moherowe berety”, użyte przez pewnego czołowego polityka, a dyskredytujące ogół kobiet, mimo że pierwotnie zostało zaadresowane do kobiet nieumiejących się ubrać, nieciekawych fizycznie i słabo wykształconych. Interesujące są zapożyczone przez język ogólny wyrażenia z języka medycznego typu „objaw kliniczny” ‘budzące zastrzeżenia zdarzenie lub czyjeś zachowanie’ i „przypadek kliniczny” ‘coś co, zasługuje na pochwałę’, ale i odwrotnie, bo w pewnych kontekstach znaczące ‘coś gorszącego, zasługującego na potępienie’. Z zasobów leksykalnych zawodowych, na przykład z techniki, pochodzą też takie frazeologizmy jak zwrot, który stopniowo rozpowszechniał się od lat 70. „jechać na oparach” ‘być bardzo zmęczonym, pracować ostatkiem sił’, i w ogóle „na oparach” ‘bez koniecznej energii’. W latach 2002-2003 karierę zaczęło robić ciekawe wyrażenie „dzień konia”, istniejące dawniej, ale w uśpieniu, a mające dziś aż trzy różne znaczenia, odróżnialne na podstawie kontekstu: ‘czas powodzenia, szczęścia’, ‘czas posiadania zwiększonej mocy, wydajności’, ‘czas wykonywania wymuszonej ciężkiej pracy’. Zdarzają się też nawroty do bardzo dawnej frazeologii. I tak dzisiejsze, przeważnie żartobliwe „lekce sobie ważyć” albo „lekko sobie ważyć coś” przez kilka wieków istniało w postaci zrostu „lekceważyć coś”. Spotyka się też liczne zmiany lub odmiany znaczeń albo nadawanie znaczeń, których pewne frazeologizmy wcześniej nie miały. Materiał gigantyczny, tak jak i twórcza aktywność językowa Polaków.

Pierwsze wydanie Wielkiego słownika frazeologicznego języka polskiego ukazało się dwadzieścia lat temu. Czym różni się od niego drugie wydanie?

Przede wszystkim zastosowaliśmy ulepszony sposób podawania treści, bardziej jednolity, przyjazny i w pełni uzasadniony naukowo, a po drugie w 80 procentach zmieniliśmy zestawienie, czyli tak zwaną siatkę haseł, ze sporą liczbą frazeologizmów zupełnie nowych. Stare hasła wraz z ich definicjami i sposobami stosowania, które pozostają w wydaniu pierwszym, z obecnego zostały wycofane. Czekają w Bazie na lepsze czasy. Uważa się, że duże zmiany we frazeologii daje się poprawnie ocenić po dwudziestu latach. Różnice językowe widać zatem między mniej więcej dwoma pokoleniami użytkowników. Teraz ten okres jest znacznie krótszy niż przed pojawieniem się Internetu. Świat pędzi do przodu, rozwija się, a wraz z tymi procesami zmieniają się języki. Nowe słowa, nowe sposoby wyrażania myśli, a więc i nowe frazeologizmy. Wraz z odmienioną frazeologią pojawiły się wyniki wieloletnich badań naukowych tej dziedziny leksykologii, także w moim warsztacie językoznawczym. Słownik się temu podporządkował. Stara klasyfikacja frazeologizmów Stanisława Skorupki ostatecznie odeszła do lamusa, a w zamian mamy trzy nowe klasyfikacje, każda systematyzuje inne cechy frazeologii. We „Wstępie” podaję ich brzmienie i zasady rozumienia, co może być przydatne nauczycielom, językoznawcom, kulturo- i literaturoznawcom. W ostatniej przed wydaniem chwili, na prośbę kulturalno-literackich grup użytkowników serwisu społecznościowego LinkedIn, dołączyłem do „Wstępu” bardzo przydatną tabelę ponad 150 wielowyrazowych spójników, przed którymi stawiamy przecinek, na przykład „mimo że”, „tak jak” czy „i to”. To taki rodzaj wiedzy z lekka tajemnej, bo Polska wciąż ma kłopoty z przecinkami.

Jako redaktor tekstów wiem coś o tym. Czy jest możliwy język bez frazeologii? Co daje językowi frazeologia?

Nie można się bez niej obejść już na poziomie czynności codziennych, w tak zwanym normalnym życiu, nie mówiąc o literaturze pięknej i innych sztukach, o nauce i edukacji, o praktyce zawodowej, a także o dużych systemach nazewniczych i czynnościowych, takich jak na przykład technika czy medycyna. Kto nie zna albo nie rozumie frazeologii w zakresie swojego działania, ten nie zna danego języka i wobec tego nie może za jego pomocą działać, jeśli musi mówić albo pisać. Ale też i myśleć, myślenie bez jakiegoś języka jest niemożliwe. To wynika z definicji myślenia. Trzeba ponadto wiedzieć, jak się trwałych połączeń wyrazowych używa i co znaczą, jaka jest ich definicja i gramatyka. Trzeba pamiętać, że ich wyrazy składowe nader często zmieniają swój sens i zupełnie nie dają informacji o sensie takiego wypowiedzenia. Nazywam je wyrazami uwięzionymi, bo zmieniają swoją „osobowość” jak więźniowie. Więzieniem dla nich są granice frazeologizmów. Na przykład „biały kruk”, nie jest ani krukiem, ani czymś białym, ani tym bardziej białym krukiem, tylko ‘rzadko spotykanym egzemplarzem książki lub innym cennym lub szlachetnym przedmiotem’. Istnieje spora grupa ok. 3,5 tysiąca często używanych związków frazeologicznych, których sensu nie można się domyślić nawet z kontekstu, czyli ze zdania lub akapitu. Trzeba się z każdym przynajmniej raz w życiu zetknąć i zapamiętać jego sens, definicję, sposób użycia.

Trwa spór językoznawców o poszczególne jednostki języka – są czy nie są frazeologizmami. Dlaczego „składać rymy”, „składać samokrytykę” to frazeologizmy, a „składać komputer” czy też „składać obrus” już nie?

To trudne zagadnienie, często rozwiązywalne dopiero na podstawie analiz licznych użyć danej jednostki. Kłopot polega na tym, że o ile wyrazy tworzą system słownictwa, powtarzam: system, o tyle związki frazeologiczne do żadnego systemu nie należą. Same są mikrosystemami, takimi systemikami, każdy frazeologizm z osobna.

Istnieje jednak solidna definicja związku frazeologicznego, która wszystko jasno precyzuje. Zasada, którą sformułowałem między innymi dzięki współpracy z Wojciechem Chlebdą, mówi, że związkiem frazeologicznym, to znaczy utrwalonym w języku połączeniem wyrazów, jest figura złożona z co najmniej dwóch wyrazów, zapamiętywalna jako związek mający zdolność oznaczania określonego znaczenia, ale który do ujawnienia swojego znaczenia wymaga zawsze określonych okoliczności. W takiej sytuacji powinna to być figura, której znaczenie daje się odtworzyć z pamięci przez odbiorcę i jest zrozumiałe dla niego na podstawie kontekstu, otoczenia tekstowego lub sytuacji mownej, w której w danym momencie jest użyta.

Istnieją gotowe frazeologizmy jako zdania albo zdania okrojone lub równoważniki zdań. Nazywamy je wtedy frazami. Na przykład „Klamka zapadła.”, „Jakoś to będzie.”, „Odpukać w niemalowane drewno”, „Otóż to!”, „Wyszło szydło z worka.” – to przykładowe frazy.

Jednak zdecydowana większość to tylko zwroty – formy czasownikowe, i wyrażenia – pozostałe. Są to półprodukty, w dodatku zmetaforyzowane częściowo, całkowicie lub nawet pozbawione przenośni, dosłowne – ale utrwalone jako jednostki języka. Można z nich korzystać w budowaniu wypowiedzi niczym z gotowca, choć czasem wymagającego jeszcze jakiejś obróbki.

Ważne jest, aby odróżniać takie formy od, jak to nazywają Andrzej Bogusławski, Andrzej Maria Lewicki czy Anna Pajdzińska, zwykłych produktów językowych, które nie istnieją w zasobach języka jako związek, i dopiero w trakcie budowania zdania zostają utworzone z wyrazów zestawianych jeden po drugim jako zestrojenie dwóch lub więcej nośników sensu. Aby uzyskać produkt językowy niebędący frazeologizmem, ale wyznaczający w wypowiedzi jedno istotne znaczenie złożone, na przykład „ojciec językoznawstwa” ‘ktoś, kto zapoczątkował istnienie językoznawstwa’, zestawiamy wyrazy „ojciec” ‘ktoś, kto daje życie’ i „językoznawstwo” ‘dziedzina nauki i wiedzy o języku’. Zwykle jeden z tych składników jest kompletnie dowolny i dobiera się go z dużej liczby możliwych jako określenie tego drugiego. Wybieramy wyraz „językoznawstwo” na dookreślenie, doprecyzowanie sensu wyrazu „ojciec”. Na poczekaniu utworzyliśmy sensowny dwuwyraz, ale nie frazeologizm, bo ojców czegokolwiek mogą być i są miliony.

Inny przykład: „niebo” – może być jasne, niebieskie, białe, granatowe, czerwone i jeszcze jakieś inne, i to w dziesiątkach możliwych zestrojeń doraźnych. I są to tylko produkty językowe, dowolne, utworzone dla jednej jedynej sytuacji wypowiedzeniowej. We frazeologii wyrazu „niebo” obok możliwych produktów językowych istnieje jednak, według naszego słownika, aż 37 utrwalonych zestawień, frazeologizmów, z wojennym „czystym niebem” ‘czasem bez nalotów bombowych’ na czele. Najprawdopodobniej wszystkie pierwotnie były produktami językowymi, ale ludziom się spodobały i zaczęto ich używać tylko w określonych sytuacjach.

Frazeologizmy mają charakter, jak to nazywał Edmund Husserl, „wyrażeń okazjonalnych” albo „potencjalnie nazywających”, to znaczy takich, które same w sobie nic nie znaczą i są tylko materiałem słownikowym, a ich znaczenie pojawia się dopiero w związku z okazją, a więc wtedy, gdy znajdują się w określonym kontekście. I to kontekst, albo jeszcze lepiej: sytuacja zaplanowania i użycia przez piszącego lub mówiącego decyduje, czy mamy do czynienia z „czarną owcą” ‘owcą o czarnej sierści’, czy z „czarną owcą” ‘osobnikiem, który kompromituje swoje środowisko’. A więc kontekst. A więc pragmatyka, użycie, sposób wstawienia do wypowiedzi, okoliczność użycia, a nawet cel wypowiadania się. Jeśli w cytacie widzę zależność znaczenia jakiegoś połączenia wyrazów od tego, co w tym tekście się znajduje, to kwalifikuję to połączenie do badań jako potencjalny związek frazeologiczny.

Czym jest Baza danych frazeologii polskiej?

To wyspecjalizowany zbiór samych związków frazeologicznych, następnie jednej, dwóch, a jeśli istnieją, to trzech definicji, a zdarza się, że nawet pięciu, które są im przypisywane przez język. Słownik następnie zawiera zestawienia obrobionych przez nas cytatów, które pokazują sposoby użycia związków frazeologicznych i źródeł ich pochodzenia, w tym danych co do przyczyn i okoliczności powstania danego związku, jeśli udało się to stwierdzić. Wreszcie słownik za pomocą kwalifikatorów podaje potężny aparat leksykologiczny z danymi co do statusu użytkowego każdej jednostki, zgodny z uznanymi klasyfikacjami. Jest to efekt, jak obliczam, 48 lat pracy naukowej nad frazeologią, od około 1975 roku, kiedy zauważyłem, że mam w biblioteczce już kilka pudeł z kartonikami, na których robiłem wypisy z czytanych tekstów. To była moja pierwsza baza. Potem przeniosłem ją na dziecięcy komputerek ZX Spectrum, co zajęło mi pół roku, potem na komputer Amiga, co już poszło szybciej, wreszcie na solidny IBM i zaczęło się pisanie oprogramowania tej bazy. Wtedy włączył się mój syn, który szybko stał się lepszy ode mnie w zakresie informatyki. Był to rok 1996. Baza wraz z oprogramowaniem jej obsługi już wtedy stawała się solidnym pierwowzorem dzisiejszego molocha, do którego dostęp pod adresem frazologia.pl mają tysiące użytkowników Internetu. Aż pewnego dnia mój przyjaciel, też profesor, Andrzej Dąbrówka, inicjator i współautor słynnych dzieł: Słownika synonimów, Słownika antonimów i Słownika stylistycznego, namówił mnie, abym pomyślał o książkowym wydaniu tej bazy, najlepiej w „Świecie Książki” firmy Bertelsmann Media, gdzie pod koniec lat 90. powstawała subredakcja leksykografii. I tak nasza baza w 2003 roku się zmaterializowała w postaci papierowej.

Interesuje mnie aspekt poprawnościowy słownika – w hasłach pojawia się znaczek „zakaz wjazdu”. O czym on informuje?

W pewnym momencie prac nad słownikiem zauważyłem w bazie sporą liczbę frazeologizmów błędnie pisanych lub wymawianych, i to zarówno co do formy, jak i znaczenia, sensu. Początkowo uznałem, że nie są materiałem słownikowym, ale kiedy zaczęli mnie o nie nagabywać studenci, pisarze, dziennikarze, koledzy naukowcy, i kiedy sam sobie uświadomiłem, z jaką niechęcią reaguję na różne niepoprawne wypowiedzi znanych ludzi w mediach, także nauczycieli, lekarzy, handlowców, techników, sportowców, polegające na bezkrytycznie niepoprawnym stosowaniu znanych form wielowyrazowych – musiałem zareagować. Do dziś, kiedy słyszę „potępiać w czambuł dyrektora” albo „…ustawę”, gdy przecież potępiać w czambuł nie można jednostki, ale tylko grupę ludzi lub rzeczy, czuję się nieswojo. Czambuł to tatarski oddział wojskowy. Pewnego dnia uruchomiłem tę archiwalną część bazy danych, która zawiera buble frazeologiczne, czyli związki wyrazowe zwichrowane, uszkodzone, okaleczone lub źle używane, i wstawiłem do słownika z ostrzegającym znaczkiem „zakaz wjazdu”, ale także z poradą językową. W ten sposób słownik stał się w znacznym stopniu podręcznikiem poprawności frazeologicznej w polszczyźnie. Nie ukrywam, że jeśli wiedziałem, że jakieś wyrażenie jest często kaleczone albo niewłaściwie stosowane, to także tu ostrzegawczo, już nie z cytatów, ale pobierając z własnej świadomości językowej, dodawałem owe skaleczenia obok jednostki poprawnej, opatrując zakazującym znaczkiem. Poprawność też jest sygnalizowana za pomocą kwalifikatorów, które objaśniają zakres użycia. Obecność tych wstawek i objaśnień już w pierwszym wydaniu z 2003 toku, a szczególnie w słowniku dla szkół, wydanym w 2004, cieszyła się bardzo dobrą opinią i oba dzieła były chwalone właśnie między innymi za to.

Jakiego typu błędy frazeologiczne popełniamy najczęściej, mówiąc i pisząc po polsku?

Och, jest cała litania znanych typów różnych przewinień. Stanisław Bąba podał swego czasu solidny wykaz możliwych innowacji, czyli nowotworów językowych, który na podstawie swoich badań uzupełniłem o następne warianty jednostek poprawnych i niepoprawnych, a więc trafnych i niesłusznych, i jest ich aż dwanaście klas głównych. Są wśród nich ciekawe pochodne form pierwotnych, ale i rozmaite przekręcenia, użycia niewłaściwych wyrazów składowych, zastosowanie w niewłaściwym znaczeniu albo w nieodpowiedniej sytuacji. Nawet zgranie frazeologizmu ze stylem wypowiedzi jest ważne. Użycie wielowyrazowca potocznego w tekście uroczystym i pompatycznym, na przykład w przemówieniu powitalnym, też jest błędem, i to nieraz rażącym i kompromitującym. W słowniku każda jednostka została oznaczona stylistycznie. Jeśli przy którejś nie ma kwalifikatora stylistycznego, to znaczy, że należy ona do stylu starannego naturalnego, zrównoważonego, w każdej sytuacji właściwego. Najwięcej jest jednak frazeologizmów potocznych, w moim materiale jakieś 70 procent, a to powoduje, że łatwo o ich nieostrożne użycie w mowie kierowanej do osoby, której należy się szacunek i której w dodatku nie zna się dobrze. Takie zachowanie językowe może być odebrane jako niegrzeczność albo wręcz ordynarność, nieokrzesanie. Na przykład powiedzenie do starszej, dostojnej, o zadbanym wyglądzie pani, że „jej mąż obudził się z ręką w nocniku”, osoba ta słusznie może uznać za przejaw chamstwa. Lepiej byłoby powiedzieć, że „mąż przeoczył odpowiedni moment”.

Od słownika do sztucznej inteligencji 2We wstępie do słownika napotkamy wskazówkę, aby szukać najpierw w indeksie, dopiero potem kierować się jego wskazaniami i szukać w odpowiednich gniazdach. Weźmy frazeologizm „mieć coś z tyłu głowy”. Gdzie znajdziemy takie hasło: w gnieździe „mieć”, gnieździe „tył” czy „głowa”?

To ważny problem, dużo ważniejszy niż się na pozór wydaje. Chodzi nie tylko o wyszukiwanie w słowniku, ale o coś więcej. O tym jednak za chwilę, najpierw o szukaniu. Zastosowałem gromadzenie haseł w gniazdach, w których artykuły hasłowe są ułożone alfabetycznie i ponumerowane. Nazwa gniazda wynika z konstrukcji haseł. Każde ma wyraz główny, który jest określany, i składnik lub składniki określające. Hasło powinno się więc znaleźć w gnieździe o nazwie, która jest w nim składnikiem głównym, tym określanym przez pozostałe wyrazy składowe frazy, zwrotu lub wyrażenia.

Dla dobrego analityka znaczeń i sensów jest oczywiste, że na przykład w zwrocie „obiecywać gruszki na wierzbie” wyrazem określanym są „gruszki”, i to one są dominantą semantyczną, tą istotną rzeczą, która jest lub nie jest obiecywana, i to one, te gruszki, są na wierzbie, a nie odwrotnie. Zwrot ten należy więc do gniazda „gruszka”.

W wypadku zwrotu „mieć coś z tyłu głowy” nieporównanie częstszą formą, a przez niektórych uważaną za jedyną frazeologiczną, jest „mieć coś w tyle głowy”. Ta pierwsza jest przeważnie traktowana jako zwykłe zestawienie wyrazów, a nie związek frazeologiczny. Mówią, że z tyłu głowy można mieć wszystko, czapkę, warkocz, kokardę i tak dalej, ale w tyle już tylko coś, co ma dla danej osoby duże znaczenie, a poza tym w tyle głowy znajduje się mózg ze swoimi mechanizmami pamięci, a z tyłu głowy są głównie włosy. Oczywiście w obu tych ciągach wyrazów dominantą jest „głowa”, a więc znajdą się w gnieździe „głowa”, a w indeksie należy szukać słówka „tył”, przy nim na pewno jest nazwa gniazda „głowa” i numery, pod którymi są szukane artykuły hasłowe, w tym wypadku akurat 134,173. Wniosek? Szukaj pan w gnieździe „głowa” pod tymi właśnie numerami!

A teraz ta zapowiadana ważniejsza informacja. Proszę zauważyć, że dzięki temu postępowaniu uzyskujemy dostęp do segmentów znaczeń frazeologicznych, które dotychczas były niewidoczne. Obecnie znajdują się w swego rodzaju przestrzeni semantycznej, znaczeniowej, między indeksem a tekstem artykułów hasłowych. Uważny użytkownik słownika wyczuwa to natychmiast już teraz. Dla słabszych przygotowuję metodę, która pozwoli uruchamiać potrzebną intuicję językową nawet osobom gorzej przygotowanym.

Podobno powstaje nowa wersja słownika.

No właśnie. Obecny słownik jest kolejnym etapem rozwoju mojej frazeologii jako nauki, ale nie ostatnim. W jego indeksie znajdują się w porządku alfabetycznym tylko składniki samych związków frazeologicznych. Ale w przyszłym, ulepszonym słowniku ma być dużo więcej i mądrzej. Po wydaniu obecnej wersji słownika przystąpiłem bowiem do kolejnej nowej pracy nad Bazą frazeologiczną. Zacząłem wprowadzać indeksację opartą na fuzzynimii, silnej tak zwanej relacji znaczeniowej, lecz wynikającej nie bezpośrednio ze znaczeń wyrazów czy nawet frazeologizmów, ale z innych parametrów. Biorę pod uwagę na przykład także relacje takie jak hiperonimia, holonimia, synonimia i quasi-synonimia, ale także około 200 innych parametrów oraz to, że każdy frazeologizm w tekście czy wypowiedzi ustnej znajduje się w ściśle określonym kontekście, w specyficznej sytuacji logicznej i pojęciowej okołomownej. Łącznie z logiką rozmytą i nieostrością pól znaczeń.

Czy badania frazeologiczne mogą pomóc w udoskonaleniu sztucznej inteligencji?

Kiedy przedstawiałem to zagadnienie na posiedzeniu naukowym Komisji Frazeologicznej Komitetu Językoznawstwa PAN, widziałem, że wywołuję spore zainteresowanie połączone z jakimś zaskoczeniem, a potem rozszalały się telefony i e-maile od osób, które w mojej relacji z badań dostrzegły szansę dla sztucznej inteligencji. AI ma bowiem poważne problemy translatorskie, a to z powodu braku istnienia słownika prawdziwie semantycznego, to jest takiego z właściwym semantyce zakresem znaczeń i zatartymi granicami pól znaczeniowych, ich zachodzeniem na siebie. Dodam, że istnieją, na przykład na Politechnikach Warszawskiej i Wrocławskiej, zaawansowane próby tworzenia takiego materiału semantycznego, opartego na różnych relacjach śródtekstowych i nie tylko. Ciekawe, fascynujące, ale nieskuteczne w leksykografii. Kilka już zaniechano, inne brną w zaułek…

Więc AI ze względu na skomplikowanie frazeologii, niestanowiącej żadnego systemu, kompletnie niejednolitej, nie daje sobie rady z przekładaniem tekstów na języki obce. Dotyczy to wszystkich języków świata. Ale może dzięki mojej metodzie AI nauczy się poprawnego, kongenialnego tłumaczenia? Nie wystarczają gotowe schematy tłumaczeń konkretnych wariantów tekstowych, w tym deszyfracji frazeologizmów i ich użycia, a w tym także celów i skutków użycia, zgodnie z teorią wypowiedzi oraz teorią aktów mowy, zwłaszcza z illokucją i perlokucją. Nie powinienem jeszcze podawać żadnych informacji co do samej metody, ale na podstawie różnych eksperymentów mogę zapewnić, że to już ma prawo działać, a w dodatku może być przedmiotem bardzo szybkiego algorytmu.

Niestety Narodowe Centrum Nauki dwukrotnie, i to pod dziwacznym pretekstem, odmówiło mi dotacji, wobec czego muszę się tym zajmować sam, bez zespołu, i prace posuwają się zbyt wolno. Lat życia mi ubywa. Ale może zdążę. Za pomocą pewnych precyzujących technik muszę strukturalnie i pojęciowo opracowywać wspomniane parametry, których wykaz przedstawiałem na kilku już konferencjach i zjazdach naukowych, to znaczy sprawdzać przydawane im definicje i funkcje, a następnie po uzyskaniu bazy ich cech i przygotowaniu instrukcji stosowania, konfrontować w słowniku. Kilka lat codziennej pracy, ale skorzystają na tym użytkownicy następnego wydania.

Rozmawiał Grzegorz Filip

Wróć