Teraźniejszość i przyszłość bibliografii językoznawstwa slawistycznego

W końcu 1993 roku, po 11-letniej przerwie w publikacji bibliografii, prace nad nią zostały wznowione w Centrum Slawistycznej Informacji Naukowej Instytutu Slawistyki PAN. Głównym celem prac, prowadzonych przy wsparciu organizacyjnym Towarzystwa Naukowego Warszawskiego, jest przekształcenie tradycyjnej bibliografii w nowoczesny system informacyjno-wyszukiwawczy. W celu jak najszybszego dostarczenia użytkownikom, głównie slawistom, informacji niezbędnej w ich pracy, a jednocześnie unowocześnienia systemu informacyjno-wyszukiwawczego zdecydowano, że na pierwszym etapie działań będzie tworzona dokumentacyjna baza danych obsługiwana przez autonomiczny system SYBISLAW (System Bibliografii Slawistycznej) oraz publikowana jako samoistne wydawnictwo seryjne pochodna tej bazy - tradycyjna bibliografia.

SYBISLAW nie pretenduje do pełnienia funkcji docelowego oprogramowania. Z założenia miał umożliwić tworzenie i rozbudowę dokumentacyjnej bazy danych w oparciu o istniejący język informacyjno-wyszukiwawczy układu klasyfikacyjnego, a także dzięki specjalnemu podprogramowi wydawniczemu miał pomóc w publikacji bibliografii. SYBISLAW pozwala wyszukiwać informacje we wszystkich polach opisu formalnego, według dowolnie wybranych cech formalnych, takich jak tytuł, odpowiedzialność, język dokumentu. Możliwe jest także wyszukiwanie informacji według klas występujących w schemacie klasyfikacyjnym oraz według słów kluczowych.

Baza danych zawiera dane o dokumentach w ich oryginalnych językach. Oznacza to, że opisy bibliograficzne odwzorowują alfabet dokumentów źródłowych, a także dokumentów wtórnych, jakimi są przekłady, we wszystkich językach słowiańskich i innych językach używanych w Europie, a także poza jej granicami.

Ponieważ pochodną bazy danych stanowi postać książkowa bibliografii, jednym z ważniejszych zadań było zaprojektowanie odpowiedniej procedury porządkowania i wyszukiwania dokumentów i danych o tych dokumentach, zapisanych w różnych językach i alfabetach (z czym szczegółowo można zapoznać się w pracy: Z. Rudnik-Karwatowa, Problemy przetwarzania tekstów stosujących różne alfabety: automatyczne porządkowanie i wyszukiwanie informacji w bibliograficznej bazie danych, [w:] Język i technologia, Warszawa, 1996).

W opracowanej kilka lat temu wstępnej koncepcji systemu informacji dokumentacyjnej językoznawstwa slawistycznego przyjęto, że istniejący dotychczas system - będący komputerową bazą danych bibliograficznych, z której generowana jest bibliografia w tradycyjnej postaci książkowej - doraźnie odpowiadając potrzebom użytkowników, powinien być sukcesywnie modernizowany i etapowo rozwijany. Stworzenie nowoczesnego systemu nie będzie polegać na prostym przekształceniu istniejącego obecnie, ponieważ ma on zbyt wiele wad (B. Bojar, Z. Rudnik-Karwatowa, Koncepcja nowoczesnego systemu informacji slawistycznej, [w:] Z polskich studiów slawistycznych, seria 9: Językoznawstwo, Warszawa, 1998).

Zasadniczej zmiany wymaga najważniejszy element systemu: język informacyjno-wyszukiwawczy (dalej: jiw), który pełni funkcję metainformacyjną, polegającą na odwzorowaniu informacji o treści i formie dokumentów, oraz funkcję wyszukiwawczą, umożliwiającą użytkownikom wyszukanie informacji.

W dotychczasowym systemie informacyjno-wyszukiwawczym z powodów praktycznych (ze względu na emanację bibliografii w postaci książkowej) używany był język klasyfikacji przedmiotowej. Mimo już przeprowadzonej w systemie skomputeryzowanym modyfikacji, polegającej na wprowadzeniu do klasyfikacji tak istotnych dla językoznawstwa tematów, jak np. semantyka i pragmatyka lingwistyczna, klasyfikacja jest zbyt płytka i nierelewantna w stosunku do obecnego stanu wiedzy. Inną jej wadą jest jednokrotne przypisanie dokumentu ze względu na temat główny do wybranej klasy tematycznej. Arbitralnych rozstrzygnięć w tym względzie nie można uniknąć nawet poprzez wskazanie tematów pobocznych w odsyłaczach znajdujących się na końcu każdego działu tematycznego Bibliografii.

Zakładamy, że docelowym językiem systemu będzie język deskryptorowy o strukturze fasetowej, cechujący się postkoordynacją, polegającą na tym, że każde wyrażenie wchodzące w skład charakterystyki wyszukiwawczej dokumentu może samodzielnie pełnić funkcję wyszukiwawczą, umożliwiając bezpośredni dostęp do zbioru informacyjnego. Dzięki rozbudowanej paradygmatyce, wykorzystującej relacje hierarchiczne i asocjacyjne, język deskryptorowy zapewni wyszukiwanie na relewantnym poziomie głębokości, eliminując szum informacyjny.

Ponadto, ze względu na wygodę użytkowników, którzy samodzielnie będą prowadzić wyszukiwanie w trybie online, a także w celu ułatwienia indeksatorom opracowywania informacji dla systemu, będzie to język o notacji i strukturze naturalnej. Język deskryptorowy będzie prezentowany przez tezaurus wielojęzyczny z dostępem we wszystkich językach słowiańskich, a także - ze względu na konieczność udostępniania informacji w Internecie - w języku angielskim. W pierwszej kolejności będzie tworzony jiw oparty na języku polskim. Wynika to stąd, że system informacyjny językoznawstwa slawistycznego jest inicjatywą polskiego środowiska slawistycznego i jest instytucjonalnie związany z Instytutem Slawistyki PAN. Następnie będą włączane do struktury tworzonego języka ekwiwalenty w języku rosyjskim, jako najszerzej stosowanym w środowisku slawistycznym, i kolejno - w innych językach słowiańskich. W efekcie użytkownicy będą mogli dotrzeć do każdej informacji według dowolnego wyrażenia (w dowolnym języku i alfabecie), w dowolnej strefie opisu, dzięki ustanowieniu klas ekwiwalencji zarówno w obrębie języka opisu formalnego, jak i w języku opisu rzeczowego, w którym również mogą występować te same wyrażenia zapisane w różnych językach i/lub w różnych alfabetach.

Docelowe zadanie będzie realizowane etapowo. Na obecnym etapie prac został sporządzony słownik obejmujący 2599 słów kluczowych (Z. Rudnik-Karwatowa, H. Karpińska, Słownik słów kluczowych językoznawstwa slawistycznego, Warszawa, 1999) (Okładka) (Wstęp), który stanowi podstawę do opracowania tezaurusa dla polskiej terminologii dokumentów językoznawstwa slawistycznego.

Zakres terminologii językoznawczej stanowiącej tworzywo systemu leksykalnego języka słów kluczowych, czyli podstawę prezentowanego słownika, podyktowany głównie potrzebami użytkowników, obejmuje przede wszystkim językoznawstwo slawistyczne, a także istotne dla slawistyki terminy z teorii języka oraz językoznawstwa ogólnego. Zastosowana metoda indukcyjno-dedukcyjna zapewnia aktualność słownictwa, z uwzględnieniem innowacji terminologicznych, oraz odzwierciedlenie pełnego zasobu tematycznego językoznawstwa slawistycznego.

Do słownika przejęto jedynie te terminy, które odzwierciedlają tematy reprezentatywnej liczby obecnie publikowanych dokumentów. Terminy bardziej szczegółowe, reprezentujące tematy pojedynczych dokumentów zostały pominięte. Przy tworzeniu słownika uwzględnione zostały terminy używane obecnie, a spośród dawniejszych - te, na które powołują się współcześni autorzy. Szczególną uwagę zwrócono na zamieszczenie słów kluczowych będących odpowiednikami terminów do niedawna mało znanych, których frekwencja znacznie wzrasta w pracach ostatnio publikowanych. Oto niektóre uwzględnione przez nas przykłady terminów, których dotychczas brak w słownikach terminologicznych: pragmalingwistyka, pragmastylistyka, analiza pragmalingwistyczna, mniejszość językowa, wspólnota komunikacyjna, manipulacja językowa, chrematonim, zoonim i inne.

Istnienie kontrolowanej listy słów kluczowych w postaci Słownika słów kluczowych na obecnym etapie prac nad nowoczesnym systemem informacyjnym językoznawstwa slawistycznego umożliwia indeksatorom pełne i relewantne przedstawianie treści dokumentów, a użytkownikom - wyższą efektywność wyszukiwania informacji zawartych w bazie danych bibliograficznych, liczącej obecnie ponad 40 tysięcy rekordów. Wydany słownik stanowi także podstawę do opracowania tezaurusa.

Docelowe rozwiązanie jest jednak odległe. Zgodnie z koncepcją będzie realizowane etapowo. Tymczasem pilne jest (i, jak się wydaje, bliskie realizacji) udostępnienie użytkownikom aktualnej bibliograficznej bazy danych slawistyki językoznawczej za pośrednictwem Internetu.