Tak wiele opracowań poświęconych sztucznej inteligencji ilustrowanych jest wizerunkami humanoidalnych robotów. W praktyce jednak rozwiązania AI nie mają z nimi wiele wspólnego. Doskonale widać to na przykładzie Amerykańskich Archiwów Narodowych (NARA), które starają się racjonalnie planować wykorzystanie nowych narzędzi wobec swoich zbiorów.

Archiwa zbyt często oskarżane są o zbędny tradycjonalizm i niechęć do nowych rozwiązań. To błędne spojrzenie, od lat przecież digitalizują swoje zbiory, starając się zwiększyć ich dostępność dzięki nowym technologiom. Jeśli nie są, podobnie jak inne instytucje pamięci, entuzjastycznie nastawione do sztucznej inteligencji, wynika to z oczywistych wątpliwości i pytań: „co możemy z tego mieć?”.
NARA oficjalnie publikuje informacje o swoich próbach pracy z systemami AI, dzięki czemu możemy zobaczyć, jak w praktyce wygląda wykorzystanie najnowszych rozwiązań informatycznych w materii historycznej, a także administracyjnej. Jak wiele innych archiwów, NARA i podległe jej instytucje zajmują się też zarządzaniem dokumentacją wytwarzaną na poziomie federalnym. Mało kto wie, że przechowuje nawet kolejne wersje stron internetowych Białego Domu.
Zamiast więc marzyć o robotach, które będą porządkować akta w archiwum, przyjrzyjmy się, do czego naprawdę przydaje się AI w takiej pracy.
Ciężka, nudna i niekreatywna praca? Dajmy ją AI
Sztuczna inteligencja świetnie sprawdza się w zadaniach, które nie są specjalnie skomplikowane, lecz ich skala powoduje, że człowiekowi trudno jest je zrealizować. Pomyślmy teraz o kilometrach półek z aktami, w których znajdują się dane osobowe – imiona i nazwiska, adresy oraz informacje wrażliwe o milionach ludzi. Mówimy przecież o archiwum, które działa w dużym i ludnym kraju, prowadzącym aktywną politykę zagraniczną na całym świecie.
Kiedy dokumenty zawierające takie dane mają być udostępnione, szczególnie w Internecie, należy je zanonimizować – usunąć lub ukryć personalia. To niewdzięczna i mrówcza praca, w której nie ma ani krzty kreatywności. Skoro tak, można do niej wykorzystać AI.
Jak czytamy w opracowaniu, w ramach pilotażowego programu NARA wykorzystuje sztuczną inteligencję do automatycznego wyszukiwania i usuwania wrażliwych informacji osobowych z cyfryzowanych dokumentów historycznych. Dzięki zastosowaniu AI proces udostępniania zdigitalizowanych dokumentów ma przyspieszyć. Amerykańskie archiwa współdziałają w tym zakresie z Amazonem, opracowując z nim własny model AI pozwalający na automatyczne rozpoznawanie danych wrażliwych w dokumentach historycznych.
AI wykorzystuje się także jako wsparcie w opisywaniu dokumentów. Nie chodzi o to, aby zastąpiło ono analizę ich treści i pochodzenia przez ludzi, ale ułatwiło wyszukiwanie i badanie dzięki automatycznie generowanym opisom, metadanym i podsumowaniom. Jednym z planowanych rozwiązań ma być „archiwalny ChatGPT” – system, za pomocą którego użytkownicy archiwum będą mogli zdobywać informacje o interesujących ich zasobach oraz warunkach dostępu do nich. W planach NARA sztuczna inteligencja ma też usprawnić odpowiadanie na wnioski o udostępnienie informacji publicznej oraz na inne zapytania kierowane do administracji tej instytucji przez użytkowników.
Opisane w przytoczonym dokumencie projekty mają status pilotażu albo są dopiero w planach. Chociaż wydaje się nam, że rewolucja AI dzieje się tu i teraz, instytucje pamięci, szczególnie tak duże jak NARA, muszą ostrożnie korzystać z nowych rozwiązań. Ceną za pospieszne i błędne wdrożenie sztucznej inteligencji mogłaby być utrata zaufania społeczeństwa wobec archiwów oraz ogromny bałagan w zbiorach.
Kto jest prawdziwym archiwistą?
W dyskusji o AI wiele mówi się o jej możliwościach, ale zbyt rzadko podkreśla ograniczenia i pokazuje potencjalne problemy związane z jej użyciem. Brakuje też głosu tych, na których nowe rozwiązania miałyby największy wpływ – głównie twórców i pracowników.
NARA stara się podchodzić do AI odpowiedzialnie. Jeszcze w 2024 roku zakazała pracownikom korzystać z Chatu GPT w obawie przed udostępnieniem jego twórcom treści dokumentów objętych ochroną oraz zawartych w nich danych osobowych.

Również w zeszłym roku władze NARA poinformowały swoich pracowników o pomyśle stworzenia bota Archie AI mającego, jak ChatGPT, wspierać korzystanie ze zbiorów. W październiku odbyło się szkolenie online „AI-mazing Tech-venture”. Archiwistom przedstawiono możliwości chata korzystającego z usługi Vertex AI firmy Google, która pozwala na uzupełnianie „wiedzy” modelu językowego przez własne zasoby instytucji.
Prezentacja nie została jednak dobrze przyjęta przez jej uczestników. W pewnym momencie bot sam określił się jako „ekspert archiwista”, co zostało skrytykowane na publicznym czacie tego szkolenia online. Wątpliwości pracowników dotyczyły głównie tego, czy sztuczna inteligencja jest w stanie zastąpić ich wiedzę i doświadczenie w poruszaniu się po skomplikowanej strukturze zbiorów archiwum. Obawiano się też halucynacji – procesu, który polega na tym, że gdy model AI nie zna odpowiedzi na zadane pytanie, po prostu ją wymyśla.
Dokumentów, treści i danych, które trzeba archiwizować, jest coraz więcej. Archiwa, biblioteki, a nawet muzea, starają się skorzystać z nowych rozwiązań technicznych do wsparcia swojej pracy i ułatwienia użytkownikom docierania do wartościowych zasobów. Sztuczna inteligencja nie jest tu jednak żadną rewolucją, ale pozwala na ostrożne wdrażanie rozwiązań, które mają wspierać człowieka w najbardziej nudnych i powtarzalnych pracach.










