Dariah.lab
LOGO UE
LOGO UE

HTR: Technologia w służbie historii

Automatyczne rozpoznawanie pisma ręcznego (HTR – Handwritten Text Recognition) z materiałów takich jak skany i zdjęcia otwiera nowe możliwości dla badaczy przeszłości, ułatwiając analizę źródeł historycznych.

Wykorzystując zaawansowane technologie OCR (Optical Character Recognition – optyczne rozpoznawanie znaków) oraz HTR można przekształcać starodruki i manuskrypty do tekstowej formy elektronicznej. Dzięki temu dokumenty stają się łatwiej dostępne i przeszukiwalne, mogą także posłużyć jako baza do stworzenia ich edycji cyfrowej. Nowoczesne metody rozpoznawania pisma opierają się na technikach uczenia maszynowego, przyspieszając i podnosząc jakość procesu analizy rękopisów.


Dariah HTR: narzędzia do transkrypcji

Dariah HTR jest usługą opartą na oprogramowaniu eScriptorium i systemie Kraken. Te narzędzia open source zapewniają kompleksowe środowisko pracy nad historycznymi rękopisami i drukami, umożliwiając manualną i automatyczną transkrypcję skanów z pismem ręcznym.

  • eScriptorium: webowa aplikacja do pracy nad historycznymi tekstami, umożliwiająca tworzenie i zarządzanie kolekcjami skanów, obsługę protokołu IIIF oraz wspierająca współpracę między użytkownikami.
  • Trenowanie modeli i automatyczna transkrypcja: eScriptorium wykorzystuje nowoczesne metody uczenia maszynowego, liczne gotowe modele rozpoznawania dopasowane do różnych rodzajów pisma, stworzone przez społeczność badaczy oraz umożliwia trenowanie własnych modeli lepiej dopasowanych do specyficznych kolekcji rękopisów.
  • Nieograniczony eksport danych: zapis transkrypcji możliwy jest w standardowych formatach jak Alto, PAGE XML lub TXT, wytrenowane modele można również wyeksportować z aplikacji lub udostępnić innym użytkownikom eScriptorium.

Usługa Dariah HTR dostępna jest odpłatnie na serwerach Poznańskiego Centrum Sieciowo-Superkomputerowego: link zostanie opublikowany wkrótce.


Pracownia Historii Cyfrowej IH PAN oferuje usługi w zakresie:

  • przygotowania środowiska do transkrypcji: przystosowania i importu skanów
  • pomocy w trenowaniu modeli na podstawie materiału treningowego
  • postprocessingu i konsultacji w celu udoskonalenia wyników transkrypcji
  • szkoleń i wsparcia w korzystaniu z eScriptorium.

Skontaktuj się z nami, aby dowiedzieć się więcej o tym, jak możemy wspierać Twoje badania  dzięki technologii rozpoznawania pisma ręcznego. Zapewniamy profesjonalne wsparcie na każdym etapie pracy z historycznymi materiałami tekstowymi.

Świadczenie usług badawczych jest odpłatne.