Automatyczne rozpoznawanie pisma ręcznego (HTR – Handwritten Text Recognition) z materiałów takich jak skany i zdjęcia otwiera nowe możliwości dla badaczy przeszłości, ułatwiając analizę źródeł historycznych.
Wykorzystując zaawansowane technologie OCR (Optical Character Recognition – optyczne rozpoznawanie znaków) oraz HTR można przekształcać starodruki i manuskrypty do tekstowej formy elektronicznej. Dzięki temu dokumenty stają się łatwiej dostępne i przeszukiwalne, mogą także posłużyć jako baza do stworzenia ich edycji cyfrowej. Nowoczesne metody rozpoznawania pisma opierają się na technikach uczenia maszynowego, przyspieszając i podnosząc jakość procesu analizy rękopisów.
Dariah HTR: narzędzia do transkrypcji
Dariah HTR jest usługą opartą na oprogramowaniu eScriptorium i systemie Kraken. Te narzędzia open source zapewniają kompleksowe środowisko pracy nad historycznymi rękopisami i drukami, umożliwiając manualną i automatyczną transkrypcję skanów z pismem ręcznym.
eScriptorium: webowa aplikacja do pracy nad historycznymi tekstami, umożliwiająca tworzenie i zarządzanie kolekcjami skanów, obsługę protokołu IIIF oraz wspierająca współpracę między użytkownikami.
Trenowanie modeli i automatyczna transkrypcja: eScriptorium wykorzystuje nowoczesne metody uczenia maszynowego, liczne gotowe modele rozpoznawania dopasowane do różnych rodzajów pisma, stworzone przez społeczność badaczy oraz umożliwia trenowanie własnych modeli lepiej dopasowanych do specyficznych kolekcji rękopisów.
Nieograniczony eksport danych: zapis transkrypcji możliwy jest w standardowych formatach jak Alto, PAGE XML lub TXT, wytrenowane modele można również wyeksportować z aplikacji lub udostępnić innym użytkownikom eScriptorium.
Usługa Dariah HTR dostępna jest odpłatnie na serwerach Poznańskiego Centrum Sieciowo-Superkomputerowego: link zostanie opublikowany wkrótce.
Pracownia Historii Cyfrowej IH PAN oferuje usługi w zakresie:
przygotowania środowiska do transkrypcji: przystosowania i importu skanów
pomocy w trenowaniu modeli na podstawie materiału treningowego
postprocessingu i konsultacji w celu udoskonalenia wyników transkrypcji
szkoleń i wsparcia w korzystaniu z eScriptorium.
Skontaktuj się z nami, aby dowiedzieć się więcej o tym, jak możemy wspierać Twoje badania dzięki technologii rozpoznawania pisma ręcznego. Zapewniamy profesjonalne wsparcie na każdym etapie pracy z historycznymi materiałami tekstowymi.
Ta strona wykorzystuje pliki cookies, które są niezbędne dla jej prawidłowego funkcjonowania. Ponadto używamy plików cookies do gromadzenia informacji odnośnie tego, w jaki sposób użytkownicy strony z niej korzystają, zapamiętując jednocześnie ich preferencje w tym zakresie.
Można wyrazić zgodę na wszystkie przez nas używane pliki cookies lub wybrać tylko niektóre pliki cookies.
Więcej informacji na temat plików cookies znajduje się w naszej Polityce Prywatności.
Niezbędne – umożliwiają korzystanie ze strony internetowej z podstawowymi funkcjami takimi, jak nawigacja po stronie i bezpieczny dostęp do poszczególnych jej obszarów. Strona internetowa nie może działać poprawnie bez tych plików cookie.
Preferencje – umożliwiają stronie internetowej zapamiętanie informacji, które zmieniają sposób jej działania lub wyglądu. Odnoszą się one np. do języka preferowanego przez użytkownika lub regionu, w którym użytkownik się znajduje.
Statystyki – pomagają nam zrozumieć, w jaki sposób użytkownicy korzystają ze strony internetowej, poprzez gromadzenie i raportowanie anonimowych informacji.