Skip to content

Dokumentstrukturerkennung

11 October, 2011


Günter Mühlberger von der Universitäts- und Landesbibliothek Tirol in Innsbruck thematisierte die Strukturanalyse auf der Basis von OCR-Ergebnissen  mit Hilfe der bisher FEP – Functional Extension Parser – genannten Software.

Die Strukturanalyse erkennt dabei für Bücher typische Strukturmerkmale, wie den Satzspiegel, Seitenzahlen, Spaltentitel, Bogenzählung oder Einträge in Inhaltsverzeichnissen.

Dies kann beispielsweise dazu dienen, die Navigation im Dokument oder zwischen Dokumenten zu erleichtern (Fußnoten könnten zu den zitierten Texten oder Datenbanken verlinken), Suchergebnisse relevanter zu gestalten (wenn Spaltentitel aus dem Suchkorpus rausgerechnet werden) oder bei der Erstellung von Faksimiles zu helfen (Satzspiegel).

Auf der IMPACT-Abschlusskonferenz am 24. und 25. Oktober 2011 in der British Library soll die Graphische Benutzeroberfläche erstmals demonstriert werden, bis Ende des Jahressoll eine Alpha-Version fertig sein. Bisher ist geplant, interessierten Institutionen die Software als Webservice anzubieten

_____________________________________________

Günter Mühlberger from the University and Regional Library of Tyrol in Innsbruck presented the Functional Extension Parser (FEP), a tool for the OCR-based structural analysis of printed texts.

 

RM (BSB); Mark-Oliver Fischer (BSB)

No comments yet

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: