From e0ad34c3218f940392124f5f02b9d3da68b9c734 Mon Sep 17 00:00:00 2001 From: tboenig Date: Wed, 29 Nov 2023 22:23:50 +0100 Subject: [PATCH] New version --- de/trans/index.dita | 21 +++++++-------------- en/trans/index.dita | 18 +++++------------- 2 files changed, 12 insertions(+), 27 deletions(-) diff --git a/de/trans/index.dita b/de/trans/index.dita index 7a7278963..a4136526d 100644 --- a/de/trans/index.dita +++ b/de/trans/index.dita @@ -3,20 +3,13 @@ Die Ground Truth Richtlinien -

Der Einsatz von Referenzdaten für Training und Auswertung statistischer Annotations- und - Analyseverfahren ist ein Kernmerkmal empirischer Forschung. Die wichtigste Grundlage für - die erfolgreiche Verwendung solcher Verfahren liegt im Einsatz geeigneter, den - Algorithmen zugrunde liegender Modelle. Für deren Erstellung ist neben einem passenden - Lernverfahren das Vorhandensein von Ground Truth die wesentliche Voraussetzung.

-

Mit den OCR-D-Ground-Truth-Guidelines wurden Richtlinien geschaffen, die eine - Format-Dokumentation des vorhandenen OCR-D-Ground-Truth darstellt und als - Handlungsanweisung für die Ground-Truth-Erstellung genutzt werden kann. Mit dieser - Normierung kann der Ground-Truth technisch validiert werden. Darüber hinaus können - vorhandene Transkriptionen auf Grundlage dieses Regelwerkes überprüft und gegebenenfalls - in Ground-Truth-Daten umgewandelt werden.

-

Das Datenformat des OCR-D-Ground-Truth ist PAGE-XML. Dieses Format wurde initial durch - das PRImA Research Lab an der Universität Salford Greater Manchester entwickelt und +

Die OCR-D-Ground-Truth-Guidelines bieten Handlungsanweisungen für die + Ground-Truth-Erstellung. Die Ground-Truth kann so technisch validiert werden und + vorhandene Transkriptionen auf Grundlage dieses Regelwerkes überprüft sowie + gegebenenfalls in Ground-Truth-Daten umgewandelt werden.

+

Das Datenformat des OCR-D-Ground-Truth ist PAGE-XML. Dieses Format wurde initial durch + das PRImA + Research Lab an der Universität Salford Greater Manchester entwickelt und innerhalb des EU-Projektes IMPACT grundlegend erweitert. Zurzeit wird es vom PRImA Research Lab betreut. Um eine Weiterentwicklung und Pflege dieses Formates zu gewährleisten, wurde auf Initiative von OCR-D ein PAGE-XML-Board geschaffen.

diff --git a/en/trans/index.dita b/en/trans/index.dita index 8dde49c87..1f6063a53 100644 --- a/en/trans/index.dita +++ b/en/trans/index.dita @@ -3,20 +3,12 @@ The Ground Truth Guidelines - -

Using reference data for training and evaluation of statistical annotation and analysis - methods is a core feature of empirical research. The most important basis for the - successful application of such methods is the employment of suitable models underlying - the algorithms. In addition to a suitable learning procedure, the existence of ground - truth is the essential prerequisite for the creation of such models.

-

The OCR-D-Ground-Truth-Guidelines contain a format documentation of the existing Ground Truth - provided by OCR-D and can be used as instructions for the compilation of - further Ground Truth. With this standardisation, Ground Truth can be technically - validated. Furthermore, existing transcriptions can be checked on the basis of this set - of rules and, if necessary, converted into Ground Truth data.

+

The OCR-D-Ground-Truth-Guidelines provide instructions for ground truth creation. The + ground truth can thus be technically validated and existing transcriptions can be + checked on this basis and, if necessary, converted into Ground Truth data.

The data format of the OCR-D-Ground-Truth is PAGE-XML. This format was initially - developed by the PRImA Research Lab at the University of Salford Greater Manchester and + developed by the PRImA Research Lab at the University of Salford Greater Manchester and fundamentally extended within the EU project IMPACT. It is currently managed by the PRImA Research Lab. In order to ensure further development and maintenance of this format, a PAGE-XML board was created on the initiative of OCR-D.