Skip to content

Commit

Permalink
New version
Browse files Browse the repository at this point in the history
  • Loading branch information
tboenig committed Nov 29, 2023
1 parent 080bcc6 commit e0ad34c
Show file tree
Hide file tree
Showing 2 changed files with 12 additions and 27 deletions.
21 changes: 7 additions & 14 deletions de/trans/index.dita
Original file line number Diff line number Diff line change
Expand Up @@ -3,20 +3,13 @@
<topic id="index">
<title>Die Ground Truth Richtlinien</title>
<body>
<p>Der Einsatz von Referenzdaten für Training und Auswertung statistischer Annotations- und
Analyseverfahren ist ein Kernmerkmal empirischer Forschung. Die wichtigste Grundlage für
die erfolgreiche Verwendung solcher Verfahren liegt im Einsatz geeigneter, den
Algorithmen zugrunde liegender Modelle. Für deren Erstellung ist neben einem passenden
Lernverfahren das Vorhandensein von Ground Truth die wesentliche Voraussetzung.</p>
<p>Mit den OCR-D-Ground-Truth-Guidelines wurden Richtlinien geschaffen, die eine
Format-Dokumentation des vorhandenen <xref href="https://ocr-d.github.io/en/data"
format="html" scope="external">OCR-D-Ground-Truth</xref> darstellt und als
Handlungsanweisung für die Ground-Truth-Erstellung genutzt werden kann. Mit dieser
Normierung kann der Ground-Truth technisch validiert werden. Darüber hinaus können
vorhandene Transkriptionen auf Grundlage dieses Regelwerkes überprüft und gegebenenfalls
in Ground-Truth-Daten umgewandelt werden.</p>
<p>Das Datenformat des OCR-D-Ground-Truth ist PAGE-XML. Dieses Format wurde initial durch
das PRImA Research Lab an der Universität Salford Greater Manchester entwickelt und
<p>Die OCR-D-Ground-Truth-Guidelines bieten Handlungsanweisungen für die
Ground-Truth-Erstellung. Die Ground-Truth kann so technisch validiert werden und
vorhandene Transkriptionen auf Grundlage dieses Regelwerkes überprüft sowie
gegebenenfalls in Ground-Truth-Daten umgewandelt werden.</p>
<p> Das Datenformat des OCR-D-Ground-Truth ist PAGE-XML. Dieses Format wurde initial durch
das <xref href="https://primaresearch.org/" format="html" scope="external">PRImA
Research Lab</xref> an der Universität Salford Greater Manchester entwickelt und
innerhalb des EU-Projektes IMPACT grundlegend erweitert. Zurzeit wird es vom PRImA
Research Lab betreut. Um eine Weiterentwicklung und Pflege dieses Formates zu
gewährleisten, wurde auf Initiative von OCR-D ein PAGE-XML-Board geschaffen.</p>
Expand Down
18 changes: 5 additions & 13 deletions en/trans/index.dita
Original file line number Diff line number Diff line change
Expand Up @@ -3,20 +3,12 @@
<topic id="index">
<title>The Ground Truth Guidelines</title>
<body>

<p>Using reference data for training and evaluation of statistical annotation and analysis
methods is a core feature of empirical research. The most important basis for the
successful application of such methods is the employment of suitable models underlying
the algorithms. In addition to a suitable learning procedure, the existence of ground
truth is the essential prerequisite for the creation of such models.</p>
<p>The OCR-D-Ground-Truth-Guidelines contain a format documentation of the existing <xref
href="https://ocr-d.github.io/en/data" format="html" scope="external">Ground Truth
provided by OCR-D</xref> and can be used as instructions for the compilation of
further Ground Truth. With this standardisation, Ground Truth can be technically
validated. Furthermore, existing transcriptions can be checked on the basis of this set
of rules and, if necessary, converted into Ground Truth data.</p>
<p>The OCR-D-Ground-Truth-Guidelines provide instructions for ground truth creation. The
ground truth can thus be technically validated and existing transcriptions can be
checked on this basis and, if necessary, converted into Ground Truth data.</p>
<p>The data format of the OCR-D-Ground-Truth is PAGE-XML. This format was initially
developed by the PRImA Research Lab at the University of Salford Greater Manchester and
developed by the <xref href="https://primaresearch.org/" format="html" scope="external"
>PRImA Research Lab</xref> at the University of Salford Greater Manchester and
fundamentally extended within the EU project IMPACT. It is currently managed by the
PRImA Research Lab. In order to ensure further development and maintenance of this
format, a PAGE-XML board was created on the initiative of OCR-D.</p>
Expand Down

0 comments on commit e0ad34c

Please sign in to comment.