Skip to content

Latest commit

 

History

History
22 lines (18 loc) · 1.26 KB

README.md

File metadata and controls

22 lines (18 loc) · 1.26 KB

Annotator

A tool for automatic annotation of Russian texts. Uses two versions of a text: original and corrected to extract and classify edits. Developed as a modification of ERRANT for Russian texts.

Using it can be as simple as

from annotator.annotator import Annotator
a = Annotator()
edits = a.annotate('К тому, что я считаю, что это единственное отличие на самом деле огромное, хотя его можно сформулировать всего лишь одно простое предложение.',
                   'К тому, что я считаю, что это единственное отличие на самом деле огромно, хотя его можно сформулировать всего лишь в одном простом предложении.')
for edit in edits:
      print(edit)

Result:

Orig: [14, 15, 'огромное'], Cor: [14, 15, 'огромно'], Type: 'Brev'
Orig: [22, 22, ''], Cor: [22, 23, 'в'], Type: 'Prep'
Orig: [22, 23, 'одно'], Cor: [23, 24, 'одном'], Type: 'Agrcase'
Orig: [23, 25, 'простое предложение'], Cor: [24, 26, 'простом предложении'], Type: 'Gov'