A tool for automatic annotation of Russian texts. Uses two versions of a text: original and corrected to extract and classify edits. Developed as a modification of ERRANT for Russian texts.
Using it can be as simple as
from annotator.annotator import Annotator
a = Annotator()
edits = a.annotate('К тому, что я считаю, что это единственное отличие на самом деле огромное, хотя его можно сформулировать всего лишь одно простое предложение.',
'К тому, что я считаю, что это единственное отличие на самом деле огромно, хотя его можно сформулировать всего лишь в одном простом предложении.')
for edit in edits:
print(edit)
Result:
Orig: [14, 15, 'огромное'], Cor: [14, 15, 'огромно'], Type: 'Brev'
Orig: [22, 22, ''], Cor: [22, 23, 'в'], Type: 'Prep'
Orig: [22, 23, 'одно'], Cor: [23, 24, 'одном'], Type: 'Agrcase'
Orig: [23, 25, 'простое предложение'], Cor: [24, 26, 'простом предложении'], Type: 'Gov'