Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Bypass OSMF Redactions #54

Open
deevroman opened this issue Oct 19, 2024 · 3 comments
Open

Bypass OSMF Redactions #54

deevroman opened this issue Oct 19, 2024 · 3 comments
Milestone

Comments

@deevroman
Copy link
Owner

There are CC-BY-SA-2.0 dumps-planets that weigh only 22 gigabytes. https://planet.openstreetmap.org/cc-by-sa/

Was a lot of data lost after the license change? I think there are not many, and they can be hosted, for example, directly on GitHub, in order to have a fallback when the extension cannot load old data

@deevroman deevroman added this to the 5.2 milestone Oct 19, 2024
@deevroman
Copy link
Owner Author

deevroman commented Oct 21, 2024

Что ж...

  1. Не все версии объектов отображаются как redacted. Часть из них отображается как удалённые (и это даже для первой версии!)
  2. Т.е. чтобы понять, что линия повреждена исправлениями, нужно обязательно запрашивать информацию обо всех удалённых версиях. Как? либо проверяйте список пользователей не согласившихся с переходом на ODbl (файл с айдишниками весит 4 мегабайта, неприкольно upd: вру, всего 4килобайта) Либо обращайтесь в репозиторий за удалёнными версиями
  3. Удалённые данные за 2005-2007 года весят 170 мб если хранить каждую удалённую версию отдельным xml файлом. И проблема больше не суммарном размере, а в количестве файлов которых уже 600к => нужно группировать в файлы
  4. Как выфильтровывать затёртые данные отдельный прикол, потому что в старых диффах иногда нет автора правки. Однако он есть в дампе всех пакетов правок. Т.е. нужно сначала отфильтровать правки несогласившихся, а потом потом по них находить нужные объекты
  5. Выфильтровать xmlины диффов на питоне боль

@deevroman
Copy link
Owner Author

deevroman commented Oct 28, 2024

Окей, данные выгружены https://github.com/osm-cc-by-sa/data

upd: ан, нет. Не всё выгружено. Например https://github.com/osm-cc-by-sa/data/blob/main/versions_affected_by_disagreed_users/node/0.osm должно содержать больше данных https://www.openstreetmap.org/node/2

@deevroman
Copy link
Owner Author

Данные до 2012 + redaction period выгружены. Остаётся допилить в расширении подгрузку геометрии

@deevroman deevroman modified the milestones: 5.2, 6.0 Nov 18, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant