Skip to content
JanPodmajersky edited this page Sep 29, 2014 · 1 revision

Môj projekt je získanie Alternativnych mien z infoboxov z Wikipedie. Mojou úlohou bude ku každému článku získať všetky alternatívne mená.

Zdroj dát : http://dumps.wikimedia.org/enwiki/latest/enwiki-latest-pages-articles27.xml-p029625017p043848221.bz2

Použijem Javu a Apache lucene. Možno aj Phyton.

Clone this wiki locally