這是將「教育部臺灣閩南語常用詞辭典」的 Excel 資料處理 為機器比較容易再利用的 CSV 及 JSON 格式。
辭典本文的著作權為教育部所有,依「創用 CC 姓名標示- 禁止改作 3.0 臺灣」授權條款釋出:
http://twblg.dict.edu.tw/holodict_new/compile1_6_1.jsp
「華語對照表」資料檔案不屬於教育部上述授權範圍,而是自 網頁版自行取得,為非營利之教育目的,依著作權法第50條, 「以中央或地方機關或公法人之名義公開發表之著作,在合理 範圍內,得重製、公開播送或公開傳輸。」
此處轉換格式、重新編排的編輯著作權(如果有的話)由 唐鳳 以 CC0 釋出。
sed 's/'$'\x02''//g' -i raw/*
sed 's/'$'\x0e''//g' -i raw/*
dos2unix raw/*
- 用
csv2uni.pl
轉出pua/
,uni/
版本 - PR更新專案資料
time docker build -t twblg .
docker run --rm twblg cat index.json > index.json
docker run --rm twblg cat dict-twblg.json > dict-twblg.json
- 安裝 docker
- 安裝 docker-compose
- 設定docker權限(Ubuntu):
sudo usermod -aG docker $USER