关于拼音匹配引擎的疑惑 #3

yugasun · 2017-09-18T09:13:50Z

首先，非常感谢github上您贡献的 pinyin-engine 库，最近也在研究学习，但是有个问题，希望您能帮忙解答下，就是：源码中的 dict-cn.json 文件是如何生成的，而且 decode.js 文件是专门用来解码这个字典json的，这个加密过程是如何实现的？

The text was updated successfully, but these errors were encountered:

1021683053 · 2017-12-18T09:43:31Z

我来回答你吧。大神估计时间少。

回答你第一个问题：加密过程是如何实现的？
这不是加密。

1, 汉字存储方式：Unicode （你需要知道编码方式）Unicode 中文对照表。
2, 汉字拼音对照表：中文拼音对照表
3, 实现数据最少量存储

dict-cn.json实现方式:
1, 所有拼音集合。
2, 所有字符岁对应拼音的位置+Unicode编码（用一个array存储两个内容使用的很巧妙，使用偏移量，因为中文中使用的Unicode大多数都是连续性的）

yugasun · 2017-12-18T10:45:01Z

@1021683053 你这个是存储方式和解码原理，看源码 decode.js 可以理解，但是我想确认生成 dict-cn.json的方式，难道大神是按照这个逻辑，反编码加密的？

1021683053 · 2017-12-18T10:59:02Z

@yugasun 我说的是中文Unicode 有区间，按照字符区间最小值往上加，把所有字全部遍历一遍，可以得出dict-cn.json
dict-cn.json 实现方式：
相当于两个数组：
[0]: 字符编码起始，与保存拼音位置。（正数为拼音位置 , 负数为下一次中文编码偏移）
[1]: 所有拼音集合与 [0] 的值一一对应。
按照这两个规则很容易生成。
你看了Decode.js 你应该会懂怎么生成。

yugasun · 2017-12-18T11:30:11Z

@1021683053 非常感谢耐心解答，具体怎么，就是想知道大神自己的实现方式，为什么会使用这种加密方式，思路是什么? 不用加密，直接输出 decode.js 解密后的中文字典json岂不是更好？为什么还要加密一次，再解密？

1021683053 · 2017-12-18T11:36:19Z

包的体量是要考虑的，你这是给前端用的！

1021683053 · 2017-12-18T13:03:13Z

@yugasun

yugasun · 2017-12-19T01:54:09Z

@1021683053 非常感谢，明白了~

aui · 2017-12-19T06:56:05Z

@1021683053 正解

经过这样编码后，服务器开启 gzip 后 dict-cn.json 就只有 16kb 了

hoelshen · 2018-03-27T01:41:37Z

怎么将自己的数据换成项目中的大学？之后要怎么使用呢

ouyangke584 · 2022-01-05T05:41:09Z

看大神们聊天，小弟颇受震撼😂

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于拼音匹配引擎的疑惑 #3

关于拼音匹配引擎的疑惑 #3

yugasun commented Sep 18, 2017

1021683053 commented Dec 18, 2017

yugasun commented Dec 18, 2017 •

edited

Loading

1021683053 commented Dec 18, 2017 •

edited

Loading

yugasun commented Dec 18, 2017

1021683053 commented Dec 18, 2017

1021683053 commented Dec 18, 2017

yugasun commented Dec 19, 2017

aui commented Dec 19, 2017

hoelshen commented Mar 27, 2018

ouyangke584 commented Jan 5, 2022

关于拼音匹配引擎的疑惑 #3

关于拼音匹配引擎的疑惑 #3

Comments

yugasun commented Sep 18, 2017

1021683053 commented Dec 18, 2017

yugasun commented Dec 18, 2017 • edited Loading

1021683053 commented Dec 18, 2017 • edited Loading

yugasun commented Dec 18, 2017

1021683053 commented Dec 18, 2017

1021683053 commented Dec 18, 2017

yugasun commented Dec 19, 2017

aui commented Dec 19, 2017

hoelshen commented Mar 27, 2018

ouyangke584 commented Jan 5, 2022

yugasun commented Dec 18, 2017 •

edited

Loading

1021683053 commented Dec 18, 2017 •

edited

Loading