相关资料整理及代码分享
DataImport文件: 原始数据处理。Rawdata读取、txt文件生成、pkl文件生成 20191102:word2vec训练最好使用txt文件
MultiClass.py ——XGB多类别概率输出
DataProcess.py ——TF-IDF模型 模型参数:ngram_range=(1, 4), min_df=0.0, max_df=1.0
BOW处理训练集和测试集.ipynb ——BOW模型 模型参数:ngram_range=(1,4),stop_words = None, min_df=0.0, max_df=1.0