NLP自然语言处理学习代码汇总
1.通过自回归(AR,ARM)模型进行时间序列预测合集:https://github.com/yangwohenmai/TimeSeriesForecasting
2.通过深度学习模型进行时间序列预测合集:https://github.com/yangwohenmai/DeepLearningForTSF
3.基于LSTM的时间序列预测项目合集:https://github.com/yangwohenmai/LSTM
1.简单LSTM分类
1.简单LSTM分类_通用版
2.LSTM层间dropout
3.LSTM层内dropout
4.LSTM+卷积网络
4.LSTM+卷积网络_通用版
vocab2.txt
- txt_sentoken
neg
pos
1.IMDB在线数据使用方法
2.简单的多层感知器分类模型(在线数据)
3.一维卷积神经网络模型(在线数据)
1.如何训练Embidding层
2.在Embidding层使用已训练好的词向量_glove
1.CountVectorizer计算字数
2.HashingVectorizer建立散列表
3.TfidfVectorizer统计词频(TF-IDF)
1.三种分词器
1.清理数据
2.词汇计数器
3.准备正面和负面评论
4.训练Embedding模型
5.调用Embedding模型分类
6.训练可用于嵌入层的word2vec词向量
7.将训练好的word2vec转化为嵌入层
embedding_word2vec.txt
vocab.txt
vocab2.txt
- txt_sentoken
neg
pos
1.清理数据
2.词汇计数器
3.准备正面和负面评论
4.生成词向量模型
5.构建NLP网络
6.调用词袋模型开始预测
vocab.txt
1.清洗评论并保存文本
2.训练、保存模型
3.三通道CNN网络分类
4.五通道CNN网络分类
test.pkl
train.pkl
1.开发Word2Vec嵌入
2.使用PCA绘制单词向量
3.词向量的减法
IMDB文本分类
IMDB文本分类_改进
TextCNN
1.语言模型设计
2.训练语言模型
3.使用网络生成文本
char_sequences.txt
mapping.pkl
model.h5
rhyme.txt
01.
02.
03.
01.
02.
03.