基于RBM的深度学习算法

基于多层RBM模型，实现二分类学习算法，目前针对该问题是采用2层RBM,特征输入只有8维，效果并不理想。

功能框架：

DBN.py：深度学习主框架，包括数据输入、输入sigmoid转换，RBM层堆叠，softmax层输出。

RBM.py：RBM层框架，包括gibss采样、交叉熵误差验证

dA.py:这个是降噪自动编码器，目前还在研究

SdA.py:，堆叠降噪自动编码器，目前仍在研究

HiddenLayer.py:隐层主要是权值计算与更新

util.py：这主要是最后的softmax函数计算及输出

normal_8.py：输入数据归一化到[0,1]

train.txt:训练数据

text.txt:测试数据

基于复杂语言网络的文本分类：

这里面主要包括两部分，一部分是语言网络的生成，另一部分是语言网络的特征抽取。

第一部分采用的数据是twenty-news-group，根据词语序列生成语言网络。

另一部分是特征抽取，由于课题没有结题，所以这里只展示了提取了结点度特征，并采用SVM作为训练器，

最终效果和采用普通的词袋模型相当。所以需要抽取语义特征加上深度模型训练。深度模型训练目前

已经有几个模型结果，效果有大幅提升，目前还在继续优化中。

后续工作：

后续需要研究的是在特征多而稀疏时，利用dA模型来进行训练，然后与RBM模型对比。

参考资料： https://github.com/lisa-lab/DeepLearningTutorials

Y. Bengio, P. Lamblin, D. Popovici, H. Larochelle: Greedy Layer-Wise Training of Deep Networks, Advances in Neural Information Processing Systems 19, 2007

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
基于复杂语言网络的文本二分类		基于复杂语言网络的文本二分类
.gitignore		.gitignore
DBN.py		DBN.py
HiddenLayer.py		HiddenLayer.py
LICENSE		LICENSE
LogisticRegression.py		LogisticRegression.py
RBM.py		RBM.py
README.md		README.md
SdA.py		SdA.py
dA.py		dA.py
normal_8.py		normal_8.py
test.arff		test.arff
test.txt		test.txt
test1.txt		test1.txt
train.arff		train.arff
train.txt		train.txt
train1.txt		train1.txt
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

基于RBM的深度学习算法

About

Releases

Packages

Languages

License

yanshengli/DBN_Learning

Folders and files

Latest commit

History

Repository files navigation

基于RBM的深度学习算法

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages