Skip to content

Latest commit

 

History

History
23 lines (19 loc) · 2.94 KB

深度学习知识杂记001.md

File metadata and controls

23 lines (19 loc) · 2.94 KB

深度学习知识杂记

  • 1.回归与分类问题区别

  • 回归(regression)    回归问题通常是用来预测一个值,如房价、天气等。常见的回归有线性回归(LR)。回归分析用于神经网络上,其最后層是不加Softmax函数的,而是对前一层累加即可。回国问题是对真实值的一种逼近预测。回归问题是指,给定一个新的模式,根据训练集推断它所对应的输出值(实数)是多少,是一种定量输出,也叫连续变量预测。

  • 分类(classification)    分类问题是用于将事物打上一个标签,通常结果为离散值。例如判断一幅图片上的动物是一只猫还是一只狗,分类通常是建立在回归之上,分类的最后一层通常要使用softmax函数进行判断其所属类别。分类并没有逼近的概念,最终正确结果只有一个,错误的就是错误的,不会有相近的概念。最常见的分类方法是逻辑回归,或者叫逻辑分类。分类问题是指,给定一个新的模式,根据训练集推断它所对应的类别(如:+1,-1),是一种定性输出,也叫离散变量预测。

举个例子:预测明天的气温是多少度,这是一个回归任务;预测明天是阴、晴还是雨,就是一个分类任务。

  • 1.overfitting(过拟合) 这篇文章很好
  • 形象图
  • 过拟合(overfitting)是指在模型参数拟合过程中的问题,由于训练数据包含抽样误差,训练时,复杂的模型将抽样误差也考虑在内,将抽样误差也进行了很好的拟合。具体表现就是最终模型在训练集上效果好;在测试集上效果差。模型泛化能力弱。这是因为机器学习算法为了满足尽可能复杂的任务,其模型的拟合能力一般远远高于问题复杂度,也就是说,机器学习算法有「拟合出正确规则的前提下,进一步拟合噪声」的能力。
  • 原因:数据太少 + 模型太复杂
  • 为什么要解决过拟合现象?这是因为我们拟合的模型一般是用来预测未知的结果(不在训练集内),过拟合虽然在训练集上效果好,但是在实际使用时(测试集)效果差。同时,在很多问题上,我们无法穷尽所有状态,不可能将所有情况都包含在训练集上。所以,必须要解决过拟合问题
  • 方法:
  1. 获取更多数据
  • (1)从数据源头获取更多数据:找更多数据。
  • (2)数据增强(Data Augmentation):通过一定规则扩充数据。如在物体分类问题里,物体在图像中的位置、姿态、尺度,整体图片明暗度等都不会影响分类结果。我们就可以通过图像平移、翻转、缩放、切割等手段将数据库成倍扩充;
  1. 使用合适的模型
  2. 结合多种模型
  3. Dropout