← 返回首页
机器学习基本构成元素
发表时间:2024-01-21 05:00:48
机器学习基本构成元素

机器学习基本构成元素。

1.分类与回归

分类(Classification)是指将数据分为不同的类别或标签。 回归(Regression)是指对未知数据的输出进行连续值预测。

无论是分类,还是回归,其本质是一样的,都是对输入做出预测,并且都是监督学习。说白了,就是根据特征,分析输入的内容,判断它的类别,或者预测其值。

二者有什么区别?

  1. 输出不同
  2. 分类问题输出的是物体所属的类别,回归问题输出的是物体的值。
  3. 分类问题输出的值是离散的,回归问题输出的值是连续的。
  4. 分类问题输出的值是定性的,回归问题输出的值是定量的。

  5. 目的不同

  6. 分类的目的是为了寻找决策边界,即分类算法得到是一个决策面,用于对数据集中的数据进行分类。
  7. 回归的目的是为了找到最优拟合,通过回归算法得到是一个最优拟合线,这个线条可以最好的接近数据集中的各个点。

  8. 结果不同

  9. 分类的结果没有逼近,对就是对,错就是错,什么类别就是什么类别,最终结果只有一个。
  10. 回归是对真实值的一种逼近预测,值不确定,当预测值与真实值相近时,误差较小时,认为这是一个好的回归。
  11. 应用场景不同
  12. 分类的应用场景非常广泛,例如判断一幅图片上的动物是一只猫还是一只狗,判断明天天气的阴晴,判断零件的合格与不合格等等。
  13. 回归问题通常是用来预测一个值。如预测房价、股票的价格、未来的天气的气温变化情况等等。

2.机器学习的问题构成元素

样本是指数据的特定实例:x。包含了属性和标签。可以简单理解为:y=f(x), x就是属性,y就是标签。 模型定义了属性与标签之间的关系。y=f(x) 就可以理解为一个模型。而学习模型的过程就是训练。训练的目的是确定模型中的参数,测试就是评价这个模型。

如果我们拿到一组只有属性没有标签的样本,那么我们可以利用已有的模型来推理样本的标签。