人工智能之机器学习5-回归算法1【培训机构学习笔记】

8 阅读 0 评论 0 点赞

培训内容：

培训班上课的PPT里很多错误，即使讲了很多年也从没改正过来。

而且很多字母没有给出具体的解释，比如RSS和TSS，对初学者非常不友善。

回归和分类是机器学习和统计学中两种常见的监督学习任务，二者主要在以下几个方面存在区别：

回归：主要用于预测一个连续的数值型目标变量，例如预测房价、股票价格、气温等。其目标是找到输入特征与连续输出之间的映射关系，使得预测值尽可能接近真实的数值。
分类：则是将输入数据划分到不同的类别中，输出是离散的类别标签，比如判断一封邮件是垃圾邮件还是正常邮件，一张图片是猫还是狗等，旨在找到输入特征与类别之间的决策边界，以准确地对数据进行分类。

回归：常用的评估指标有均方误差（MSE）、平均绝对误差（MAE）、均方根误差（RMSE）等。这些指标衡量的是预测值与真实值之间的差异程度，差异越小，说明回归模型的性能越好。
- 均方误差的计算公式为： $MSE = \frac{1}{n}\sum_{i=1}^{n}(y^{_{i}}-\hat{y}^{_{i}})^{2}$ ，其中 $y^{_{i}}$ 是真实值， $\hat{y}^{_{i}}$ 是预测值， n是样本数量。
- 平均绝对误差的计算公式为： $MAE = \frac{1}{n}\sum_{i=1}^{n}|y^{_{i}}-\hat{y}^{_{i}}|$
- 均方根误差则是均方误差的平方根，即 $RMSE = \sqrt{MSE}$
分类：常见的评估指标包括准确率（Accuracy）、精确率（Precision）、召回率（Recall）、F1 值等。

回归：通常使用均方误差损失函数，即模型预测值与真实值之间差的平方和的平均值。其目的是使预测值尽可能地接近真实值，通过最小化均方误差来调整模型的参数。
分类：不同的分类模型使用的损失函数有所不同。例如，逻辑回归使用对数损失函数，也称为交叉熵损失函数，它衡量的是预测概率分布与真实概率分布之间的差异，通过最小化交叉熵损失来优化模型参数，使得预测的类别概率更加接近真实的类别分布；支持向量机使用合页损失函数，其目标是找到一个能够最大化间隔的超平面，使得分类错误的样本尽可能少，并且尽可能远离决策边界。

回归和分类在目标、输出变量类型、评估指标、模型选择和损失函数等方面都存在明显的区别，在实际应用中，需要根据具体的问题和数据特点来选择合适的任务类型和相应的模型。

本站资源均来自互联网，仅供研究学习，禁止违法使用和商用，产生法律纠纷本站概不负责！如果侵犯了您的权益请与我们联系！

点赞(0) 打赏

暂无评论