geekdoc-python-zh/docs/askpython/supervised-vs-unsupervised-...

4.7 KiB

监督学习与非监督学习——需要了解的差异!

原文:https://www.askpython.com/python/supervised-vs-unsupervised-learning

读者朋友们,你们好!在本文中,我们将详细关注监督学习和非监督学习之间的差异。

在对数据值进行建模以了解趋势时,机器学习已经成为一个重要的概念。从类似的角度来看,它为我们提供了两种最常用的算法——监督和非监督的最大似然算法。

让我们在下一节中首先对这一点有一个简要的了解。

所以,让我们开始吧!!🙂


什么是监督学习?

监督机器学习是机器学习的一个分支,其中模型从历史数据值中学习。也就是说,我们向模型提供历史数据值(训练数据集),然后模型/算法从提供的数据中学习,以对其执行预测。

当它从历史数据中学习时,它确定模式并使用它们对未知数据值执行预测。提供给模型的数据是完全标记的。

常见的监督 ML 算法——

  1. 线性回归
  2. 决策树回归器
  3. 随机森林回归子等。

现在让我们来理解一些有监督的机器学习算法,以了解相同的概念


线性回归

通过线性回归,我们试图根据对自变量数据的印象找到最佳拟合线来确定因变量。

也就是说,我们将这组值提供给算法(训练数据集)。基于这些值,算法试图找到并预测因变量的值。这里的所有变量本质上都是线性的,甚至最终结果值本质上都是线性的。


决策树

决策树是一种有监督的机器学习算法,具有流程图结构。也就是说,数据值的预测取决于决策规则。树结构的内部节点代表属性。该树根据这些属性的值进行划分和分区。分割继续进行,直到所有节点/属性都用尽。


什么是无监督学习?

与有监督的机器学习不同,无监督的 ML 算法不从历史数据值中学习。也就是说,它不接受任何带有模式的学习数据。相反,它从数据中检测相似的特征,并为预测形成相同的类别。

它利用未标记的数据,然后检测相同范围内的模式,并将其收集到一个分组的形式中,以便在输入时检测未知数据。

常见的无监督学习算法–

  1. K 表示聚类
  2. 关联算法

使用无监督学习算法,不会提供任何训练数据。假设 K 表示聚类,该算法对特定值(n)的数据进行聚类,并根据独立变量收集具有相似性的属性。

从而证明了检测模式的概念。基本上,就单词而言,我们的意思是说算法根据周围的其他属性考虑一些模式和相似性,将 n 个属性分组(聚类)。


监督学习和非监督学习的基本区别

让我们来了解一下监督学习和非监督学习的 3 个区别。

1.真实数据集上的结果

预测后,当我们考虑模型的评估时,与非监督学习模型相比,监督机器学习模型在更高的准确性方面给我们提供了更好的结果。

原因是受监督的 ML 模型从历史数据中学习,然后执行预测,这使得它更加准确。当我们想到无监督模型时,算法检测模式和执行预测有点挑战性,因为没有历史数据集,这可能导致开始时的准确性较低。

然而,如果无监督模型在真实世界的数据集上进行足够的“练习”,随着模型学习你以前可能没有见过的模式,准确性可以飙升。同样,这取决于模型和数据类型。


2.输入数据的性质

当涉及到监督学习算法时,馈入模型的输入数据被标记。这就是它如何使算法能够从数据中检测模式。

另一方面,未标记的数据被提供给无监督的模型,在其中检测相似的特征并将它们分组。


3.定型数据模型的行为

当涉及到监督机器学习时,模型需要输入学习数据和输出模型。它非常清楚输入和输出值。

使用无监督机器学习,只有输入/训练数据被馈送到模型。该模型不将预测的输出(对于历史数据)作为输入,这是它完全不知道的。


结论

到此,我们就结束了这个话题。如果你有任何问题,欢迎在下面评论。更多关于 Python 编程和机器学习的帖子,请继续关注我们。

在那之前,学习愉快!!🙂