4.7 KiB

Raw Permalink Blame History

监督学习与非监督学习——需要了解的差异！

原文：https://www.askpython.com/python/supervised-vs-unsupervised-learning

读者朋友们，你们好！在本文中，我们将详细关注监督学习和非监督学习之间的差异。

在对数据值进行建模以了解趋势时，机器学习已经成为一个重要的概念。从类似的角度来看，它为我们提供了两种最常用的算法——监督和非监督的最大似然算法。

让我们在下一节中首先对这一点有一个简要的了解。

所以，让我们开始吧！！🙂

什么是监督学习？

监督机器学习是机器学习的一个分支，其中模型从历史数据值中学习。也就是说，我们向模型提供历史数据值(训练数据集)，然后模型/算法从提供的数据中学习，以对其执行预测。

当它从历史数据中学习时，它确定模式并使用它们对未知数据值执行预测。提供给模型的数据是完全标记的。

常见的监督 ML 算法——

现在让我们来理解一些有监督的机器学习算法，以了解相同的概念

线性回归

通过线性回归，我们试图根据对自变量数据的印象找到最佳拟合线来确定因变量。

也就是说，我们将这组值提供给算法(训练数据集)。基于这些值，算法试图找到并预测因变量的值。这里的所有变量本质上都是线性的，甚至最终结果值本质上都是线性的。

决策树

决策树是一种有监督的机器学习算法，具有流程图结构。也就是说，数据值的预测取决于决策规则。树结构的内部节点代表属性。该树根据这些属性的值进行划分和分区。分割继续进行，直到所有节点/属性都用尽。

什么是无监督学习？

与有监督的机器学习不同，无监督的 ML 算法不从历史数据值中学习。也就是说，它不接受任何带有模式的学习数据。相反，它从数据中检测相似的特征，并为预测形成相同的类别。

它利用未标记的数据，然后检测相同范围内的模式，并将其收集到一个分组的形式中，以便在输入时检测未知数据。

常见的无监督学习算法–

使用无监督学习算法，不会提供任何训练数据。假设 K 表示聚类，该算法对特定值(n)的数据进行聚类，并根据独立变量收集具有相似性的属性。

从而证明了检测模式的概念。基本上，就单词而言，我们的意思是说算法根据周围的其他属性考虑一些模式和相似性，将 n 个属性分组(聚类)。

监督学习和非监督学习的基本区别

让我们来了解一下监督学习和非监督学习的 3 个区别。

1.真实数据集上的结果

预测后，当我们考虑模型的评估时，与非监督学习模型相比，监督机器学习模型在更高的准确性方面给我们提供了更好的结果。

原因是受监督的 ML 模型从历史数据中学习，然后执行预测，这使得它更加准确。当我们想到无监督模型时，算法检测模式和执行预测有点挑战性，因为没有历史数据集，这可能导致开始时的准确性较低。

然而，如果无监督模型在真实世界的数据集上进行足够的“练习”，随着模型学习你以前可能没有见过的模式，准确性可以飙升。同样，这取决于模型和数据类型。

2.输入数据的性质

当涉及到监督学习算法时，馈入模型的输入数据被标记。这就是它如何使算法能够从数据中检测模式。

另一方面，未标记的数据被提供给无监督的模型，在其中检测相似的特征并将它们分组。

3.定型数据模型的行为

当涉及到监督机器学习时，模型需要输入学习数据和输出模型。它非常清楚输入和输出值。

使用无监督机器学习，只有输入/训练数据被馈送到模型。该模型不将预测的输出(对于历史数据)作为输入，这是它完全不知道的。

结论

到此，我们就结束了这个话题。如果你有任何问题，欢迎在下面评论。更多关于 Python 编程和机器学习的帖子，请继续关注我们。

在那之前，学习愉快！！🙂

4.7 KiB Raw Permalink Blame History