4.7 KiB
监督学习与非监督学习——需要了解的差异!
原文:https://www.askpython.com/python/supervised-vs-unsupervised-learning
读者朋友们,你们好!在本文中,我们将详细关注监督学习和非监督学习之间的差异。
在对数据值进行建模以了解趋势时,机器学习已经成为一个重要的概念。从类似的角度来看,它为我们提供了两种最常用的算法——监督和非监督的最大似然算法。
让我们在下一节中首先对这一点有一个简要的了解。
所以,让我们开始吧!!🙂
什么是监督学习?
监督机器学习是机器学习的一个分支,其中模型从历史数据值中学习。也就是说,我们向模型提供历史数据值(训练数据集),然后模型/算法从提供的数据中学习,以对其执行预测。
当它从历史数据中学习时,它确定模式并使用它们对未知数据值执行预测。提供给模型的数据是完全标记的。
常见的监督 ML 算法——
现在让我们来理解一些有监督的机器学习算法,以了解相同的概念
线性回归
通过线性回归,我们试图根据对自变量数据的印象找到最佳拟合线来确定因变量。
也就是说,我们将这组值提供给算法(训练数据集)。基于这些值,算法试图找到并预测因变量的值。这里的所有变量本质上都是线性的,甚至最终结果值本质上都是线性的。
决策树
决策树是一种有监督的机器学习算法,具有流程图结构。也就是说,数据值的预测取决于决策规则。树结构的内部节点代表属性。该树根据这些属性的值进行划分和分区。分割继续进行,直到所有节点/属性都用尽。
什么是无监督学习?
与有监督的机器学习不同,无监督的 ML 算法不从历史数据值中学习。也就是说,它不接受任何带有模式的学习数据。相反,它从数据中检测相似的特征,并为预测形成相同的类别。
它利用未标记的数据,然后检测相同范围内的模式,并将其收集到一个分组的形式中,以便在输入时检测未知数据。
常见的无监督学习算法–
使用无监督学习算法,不会提供任何训练数据。假设 K 表示聚类,该算法对特定值(n)的数据进行聚类,并根据独立变量收集具有相似性的属性。
从而证明了检测模式的概念。基本上,就单词而言,我们的意思是说算法根据周围的其他属性考虑一些模式和相似性,将 n 个属性分组(聚类)。
监督学习和非监督学习的基本区别
让我们来了解一下监督学习和非监督学习的 3 个区别。
1.真实数据集上的结果
预测后,当我们考虑模型的评估时,与非监督学习模型相比,监督机器学习模型在更高的准确性方面给我们提供了更好的结果。
原因是受监督的 ML 模型从历史数据中学习,然后执行预测,这使得它更加准确。当我们想到无监督模型时,算法检测模式和执行预测有点挑战性,因为没有历史数据集,这可能导致开始时的准确性较低。
然而,如果无监督模型在真实世界的数据集上进行足够的“练习”,随着模型学习你以前可能没有见过的模式,准确性可以飙升。同样,这取决于模型和数据类型。
2.输入数据的性质
当涉及到监督学习算法时,馈入模型的输入数据被标记。这就是它如何使算法能够从数据中检测模式。
另一方面,未标记的数据被提供给无监督的模型,在其中检测相似的特征并将它们分组。
3.定型数据模型的行为
当涉及到监督机器学习时,模型需要输入学习数据和输出模型。它非常清楚输入和输出值。
使用无监督机器学习,只有输入/训练数据被馈送到模型。该模型不将预测的输出(对于历史数据)作为输入,这是它完全不知道的。
结论
到此,我们就结束了这个话题。如果你有任何问题,欢迎在下面评论。更多关于 Python 编程和机器学习的帖子,请继续关注我们。
在那之前,学习愉快!!🙂