今天在看李航的《机器学习方法》的第一章,第一章主要是一些概述性的内容,其实结合自己以前的实战经历,还是比较好理解的。但是由于我的数学基础太菜了,对于一些说的比较绕的或者比较科学化的内容,就有点整不明白是什么意思,不过好在有chatgpt可以帮我去理解一些概念。本文主要是记录一下对于概率模型与非概率模型的理解。
概率模型使用概率论来描述数据生成的过程。这类模型会明确地估计数据的分布,或者在预测时输出概率分布。例如:
这些模型的输出通常是概率,比如预测某个样本属于某个类别的概率。在使用概率模型时,你可以获得关于模型预测结果的不确定性信息,这是它们的一个重要特征。
非概率模型则不直接使用概率来描述数据和预测结果。它们的目标通常是直接学习一个决策边界,或者找到一个可以将输入映射到输出的函数。例如:
非概率模型通常直接输出一个确定的预测结果,不会告诉你预测结果的概率信息。
它们的主要区别在于是否使用概率论来描述数据和预测结果。
在深度学习的一个分类任务中,例如三分类任务,获得的结果是[0.6,0.1,0.3],这是有概率的值,但是最终输出认为分类结果属于类别0。 这种情况属于概率模型还是非概率模型?
这种情况属于概率模型。
在深度学习的分类任务中,尤其是使用Softmax激活函数的多分类模型中,模型的输出是每个类别的概率分布。例如,你提到的输出 [0.6, 0.1, 0.3]
表示模型认为第一个类别的概率是 60%,第二个类别是 10%,第三个类别是 30%。这些概率值总和为 1。
虽然最终分类结果是选择概率最大的类别(在这个例子中是类别 0),但整个过程依然是基于概率的。因此,这种模型属于概率模型。