贝叶斯分类器
贝叶斯分类器是一种基于生成式模型的分类器,其基本思想是利用贝叶斯公式计算后验概率
两种机器学习的策略
机器学习所要实现的目标在某种程度上可以视作利用有限的样本进行学习,以达到给定输入
- 判别式模型:直接对
进行建模,例如决策树、支持向量机、神经网络等。 - 生成式模型:对联合分布
进行建模,然后通过贝叶斯公式计算后验概率 。
贝叶斯公式
给定样本
其中
极大似然估计
在实际应用中,我们通常先假设似然
一般使用对数似然来简化计算并避免数值下溢:
例如,如果假设
显然,估计结果的准确性严重依赖于所假设的概率分布形式是否符合潜在的真实分布。上述的例子中,如果真实的分布不是高斯分布,那么使用高斯分布来估计参数会导致欠拟合。
朴素贝叶斯分类器
朴素贝叶斯分类器是一种简单的贝叶斯分类器,其朴素体现在特征之间相互独立的假设上。在这一假设下,我们有
其中
对于
其中
如果特征