- • 基于贝叶斯定理的概率分类器
- • 假设特征独立(朴素假设)
- • 训练和预测速度非常快
- • 文本分类的经典方法
7.7 朴素贝叶斯
基于概率的快速分类器
🎯 学习目标
- 理解贝叶斯定理
- 掌握朴素贝叶斯的假设
- 学会不同类型的朴素贝叶斯
- 了解文本分类应用
📐 贝叶斯定理
P(类别|特征) = P(特征|类别) × P(类别) / P(特征)
"朴素"假设:各特征之间相互独立
💻 sklearn实现
from sklearn.naive_bayes import GaussianNB, MultinomialNB, BernoulliNB
# 高斯朴素贝叶斯(连续特征)
gnb = GaussianNB()
gnb.fit(X_train, y_train)
# 多项式朴素贝叶斯(文本分类)
mnb = MultinomialNB()
mnb.fit(X_train_counts, y_train)
# 伯努利朴素贝叶斯(二值特征)
bnb = BernoulliNB()
bnb.fit(X_train_binary, y_train)
# 预测
y_pred = gnb.predict(X_test)
📝 本节小结
✅