🎯 学习目标

  • 理解贝叶斯定理
  • 掌握朴素贝叶斯的假设
  • 学会不同类型的朴素贝叶斯
  • 了解文本分类应用

📐 贝叶斯定理

P(类别|特征) = P(特征|类别) × P(类别) / P(特征)

"朴素"假设:各特征之间相互独立

💻 sklearn实现

from sklearn.naive_bayes import GaussianNB, MultinomialNB, BernoulliNB # 高斯朴素贝叶斯(连续特征) gnb = GaussianNB() gnb.fit(X_train, y_train) # 多项式朴素贝叶斯(文本分类) mnb = MultinomialNB() mnb.fit(X_train_counts, y_train) # 伯努利朴素贝叶斯(二值特征) bnb = BernoulliNB() bnb.fit(X_train_binary, y_train) # 预测 y_pred = gnb.predict(X_test)

📝 本节小结

  • • 基于贝叶斯定理的概率分类器
  • • 假设特征独立(朴素假设)
  • • 训练和预测速度非常快
  • • 文本分类的经典方法