位置：首页>> 网络编程>> Python编程>> Python机器学习应用之朴素贝叶斯篇

Python机器学习应用之朴素贝叶斯篇

作者：柚子味的羊　　发布时间：2024-01-02 23:11:15　

标签：Python,朴素贝叶斯,机器学习

朴素贝叶斯（Naive Bayes，NB）：朴素贝叶斯分类算法是学习效率和分类效果较好的分类器之一。朴素贝叶斯算法一般应用在文本分类，垃圾邮件的分类，信用评估，钓鱼网站检测等。

1、鸢尾花案例

#％％库函数导入
import warnings
warnings.filterwarnings('ignore')
import numpy as np
# 加载莺尾花数据集
from sklearn import datasets
# 导入高斯朴素贝叶斯分类器
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split
#％％数据导入&分析
X, y = datasets.load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
#％％查看数据集
print(X)#特征集
print(y)#现象
#％％模型训练
# 假设每个特征都服正态分布，使用高斯朴素贝叶斯进行计算
clf = GaussianNB(var_smoothing=1e-8)
clf.fit(X_train, y_train)
#％％模型预测
# 评估
y_pred = clf.predict(X_test)
acc = np.sum(y_test == y_pred) / X_test.shape[0]
print("Test Acc : ％.3f" ％ acc)

# 预测
#对第一行数据预测
y_proba = clf.predict_proba(X_test[:1])
#使用predict()函数得到预测结果
print(clf.predict(X_test[:1]))
#输出预测每个标签的概率，预测标签为0，1，2的概率分别为数组的三个值
print("预计的概率值:", y_proba)

运行结果

2、小结

predict（）函数和predict_proba（）函数的区别： predict（）函数用于预测标签，直接得到预测标签。predict_proba（）函数得到的是测试集预测得到的每个标签的概率。如果测试集一共有30个数据集，数据原本有3个标签，那么使用predict（）函数将会得到30个具体预测得到的标签值，是一个【130】的数组，使用predict_proba（）函数得到的是30个数据集分别取得3个标签的概率，是一个【303】的数组。

我又回来了，继续更新~ 欢迎交流

来源：https://blog.csdn.net/qq_43368987/article/details/122297194

0

投稿

猜你喜欢

python实现音乐播放和下载小程序功能
（本篇部分代码综合整理自B站，B站有手把手说明的教程）1.网易云非付费内容爬取器（声明：由于技术十分简单，未到触犯软件使用规则的程度）驱动E
numpy的sum函数的axis和keepdim参数详解
一.axisaxis就是指定轴。三维数组可看作元素是二维数组的一维数组，二维数组可看作元素是一维数组的一维数组。（这么理解就舒服了！）例：
Django ValuesQuerySet转json方式
在使用ValuesQuerySet存放查询结果时，有时需要转为json，但并不能直接使用json.dumps()直接转，而是需要经过下面一个
Python测试框架pytest核心库pluggy详解
代码案例import pluggy# HookspecMarker 和 HookimplMarker 实质上是一个装饰器带参数的装饰器类，作
django1.11.1 models 数据库同步方法
在django1.9之前，数据库同步只需要一条命令：python manage.py syncdb在djang1.9以后，数据库同步执行指令
python实现数独算法实例
本文实例讲述了python实现数独算法的方法。分享给大家供大家参考。具体如下：# -*- coding: utf-8 -*-'
python sklearn包——混淆矩阵、分类报告等自动生成方式
preface：做着最近的任务，对数据处理，做些简单的提特征，用机器学习算法跑下程序得出结果，看看哪些特征的组合较好，这一系列流程必然要用到
这么多的 Oracle 性能工具
偶然看到 Tanel Poder 提到的一个 Metalink Note (438452.1): Performance Tools Qui
费明红：什么样的404页面才是正确的？
404页面对于站长来说应该并不陌生，其作用无碍乎二点：提高用户体验和增强对搜索引擎的友好性。去年在跟几个朋友在聊天的时候，跟我说404页面不
python中如何利用matplotlib画多个并列的柱状图
首先如果柱状图中有中文，比如X轴和Y轴标签需要写中文，解决中文无法识别和乱码的情况，加下面这行代码就可以解决了：plt.rcParams[&
Python实现监控内存使用情况和代码执行时间
我的代码的哪些部分运行时间最长、内存最多？我怎样才能找到需要改进的地方？”在开发过程中，我很确定我们大多数人都会想知道这
SQL Server 公用表表达式(CTE)实现递归的方法
公用表表达式简介：公用表表达式 (CTE) 可以认为是在单个 SELECT、INSERT、UPDATE、DELETE 或 CREATE VI
python 操作mysql数据中fetchone()和fetchall()方式
fetchone() 返回单个的元组，也就是一条记录(row)，如果没有结果则返回 Nonefetchall() 返回多个元组，即返回多个
Python中的文本相似度的计算方法总结
在自然语言处理（NLP）领域，文本相似度计算是一个常见的任务。本文将介绍如何使用Python计算文本之间的相似度，涵盖了余弦相似度、Jacc
win2003 Server配置SQL Server 2005远程连接的方法
今天第一次玩SQL Server 2005，需要配置远程连接。我废话少说，直入主题，总结下我从新手立场在win2003 server环境下去
如何用Cookie进行登录验证？
如何用Cookie进行登录验证？很简单，看看这两个文件：login.htm请注册登录随风起舞<FORM ACTION=&qu
Go中strings的常用方法详解
string操作在编程中具有极高的频率，那么string中有哪些有用的方法呢？使用strings直接操作Comparefunc Compar
JS数组Array常用方法汇总+实例
一、JavaScript中创建数组的方式（1）使用 Array 构造函数：var arr1 = new Array(); //创建
Python3列表List入门知识附实例
序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置，或索引，第一个索引是0，第二个索引是1，依此类推。Pyt
10点优化sql数据库技巧
与没有数据库的网站相比，数据库的存取会降低你的系统性能。但是大多数情况下，网站和数据库有密不可分的关系，正是数据库给站点提供了大容量、多样性

运筹学-Python实现图论与最短距离

python重试装饰器的简单实现方法

将python字符串转化成长表达式的函数eval实例

python在windows下实现备份程序实例

python实现图书馆研习室自动预约功能

Python学习笔记之if语句的使用示例

python中openpyxl库用法详解

详解Python爬取并下载《电影天堂》3千多部电影

selenium2.0中常用的python函数汇总

Python搭建APNS苹果推送通知推送服务的相关模块使用指南

苹果Mac系统笔记本电脑卸载软件的方法

花亦山心之月玉泽技能怎么样

鸿图之下怎么兑换合适的武技

食物语多余的家具怎么处理？多余家具处理办法介绍

如何在word2007显示或隐藏格式标记

Word2007表格怎么绘制斜线表头及样式

Word2007中妙用"+"."-"号绘制表格

天涯明月刀手游等级上限是多少

iPhone 控制中心在锁定屏幕怎么关闭？

PPT背景图怎么设置如何制作一个精彩的PPT作品

手机版 网络编程 asp之家 www.aspxhome.com