当前位置：首页 > news >正文

用dz程序做的电影网站seo站长工具推广平台

news 2025/7/9 6:38:42

用dz程序做的电影网站,seo站长工具推广平台,网站建设论文致谢,做教育业网站目录 1、朴素贝叶斯算法 1.1 案例 1.2 联合概率、条件概率、相互独立 1.3 贝叶斯公式 1.4 朴素贝叶斯算法原理 1.5 应用场景 2、朴素贝叶斯算法对文本进行分类 2.1 案例 2.2 拉普拉斯平滑系数 3、API 4、案例：20类新闻分类 4.1 步骤分析 4.2 代码分析 …

目录

1、朴素贝叶斯算法

1.1 案例

1.2 联合概率、条件概率、相互独立

1.3 贝叶斯公式

1.4 朴素贝叶斯算法原理

1.5 应用场景

2、朴素贝叶斯算法对文本进行分类

2.1 案例

2.2 拉普拉斯平滑系数

3、API

4、案例：20类新闻分类

4.1 步骤分析

4.2 代码分析

5、总结

sklearn转换器和估算器
KNN算法
模型选择和调优
朴素贝叶斯算法
决策树
随机森林

1、朴素贝叶斯算法

朴素？

假设：特征与特征之间是相互独立的

1.1 案例

1.2 联合概率、条件概率、相互独立

1.3 贝叶斯公式

1.4 朴素贝叶斯算法原理

朴素 + 贝叶斯

1.5 应用场景

文本分类（单词作为特征）

2、朴素贝叶斯算法对文本进行分类

2.1 案例

2.2 拉普拉斯平滑系数

3、API

4、案例：20类新闻分类

4.1 步骤分析

获取数据
划分数据集
特征工程 --文本特征抽取
朴素贝叶斯预估器流程
模型评估

4.2 代码分析

from sklearn.datasets import load_iris, fetch_20newsgroups
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.naive_bayes import MultinomialNB
from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import StandardScalerdef knn_iris():# 用KNN 算法对鸢尾花进行分类# 1、获取数据iris = load_iris()# 2、划分数据集x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=6)# 3、特征工程 - 标准化transfer = StandardScaler()x_train = transfer.fit_transform(x_train)x_test = transfer.transform(x_test)# 4、KNN 算法预估器estimator = KNeighborsClassifier(n_neighbors=3)estimator.fit(x_train,y_train)# 5、模型评估# 方法1 ：直接比对真实值和预测值y_predict = estimator.predict(x_test)print("y_predict：\n",y_predict)print("直接比对真实值和预测值：\n",y_test == y_predict)# 方法2：计算准确率score = estimator.score(x_test,y_test)print("准确率为：\n",score)return Nonedef knn_iris_gscv():# 用KNN 算法对鸢尾花进行分类，添加网格搜索和交叉验证# 1、获取数据iris = load_iris()# 2、划分数据集x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=6)# 3、特征工程 - 标准化transfer = StandardScaler()x_train = transfer.fit_transform(x_train)x_test = transfer.transform(x_test)# 4、KNN 算法预估器estimator = KNeighborsClassifier()# 加入网格搜索和交叉验证# 参数准备param_dict = {"n_neighbors":[1,3,5,7,9,11]}estimator = GridSearchCV(estimator,param_grid=param_dict,cv=10)estimator.fit(x_train,y_train)# 5、模型评估# 方法1 ：直接比对真实值和预测值y_predict = estimator.predict(x_test)print("y_predict：\n",y_predict)print("直接比对真实值和预测值：\n",y_test == y_predict)# 方法2：计算准确率score = estimator.score(x_test,y_test)print("准确率为：\n",score)# 最佳参数：best_params_print("最佳参数：\n",estimator.best_params_)# 最佳结果：best_score_print("最佳结果：\n",estimator.best_score_)# 最佳估计值：best_estimator_print("最佳估计值：\n",estimator.best_estimator_)# 交叉验证结果：cv_results_print("交叉验证结果：\n",estimator.cv_results_)return Nonedef nb_news():# 用朴素贝叶斯算法对新闻进行分类# 1、获取数据news = fetch_20newsgroups(subset="all")# 2、划分数据集x_train,x_test,y_train,y_test = train_test_split(news.data,news.target)# 3、特征工程：文本特征抽取-tfidftransfer = TfidfVectorizer()x_train = transfer.fit_transform(x_train)x_test = transfer.transform(x_test)# 4、用朴素贝叶斯算法预估器流程estimator = MultinomialNB()estimator.fit(x_train,y_train)# 5、模型评估# 方法1 ：直接比对真实值和预测值y_predict = estimator.predict(x_test)print("y_predict：\n", y_predict)print("直接比对真实值和预测值：\n", y_test == y_predict)# 方法2：计算准确率score = estimator.score(x_test, y_test)print("准确率为：\n", score)return Noneif __name__ == "__main__":# 代码1 ：用KNN算法对鸢尾花进行分类# knn_iris()# 代码2 ：用KNN算法对鸢尾花进行分类，添加网格搜索和交叉验证# knn_iris_gscv()# 代码3：用朴素贝叶斯算法对新闻进行分类nb_news()

5、总结

http://www.ritt.cn/news/16127.html

相关文章：

莆田网站建站快排seo排名软件

做网站开发多少钱杭州推广系统

建设工程招聘信息网站免费企业网站建设流程

公司网站如何做维护合作seo公司

网站建设栏目百度网站收录入口

威海哪有网站建设2022年大事热点新闻

中贸网做的网站网络营销的好处

云南网站制作案例网络营销课程总结1500字

网站代码开发方式市场监督管理局官网入口

政务网站建设规范针对本地的免费推广平台

深圳做自适应网站设计百度热搜榜排名今日第一

公益建网站新媒体运营是做什么

深圳网站建设维护服务品牌推广渠道

网站选项怎么做搜狗推广登录入口

竭诚网络网站建设开发免费crm网站不用下载的软件

pc端兼手机端网站模板网络营销知名企业

中文安卓开发软件廊坊seo排名

专做动漫的网站免费网站外链推广

流量型网站 cms销售的技巧与口才

遵义公司做网站网络营销概述

拍摄企业宣传片公司哪家好搜索引擎优化seo怎么做

网站建设模板坏处seo优化网站推广专员招聘

承德网站制作公司口碑营销方案

宁晋县建设局网站整站优化seo

高大上网站建设公司2022年新闻摘抄十条简短

如何做淘宝返利网站seo运营做什么

营销型网站建设个人总结怎么写公司网页网站建设

如何自学网站后台北京seo百度推广

网站建设贸易宁波seo外包服务平台

wordpress 4.4.2 漏洞专业网站seo推广