fine_rain

使用sklearn完成4种基本的分类算法：朴素贝叶斯算法、决策树算法、人工神经网络、支持向量机算法

文章目录

实验目的
实验内容及步骤
实验数据说明
实验过程
- 朴素贝叶斯分类
- 决策树
- - 决策树概念简介
- 神经网络
- SVM

实验目的

巩固4种基本的分类算法的算法思想：朴素贝叶斯算法，决策树算法，人工神经网络,支持向量机算法；
能够使用现有的分类器算法代码进行分类操作
学习如何调节算法的参数以提高分类性能；

实验内容及步骤

利用现有的分类器算法对文本数据集进行分类
实验步骤：
1．了解文本数据集的情况并阅读算法代码说明文档；
2．利用文本数据集中的训练数据对算法进行参数学习；
3．利用学习的分类器对测试数据集进行测试；
4．统计测试结果；

实验数据说明

汽车评估数据集包含1728个数据，其中训练数据1350，测试数据个。每个数据包含6个属性，所有的数据分为4类：
Class Values: unacc, acc, good, vgood
Attributes:
buying: vhigh, high, med, low.
maint: vhigh, high, med, low.
doors: 2, 3, 4, 5，more.
persons: 2, 4, more.
lug_boot: small, med, big.
safety: low, med, high.
其中Attributes是指它的属性子集。而其属性子集包括了六类，分别是购买（buying），维修（maint），车门数（doors），承载人数（Persons），载行李量（Luggage boot），安全性（safety)。每种属性又分成了相应的子集，分别为高中低或者是能承载的数量。下图是提供该数据集的网站截图。

实验过程

首先将所需要的库和数据集导入，分为训练集和测试集

from sklearn import svm,tree
from sklearn.naive_bayes import GaussianNB,MultinomialNB,BernoulliNB
from sklearn.metrics import classification_report
from sklearn.neural_network import MLPClassifier

import numpy as np



def iris_type1(s):
    Class_Values = {b'unacc':0, b'acc':1, b'good':2, b'vgood':3}
    return Class_Values[s]

def iris_type2(s):
    buying = {b'vhigh': 0, b'high': 1, b'med': 2, b'low': 3}
    return buying[s]

def iris_type3(s):
    maint =  {b'vhigh': 0, b'high': 1, b'med': 2, b'low': 3}
    return maint[s]

def iris_type4(s):
    doors = {b'2':0, b'3':1, b'4':2, b'5more':3}
    return doors[s]

def iris_type5(s):
    persons = {b'2':0, b'4':1, b'more':2}
    return persons[s]

def iris_type6(s):
    lug_boot = {b'small':0, b'med':1, b'big':2}
    return lug_boot[s]

def iris_type7(s):
    safety = {b'low':0, b'med':1, b'high':2}
    return safety[s]


path1 = u'D:/大三上/人工智能导论/实验/dataset/test.txt'  # 数据文件路径
path2 = u'D:/大三上/人工智能导论/实验/dataset/predict.txt'
train = np.loadtxt(path1,dtype=int,delimiter=',',converters={0: iris_type3, 1: iris_type3, 2: iris_type4,
                                                             3: iris_type5, 4: iris_type6, 5: iris_type7,
                                                             6: iris_type1})
test = np.loadtxt(path2,dtype=int,delimiter=',',converters={0: iris_type3, 1: iris_type3, 2: iris_type4,
                                                             3: iris_type5, 4: iris_type6, 5: iris_type7,
                                                             6: iris_type1})

将训练集和测试集的特征属性划分

train_x, train_y = np.split(train, (6,), axis=1) #划分特征 和 标签
test_x, test_y = np.split(test, (6,), axis=1) #划分属性 和 value

朴素贝叶斯分类

朴素贝叶斯算法 3种朴素贝叶斯分类算法：GaussianNB(高斯朴素贝叶斯)、MultinomialNB(多项式朴素贝叶斯)、BernoulliNB(伯努利朴素贝叶斯)
高斯模型
当特征是连续变量的时候，假设特征分布为正太分布，根据样本算出均值和方差，再求得概率。

clf = GaussianNB()
clf.fit(train_x, train_y.ravel())
print (clf.score(train_x, train_y))
print (clf.score(test_x, test_y))

输出结果：

0.766666666667
0.666666666667

多项式朴素贝叶斯：sklearn.naive_bayes.MultinomialNB(alpha=1.0, fit_prior=True, class_prior=None)主要用于离散特征分类，例如文本分类单词统计，以出现的次数作为特征值
多项式模型：多项式模型在计算先验概率P(Yk)P(Yk)和条件概率P(xi|Yk)P(xi|Yk)时，会做一些平滑处理，具体公式为：

参数说明： alpha：浮点型，可选项，默认1.0，添加拉普拉修/Lidstone平滑参数
fit_prior：布尔型，可选项，默认True，表示是否学习先验概率，参数为False表示所有类标记具有相同的先验概率
class_prior：类似数组，数组大小为(n_classes,)，默认None，类先验概率

clf = MultinomialNB(alpha=2.0,fit_prior=True)
clf.fit(train_x, train_y.ravel())
print (clf.score(train_x, train_y))
print (clf.score(test_x, test_y))

输出结果：

0.731851851852
0.582010582011

伯努利模型伯努利模型适用于离散特征的情况，伯努利模型中每个特征的取值只能是1和0

伯努利朴素贝叶斯：sklearn.naive_bayes.BernoulliNB类似于多项式朴素贝叶斯，也主要用户离散特征分类，和MultinomialNB的区别是：MultinomialNB以出现的次数为特征值，BernoulliNB为二进制或布尔型特性
参数说明： binarize：将数据特征二值化的阈值

clf = BernoulliNB(binarize = 3.0,fit_prior=True)
clf.fit(train_x, train_y.ravel())
print (clf.score(train_x, train_y))
print (clf.score(test_x, test_y))

输出结果：

0.733333333333
0.582010582011

决策树

决策树概念简介

决策树(Decision Tree）是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。
由于这种决策分支画成图形很像一棵树的枝干，故称决策树。在机器学习中，决策树是一个预测模型，他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度，使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。
决策树（decision tree）是一个树结构（可以是二叉树或非二叉树）。其每个非叶节点表示一个特征属性上的测试，每个分支代表这个特征属性在某个值域上的输出，而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始，测试待分类项中相应的特征属性，并按照其值选择输出分支，直到到达叶子节点，将叶子节点存放的类别作为决策结果
分类树（决策树）是一种十分常用的分类方法。他是一种监管学习，所谓监管学习就是给定一堆样本，每个样本都有一组属性和一个类别，这些类别是事先确定的，那么通过学习得到一个分类器，这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。
比较重要的参数：
criterion ：规定了该决策树所采用的的最佳分割属性的判决方法，有两种：“gini”，“entropy”。 gini值表示采用了CART树的规则，采用一种二分递归分割的技术，将当前的样本集分为两个子样本集，使得生成的的每个非叶子节点都有两个分支。因此，CART算法生成的决策树是结构简洁的二叉树。即不纯度来作为树结构的指标的二叉树，在CART算法中, 基尼不纯度表示一个随机选中的样本在子集中被分错的可能性。
基尼不纯度为这个样本被选中的概率乘以它被分错的概率。
当一个节点中所有样本都是一个类时，基尼不纯度为零。
而entropy则表示选择C3树的规则，即信息增益来作为树结构产生的标准，选择分裂后信息增益最大的属性进行分裂。

参数说明：
max_depth：限定了决策树的最大深度，防止过拟合
min_samples_leaf：限定了叶子节点包含的最小样本数，这个属性对于防止数据碎片问题很有作用。
使用该算法训练数据时的注意事项：
当我们数据中的feature较多时，一定要有足够的数据量来支撑我们的算法，不然的话很容易overfitting 。
PCA是一种避免高维数据overfitting的办法。从一棵较小的树开始探索，用export方法打印出来看看。
善用max_depth参数，缓慢的增加并测试模型，找出最好的那个depth。
善用min_samples_split和min_samples_leaf参数来控制叶子节点的样本数量，防止overfitting。
平衡训练数据中的各个种类的数据，防止一个种类的数据dominate。
6.

#使用信息熵作为划分标准，对决策树进行训练
clf=tree.DecisionTreeClassifier(criterion='entropy')
clf.fit(train_x, train_y.ravel())
print (clf.score(train_x, train_y))
print (clf.score(test_x, test_y))

clf=tree.DecisionTreeClassifier(criterion='gini')
clf.fit(train_x, train_y.ravel())
print (clf.score(train_x, train_y))
print (clf.score(test_x, test_y))

神经网络

人工神经网络多层向前神经网络组成部分
输入层（input layer），隐藏层（hiddenlayer），输出层（output layer）
每层由单元（units）组成
输入层（input layer）是由训练集的实例特征向量传入
经过连接结点的权重（weight）传入下一层，一层的输出是下一层的输入
隐藏层的个数是任意的，输出层和输入层只有一个
每个单元（unit）也可以被称作神经结点，根据生物学来源定义
上图称为2层的神经网络（输入层不算）
一层中加权的求和，然后根据非线性的方程转化输出
作为多层向前神经网络，理论上，如果有足够多的隐藏层（hidden layers）和足够大的训练集，可以模拟出任何方程

训练方法：
计算的时间复杂度非常高 solver=‘lbfgs’, MLP的求解方法：L-BFGS 在小数据上表现较好，Adam 较为鲁棒，SGD在参数调整较优时会有最佳表现（分类效果与迭代次数）； SGD标识随机梯度下降。
SGD:随机从训练集选取数据训练，不归一化数据，需要专门在外面进行归一化，支持L1,L2正则化。
L-BFGS:所有的数据都会参与训练，算法融入方差归一化和均值归一化。支持L1,L2正则化。
adam: 随机梯度下降保持单一的学习率（即 alpha）更新所有的权重，学习率在训练过程中并不会改变。而 Adam 通过计算梯度的一阶矩估计和二阶矩估计而为不同的参数设计独立的自适应性学习率
参数说明：
alpha：同样也称为学习率或步长因子，它控制了权重的更新比率（如 0.001）。较大的值（如 0.3）在学习率更新前会有更快的初始学习，而较小的值（如 1.0E-5）会令训练收敛到更好的性能
L2的参数：MLP是可以支持正则化的，默认为L2，具体参数需要调整,正则化的目的是限制参数过多或者过大，避免模型更加复杂
hidden_layer_sizes=(5, 2) hidden层2层,第一层5个神经元，第二层2个神经元)
通过应用Softmax作为输出函数，MLPClassifier支持多类别分类。进一步，模型支持多标签分类，即，一个样本能够属于多个类。对于每一个类，原始输出经历logistic函数。大于等于0.5的值，记为1；否则，记为0. 对于一个样本的预测输出，值是1的索引代表分派给那个样本的类。

clf = MLPClassifier(hidden_layer_sizes=(12,9),
                                    activation='logistic',
                                    solver='lbfgs',
                                    alpha=1e-3,
                                    random_state=1)
clf.fit(train_x, train_y.ravel())
print (clf.score(train_x, train_y))
print (clf.score(test_x, test_y))

输出结果：

0.988888888889
0.910052910053

SVM

训练svm分类器 C越大，相当于惩罚松弛变量，希望松弛变量接近0，即对误分类的惩罚增大，趋向于对训练集全分对的情况，这样对训练集测试时准确率很高，但泛化能力弱。C值小，对误分类的惩罚减小，允许容错，将他们当成噪声点，泛化能力较强。

参数说明：

gamma ： ‘rbf’,‘poly’ 和‘sigmoid’的核函数参数。gamma值越小，分类界面越连续；gamma值越大，分类界面越“散”，分类效果越好，但有可能会过拟合。默认是’auto’，则会选择1/n_features
kernel='linear’时，为线性核。
kernel='rbf’时（default），为高斯核，
decision_function_shape='ovr’时，为one v rest，即一个类别与其他类别进行划分，
decision_function_shape='ovo’时，为one v one，即将类别两两之间进行划分，用二分类的方法模拟多分类的结果。

核函数

clf = svm.SVC(C=0.8, kernel='rbf', gamma=10, decision_function_shape='ovo')
clf.fit(train_x, train_y.ravel())

输出结果：

SVC(C=0.8, cache_size=200, class_weight=None, coef0=0.0,
decision_function_shape=‘ovo’, degree=3, gamma=10, kernel=‘rbf’,
max_iter=-1, probability=False, random_state=None, shrinking=True,
tol=0.001, verbose=False)

计算svc分类器的准确率

高斯核：

print (clf.score(train_x, train_y))  # 精度
y_hat = clf.predict(train_x)
print (clf.score(test_x, test_y))
y_hat = clf.predict(test_x)
#print(classification_report(test_y,y_hat))

输出结果：

0.963703703704
0.582010582011

线性划分：

clf = svm.SVC(C=0.8, kernel='linear', decision_function_shape='ovr')
clf.fit(train_x, train_y.ravel())
print (clf.score(train_x, train_y))
print (clf.score(test_x, test_y))

输出结果：

0.868888888889
0.804232804233

大学生python编程小游戏,python初学者小项目 2301_81895949 java 前端服务器人工智能
大家好，本文将围绕大学生python编程小游戏展开说明，python初学者小项目是一个很多人都想弄明白的事情，想搞清楚python做简单的项目需要先了解以下几个事情。开发教程目录前前言——是大佬就别进来看了，远古项目，写的很菜前言——学会项目开发项目开发的意义和重要性如何去开发一个项目(理论)开发前期准备(了解业务)项目设计项目需求讨论项目开发规划项目资源的准备源代码的编写开发后期处理正文——开发
华为OD机试E卷 --英文输入法--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述主管期望你来实现英文输入法单词联想功能。需求如下：•依据用户输入的单词前缀，从已输入的英文语句中联想出用户想输入的单词，按字典序输出联想到的单词序列，•如果联想不到，请输出用户输入的单词前缀。注意：英文单词联想时，区分大小写缩略形式如”don’t”，判定为两个单词，”don”和”t”
python+ollama本地大模型批量识别PDF，总结摘要以及关键词并输出EXCEL。月野难浔丶 python pdf 开发语言
现在市场上有很多PDF文件的识别，转化，等等。有些业务可能需要总结摘要和关键词等等一系列的操作。然而随着AI的兴起，本地大模型的部署，这些成为一种很方便的方法，接下来我将为各位介绍我所使用的方法。本篇文章旨在自动化处理PDF文档，提取并清理文本数据，然后使用一种大型模型生成摘要和关键词。最后，处理结果会被整理并输出到Excel文件中，便于后续分析和查看。人工智能（AI）是一种模拟人类智能的科技，它
python edge_tts（文本转音频) Oscar_0208 python 音视频
1.安装插件edge-ttspipinstalledge-tts2.文本转音频""":paramvoice:指定声音名称:paramcontent:文本内容:paramaudioFile:音频输出文件:paramvttFile:字幕输出文件"""asyncdefcreate_tts_mp3(voice:str,content:str,audioFile:str,vttFile:str)->None
Python 编译Edge-TTS（edge_tts）转MP3工具浩读语音朗读 edge-tts python edge 自然语言处理前端
Python编译Edge-TTS利用PIPEdge-tts库来实现Azure神经网络自然语音转MP3，这应该是微软给老百姓们一个共享前沿科技大餐。（edge_tts）找了网上的很多源代，现在利用现有公开的代码混编译一个个人的学习工具。代码仅供学习研究。fromtkinterimport*fromtkinter.filedialogimport*fromtkinter.messageboximpor
使用Cursor调试Python代码的详细步骤 shine_du python java 开发语言 cursor
以下是使用Cursor调试Python代码的详细步骤：一、准备Python代码首先，确保你已经在Cursor中创建了一个Python项目并编写了要调试的Python代码。例如，以下是一段简单的Python代码示例，我们将对其进行调试：defcalculate_sum(numbers):total=0fornumberinnumbers:total+=numberreturntotaldefmain
多Agent框架之-CrewAI-人工智能代理团队的未来 WorkAgent 人工智能 ai langchain
CrewAI-aroleplayingAIAgentsgit地址：https://github.com/joaomdmoura/crewai#why-crewailangchain地址：CrewAIUnleashed:FutureofAIAgentTeamsAgent具有与另一个Agent联系的能力，以委派工作或提出问题。任务可以使用特定的代理工具覆盖，这些工具应该被使用，同时还可以指定特定的代理
Python 字符串基本操作 iFulling Python python
字符串基本操作一、字符串拼接+-二、获取字符串的长度-len()三、字符串截取（切片运算）四、字符串分隔-split()五、字符串合并-join()六、检索子串出现次数-count()七、检索子串出现位置1、find()2、index()八、检查是否以指定子串开头-startswith()九、检查是否以指定子串结尾-endswith()十、字符串替换-replace()十一、字符串大小写转换一、字
【Python学习笔记】简单调用百度API应用白马银枪素征袍 python python 百度开发语言
#本文一切代码及理论均来自于郑秋生、夏敏捷二位老师主编《Python项目案例发从入门到实践》一书，本人仅做微改。创作本文的目的仅为总结本人的学习过程和成果，借此巩固。可能存在许多疏漏之处，还请各位同道多多批评指正。今天学的是调用百度API一个章节，百度大家都熟悉，现如今中国最大的互联网企业之一，坐拥大量曾经的“爆款”，甚至拥有堪称第一代中国现象级软件的“百度贴吧”，创造了无数出圈梗，几乎是一代人的
python中文版软件下载-Python IDLE(Python集成开发环境)v3.7中文版编程大乐趣
PythonIDLE是一款汉化版的Python集成开发环境，是一款专门用于各类非商业Python开发的选择，不过一般下载正版的python后，IDLE会自动安装，软件涵盖了语法加亮、段落缩进、基本文本编辑、TABLE键控制、调试程序等功能，这款PythonIDLE是汉化版的，将idlelib.zip解压后替换Python安装目录下的Lib文件夹中的idlelib文件夹即可替代Python原版的ID
Python百度搜索引擎API使用手册宫和举Esmeralda
Python百度搜索引擎API使用手册python-baidusearch自己手写的百度搜索接口的封装，pip安装，支持命令行执行。BaiduSearchunofficialAPIforPythonwithnoexternaldependencies项目地址:https://gitcode.com/gh_mirrors/py/python-baidusearch概览本文档将详细介绍如何安装与使用p
机器人学习的范式转变：从专用走向通用基础模型 XianxinMao 机器人
标题：机器人学习的范式转变：从专用走向通用基础模型文章信息摘要：机器人学习正经历从特定任务向通用基础模型的范式转变，这一演进路径与大语言模型相似。通过多机器人协作和跨任务泛化能力的成功，基础模型方向展现出实现通用人工智能的潜力。然而，这一转变面临两大关键挑战：机器人硬件的高昂成本限制了大规模部署和数据采集，以及获取足够规模和多样性的训练数据存在实际困难。突破这些瓶颈需要在制造工艺创新、数据共享生态
Django 详解飞滕人生TYF django sqlite 数据库
Django是一个高级的PythonWeb框架，用于快速开发安全且可维护的Web应用。它遵循“Djangoforperfectionistswithdeadlines”（为有期限的完美主义者设计）的理念，提供了一套完整的工具包，帮助开发者快速构建Web应用。1.Django基础概念1.1什么是Django？Django是一个基于Python的全栈Web框架，具备如下特点：MVC架构（在Django
Python Baidu Search API：轻松实现百度搜索的强大工具任凝俭
PythonBaiduSearchAPI：轻松实现百度搜索的强大工具python-baidusearch自己手写的百度搜索接口的封装，pip安装，支持命令行执行。BaiduSearchunofficialAPIforPythonwithnoexternaldependencies项目地址:https://gitcode.com/gh_mirrors/py/python-baidusearch项目介
简单分享下python打包手机app的apk 小软件大世界 python 开发语言
Python把python程序打包成apk的完整步骤1.引言在移动应用市场蓬勃发展的今天，开发人员常常需要将自己的Python程序打包成APK文件，以便在Android设备上运行。本文将详细介绍将Python程序打包成APK的完整步骤。2.准备工作在开始打包前，我们需要先安装以下几个工具：AndroidStudio：用于构建和打包APK文件；PythonforAndroid：用于将Python程序
AI写代码工具Claude：惊悚小说创作的意外热潮与全球用户偏好差异前端
近年来，人工智能在各个领域的应用日新月异，其中AI代码生成器的兴起更是为开发者带来了前所未有的效率提升。Anthropic最近发布的一份Claude使用报告，基于百万级用户数据，揭示了这款强大的AI模型的广泛应用，以及不同语言用户对其偏好差异的惊人发现。报告的核心发现之一，便是中文用户对使用Claude创作惊悚小说的强烈偏好，这一现象引发了广泛关注。这篇文章将深入探讨这一现象背后的原因，并对比分析
《人工智能新质生产力：GDP增长的未来引擎，究竟能贡献多少？》人工智能深度学习
在当今科技飞速发展的时代，人工智能作为新质生产力的代表，正以前所未有的态势冲击着全球经济格局，其对GDP增长的贡献率备受关注。从全球视角来看，诸多研究和专家观点都对人工智能的经济贡献给出了积极预测。普华永道曾在2017年发布报告指出，到2030年，人工智能的发展将带动全球GDP增长14％，相当于15.7万亿美元。莫干山研究院学术委员会主任朱嘉明认为，当前人工智能对全球GDP的平均影响约为0.1%，
chatgpt赋能python：Python怎么打包成APK vacvefito ChatGpt python chatgpt 开发语言计算机
Python怎么打包成APK如果你是一位有10年Python编程经验的工程师，并且想要将自己的Python应用程序打包成APK，那么你来对地方了。本文将会介绍如何使用Python来打包成APK，以及在不同平台上的一些注意事项。在阅读本文之后，你应该可以顺利地将自己的Python应用程序打包成APK了。什么是Python的APKAPK是AndroidPackage的缩写，它是Android系统中的一
小红书获取笔记详情API接口的开发、应用与收益。前端后端运维数据挖掘api
一、开发基础（一）技术选型在开发小红书获取笔记详情API接口时，后端语言可选用Python搭配Django框架。Django具有强大的路由系统、数据库管理功能以及内置的安全机制，能极大提高开发效率。数据库方面，MySQL以其稳定性和广泛的应用场景成为不错选择，可高效存储笔记的各类信息，包括文字内容、图片链接、点赞数、评论数等。（二）接口设计请求方式：采用HTTPGET请求，通过在URL中携带笔记的
1688商品类目API接口的开发应用与收益前端后端运维数据挖掘api
在电子商务领域，数据的获取与分析是企业决策的关键。阿里巴巴旗下的1688平台，作为全球领先的B2B在线交易市场，提供了丰富的API接口，助力企业高效获取商品信息，优化供应链管理，提升市场竞争力。本文将深入探讨1688商品类目API接口的开发应用，结合实际案例，展示其为企业带来的显著收益，并附上Python代码示例，以便开发者快速上手。一、1688商品类目API接口概述1688商品类目API接口允许
AI写代码工具Claude：惊悚小说创作的意外热潮与全球用户偏好差异前端
近年来，人工智能在各个领域的应用日新月异，其中AI代码生成器的兴起更是为开发者带来了前所未有的效率提升。Anthropic最近发布的一份Claude使用报告，基于百万级用户数据，揭示了这款强大的AI模型的广泛应用，以及不同语言用户对其偏好差异的惊人发现。报告的核心发现之一，便是中文用户对使用Claude创作惊悚小说的强烈偏好，这一现象引发了广泛关注。这篇文章将深入探讨这一现象背后的原因，并对比分析
[python][whl]pyltp的whl格式文件所有版本下载地址汇总 FL1623863129 Python python 开发语言
pyltp：Python中的中文自然语言处理工具在数字化时代，自然语言处理（NLP）成为了与机器进行交互的关键技术。对于中文，由于其独特的语言结构和复杂性，专门的工具和库显得尤为重要。pyltp正是这样一个为中文NLP任务设计的Python库，它封装了LTP（LanguageTechnologyPlatform）的核心功能，使得开发者能够轻松地在Python环境中进行中文文本的处理和分析。pylt
Python 应用打包成 APK【全流程】今晚务必早点睡 Python 运维 python 开发语言 apk
将Python应用打包成APK。文章目录步骤1:安装Buildozer和其依赖Linux(Ubuntu)环境下安装:步骤2:创建你的Python应用步骤3:配置Buildozer步骤4:打包成APK总结步骤1:安装Buildozer和其依赖首先确保你的系统中已安装Python和pip。接下来，我们需要安装Buildozer以及一些必要的系统依赖。Linux(Ubuntu)环境下安装:安装Pytho
【Python】已完美解决：ERROR: Could not find a version that satisfies the requirement re 屿小夏 python 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
基于Python的三种主流网络爬虫技术吃肉肉335 python 爬虫开发语言
一、网络爬虫是什么网络爬虫，通常也被称为网络蜘蛛或网络机器人，是一种按照一定方法，获取网络各种信息的自动化脚本程序，也可以将其理解为一个在互联网上自动提取网页信息并进行解析抓取的程序。网络爬虫的功能不仅局限于复制网页内容、下载音视频文件，更包括自动化执行行为链以及模拟用户登录等复杂操作。在当前大数据背景下，无论是人工智能应用还是数据分析工作，均依赖于海量的数据支持。如果仅依赖人工采集这一种方式，不
python md5加密计算机辅助工程 python 前端 javascript
在Python中，可以使用hashlib模块来进行MD5加密。以下是一个简单的例子：importhashlibdefmd5_encryption(data):md5=hashlib.md5()#创建一个md5对象md5.update(data.encode('utf-8'))#使用utf-8编码数据returnmd5.hexdigest()#返回加密后的十六进制字符串#使用函数data="Hell
Python网络爬虫核心面试题闲人编程程序员面试 python 爬虫开发语言面试网络编程
网络爬虫1.爬虫项目中如何处理请求失败的问题？2.解释HTTP协议中的持久连接和非持久连接。3.什么是HTTP的持久化Cookie和会话Cookie？4.如何在爬虫项目中检测并处理网络抖动和丢包？5.在爬虫项目中，如何使用HEAD请求提高效率？6.如何在爬虫项目中实现HTTP请求的限速？7.解释HTTP2相对于HTTP1.1的主要改进。8.如何在爬虫项目中模拟HTTP重试和重定向？9.什么是COR
Python全局解释器锁GIL与多线程程序媛一枚~ Python OpenCV 图像处理 Python进阶 Python OpenCV python 多线程全局解释器锁GIL
Python中如果是I/O密集型的操作，用多线程（协程Asyncio、线程Threading），如果I/O操作很慢，需要很多任务/线程协同操作，用Asyncio，如果需要有限数量的任务/线程，那么使用多线程。如果是CPU密集型操作，用多进程（multeprocessing）。一、GILGIL（GlobalInterpreterLock，即全局解释器锁），Python实质上并不存在真正的多线程，只有
Python 面试时需要知道的 10 个问题及详解迪小莫学AI python 面试开发语言
Python面试时需要知道的10个问题及详解在Python的面试中，考察的重点通常是基础知识、编程思维和实际应用能力。掌握Python的核心概念不仅能帮助你在面试中脱颖而出，还能让你在实际工作中高效编写代码。下面我们将详细解答10个Python面试中常见的问题，帮助你更加深入理解Python的基本特性和应用。1.Python中的全局、受保护和私有属性是什么？在Python中，属性的访问权限并不像J
python解奥赛运算题 Python数据分析与机器学习 python 开发语言算法贪心算法
有一个以文字代替数字的算术表达式如下图所示，已知4个替代数字的文字中没有重复，编写程序求出文字所替代的数字。按逻辑思维:如果3位数和3位数相加等于4位数，则“青”只能是1:“山”+“青”大于等于10，因此“山”只能是9，得出“龙”是0:个位的两个“山”相加，推得“外”等于8。而按计算思维，则注重于程序的实现，用穷举法设计嵌套的4层循环，把所有的数字都试一遍，找出4个数字不相互重复的合满足加法等式条
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

使用sklearn完成4种基本的分类算法：朴素贝叶斯算法、决策树算法、人工神经网络、支持向量机算法

文章目录

实验目的

实验内容及步骤

实验数据说明

实验过程

朴素贝叶斯分类

决策树

决策树概念简介

神经网络

SVM

你可能感兴趣的:(人工智能,sklearn,分类算法,人工智能,机器学习,python)