Amo Xiang

Python数据挖掘基础(三)：Pandas基础

1. 介绍

2008年WesMcKinney开发出的库
以NumPy为基础，借力NumPy模块在计算方面性能高的优势
专门用于数据挖掘的开源python库
基于matplotlib，能够简便的画图
独特的数据结构

1.1 为什么使用Pandas？

需求：创建一个符合正态分布的10个股票5天的涨跌幅数据，使用 NumPy 创建示例代码如下：

import numpy as np

stock_change = np.random.normal(0, 1, size=(10,5))
stock_change

上述代码执行结果如下：

上述结果，很难看出来这个数据是用来描述什么的，并且数据结构也不是十分的清晰。使用 Pandas 创建示例代码如下：

import pandas as pd
import numpy as np

stock_change = np.random.normal(0, 1, size=(10,5))
# 1.构造行索引列表
stock_code = ["股票{}".format(str(i+1)) for i in range(stock_change2.shape[0])]
# 2.生成一个时间的序列 为列索引
# start: "2020-05-01" 开始时间
# end: 结束日期 
# periods: 时间天数 stock_change2.shape[1]==> 5天
# freq: 递进单位，默认1天,'B'默认略过周末
# 注意: end和periods使用一个就可以了
stock_time = pd.date_range("2020-05-01", periods=stock_change2.shape[1], freq="B")
pd.DataFrame(stock_change, index=stock_code, columns=stock_time)

上述代码执行结果如下：

从执行结果来看Pandas 让数据更有意义的显示。Pandas 学习的目的如下：

便捷的数据处理能力
读取文件方便
封装了Matplotlib、NumPy的画图和计算

1.2 DataFrame(对比二维数组)

DataFrame对象既有行索引，又有列索引:

行索引，表明不同行，横向索引，叫index，0轴，axis=0
列索引，表名不同列，纵向索引，叫columns，1轴，axis=1

1.2.1 DataFrame的属性

转置，如下：

head()：如果不补充参数，默认5行。填入参数N则显示前N行，如下：

tail() 如果不补充参数，默认5行。填入参数N则显示后N行，示例代码如下：

1.2.2 DatatFrame索引的设置

修改行列索引值，示例代码如下：

reset_index(drop=False)，设置新的下标索引，drop: 默认为False，不删除原来索引，如果为True，删除原来的索引值。示例代码如下：

以某列值设置为新的索引，set_index(keys, drop=True)

keys : 列索引名称或者列索引名称的列表
drop : boolean, default True. 当做新的索引，删除原来的列

示例代码如下：

1.3 MultiIndex(对比三维数组)

打印刚才的df的行索引结果：

多级或分层索引对象。index属性：

names：levels的名称
levels：每个level的元组值

1.4 Series结构(对比一维数组)

什么是Series结构呢，我们直接看下面的图：

series结构只有行索引。我们将之前的涨跌幅数据进行转置，然后获取股票 __0 的所有数据，示例代码如下：

1.4.1 创建series

通过已有数据创建(指定内容，默认索引) 示例代码如下：
指定索引示例代码如下：
通过字典数据创建示例代码如下：
series获取属性和值示例代码如下：

2. 基本数据操作

为了更好的理解这些基本操作，我们将读取一个真实的股票数据。关于文件操作，后面在介绍，这里只先用一下API，文件的获取路径如下：

链接:https://pan.baidu.com/s/1-3LnQSHyYeeFSEJ6roDY2w  密码:40tm

读取文件操作如下：

import pandas as pd

# 1.读取文件
data = pd.read_csv("./data/stock_day.csv")
# 2.删除一些列，让数据更简单些，再去做后面的操作
data = data.drop(["ma5","ma10","ma20","v_ma5","v_ma10","v_ma20"], axis=1)

数据展示结果如下：

2.1 索引操作

在此处我们已经学习过使用索引选取序列和切片选择，Pandas 也支持类似的操作，也可以直接使用列名、行名称，甚至组合使用。

2.1.1 直接使用行列索引(先列后行)

获取2018-02-14 这天的 open 的结果，示例代码如下：

data["open"]["2018-02-14"]  # 先列后行 21.49

2.1.2 结合loc或者iloc使用索引

获取从 2018-02-27 : 2018-02-14，high 的结果，示例代码如下：

# 获取从'2018-02-27':'2018-02-14'，'high'的结果 
data.loc['2018-02-27':'2018-02-14', "high"]  # 使用loc:只能指定行列索引的名字

上述代码执行结果为：

获取前10天数据的 open 和 high 列的结果，示例代码如下：

data.iloc[:10, :2]  # 使用iloc可以通过索引的下标去获取

上述代码执行结果为：

2.1.3 组合索引

获取行第1天到第4天，open/high/close 这三个指标的结果，示例代码如下：

data.loc[data.index[:4], ["open","high","close"]]

上述代码执行结果为：

获取行第2天到第5天，open/high/close/low 这四个指标的结果，示例代码如下：

data.iloc[2:6, data.columns.get_indexer(["open","high","close","low"])]

上述代码执行结果为：

2.2 赋值操作

对DataFrame当中的 open 列进行重新赋值为10，示例代码如下：

data["open"] = 10

上述代码执行结果为：

对DataFrame当中的 open 列进行重新赋值为100，示例代码如下：

data.open = 100

上述代码执行结果为：

2.3 排序

排序有两种形式，一种对于 索引 进行排序，一种对于 内容 进行排序。使用 df.sort_values(by=, ascending=)，单个键排序，示例代码如下：

# 按照涨跌幅大小进行排序 , 使用ascending指定按照大小排序
data.sort_values(by="p_change").head()  # 默认升序

上述代码执行结果为：

多个键进行排序，示例代码如下：

# 按照high进行排序,如果high值相同则比较close值
# ascending=True升序 =False降序
data.sort_values(by=["high", "close"], ascending=False).head()

上述代码执行结果为：

使用 df.sort_index 给索引进行排序，这个股票的日期索引原来是从大到小，现在重新排序，从小到大，示例代码如下：

data.sort_index().head(3)

上述代码执行结果为：

使用 series.sort_values(ascending=True) 进行排序，series排序时，只有一列，不需要参数，示例代码如下：

# 对high这一列的数据进行排序
# ascending=False: 降序排列
# data["high"] 返回的就是series
data["high"].sort_values(ascending=False).head()

上述代码执行结果为：

使用 series.sort_index() 进行排序，与df一致，示例代码如下：

# 对high这一列的数据进行排序
data["high"].sort_index(ascending=True).head()

上述代码执行结果为：

3. DataFrame运算

为了更好的理解这些基本操作，我们和上面一样读取一个真实的股票数据。关于文件操作，后面在介绍，这里只先用一下API，文件的获取路径如下：

链接:https://pan.baidu.com/s/1-3LnQSHyYeeFSEJ6roDY2w  密码:40tm

读取文件操作如下：

import pandas as pd

# 1.读取文件
data = pd.read_csv("./data/stock_day.csv")
# 2.删除一些列，让数据更简单些，再去做后面的操作
data = data.drop(["ma5","ma10","ma20","v_ma5","v_ma10","v_ma20"], axis=1)

数据展示结果如下：

3.1 算术运算

add(other)：比如进行数学运算加上具体的一个数字，示例代码如下：

# 给open这一列的数据都加上10
data["open"].add(10).head()
# 或者是下面这种直接相加的方式 一般使用的比较少
data["open"] + 10

上述代码执行结果为：

sub(other)：比如进行数学运算减去具体的一个数字，示例代码如下：

data["open"].sub(10).head()  # ==> data["open"] - 10

上述代码执行结果为：

如果想要得到每天的涨跌大小? 求出每天 close-open 价格差，示例代码如下：

data["close"].sub(data["open"]).head()  # 收盘价-开盘价

上述代码执行结果为：

3.2 逻辑运算

3.2.1 逻辑运算符号<、 >、|、 &

例如筛选 p_change > 2 的日期数据，示例代码如下：

(data["p_change"] > 2).head()  # 返回逻辑值
(data[data["p_change"]>2]).head()  # 逻辑判断的结果也可以作为筛选的依据

上述代码执行结果为：

完成多个逻辑判断，筛选 p_change > 2 并且 open > 15，示例代码如下：

((data["p_change"] > 2) & (data["open"] > 15)).head(5)
data[(data["p_change"] > 2) & (data["open"] > 15)].head(5)

3.2.2 逻辑运算函数

query(expr)：expr指的是查询字符串。通过 query 使得刚才的过程更加方便简单。示例代码如下：

data.query("p_change>2 & open > 15").head()

上述代码执行结果为：

isin(values)：例如判断 turnover 是否为4.19，2.39，示例代码如下：

data["turnover"].isin([4.19, 2.39]).head()  # 返回逻辑值
data[data["turnover"].isin([4.19, 2.39])].head()  # 返回符合条件的数据

上述代码执行结果为：

3.3 统计运算

describe()：综合分析，能够直接得出很多统计结果 count/mean/std/min/max等。示例代码如下：

data.describe()

上述代码执行结果为：

统计函数在这里已经详细介绍，以下演示 min(最小值)，max(最大值)，mean(平均值)，median(中位数)，var(方差)，std(标准差)，mode(众数)的结果，示例代码如下：

data.max()  # 最大值
data.min()  # 最小值
data.std(0)  # 标准差
data.var()  # 方差
# median(): 中位数
# 中位数为将数据从小到大排列，在最中间的那个数为中位数。如果没有中间数，取中间两个数的平均值。
df = pd.DataFrame({'COL1' : [2,3,4,5,4,2],
                   'COL2' : [0,1,2,3,4,2]})
df.median()  # [2,3,4,5,4,2]==>[2,2,3,4,4,5]==>3+4/2==>3.5
data.idxmax()  # 求出最大值的位置
data.idxmin()  # 求出最小值的位置

注意：对于单个函数去进行统计的时候，坐标轴还是按照这些默认为 columns (axis=0, default)，如果要对行 index 需要指定(axis=1)。

3.4 累计统计函数

函数	作用
cumsum	计算前1/2/3/…/n个数的和
cummax	计算前1/2/3/…/n个数的最大值
cummin	计算前1/2/3/…/n个数的最小值
cumprod	计算前1/2/3/…/n个数的积

那么这些累计统计函数怎么用？以上这些函数可以对 series 和 dataframe 操作。这里我们按照时间的从前往后来进行累计，示例代码如下：

# 排序之后，进行累计求和
data = data.sort_index()
# 对p_change进行求和
stock_rise = data["p_change"]
stock_rise.cumsum()

上述代码执行结果为：

那么如何让这个连续求和的结果更好的显示呢？

3.5 自定义运算

apply(func, axis=0)

func：自定义函数
axis=0：默认是列，axis=1为行进行运算

定义一个对列 最大值-最小值 的函数，示例代码如下：

data[["open", "close"]].apply(lambda x: x.max()-x.min(), axis=0)

上述代码执行结果为：

4. Pandas画图

语法格式如下：

DataFrame.plot(x=None, y=None, kind="line")

参数说明如下：

x : label or position, default None
y : label, position or list of label, positions, default None
- Allows plotting of one column versus another
kind : str
line : line plot (default)
bar : vertical bar plot
barh : horizontal bar plot
hist : histogram
pie : pie plot
scatter : scatter plot

之前在此处已经详细讲解过上述常用的图形，这里的话不再详细的用案例进行说明，在后续代码中用到的时候在具体进行展示。

5. 文件读取与存储

我们的数据大部分存在于文件当中，所以 Pandas 会支持复杂的IO操作，Pandas 的API支持众多的文件格式，如CSV、SQL、XLS、JSON、HDF5等。

5.1 CSV

5.1.1 read_csv

语法格式如下：

pd.read_csv(filepath_or_buffer, sep ="," )

参数说明如下：

filepath_or_buffer：文件路径
usecols：指定读取的列名，列表形式

读取之前的股票的数据，示例代码如下：

data = pd.read_csv("./data/stock_day.csv").head()  # 读取全部
# 读取文件,并且指定只获取"open", "close"指标
data = pd.read_csv("./data/stock_day.csv", usecols=["open", "close"]).head()

5.1.2 to_csv

语法格式如下：

DataFrame.to_csv(path_or_buf=None, sep=", ",columns=None, 
	header=True, index=True, mode="w", encoding=None)

参数说明如下：

path_or_buf：string or file handle, default None
sep：character, default ,
columns：sequence, optional
mode：w 重写，a 追加
index：是否写进行索引
header：boolean or list of string, default True 是否写进列索引值

保存 open 列的数据到csv文件中，示例代码如下：

data[:10].to_csv("./data/amo.csv", columns=["open"])

上述代码执行结果为：

会发现将索引存入到文件当中，变成单独的一列数据。如果需要删除，可以指定index参数，删除原来的文件，重新保存一次。示例代码如下：

# index: 存储不会将索引值变成一列数据
data[:10].to_csv("./data/amo2.csv", columns=["open"], index=False)

上述代码执行结果为：

5.2 HDF5

5.2.1 read_hdf 与 to_hdf

HDF5文件 的读取和存储需要指定一个键，值为要存储的DataFrame。从 h5 文件当中读取数据，语法格式如下：

pandas.read_hdf(path_or_buf，key =None，** kwargs)

参数说明如下：

path_or_buffer：文件路径
key：读取的键
return：Theselected object

DataFrame.to_hdf(path_or_buf, key, \kwargs)

5.2.2 案例

示例代码如下：

# 读取文件
day_eps_ttm = pd.read_hdf("./data/stock_data/day/day_eps_ttm.h5")  
# 存储文件
# 这个文件不能像csv一样 直接打开观看 只有先读取出来在观看
day_eps_ttm.to_hdf("./data/amo.h5", key="day_eps_ttm")  
# 再次读取的时候，需要指定键的名字
new_eps = pd.read_hdf("./data/amo.h5", key="day_eps_ttm")
new_eps.head()

上述代码执行结果为：

5.3 JSON

JSON是我们常用的一种数据交换格式，在前后端的交互，爬取数据的时候经常用到，也会在存储的时候选择这种格式。所以我们需要知道 Pandas 如何进行读取和存储JSON格式。

5.3.1 read_json

将JSON格式准换成默认的Pandas DataFrame格式，语法格式如下：

pandas.read_json(path_or_buf=None, orient=None, typ="frame", lines=False)

5.3.2 read_josn 案例

这里使用一个新闻标题讽刺数据集，格式为json。is_sarcastic：1讽刺的，否则为0。headline：新闻报道的标题。article_link：链接到原始新闻文章。存储格式为：

{"article_link": "https://www.huffingtonpost.com/entry/versace-black-code_us_5861fbefe4b0de3a08f600d5", "headline": "former versace store clerk sues over secret 'black code' for minority shoppers", "is_sarcastic": 0}
{"article_link": "https://www.huffingtonpost.com/entry/roseanne-revival-review_us_5ab3a497e4b054d118e04365", "headline": "the 'roseanne' revival catches up to our thorny political mood, for better and worse", "is_sarcastic": 0}

读取，orient 指定存储的json格式，lines 指定按照行去变成一个样本，示例代码如下：

# orient指定存储的json格式，lines指定按照行去变成一个样本
json_read = pd.read_json("./data/Sarcasm_Headlines_Dataset.json", orient="records", lines=True)
json_read

结果为：

5.3.3 to_json

将Pandas 对象存储为json格式，语法格式为：

DataFrame.to_json(path_or_buf=None, orient=None, lines=False)

path_or_buf=None：文件地址
orient：存储的json形式，{“split”,“records”,“index”,“columns”,“values”}
lines：一个对象存储为一行

5.3.4 案例

示例代码如下：

# 存储文件
json_read.to_json("./data/amo.json", orient="records")
# 修改lines参数为True
json_read.to_json("./data/amo2.json", orient="records", lines=True)

结果为：

5.4 总结

优先选择使用 HDF5 文件存储，有以下原因：

HDF5 在存储的时候支持压缩，使用的方式是 blosc，这个是速度最快的也是Pandas 默认支持的
使用压缩可以提磁盘利用率，节省空间
HDF5 还是跨平台的，可以轻松迁移到hadoop上面

笔者这篇博文写完之后脑袋都炸掉了，Pandas 高级部分的操作会在 Python数据挖掘基础(四)：Pandas高级处理中展示给大家，这篇博文太长，内容也比较多，并且在几个小时内完成，难免出现错误，希望大家多多指教，编写不易，大家手留余香，感谢。

你可能感兴趣的:(Python)

python assert()函数欢天喜地小姐姐 python编程学习 python
1.断言函数作用断言函数是对表达式布尔值的判断，要求表达式计算值必须为真。可用于自动调试。如果表达式为假，触发异常；如果表达式为真，不会报错。2.使用assert判断数组是否相等np.array.any()和numpy.array.all()np.array.any()是或操作，任意一个元素为True，输出为True。np.array.all()是与操作，所有元素为True，输出为True。当我们
【LeetCode 热题100】 23. 合并 K 个升序链表的算法思路及python代码 pljnb LeetCode热题100 算法 leetcode 链表
23.合并K个升序链表给你一个链表数组，每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中，返回合并后的链表。示例1：输入：lists=[[1,4,5],[1,3,4],[2,6]]输出：[1,1,2,3,4,4,5,6]解释：链表数组如下：[1->4->5,1->3->4,2->6]将它们合并到一个有序链表中得到。1->1->2->3->4->4->5->6示例2：输入：lists=[
人生重开模拟器 -deepseek版 Cccc吃吃吃 python 开发语言
人生重开模拟器是一个有趣的文字类游戏，玩家可以通过选择不同的选项来体验不同的人生轨迹。下面是一个简单的Python实现，模拟了人生重开的过程。玩家可以通过输入数字来选择不同的选项，游戏会根据选择生成不同的人生结局。```pythonimportrandomdefprint_intro():print("欢迎来到人生重开模拟器！")print("你将重新开始你的人生，通过不同的选择体验不同的人生轨迹
PTA天梯赛Python7-52 古风排版胡同Alley python
中国的古人写文字，是从右向左竖向排版的。本题就请你编写程序，把一段文字按古风排版。输入格式：输入在第一行给出一个正整数N（<100），是每一列的字符数。第二行给出一个长度不超过1000的非空字符串，以回车结束。输出格式：按古风格式排版给定的字符串，每列N个字符（除了最后一列可能不足N个）。输入样例：4Thisisatestcase输出样例：asaTstihetsices代码长度限制16KB时间限制
详细介绍 Jupyter nbconvert 工具及其用法：如何将 Notebook 转换为 Python 脚本源代码杀手 python使用技巧 python jupyter ide
nbconvert是Jupyter提供的一个非常强大的工具，允许用户将JupyterNotebook文件（.ipynb）转换成多种格式，包括Python脚本（.py）、HTML、PDF、LaTeX等。你可以通过命令行来运行nbconvert，也可以在JupyterNotebook中通过一些自定义的设置来实现转换。安装nbconvert通常情况下，nbconvert会随Jupyter一起安装，因此不
python -- assert函数我不是程序员‍ python知识 python
一、assert函数在Python中，assert语句用于调试和测试代码。它用于检查某个条件是否为真。如果条件为假，assert语句会抛出一个AssertionError异常，并可以选择性地附加一条错误消息。assert语句的基本语法是：assertcondition,optional_messagecondition:一个布尔表达式。如果结果为True，程序继续执行。如果为False，会触发As
CTF杂项挑战：使用已知字典破解ZIP文件密码 0dayNu1L Web安全 CTF web安全网络安全
在CTF比赛中，杂项挑战通常包含一些非传统的题目，其中破解ZIP文件密码是一个常见的任务。本文将介绍两种在已知密码字典文件的情况下，破解ZIP文件密码的方法：一种是使用Python脚本进行暴力破解，另一种是通过zip2john和john命令结合进行破解。0dayNu1L-CSDN博客请一键三连吧！！！❤❤❤目录方法一：使用Python脚本进行暴力破解步骤方法二：使用zip2john和john命令结
文本转语音的Python库（pyttsx3）数产第一混子 python库 python
一、pyttsx3的概述pyttsx3isatext-to-speechconversionlibraryinPython.pyttsx3是Python中的文本到语音转换库。二、pyttsx3的安装pipinstallpyttsx3三、小试牛刀importpyttsx3engine=pyttsx3.init()engine.say("Iwillspeakthistextrightnow")engi
区块链赋能：用Python开发去中心化投票系统 Echo_Wish Python！实战！区块链 python 去中心化
区块链赋能：用Python开发去中心化投票系统在这个互联网迅猛发展的时代，投票系统不仅仅停留在政务领域，它已成为社区治理、企业决策甚至区块链DAO（去中心化自治组织）中重要的机制。然而，传统投票系统往往集中化，存在信任和数据安全问题。区块链技术以其不可篡改性和透明性为去中心化投票提供了理想的解决方案。在这篇文章中，我将通过Python语言，结合区块链智能合约，教你如何从零开发一个去中心化的投票系统
Python助力区块链互通——跨链桥接的实现与实践 Echo_Wish Python！实战！区块链 python 开发语言
Python助力区块链互通——跨链桥接的实现与实践区块链技术的繁荣发展带来了巨大的生态创新，但也因各链之间的割裂局面限制了它们的潜力。例如，你或许想在以太坊上使用来自比特币的资产，却因两条链不互通而不得不求助于中心化交易所。要打破“链间壁垒”，跨链桥接（Cross-chainBridge）应运而生。今天，我以Echo_Wish的视角，通过Python代码实践，带你深入了解跨链桥接的工作原理，技术实
python pyttsx3文本转语音_python 利用pyttsx3文字转语音木大木大本太 python pyttsx3文本转语音
#-*-coding:utf-8-*-importpyttsx3f=open("all.txt",'r')line=f.readline()engine=pyttsx3.init()whileline:line=f.readline()print(line,end='')engine.say(line)engine.runAndWait()f.close()importwin32com.clien
技术沙龙 | 从高并发架构到企业级区块链探索零售创新 weixin_33984032 区块链 python 数据库
2019独角兽企业重金招聘Python工程师标准>>>伴随消费新理念的不断升级和技术创新发展，零售业逐渐被推到风口浪尖，对此京东曾表示，推动“无界零售”时代的到来理念，倡导实现成本、效率、体验的升级才是终极目标。此概念一出，零售行业的侧重点开始由销售端向技术端倾斜，趁着一年一度618来临之际，京东云特别在上海举办了主题为"从高并发架构到企业级区块链，探索无界零售的数字化创新"的技术沙龙活动。本次活
Python Pyttsx3模块墨水云烟 Python python 开发语言
大家有没有让电脑“说话”的欲望，如果我说可以帮大家实现这个愿望的话，大家肯定会说我又要用print函数，但是今天我们就可以真的让电脑说话。让电脑说话其实很简单，使用python第三方库pyttsx3模块就行了。使用之前还需要安装pyttsx3模块，安装方法：python终端或cmd输入：pipinstallpyttsx3然后就是导入pyttsx3模块：importpyttsx3后面就是使用这个模块
使用python seaborn创建配对图：从核心概念到实战案例梦想画家数据分析工程 #python 人工智能 python 机器学习
Seaborn的配对图（Pairplot）是一种用于探索多变量数据关系的可视化工具，尤其适合分析数据集中多个特征之间的相关性、分布模式或异常值。本文介绍如何生成数据集数值变量之间的配对图，并通过参数设置色系。配对图的核心作用矩阵式可视化生成一个N×N的网格图（N为特征数），每个单元格展示两列特征之间的关系。默认对角线显示单变量分布（直方图或KDE曲线），非对角线显示散点图或其他关系图。快速发现模式
如何用Python和Selenium实现表单的自动填充与提交？字节王德发 python python selenium 开发语言
在今天的数字化时代，自动化工具可以极大地提高工作效率。很多人可能会觉得填表单是个繁琐的任务，不过你知道吗？用Python和Selenium可以轻松解决这一问题！本文将带你走进如何利用这两个强大的工具，实现表单的自动填充和提交，让你省去不少时间。什么是Selenium？Selenium是一个广泛使用的自动化测试工具，它能够模拟用户在浏览器中的操作。通过它，我们可以自动化执行诸如点击按钮、输入文本、选
使用 Python 的 pyttsx3 库进行文本转语音 Bingjia_Hu python 开发语言 pyttsx3
1.什么是pyttsx3？1.1pyttsx3是一个Python库，它可以将文本转换为语音。与其他文本转语音库（如gTTS）不同，pyttsx3不依赖于网络服务，它使用本地的TTS（Text-to-Speech）引擎，这使得它在离线状态下也能正常工作1.2pyttsx3支持多平台（Windows、Linux和macOS），且可以对语音的音量、语速以及语音类型等进行控制2.安装pyttsx3要使用p
如何在 Python 中将语音转换为文本无水先生语音处理人工智能综合 python xcode 开发语言
一、说明学习如何使用语音识别Python库执行语音识别，以在Python中将音频语音转换为文本。想要更快地编码吗？我们的Python代码生成器让您只需点击几下即可创建Python脚本。现在就现在试试！二、语言AI库2.1相当给力的转文字库语音识别是计算机软件识别口语中的单词和短语并将其转换为人类可读文本的能力。在本教程中，您将学习如何使用SpeechRecognition库在Python中
Python赋能区块链溯源系统：从技术实现到应用落地 Echo_Wish Python！实战！python 区块链开发语言
Python赋能区块链溯源系统：从技术实现到应用落地在供应链管理、食品安全、药品追踪等多个领域，产品的来源和流通过程正成为消费者和企业关注的重点。传统溯源系统往往缺乏数据透明性和不可篡改性，而区块链技术的引入解决了这些痛点，将溯源信息永久记录在分布式账本上，实现全流程可追溯。那么问题来了：如何用Python这把“瑞士军刀”构建一个高效的区块链溯源系统？本文将围绕这一主题，深入探讨Python在区块
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
python-flask复习(一) 胖虎是只mao python-web python函数 python python flask
一、Python现阶段三大主流Web框架Django、Tornado、Flask对比Django主要特点是大而全，集成了很多组件（例如Models、Admin、Form等等）,不管你用得到用不到，反正它全都有，属于全能型框架，通常用于大型Web应用，由于内置组件足够强大所以使用Django开发可以一气呵成，优点是大而全，缺点也就暴露出来了，这么多的资源一次性全部加载，肯定会造成一部分的资源浪费；T
python pip报错：Preparing metadata (pyproject.toml) ... error 我有一个魔盒其他 python pip 开发语言
环境：win11（Python3.9.13）原因：想安装低版本python，结果安装成了32位的，但是依赖包基本都是64位的。解决办法：重装64位python（可能还需要VisualStudio内安装“使用C++的桌面开发”）异常报错：Collectingmatplotlib~=3.0(fromgradio)Usingcachedhttps://pypi.tuna.tsinghua.edu.cn/
python安装scipy库出错_解决scipy安装（pip install scipy）失败,以及其他问题 weixin_39663933
解决scipy安装(pipinstallscipy)失败,以及其他问题解决：1.在scipy官方库中并没有适合Windows的python3.6相关版本，故需要在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy下载适合的版本，下载如：scipy‑0.19.1‑cp36‑cp36m‑win32.whl2.Windows中scipy安装成功后，还会存
Python 安装scipy失败 _不二_ python python
在使用pip安装scipy时会报错OSError:[Errno13]Permissiondenied:'/usr/local/lib/python2.7/dist-packages/scipy'网上查了，说是由于墙的原因，但我已经翻了墙的，任然报这个错误，下载速度特别慢，到11%或者27%就挂啦，最后很无赖，直接手动安装吧。先去官网搜索scipy选择合适的版本如下图下载完成后pipinstalls
win7下python3.6通过pip安装scipy报错的解决办法青松一夏 python
一、问题描述通过pip方式安装了numpy和sklearn，但是sklearn需要依赖于scipy，但当通过pip方式安装scipy时，报错：numpy.distutils.system_info.NotFoundError:nolapack/blasresourcesfound按照网上的教程，并没有找到真正的解决办法，后来我是通过如下方式解决的。二、我的解决方案（1）首先卸载numpypipun
聊聊关于Python与人工智能那些事小G-biu- python 人工智能 tensorflow
Python与人工智能：介绍Python在人工智能方面的应用Python是一种广泛使用的编程语言，也是人工智能领域中最受欢迎的语言之一。Python提供了许多用于构建和训练人工智能模型的库和框架。本文将介绍一些常见的人工智能技术以及Python在这些技术中的应用。OpenAIOpenAI是一个非营利组织，旨在推动人工智能的发展并促进其对人类的利益。OpenAI通过开发人工智能技术、研究人工智能的影
numpy学习笔记10：arr *= 2向量化操作性能优化宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记10：arr*=2向量化操作性能优化在NumPy中，直接对整个数组进行向量化操作（如arr*=2）的效率远高于显式循环（如foriinrange(len(arr)):arr[i]*=2）。以下是详细的解释：1.性能差异的原理(1)底层实现不同显式循环（错误示范）：Python的for循环是解释执行的，每次迭代需要动态解析变量类型、执行函数调用等操作。对每个元素的操作会触发多次Py
Python前端开发 PITSU 正则表达式 html css3 mysql
Python前端开发1.前端三剑客（HTML，CSS和JavaScript）1.1HTML1.1.1HTML简介HyperTextMark-upLanguage,指的是超文本标记语言；html是开发网页的语言；html中的标签大多数都是成对出现的,格式:1.1.2HTML结构第一行是文档声明部分HTML：分为页头，页身和页脚。标签大部分是成对出现1.1.3第一行文档声明部分HTML在vscode中
AIGC与教育行业的邂逅--其在数学领域的应用与实现想成为高手499 AIGC
引言在数学教学中，教师往往需要大量的时间准备练习题和答案解析，而学生则需要定制化的练习来满足不同的学习需求。AIGC技术可以通过自动生成数学题目、定制化学习内容、即时反馈等方式，极大地提升数学学习的效率与质量。本文将深入探讨AIGC在数学领域的几种应用场景，并通过Python代码展示具体实现方式。1.自动生成数学题目与解析数学题目生成是AIGC在数学教学中的主要应用之一。通过生成不同难度和类型的题
Python在人工智能与机器人开发中的应用与实践一键难忘 python 人工智能机器人
Python在人工智能与机器人开发中的应用与实践Python已经成为人工智能和机器人开发的主要编程语言之一，凭借其简洁的语法、强大的库支持和广泛的社区资源，Python为开发者提供了一个高效且易于学习的平台。在这篇文章中，我们将深入探讨如何使用Python进行人工智能（AI）和机器人开发，并通过实际代码示例展示核心技术和应用。1.Python在人工智能中的应用人工智能（AI）领域的核心任务包括机器
python中strip()，lstrip()，rstrip()函数的讲解使用方法高质量海王哦 python python
在Python中，strip()、lstrip()和rstrip()是用于处理字符串的三个常用方法，它们的作用都是去除字符串两端的空白字符或指定字符，但它们的去除位置有所不同。下面是它们的详细讲解：1.strip()方法strip()方法用于去除字符串两端的空白字符（默认情况下，包括空格、换行符、制表符等），或者去除指定的字符序列。语法：string.strip([chars])chars：可选参
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s

Python数据挖掘基础(三)：Pandas基础

目录

1. 介绍

1.1 为什么使用Pandas？

1.2 DataFrame(对比二维数组)

1.2.1 DataFrame的属性

1.2.2 DatatFrame索引的设置

1.3 MultiIndex(对比三维数组)

1.4 Series结构(对比一维数组)

1.4.1 创建series

2. 基本数据操作

2.1 索引操作

2.1.1 直接使用行列索引(先列后行)

2.1.2 结合loc或者iloc使用索引

2.1.3 组合索引

2.2 赋值操作

2.3 排序

3. DataFrame运算

3.1 算术运算

3.2 逻辑运算

3.2.1 逻辑运算符号<、 >、|、 &

3.2.2 逻辑运算函数

3.3 统计运算

3.4 累计统计函数

3.5 自定义运算

4. Pandas画图

5. 文件读取与存储

5.1 CSV

5.1.1 read_csv

5.1.2 to_csv

5.2 HDF5

5.2.1 read_hdf 与 to_hdf

5.2.2 案例

5.3 JSON

5.3.1 read_json

5.3.2 read_josn 案例

5.3.3 to_json

5.3.4 案例

5.4 总结

你可能感兴趣的:(Python)