可以叫我才哥

实践应用|pandas+PyQt5制作数据(分组)透视处理工具

文章目录

- - 执行效果
  - 1.窗体可视化设计
  - 2.多文件合并（concat）
  - - 2.1.获取文件夹下的文件列表
    - 2.2.根据文件类型进行文件读取
    - 2.3.对读取的文件夹下简单的数据清洗
    - 2.4.合并清洗后的数据
  - 3.多文件拼接（merge）
  - 4.数据处理（pivot_table和groupby）
  - - 4.1.数据透视（pivot_table）
    - 4.2.分组统计（groupby）
    - 4.3.数据处理函数
  - 5.总结

由于在工作中需要处理很多日志文件数据，这些数据并不存在于数据库，而是以每日1个单文件的形式存在，为了让我们在日常数据处理中更方便的进行一些基础的数据合并、清洗筛选以及简单的分组或数据透视处理，结合PyQt5与pandas库，制作了一个简单的数据处理可视化工具。

实践应用|pandas+PyQt5制作数据(分组)透视处理工具_第1张图片

执行效果

我们运行脚本打包后的 exe 可执行文件，设定相关参数后点击“数据处理并导出”即可等待处理~
以下是29文件共1400余万行数据的处理结果，差不多用了10分钟合并并处理导出所需结果~

1.窗体可视化设计

采用PyQt5进行可视化界面设计，具体设计过程可以直接在QT designer中进行操作，然后转化为可视化界面的py文件。
具体这里不做更多的介绍，大家可以关注留意后续更新（专门针对PyQt5的学习笔记）。
界面效果如下图：

对于我们的操作界面，支持以下功能：

选择原始数据所在的文件夹
选择需要vlookup的文件所在的文件夹
选择处理后结果导出的文件夹
输入结果导出的文件名
在原始数据中用于过滤筛选的字段
在原始数据中用于过滤筛选的条件
如果做数据透视的行（index）
数据透视的列（column）
用于计算的字段
用于计算的方法

2.多文件合并（concat）

由于我们拿到的原始数据是以日期为文件名的csv文件，如果需要处理多天的数据，需要进行简单的数据合并后再做相关数据处理操作。
这一步其实有4个操作：
①获取文件夹下的文件列表
②根据文件类型进行文件读取
③对读取的文件进行简单的数据清洗
④合并清洗后的数据

2.1.获取文件夹下的文件列表

获取文件夹下文件列表可以使用os.walk方法，产生3-元组 (dirpath, dirnames, filenames)【文件夹路径, 文件夹名字, 文件名】。
根据文件夹路径+文件名即可组成改文件的绝对路径，用于后续文件读取。

In  [1]: import os
    ...: 
    ...: location = r'F:\数据处理工具\测试数据'
    ...: filenames = os.walk(location)
    ...: 
    ...: #获取文件夹下全部文件的绝对路径
    ...: for fileName in os.walk(location):
    ...:     for table in fileName[2]:
    ...:         path = fileName[0] + '\\' + table
    ...:         print(path)
F:\数据处理工具\测试数据\1.csv
F:\数据处理工具\测试数据\2.csv
F:\数据处理工具\测试数据\3.csv
F:\数据处理工具\测试数据\4.csv
F:\数据处理工具\测试数据\5.csv
F:\数据处理工具\测试数据\6.csv
F:\数据处理工具\测试数据\7.csv
F:\数据处理工具\测试数据\8.csv
F:\数据处理工具\测试数据\9.csv

2.2.根据文件类型进行文件读取

由于在实际操作过程中，可能存在原始文件是csv压缩包zip格式，或者xlsx格式。我们需要根据文件名后缀进行判断，然后选择对应的读取文件数据方法。
采用os.path.splitext(“文件路径”) 分离文件名与扩展名，默认返回(fname,fextension)元组。
这里我们只考虑两种情况：csv(含zip)以及xlsx(含xls)：

if filetype == '.csv'or filetype == '.zip':
    Li = pd.read_csv(path, header=0)                        
elif filetype == '.xlsx' or filetype == '.xls':
    Li = pd.read_excel(path, header=0)
else:
    log = '不是支持的文件类型,该工具暂时只支持csv、xlsx和xls文件类型'
	print(log)

2.3.对读取的文件夹下简单的数据清洗

对于读取的文件数据，并不是所有的数据都是我们需要用到的，或者说我们需要用到的数据可能是需要满足指定条件的。
比如对于下面这个情况，读取 9.csv 文件后，我们看到 usernum 每个值出现的次数，然后我希望取满足uesrnum为10的数据。

In [2]: df = pd.read_csv(r'F:\数据处理工具\测试数据\9.csv')
In [3]: df.groupby('usernum').count()
Out[3]: 
         @timestamp   appid  ...  truedmgtohero  victory
usernum                      ...                        
1            516999  516999  ...         516999   516999
2             33970   33970  ...          33970    33970
3             36819   36819  ...          36819    36819
4              6917    6917  ...           6917     6917
5              7855    7855  ...           7855     7855
6             15416   15416  ...          15416    15416
8              1220    1220  ...           1220     1220
10            75420   75420  ...          75420    75420

[8 rows x 71 columns]

我们用到布尔索引即可df[df[‘usernum’]==10]

In [4]: df_10 = df[df['usernum']==10]
In [5]: df_10.groupby('usernum').count()
Out[5]: 
         @timestamp  appid  ...  truedmgtohero  victory
usernum                     ...                        
10            75420  75420  ...          75420    75420

[1 rows x 71 columns]

但是，因为我们的筛选字段及条件都是通过可视化操作界面进行输入的，输入的数据类型在程序中是字符串，所以我们需要将其处理成为可以用于条件筛选的形式。而且，我们在进行清洗的时候字段及条件可能是多个的。
比如我输入的字段为：usernum/victory；输入的条件为：>=6/==1。
那我们实际上需要进行的清洗过程是df = df[df[‘usernum’]>=6] 和 df = df[df[‘victory’]==1]，为实现这个效果，可以用最简单的字符拼接的形式 s = f"Li[’{checkli[0]}’]{conditionli[0]}"，然后进行eval(s)转化。

#获取输入的筛选字段（用‘/’分割），我们用'/'拆分为列表
checkli = self.lineEditcheck.text().split('/')
#获取输入的条件参数（用‘/’分割），我们用'/'拆分为列表
conditionli = self.lineEditcondition.text().split('/')
for inum in range(len(checkli)):
    s = f"Li['{checkli[0]}']{conditionli[0]}"
    Li = Li[eval(s)]

关于数据清洗处理，我们会在pandas学习笔记中进行详细介绍~

2.4.合并清洗后的数据

这一步就比较简单了，直接将需要合并的数据添加的列表中，然后concat合并即可。不过，需要做个简单的判断，如果原始只有1个文件，直接就取改文件即可；超过1个文件情况下，才需要执行合并操作。

    #...读取并清洗数据...
    fileList.append(Li)

if len(fileList)>1:
    data_result = pd.concat(fileList, ignore_index=True)
else:
    data_result = fileList[0]

3.多文件拼接（merge）

这个其实也比较简单，我们事先把需要用于横向拼接的文件放到指定目录后，读取文件列表逐一和第2节中的处理过的原始数据进行merge处理。
基于第2节中介绍过的文件夹下文件列表读取，这里只介绍merge处理。
还是一样的逻辑，先判断是否有需要merge的文件，然后再执行后续操作，我们需要用到左连接方式处理。

    #...读取需要用于merge的文件组合成列表...
    fileList.append(Li)
for i in range(0,len(fileList)):
    data = pd.merge(data,fileList[i],how = 'left')

4.数据处理（pivot_table和groupby）

数据处理中我们可以用到pivot_table方法或者数据透视分组统计groupby方法，具体根据自己的需求选择。
这一部分我们在后续 pandas学习笔记中也会详细介绍~

4.1.数据透视（pivot_table）

pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc=‘mean’, fill_value=None, margins=False, dropna=True, margins_name=‘All’, observed=False)

以下举例，简单介绍下其使用方式

In  [6]: df = pd.DataFrame({"A": ["foo", "foo", "foo", "foo", "foo",
    ...:                          "bar", "bar", "bar", "bar"],
    ...:                    "B": ["one", "one", "one", "two", "two",
    ...:                          "one", "one", "two", "two"],
    ...:                    "C": ["small", "large", "large", "small",
    ...:                          "small", "large", "small", "small","large"],
    ...:                    "D": [1, 2, 2, 3, 3, 4, 5, 6, 7],
    ...:                    "E": [2, 4, 5, 5, 6, 6, 8, 9, 9]})
In [7]: df
Out[7]: 
     A    B      C  D  E
0  foo  one  small  1  2
1  foo  one  large  2  4
2  foo  one  large  2  5
3  foo  two  small  3  5
4  foo  two  small  3  6
5  bar  one  large  4  6
6  bar  one  small  5  8
7  bar  two  small  6  9
8  bar  two  large  7  9

# values是需要用于计算的字段，index是索引，columns是列，aggfunc是统计方式
In  [8]: table = pd.pivot_table(df, values='D', index=['A', 'B'],
    ...:                     columns=['C'], aggfunc='sum')
In [9]: table
Out[9]: 
C        large  small
A   B                
bar one    4.0    5.0
    two    7.0    6.0
foo one    4.0    1.0
    two    NaN    6.0

#如果aggfunc指定了多个统计方式，其会对计算的字段values中每个字段进行多个统计计算
In [10]: table = pd.pivot_table(df, values=['D', 'E'], index=['A', 'C'],
    ...:                     aggfunc={'mean','sum'})
In [11]: table
Out[11]: 
                  D               E      
               mean   sum      mean   sum
A   C                                    
bar large  5.500000  11.0  7.500000  15.0
    small  5.500000  11.0  8.500000  17.0
foo large  2.000000   4.0  4.500000   9.0
    small  2.333333   7.0  4.333333  13.0
    
#我们可以通过给aggfunc传递字典的形式指定每个用于计算字段的统计方式，这也是我们本次需要用到的
In [12]: table = pd.pivot_table(df, values=['D', 'E'], index=['A', 'C'],
    ...:                     aggfunc={'D': 'mean','E': 'sum'})
In [12]: table
Out[12]: 
                  D   E
A   C                  
bar large  5.500000  15
    small  5.500000  17
foo large  2.000000   9
    small  2.333333  13

4.2.分组统计（groupby）

DataFrame.groupby([]).agg(dict)

分组统计是pandas很大的模块，这里也不做过多的介绍，大家可以关注后续 pandas学习笔记系列
简单举个例子：

In [13]: df
Out[13]: 
     A    B      C  D  E
0  foo  one  small  1  2
1  foo  one  large  2  4
2  foo  one  large  2  5
3  foo  two  small  3  5
4  foo  two  small  3  6
5  bar  one  large  4  6
6  bar  one  small  5  8
7  bar  two  small  6  9
8  bar  two  large  7  9

In [14]: df.groupby('A')['D'].mean()
Out[14]: 
A
bar    5.5
foo    2.2
Name: D, dtype: float64

#agg传字段参数更合适，可以和pivot_table统一化
In [15]: df.groupby(['A']).agg({'D':'mean','E':'sum'})
Out[15]: 
       D   E
A           
bar  5.5  32
foo  2.2  22

4.3.数据处理函数

由于行列以及计算字段和方法都是在可视化操作界面输入，我们需要对获取参数后进行字符串有关处理，从而组合成为最终的计算方式。

#获取输入的行、列、计算字段和方法
hang = self.lineEditHang.text().split(',')
lie = self.lineEditLie.text().split(',') if len(self.lineEditLie.text())!=0 else []
ziduan = self.lineEditJisuan.text().split(',')
fangfa = self.lineEditJisF.text().split(',')

将计算字段和计算方法进行组合成为字典

dic = {}
for i in range(len(fangfa)):
	#需要注意，这里对于非重复计数，其组合形式有点特别，不能用引号
   	if fangfa[i] == 'pd.Series.nunique':
    	dic[ziduan[i]] = eval(fangfa[i])
   	else:
   		dic[ziduan[i]] = fangfa[i]

判断在可视化操作界面是否选中了数据透视操作，然后执行数据处理

if self.radioButton_toushi.isChecked():
    result = pd.pivot_table(df, values=ziduan,
                  aggfunc=dic, 
                  columns=lie,
                  index=hang,
                  ).reset_index()
else:
    result = df.groupby(hang).agg(dic).reset_index()

5.总结

以上主要三部分：

先创建好可视化操作界面，
然后编写功能槽函数和可视化操作界面功能进行关联，
最后就是打包源代码成可执行文件exe。

在进行每一步的操作时，最好都能加上边界条件处理，避免出现异常报错导致程序崩溃的情况。
每个槽函数其实都是利用到的python基础知识或者pandas基础数据处理知识，熟练掌握后便可很方便理解和实现。

关于微信公众号：可以叫我才哥，可以领取源代码或数据处理工具exe文件。

你可能感兴趣的:(Python数据分析)

Python数据分析：从入门到精通
引言在当今数据驱动的时代，数据分析已成为企业和组织做出明智决策的关键。Python作为一种强大的编程语言，因其简洁性和丰富的数据分析库而成为数据科学领域的首选工具。无论你是初学者还是有一定经验的数据分析师，本指南都将带你从入门到精通Python数据分析，掌握必备技能和最佳实践。数据分析的重要性与Python的角色数据分析涉及收集、处理和解释数据，以揭示模式、趋势和见解。它有助于解决复杂问题，优化业
Python数据分析案例｜从模拟数据到可视化：零售门店客流量差异分析全流程
1.依赖库导入importmatplotlib.pyplotaspltimportnumpyasnpimportpandasaspdfrommatplotlibimportfont_managerfromdatetimeimportdatetimematplotlib.pyplot：用于绘制图表。numpy：numpy：pandas：虽然代码中未font_manager：设置datetime：生成
Python数据分析学习笔记：字符串统计 NIKEeri python pandas 字符串匹配 python 数据分析学习
一、题目来源KagglePandas-Exercise:SummaryFunctionsandMaps章节二、题目要求描述一瓶葡萄酒时，可用的词汇有限。哪种词出现频率更高：“tropical”还是“fruity”？统计description列中这两个词的出现次数。忽略大小写。三、我的思路（使用str.contains统计总次数）tropical_count=reviews['description
python数据分析scipy库安装与使用范哥来了 python 数据分析 scipy
安装scipy库scipy是一个用于科学计算的Python库，它依赖于numpy。如果你还没有安装scipy，可以使用以下命令来安装：pipinstallscipy或者，如果你使用的是Anaconda环境，可以通过conda来安装：condainstallscipy使用scipy库scipy提供了许多用于科学计算的功能，包括统计、优化、积分、线性代数等。下面是一些常见的用法示例。1.导入scipy
Python,C++开发上市辅导方法与实操APP Geeker-2025 python c++
#上市辅导方法与实操APP-Python与C++综合解决方案下面是一个完整的上市辅导方法与实操APP的实现方案，结合Python和C++的优势，涵盖金融建模、合规分析、流程管理等多个方面：```mermaidgraphTDA[上市辅导系统]-->B[核心引擎]A-->C[应用平台]B-->D[C++金融计算引擎]B-->E[Python数据分析]B-->F[合规检查系统]C-->G[Web管理平台
《python 数据分析从入门到精通》读书笔记｜了解数据分析｜数据分析基础知识
《python数据分析从入门到精通》读书笔记第一章：了解数据分析1.1什么是数据分析数据分析是利用数学、统计学理论与实践相结合的科学统计分析方法，对Excel数据、数据库中的数据、收集的大量数据、网页抓取的数据进行分析，从中提取有价值的信息并形成结论进行展示的过程。数据分析实际上是通过数据的规律来解决业务问题，以帮助实际工作中的管理者做出判断和决策。数据分析包括以下几个主要内容：（1）现状分析：分
【python数据分析】数据建模之Kmeans聚类斑点鱼 SpotFish python 数据建模聚类 python 数据分析
K-means聚类：最常用的机器学习聚类算法，且为典型的基于距离的聚类算法。K均值：基于原型的、划分的距离技术，它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度Kmeans聚类案例分析：make_blobs聚类数据生成器#导入模块from sklearn.cluster import KMeansfromsklearn.datasetsimportmake_blobs#创建数据x,y_tr
Python 数据分析与机器学习入门 (一)：环境搭建与核心库概览程序员阿超的博客 Python python 数据分析机器学习入门教程环境搭建 Anaconda JupyterNotebook
Python数据分析与机器学习入门(一)：环境搭建与核心库概览本文摘要本文是Python数据分析与机器学习入门系列的第一篇，专为初学者设计。文章首先阐明了Python在数据科学领域的优势，然后手把手指导读者如何使用Anaconda搭建一个无痛、专业的开发环境，并介绍了强大的交互式工具JupyterNotebook的基本操作。最后，简要概览了NumPy、Pandas、Scikit-learn等核心库
物流数据行业分析（包含完整代码和流程）------python数据分析师项目Anaconda 欲梦yhd 数据分析项目大数据 conda python
一、引言数据分析流程为明确目的、获取数据、数据探索和预处理、分析数据、得出结论、验证结论、结果展现。物流业务中对数据进行深入挖掘和分析的过程，旨在提高运输效率、降低运输成本、提高客户满意度，以及提高公司的竞争力。本案例物流数据分析目的：a、配送服务是否存在问题b、是否存在尚有潜力的销售区域c、商品是否存在质量问题二、详细流程1、数据预处理（数据清洗）（1）数据导入使用panda库读取数据，编码方式
Python 数据分析实践经验与学习心得 lzzy_sj_0999 python 数据分析开发语言
在当今数据驱动的时代，Python以其丰富的库和便捷的语法，成为数据分析领域的首选语言。本文将结合实际案例，分享Python数据分析的学习心得与实践经验，涵盖数据读取、清洗、分析及可视化等关键环节，希望能为大家的学习和工作提供帮助。一、数据分析必备库介绍在Python数据分析中，有几个核心库是必须掌握的，它们就像我们手中的“神兵利器”，能够高效完成各种数据分析任务。Pandas：用于数据处理和分析
《Python数据分析与挖掘实战》Chapter8中医证型关联规则挖掘笔记茫茫大地真干净机器学习 Python 数据挖掘
最近在学习《Python数据分析与挖掘实战》中的案例，写写自己的心得。代码分为两大部分：1.读取数据并进行聚类分析2.应用Apriori关联规则挖掘规律1.聚类部分函数分析：defprogrammer_1():datafile="C:/Users/longming/Desktop/chapter8/data/data.xls"processedfile="C:/Users/longming/Des
python数据分析张俊红_Python数据分析实战基础 | 初识Pandas weixin_39678531 python数据分析张俊红
这是Python数据分析实战基础的第一篇内容，主要是和Pandas来个简单的邂逅。已经熟练掌握Pandas的同学，可以加快手速滑动浏览或者直接略过本文。01重要的前言这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像
python数据分析第9天雪球滚滚滚数据分析 python 数据挖掘
python数据分析第9天电商网站用户/订单/活动数据分析项目商业模式B2B：商家对商家（企业卖家对企业买家），交易双方都是企业，最典型的案例就是阿里巴巴，汇聚了各行业的供应商，特点是订单量一般较大。B2C：商家对个人（企业卖家对个人买家），例如：唯品会，聚美优品。B2B2C：商家对商家对个人，例如：天猫、京东。C2C：个人（卖家）对个人（买家），例如：淘宝、人人车。O2O：线上（售卖）到线下（提
Python数据处理三剑客：NumPy、Pandas和xarray全面详解 AI开发学习分享 python 数据分析 python numpy pandas
在Python数据分析领域，NumPy、Pandas和xarray是最核心的三个库。本文将详细介绍它们的功能、用法和区别，并提供大量实用代码示例。一、NumPy：科学计算基础库NumPy是Python科学计算的基础包，提供了高性能的多维数组对象和各种计算工具。1.1基本数组操作importnumpyasnp#创建数组arr1=np.array([1,2,3,4])#一维数组arr2=np.arra
100个Pandas练习题：从入门到精通的实战指南陆骊咪Durwin
100个Pandas练习题：从入门到精通的实战指南100-pandas-puzzles100datapuzzlesforpandas,rangingfromshortandsimpletosupertricky(60%complete)项目地址:https://gitcode.com/gh_mirrors/10/100-pandas-puzzles前言Pandas作为Python数据分析的核心库，
Python 数据分析与可视化实践与python数据分析绘图表的实现，和实际的完整案例 Q_ytsup5681 python 数据分析开发语言 plotly matplotlib
本文链接：Python数据分析与可视化实践与python数据分析绘图表的实现，和实际的完整案例-CSDN博客学习Python数据可视化对于数据分析和数据科学领域是至关重要的，它有着许多作用，包括但不限于以下几个方面：1.数据理解与探索：可视化使得数据更加直观，通过图表和图形，可以更容易地观察数据的分布、趋势和模式。这有助于深入理解数据，识别异常值和发现潜在的关联性。2.决策支持：数据可视化为决策提
python数据分析期末测验,python数据分析基础题库 Leospanb87 python 开发语言人工智能
大家好，小编来为大家解答以下问题，python数据分析与应用选择题答案，python数据分析与应用课后题，现在让我们一起来看看吧！文章目录一、选择题二、填空题三、判断题四、代码分析题五、程序题一、选择题1.sum(range(0,101)的结果是（）A.5050B.5151C.0D.101A2.下面哪个不是python合法的标识符（）A.int32B.70XLC.selfD.__name__B3.
python数据分析与可视化蓝宗林 python 数据分析信息可视化
一、Python数据分析概述Python是一种解释型、交互式的编程语言，其设计理念强调代码的可读性和简洁性。Python的语法结构简单，支持面向对象、过程式和函数式三种编程范式，使得Python成为一种强大而灵活的编程语言。Python数据分析主要包括数据清洗、数据探索和数据可视化三个部分。数据清洗是数据分析的重要环节，主要是对数据进行预处理，包括缺失值处理、异常值处理、数据类型转换等。数据探索则
Python数据分析与可视化理论知识
Python数据分析概述Python数据分析依赖的两个对象表格对象实现统计分析数据预处理Matplotlib数据可视化总结Python数据分析概述数据分析的概述数据分析：用适当的统计分析方法将收集来的大量数据进行分析，将他们加以汇总和理解并消化，以求最大化地开发数据的功能，发挥数据的作用。为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析的类别：描述性数据分析、探索性数据分析
3648766 天浊海 python pycharm sklearn
1.Python数据分析介绍及环境搭建1.1python数据分析简介【了解】1.1.1python做数据分析的优势可以独立完成数据分析的各种任务功能强大,有海量的开源包(pandas,numpy…)处理海量数据效率高开源免费1.1.2常用python数据分析开源库numpy:用于数组计算pandas:分析结构化数据的工具集series:类似一维数组的对象(一行数据或者一列数据)dataframe:
Python数据分析的基本步骤在焦虑的沙漠里种一棵树 python 数据分析开发语言
数据分析的基本步骤（基于Python）一、引言在当今数字化时代，数据已成为企业、科研机构等组织的重要资产。有效地进行数据分析可以帮助我们从海量的数据中提取有价值的信息，从而支持决策制定、优化流程、发现趋势等。Python作为一种强大的编程语言，拥有丰富的数据分析库，如Pandas、NumPy、Matplotlib等，为数据分析工作提供了极大的便利。本文将详细阐述基于Python的数据分析基本步骤，
Python数据分析从小白到高手--数据可视化分析王国平信息可视化 python 数据分析人工智能大数据数据挖掘开发语言
Python是一种功能强大的编程语言，也是一种流行的数据分析工具，其数据可视化能力也非常强大，本章我们将结合实际案例介绍Python的主要数据可视化库，包括Matplotlib、Pyecharts、Seaborn、Plotly、Altair、NetworkX等。7.1Matplotlib7.1.1Matplotlib库简介Matplotlib是Python中最流行的数据可视化库之一，基于Numpy
【无痛学Python】Pandas数据载入与预处理，看这一篇就够了！ Skrrapper Python python pandas 数据库
【Python数据分析】Pandas数据载入与预处理，看这一篇就够了！对于数据分析而言，数据大部分来源于外部数据，例如CSV文件、Excel文件以及数据库文件等等。我们要把各种格式的数据转换成Pandas可处理的Series和DataFrame数据格式，进行完数据分析与处理之后再重新存储到外部文件中，这就是Pandas的数据载入与预处理。数据载入其实对于读/写文件和存储文件来说，不同类型文件的函数
Python 数据分析：NumPy 库的使用小张在编程 python 数据分析 numpy
引言：为什么说NumPy是Python数据分析的“基石”？在Python数据分析领域，有这样一句话：“没有NumPy，就没有Pandas、Matplotlib和Scikit-learn”。作为Python科学计算的核心库，NumPy（NumericalPython）凭借高效的多维数组（ndarray）和向量化运算能力，成为了所有数据分析工具的底层支撑。无论是处理百万级别的销售数据，还是实现复杂的机
python数据分析期末_Python数据分析期末作业 xander Sun python数据分析期末
Python数据分析期末作业(50分)一、名称：国民经济核算季度数据分析可视化处理；二、需求：根据文件《国民经济核算季度数据.npz》提供的各年中每个季度的数据，完成如下操作处理：1、绘制直方图：(1)在一个画板中绘制2000年、2017年第一季度国民生产总值产业构成分布、行业构成分布直方图，其效果形式如下；(2)要求：?每个图形的标题、轴标签、刻度、图形颜色、柱形宽度与效果图中的完全一致；?在每
1、Python数据分析：数据的采集数字化与智能化 Python数据分析 python数据分析 python数据的采集
一、数据的采集数据采集是系统性工程，需平衡技术、成本与合规性。在实际操作中，建议从最小可行采集方案（MVP）起步，逐步迭代优化，同时建立数据治理规范，确保长期可持续性。1.数据采集的核心目标全面性：覆盖关键维度，避免信息缺失。准确性：确保数据真实反映现实，减少误差。时效性：数据需满足实时或近实时需求（如金融交易监控）。合规性：遵守隐私保护（如GDPR）、数据安全等法律法规。2.数据来源分类（1）第
如何进行Python数据分析？正确的“入门之路”三部曲白帽黑客麦叔 Python python 数据分析开发语言职场和发展 Python教程
前言Python是一种面向对象、直译式计算机程序设计语言，由于他简单、易学、免费开源、可移植性、可扩展性等特点，Python又被称之为胶水语言。下图为主要程序语言近年来的流行趋势，Python受欢迎程度扶摇直上。由于Python拥有非常丰富的库，使其在数据分析领域也有广泛的应用。一、为什么要用Python做数据分析？在我看来，大概有3大理由。广度：各行各业都有自己的商业场景，每一个行业都需要使用数
如何进行Python数据分析？正确的“入门之路”三部曲！_python医学数据分析入门 2401_84301948 程序员网络安全学习面试
给大家的福利零基础入门对于从来没有接触过网络安全的同学，我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。同时每个成长路线对应的板块都有配套的视频提供：因篇幅有限，仅展示部分资料网络安全面试题绿盟护网行动还有大家最喜欢的黑客技术网络安全源码合集+工具包所有资料共282G，朋友们如果有需要全套《网络安全入门+黑客进阶学习资源包》，可以扫描下方二维码
【数据分析】第四章 pandas简介（1）神秘敲码人数据分析 python pandas
4.1pandas:Python数据分析库pandas是一个专门为数据分析量身定制的开源Python库。在当今的Python数据科学界，无论是专业研究还是进行统计分析和决策，pandas都是每一位数据专业人士不可或缺的基础工具。这个强大的库由WesMcKinney于2008年开始设计和开发。到了2012年，他的同事SienChang也加入了开发团队。正是他们二人的共同努力，造就了Python社区中
一篇文章搞定Python数据分析用到的所有库花小姐的春天跟着花姐学Python python 数据分析开发语言 0基础学Python Python教程 Python基础教程数据挖掘
想做数据分析，却不知道从哪里入手？别担心，花姐今天就来告诉你，想搞定数据分析，掌握以下这些Python库就够了！准备好了吗？跟着我一起看看这些实用的库吧！1.数据处理库在数据分析的世界里，数据处理是最基础也是最重要的部分。如果你想要做一份高质量的报告，或者让数据“乖乖”地为你服务，首先必须得把数据弄清楚、整理好。今天，我们就从四个强大的数据处理库说起——pandas、numpy、dask和modi
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他