利用Python进行数据分析--数据聚合与分组运算1

转载自：http://blog.csdn.net/ssw_1990/article/details/22286583

pandas提供了一个灵活高效的groupby功能，它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。

根据一个或多个键（可以是函数、数组或DataFrame列名）拆分pandas对象。
计算分组摘要统计，如计数、平均值、标准差，或用户自定义函数。
对DataFrame的列应用各种各样的函数。
应用组内转换或其他运算，如规格化、线性回归、排名或选取子集等。
计算透视表或交叉表。
执行分位数分析以及其他分组分析。

1、分组键可以有多种形式，且类型不必相同

列表或数组，其长度与待分组的轴一样。
表示DataFrame某个列名的值。
字典或Series，给出待分组轴上的值与分组名之间的对应关系。
函数，用于处理轴索引或索引中的各个标签。

注意：

后三种都只是快捷方式而已，其最终目的仍然是产生一组用于拆分对象的值。

2、首先来看看下面这个非常简单的表格型数据集（以DataFrame的形式）：

[python]  view plain copy

 >>> import pandas as pd  
 >>> df = pd.DataFrame({'key1':['a', 'a', 'b', 'b', 'a'],  
 ...     'key2':['one', 'two', 'one', 'two', 'one'],  
 ...     'data1':np.random.randn(5),  
 ...     'data2':np.random.randn(5)})  
 >>> df  
       data1     data2 key1 key2  
 0 -0.410673  0.519378    a  one  
 1 -2.120793  0.199074    a  two  
 2  0.642216 -0.143671    b  one  
 3  0.975133 -0.592994    b  two  
 4 -1.017495 -0.530459    a  one  

假设你想要按key1进行分组，并计算data1列的平均值，我们可以访问data1，并根据key1调用groupby：

[python]  view plain copy

 >>> grouped = df['data1'].groupby(df['key1'])  
 >>> grouped  
 0x04120D70>  

变量grouped是一个GroupBy对象，它实际上还没有进行任何计算，只是含有一些有关分组键df['key1']的中间数据而已，然后我们可以调用GroupBy的mean方法来计算分组平均值：

[python]  view plain copy

 >>> grouped.mean()  
 key1  
 a      -1.182987  
 b       0.808674  
 dtype: float64  

说明：

数据（Series）根据分组键进行了聚合，产生了一个新的Series，其索引为key1列中的唯一值。之所以结果中索引的名称为key1，是因为原始DataFrame的列df['key1']就叫这个名字。

3、如果我们一次传入多个数组，就会得到不同的结果：

[python]  view plain copy

 >>> means = df['data1'].groupby([df['key1'], df['key2']]).mean()  
 >>> means  
 key1  key2  
 a     one    -0.714084  
       two    -2.120793  
 b     one     0.642216  
       two     0.975133  
 dtype: float64  

通过两个键对数据进行了分组，得到的Series具有一个层次化索引（由唯一的键对组成）：

[python]  view plain copy

 >>> means.unstack()  
 key2       one       two  
 key1                      
 a    -0.714084 -2.120793  
 b     0.642216  0.975133  

在上面这些示例中，分组键均为Series。实际上，分组键可以是任何长度适当的数组：

[python]  view plain copy

 >>> states = np.array(['Ohio', 'California', 'California', 'Ohio', 'Ohio'])  
 >>> years = np.array([2005, 2005, 2006, 2005, 2006])  
 >>> df['data1'].groupby([states, years]).mean()  
 California  2005   -2.120793  
             2006    0.642216  
 Ohio        2005    0.282230  
             2006   -1.017495  
 dtype: float64  

4、此外，你还可以将列名（可以是字符串、数字或其他Python对象）用作分组将：

[python]  view plain copy

 >>> df.groupby('key1').mean()  
          data1     data2  
 key1                      
 a    -1.182987  0.062665  
 b     0.808674 -0.368333  
 >>> df.groupby(['key1', 'key2']).mean()  
               data1     data2  
 key1 key2                      
 a    one  -0.714084 -0.005540  
      two  -2.120793  0.199074  
 b    one   0.642216 -0.143671  
      two   0.975133 -0.592994  

说明：

在执行df.groupby('key1').mean()时，结果中没有key2列。这是因为df['key2']不是数值数据，所以被从结果中排除了。默认情况下，所有数值列都会被聚合，虽然有时可能会被过滤为一个子集。

无论你准备拿groupby做什么，都有可能会用到GroupBy的size方法，它可以返回一个含有分组大小的Series：

[python]  view plain copy

 >>> df.groupby(['key1', 'key2']).size()  
 key1  key2  
 a     one     2  
       two     1  
 b     one     1  
       two     1  
 dtype: int64  

注意：

分组键中的任何缺失值都会被排除在结果之外。

5、对分组进行迭代

GroupBy对象支持迭代，可以产生一组二元元组（由分组名和数据块组成）。看看下面这个简单的数据集：

[python]  view plain copy

 >>> for name, group in df.groupby('key1'):  
 ...     print(name)  
 ...     print(group)  
 ...   
 a  
       data1     data2 key1 key2  
 0 -0.410673  0.519378    a  one  
 1 -2.120793  0.199074    a  two  
 4 -1.017495 -0.530459    a  one  
 b  
       data1     data2 key1 key2  
 2  0.642216 -0.143671    b  one  
 3  0.975133 -0.592994    b  two  

对于多重键的情况，元组的第一个元素将会是由键值组成的元组：

[python]  view plain copy

 >>> for (k1, k2), group in df.groupby(['key1', 'key2']):  
 ...     print k1, k2  
 ...     print group  
 ...   
 a one  
       data1     data2 key1 key2  
 0 -0.410673  0.519378    a  one  
 4 -1.017495 -0.530459    a  one  
 a two  
       data1     data2 key1 key2  
 1 -2.120793  0.199074    a  two  
 b one  
       data1     data2 key1 key2  
 2  0.642216 -0.143671    b  one  
 b two  
       data1     data2 key1 key2  
 3  0.975133 -0.592994    b  two  

当然，你可以对这些数据片段做任何操作。有一个你可能会觉得有用的运算：将这些数据片段做成一个字典：

[python]  view plain copy

 >>> pieces = dict(list(df.groupby('key1')))  
 >>> pieces['b']  
       data1     data2 key1 key2  
 2  0.642216 -0.143671    b  one  
 3  0.975133 -0.592994    b  two  
 >>> df.groupby('key1')  
 0x0413AE30>  
 >>> list(df.groupby('key1'))  
 [('a',       data1     data2 key1 key2  
 0 -0.410673  0.519378    a  one  
 1 -2.120793  0.199074    a  two  
 4 -1.017495 -0.530459    a  one), ('b',       data1     data2 key1 key2  
 2  0.642216 -0.143671    b  one  
 3  0.975133 -0.592994    b  two)]  

groupby默认是在axis=0上进行分组的，通过设置也可以在其他任何轴上进行分组。那上面例子中的df来说，我们可以根据dtype对列进行分组：

[python]  view plain copy

 >>> df.dtypes  
 data1    float64  
 data2    float64  
 key1      object  
 key2      object  
 dtype: object  
 >>> grouped = df.groupby(df.dtypes, axis=1)  
 >>> dict(list(grouped))  
 {dtype('O'):   key1 key2  
 0    a  one  
 1    a  two  
 2    b  one  
 3    b  two  
 4    a  one, dtype('float64'):       data1     data2  
 0 -0.410673  0.519378  
 1 -2.120793  0.199074  
 2  0.642216 -0.143671  
 3  0.975133 -0.592994  
 4 -1.017495 -0.530459}  

[python]  view plain copy

 >>> grouped  
 0x041288F0>  
 >>> list(grouped)  
 [(dtype('float64'),       data1     data2  
 0 -0.410673  0.519378  
 1 -2.120793  0.199074  
 2  0.642216 -0.143671  
 3  0.975133 -0.592994  
 4 -1.017495 -0.530459), (dtype('O'),   key1 key2  
 0    a  one  
 1    a  two  
 2    b  one  
 3    b  two  
 4    a  one)]  

6、选取一个或一组列

对于由DataFrame产生的GroupBy对象，如果用一个（单个字符串）或一组（字符串数组）列名对其进行索引，就能实现选取部分列进行聚合的目的，即：

[python]  view plain copy

 >>> df.groupby('key1')['data1']  
 0x06615FD0>  
 >>> df.groupby('key1')['data2']  
 0x06615CB0>  
 >>> df.groupby('key1')[['data2']]  
 0x06615F10>  

和以下代码是等效的：

[python]  view plain copy

 >>> df['data1'].groupby([df['key1']])  
 0x06615FD0>  
 >>> df[['data2']].groupby([df['key1']])  
 0x06615F10>  
 >>> df['data2'].groupby([df['key1']])  
 0x06615E30>  

尤其对于大数据集，很可能只需要对部分列进行聚合。例如，在前面那个数据集中，如果只需计算data2列的平均值并以DataFrame形式得到结果，代码如下：

[python]  view plain copy

 >>> df.groupby(['key1', 'key2'])[['data2']].mean()  
               data2  
 key1 key2            
 a    one  -0.005540  
      two   0.199074  
 b    one  -0.143671  
      two  -0.592994  
 >>> df.groupby(['key1', 'key2'])['data2'].mean()  
 key1  key2  
 a     one    -0.005540  
       two     0.199074  
 b     one    -0.143671  
       two    -0.592994  
 Name: data2, dtype: float64  

这种索引操作所返回的对象是一个已分组的DataFrame（如果传入的是列表或数组）或已分组的Series（如果传入的是标量形式的单个列明）：

[python]  view plain copy

 >>> s_grouped = df.groupby(['key1', 'key2'])['data2']  
 >>> s_grouped  
 0x06615B10>  
 >>> s_grouped.mean()  
 key1  key2  
 a     one    -0.005540  
       two     0.199074  
 b     one    -0.143671  
       two    -0.592994  
 Name: data2, dtype: float64  

7、通过字典或Series进行分组

除数组以外，分组信息还可以其他形式存在，来看一个DataFrame示例：

[python]  view plain copy

 >>> people = pd.DataFrame(np.random.randn(5, 5),  
 ...     columns=['a', 'b', 'c', 'd', 'e'],  
 ...     index=['Joe', 'Steve', 'Wes', 'Jim', 'Travis']  
 ... )  
 >>> people  
                a         b         c         d         e  
 Joe     0.306336 -0.139431  0.210028 -1.489001 -0.172998  
 Steve   0.998335  0.494229  0.337624 -1.222726 -0.402655  
 Wes     1.415329  0.450839 -1.052199  0.731721  0.317225  
 Jim     0.550551  3.201369  0.669713  0.725751  0.577687  
 Travis -2.013278 -2.010304  0.117713 -0.545000 -1.228323  
 >>> people.ix[2:3, ['b', 'c']] = np.nan   

假设已知列的分组关系，并希望根据分组计算列的总计：

[python]  view plain copy

 >>> mapping = {'a':'red', 'b':'red', 'c':'blue',  
 ...     'd':'blue', 'e':'red', 'f':'orange'}  
 >>> mapping  
 {'a': 'red', 'c': 'blue', 'b': 'red', 'e': 'red', 'd': 'blue', 'f': 'orange'}  
 >>> type(mapping)  
 'dict'>  

现在，只需将这个字典传给groupby即可：

[python]  view plain copy

 >>> by_column = people.groupby(mapping, axis=1)  
 >>> by_column  
 0x066150F0>  
 >>> by_column.sum()  
             blue       red  
 Joe    -1.278973 -0.006092  
 Steve  -0.885102  1.089908  
 Wes     0.731721  1.732554  
 Jim     1.395465  4.329606  
 Travis -0.427287 -5.251905  

Series也有同样的功能，它可以被看做一个固定大小的映射。对于上面那个例子，如果用Series作为分组键，则pandas会检查Series以确保其索引跟分组轴是对齐的：

[python]  view plain copy

 >>> map_series = pd.Series(mapping)  
 >>> map_series  
 a       red  
 b       red  
 c      blue  
 d      blue  
 e       red  
 f    orange  
 dtype: object  
 >>> people.groupby(map_series, axis=1).count()  
         blue  red  
 Joe        2    3  
 Steve      2    3  
 Wes        1    2  
 Jim        2    3  
 Travis     2    3  

8、通过函数进行分组

相较于字典或Series，Python函数在定义分组映射关系时可以更有创意且更为抽象。任何被当做分组键的函数都会在各个索引值上被调用一次，其返回值就会被用作分组名称。

具体点说，以DataFrame为例，其索引值为人的名字。假设你希望根据人名的长度进行分组，虽然可以求取一个字符串长度数组，但其实仅仅传入len函数即可：

[python]  view plain copy

 >> people.groupby(len).sum()  
           a         b         c         d         e  
 3  2.272216  3.061938  0.879741 -0.031529  0.721914  
 5  0.998335  0.494229  0.337624 -1.222726 -0.402655  
 6 -2.013278 -2.010304  0.117713 -0.545000 -1.228323  

将函数跟数组、列表、字典、Series混合使用也不是问题，因为任何东西最终都会被转换为数组：

[python]  view plain copy

 >>> key_list = ['one', 'one', 'one', 'two', 'two']  
 >>> people.groupby([len, key_list]).min()  
               a         b         c         d         e  
 3 one  0.306336 -0.139431  0.210028 -1.489001 -0.172998  
   two  0.550551  3.201369  0.669713  0.725751  0.577687  
 5 one  0.998335  0.494229  0.337624 -1.222726 -0.402655  
 6 two -2.013278 -2.010304  0.117713 -0.545000 -1.228323  

9、根据索引级别分组

层次化索引数据集最方便的地方在于它能够根据索引级别进行聚合。要实现该目的，通过level关键字传入级别编号或名称即可：

[python]  view plain copy

 >>> columns = pd.MultiIndex.from_arrays([['US', 'US', 'US', 'JP', 'JP'],  
 ...     [1, 3, 5, 1, 3]], names=['cty', 'tenor'])  
 >>> columns  
 MultiIndex  
 [US  1,     3,     5, JP  1,     3]  
 >>> hier_df = pd.DataFrame(np.random.randn(4, 5), columns=columns)  
 >>> hier_df  
 cty          US                            JP            
 tenor         1         3         5         1         3  
 0     -0.166600  0.248159 -0.082408 -0.710841 -0.097131  
 1     -1.762270  0.687458  1.235950 -1.407513  1.304055  
 2      1.089944  0.258175 -0.749688 -0.851948  1.687768  
 3     -0.378311 -0.078268  0.247147 -0.018829  0.744540  
 >>> hier_df.groupby(level='cty', axis=1).count()  
 cty  JP  US  
 0     2   3  
 1     2   3  
 2     2   3  
 3     2   3  

【Python系列】异步任务的终止 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
【Python系列】使用切片移动元素位置 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
Java Kafka生产者实现 stormsha Java web java kafka linq
欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐：「stormsha的主页」，「stormsha的知识库」持续学习，不断总结，共同进步，为了踏实，做好当下事儿~专栏导航Python系列:Python面试题合集，剑指大厂Git系列:Git操作技巧GO系列:记录博主学习GO语言的笔记，该笔记专栏
python系列：[Python]在VSCode中搭建Python开发环境坦笑&&life #python python vscode 开发语言
[Python]在VSCode中搭建Python开发环境[Python]在VSCode中搭建Python开发环境前言安装1.安装VSCode的Python插件2.选择python解释器3.运行代码配置python检查项安装对应的库修改vscode的配置文件[Python]在VSCode中搭建Python开发环境前言之前用过Anaconda下的Spyder、Pycharm和Jupyter等写过pyt
【Python系列】中位数计算 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
python系列：FASTAPI 11-请求BODY的嵌套模型创建坦笑&&life #python python fastapi windows
FASTAPI11-请求BODY的嵌套模型创建FASTAPI11-请求BODY的嵌套模型创建前言一、声明属性子类型二、嵌套模型1.定义子模型2.深度嵌套模型总结FASTAPI11-请求BODY的嵌套模型创建前言使用FastAPI，你可以定义、校验、记录文档并使用任意深度嵌套的模型，使用Pydantic创建模型一、声明属性子类型将一个属性定义为拥有子元素的类型，首先，从Python的标准库typin
python系列：已解决error: subprocess-exited-with-error 坦笑&&life #python python 开发语言 linux
已解决error:subprocess-exited-with-error已解决error:subprocess-exited-with-error报错问题报错翻译报错信息翻译如下：报错原因报错原因：解决方法1（1）安装setuptools：（2）安装微软的VSInstall，把你的操作系统包和改装的库装上：（3）然后再次安装lxml模块试试：解决方法2（适用于所有模块安装）已解决error:su
python系列之：读取yaml文件快乐骑行^_^ 日常分享专栏 python系列读取yaml文件
python系列之：读取yaml文件一、yaml文件二、读取yaml文件一、yaml文件data.ymlname:刘备power:80000foods:-apple-orangehobby:sport:footballgame:fight二、读取yaml文件importyamlwithopen("/data/firstProject/data.yml")asf:print(yaml.load(f,
13 Python面向对象编程：装饰器凡人编程传 Python python 开发语言
本篇是Python系列教程第13篇，更多内容敬请访问我的Python合集Python装饰器是一种强大的工具，用于修改或增强函数或方法的行为，而无需更改其源代码。装饰器本质上是一个接收函数作为参数的函数，并返回一个新的函数。装饰器的用途包括日志记录、性能测试、事务处理、缓存、权限校验等1基本语法装饰器的基本语法是在函数定义之前使用@符号，紧跟着装饰器的名字。例如：#定义一个装饰器，参数为被装饰的方法
python基础（17面试题附答案二）佳佳不爱上班 python基础 python 面试功能测试自动化开发语言
python系列文章目录python基础（01变量&数据类型&运算符）python基础（02序列共性）python基础(03列表和元组)python基础（04字符串&字典）python基础（05集合set）python基础（06控制语句）python基础（07函数）python基础（08类和对象）python基础（09闭包&装饰器）python基础（10异常处理）python基础（11文件读取）p
【Python系列】signal信号处理 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 信号处理开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
6 Python运算符和表达式凡人编程传 Python python 开发语言
本篇是Python系列教程第6篇，更多内容敬请访问我的Python专栏Python运算符和Java类似，但也有个别不同。Python表达式和Java的区别是Python表达式不用跟“;”结尾。1算术运算符算术运算符用于执行基本的数学运算，如加减乘除等。加法(+):将两个数相加。result=5+3#结果为8减法(-):从第一个数减去第二个数。result=10-3#结果为7乘法(*):两个数相乘。
python基础（09闭包&装饰器）佳佳不爱上班 python基础 python 功能测试自动化开发语言
python系列文章目录python基础（01变量&数据类型&运算符）python基础（02序列共性）python基础(03列表和元组)python基础（04字符串&字典）python基础（05集合set）python基础（06控制语句）python基础（07函数）python基础（08类和对象）文章目录python系列文章目录前言一、函数的特性二、闭包1.定义2.闭包条件3.闭包使用4.闭包特殊
python基础（10异常处理）佳佳不爱上班 python基础 python 开发语言功能测试自动化
python系列文章目录python基础（01变量&数据类型&运算符）python基础（02序列共性）python基础(03列表和元组)python基础（04字符串&字典）python基础（05集合set）python基础（06控制语句）python基础（07函数）python基础（08类和对象）python基础（09闭包&装饰器）文章目录python系列文章目录前言一、引导问题二、结构1.try
python基础（06控制语句）佳佳不爱上班 python基础 python 开发语言功能测试自动化
python系列文章目录python基础（01变量&数据类型&运算符）python基础（02序列共性）python基础(03列表和元组)python基础（04字符串&字典）python基础（05集合set）文章目录python系列文章目录前言一、语句块二、bool类型：Ture、False三、条件判断（if、else、elif）四、循环语句五、推导式1.列表推导式2.字典推导式2.集合推导式总结前
python基础（08类和对象）佳佳不爱上班 python基础 python 功能测试开发语言自动化
python系列文章目录python基础（01变量&数据类型&运算符）python基础（02序列共性）python基础(03列表和元组)python基础（04字符串&字典）python基础（05集合set）python基础（06控制语句）python基础（07函数）文章目录python系列文章目录前言一、对象基础概念二、定义类1.例子12.例子2三、实例化类四、继承五、经典类、新式类1.经典类2.
Python系列：pip安装地址--清华源(国内常用镜像源) 坦笑&&life #python python pip 开发语言
pip安装地址--清华源(国内常用镜像源）pip安装地址--清华源(国内常用镜像源)国内常用镜像源————————————————1、临时使用2、永久使用pip安装地址–清华源(国内常用镜像源)国内常用镜像源清华大学：https://pypi.tuna.tsinghua.edu.cn/simple/阿里云：http://mirrors.aliyun.com/pypi/simple/中国科学技术大学
Python系列：Python中比较大小的几种方法坦笑&&life #python python 开发语言
Python中比较大小的几种方法Python中比较大小的几种方法一、if语句实现比较大小二、使用max()和min()函数实现大小比较三、使用sorted()函数实现大小比较四、使用cmp()函数实现大小比较五、使用operator模块实现大小比较六、小结Python中比较大小的几种方法更新：2023-06-0113:28Python中比较大小是编程中常用的操作之一，在实际开发中，我们经常需要比较
Python系列（17）—— 位运算符隐私无忧万花筒 #Python python
Python中的位运算符（BitwiseOperator）一、引言位运算符是直接对整数的二进制位进行操作的运算符。在Python中，位运算符可以对整数进行位级别的运算，如按位与（AND）、按位或（OR）、按位异或（XOR）、按位取反（NOT）等。这些运算符在底层系统编程、算法优化、网络通信等领域有广泛的应用。二、位运算符介绍按位与（&）：对应位都为1时，结果位才为1，否则为0。按位或（|）：对应位
Python系列（10）—— 逻辑运算符隐私无忧万花筒 #Python python
在Python中，逻辑运算符被用于连接布尔表达式，从而根据这些表达式的真假值来执行相应的操作。Python提供了三种基本的逻辑运算符：and（与）、or（或）和not（非）。1.and运算符and运算符用于连接两个布尔表达式。当两个表达式都为True时，整个表达式的结果才为True。#示例：检查两个条件是否同时满足a=5b=10ifa>3andb3orb10:print("a不大于10")else
「Python系列」Python运算符雪梅零落 Python系列专栏 python 开发语言
文章目录一、Python运算符二、Python简介三、相关链接一、Python运算符Python支持多种运算符，包括算术运算符、比较运算符、逻辑运算符、位运算符等等。以下是这些运算符的简要概述和相应的案例代码：算术运算符：用于基本的数学运算。加法（+）：python`a=5+3#a的值为8减法（-）：python`b=5-3#b的值为2乘法（*）：python`c=5*3#c的值为15除法（/）：
Python系列（13）—— 三元运算符隐私无忧 #Oracle #Python python 开发语言
在Python中，三元运算符（TernaryOperator）是一种简洁的条件表达式，它允许我们在一行代码中执行简单的条件判断。三元运算符的格式如下：value_if_trueifconditionelsevalue_if_false如果condition为True，则整个表达式的值为value_if_true；如果condition为False，则整个表达式的值为value_if_false。示
下载Bing图片（Python系列之——爬虫）罗方涵 python python 爬虫
必应是一个搜素引擎，它有许多漂亮的图片，比如：或者现在我们要将它们爬取下来（记得下载requests库）：importrequestsBING_URL="https://cn.bing.com"API_URL=BING_URL+"/HPImageArchive.aspx?format=js&idx=0&n=8"defget_image_list():reponse=requests.get(API
查询天气信息（Python系列之——爬虫）罗方涵 python 爬虫 python
在我们生活的每一个天，都有天气（废话！）那我们可以使用Python的BeautifulSoup库就能爬取到天气信息。1.安装BeautifulSoup与lxmlpipinstallbeautifulsoup4pipinstalllxml2.准备编程笔者是Python3.11制作的，就拿杭州的信息做：frombs4importBeautifulSoupimportrequestsurl="http:
遍历网络密码（python系列之——pywifi库）罗方涵 python python pip
目录1.pywifi下载方式2.pywifi使用方法扫描可用的无线网络连接WiFi3.实战1.pywifi下载方式pywifi是一个可以在python中连接网络的第三方库，包括了获取网络名称列表、连接或断开网洛的python库，先下载：pipinstallpywifi如果报错，报错信息是comtypes模块找不到，那么也得安装：pipinstallcomtypes2.pywifi使用方法扫描可用的
Python系列（亲测有效）：uWSGI - 日志常见报错问题集锦及解决方法（uwsgi invalid request block size、invalid uwsgi request (curr）坦笑&&life #python python java 开发语言
uWSGI-日志常见报错问题集锦及解决方法（uwsgiinvalidrequestblocksize、invaliduwsgirequest(curr）一.uWSGI-日志常见报错问题集锦及解决方法序言问题1uwsgi服务器日志报错：解决方法：问题2uwsgi日志报错：解决方法二.uwsgi出现invalidrequestblocksize:21573(max4096)...skip解决办法buf
Python系列（亲测有效）：Pycharm中全局查找及替换关键字坦笑&&life #python python
Pycharm中全局查找及替换关键字编写程序时，通常想要在所有文件中查找或者替换某个词。方法一：首先在最上方任务栏中找到“Edit”，选择“Find”，再选择“FindinFiles”。输入一个关键字，会显示关键字所在的所有位置，即可完成全局查找。替换词的话选择“ReplaceinFiles”即可。方法二：选中想要查找的单词，右击，点击“FindinFiles”，即可完成全局查找。zhao_mfP
Python系列（极具参考意义）：配置nginx+uwsgi+django遇到的那些坑坦笑&&life #python python nginx django
配置nginx+uwsgi+django遇到的那些坑问题一：`uwsgi`--配置出错`bind():Addressalreadyinuse[core/socket.cline769]`问题二：`nginx`转发`WebSocket`请求`502BadGateway`问题三：`Django`部署`WebSocket400`错误处理问题四：`uwsgiASYNCcallwithoutasyncmod
python系列8：python的web工程化问题 IE06 python系列
1.回调函数简单来说就是把函数作为参数，声明的时候只是形式上执行了函数，只有在“回调”的时候才回去实际执行函数内容。来看一个简单的例子：importtimedefcallback():print("这是一个callback函数")deftest_callback(call):print("进入函数")time.sleep(1)#开始回调call()print("调用完成")test_callbac
「Python系列」Python基础语法/数据类型雪梅零落 Python系列专栏 python windows 开发语言
文章目录一、Python基础语法二、Python数据类型三、Python数据类型转换四、Python整体详解五、相关链接一、Python基础语法变量和数据类型：#变量赋值x=10y="Hello,World!"#打印变量print(x)#输出10print(y)#输出Hello,World!#数据类型a=1#整数b=3.14#浮点数c="Python"#字符串d=[1,2,3]#列表e=(4,5,
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

利用Python进行数据分析--数据聚合与分组运算1

你可能感兴趣的:(Python系列)