weixin_39525118

numpy数组按某一维度相加_Numpy/Pandas数据分析基础知识及案例应用

在数据分析领域中，用到最多的包是numpy（用于数学计算）、pandas（基于numpy的数据分析工具，方便对表的数据结构进行分析）和matplotlib（图形绘制库，用于数据分析结果的可视化）。本文首先了解下Numpy和pandas在数据分析中的一些基本操作。

本文结构如下：

一、一维数据分析

二、二维数据分析

三、案例：销售数据分析

一、一维数据分析

Numpy中表示一维数组的是array，pandas表示一维数组的是Series。Series是建立在numpy基础上的，比array有更多的功能。使用这两个数组首先用import导入numpy和pandas这两个包。

（一）Numpy 一维数组array

定义一个数组：

查询访问array中的元素：

通过for i in 数组名遍历数组中的元素：

通过数组名.dtype查看数组中元素的数据类型：

Numpy数组array和列表的区别：

1、array可以进行统计功能，如求平均值mean()，标准差std()

2、array可以进行向量化运算（相加、乘法）

查看下图中array和列表相加结果的区别。

3、array中元素必须是同一种数据类型，列表中的元素可以是不同数据类型。

如图，虽然数组array1中的元素1和3看起来是数据类型，但是在打印出来之后，1和3都作为字符串类型了。而列表list1中的1和3打印出来是数据类型。

上图array2中的元素包含列表和字符串，两种数据类型不相同，在打印的时候就会报错，如果将1和3也改成列表，就可以打印了：

可以看到array2里的元素是3个列表。

（二）pandas 一维数组Series

Series和array的主要区别是Series可以通过索引定位数组中的数据。在定义的时候通过index定义索引。

要注意这里的Series首字母应大写，不然会报错。而定义array的时候首字母不用大写。Series后面接小括号，小括号前半部分是列表形式的元素，后半部分是用index=[]指定每个元素的索引，方便以后通过索引访问其中的元素。

可以通过describe获取数组的描述统计信息（元素个数，平均值，标准差，四分位数，最大最小值），数组名.describe()：

获取数组中的元素：

方法一：用iloc属性根据位置获取元素

方法二：用loc属性根据索引获取对应的元素

Series向量运算：

1、用加号+直接相加，索引值相同的元素才会相加，只出现在一个数组里的索引相加之后的值为空值。

在数据分析中，可以通过Ser.dropna()删除掉空值。

2、用add将两个数组相加，并用fill_value指定一个数据来填充缺失值。下面两个图展示了用0和1分别进行填充，比如’c’在s1中，但s2中没有’c’，就用0填充s2中的’c’

二、二维数据分析

相比于一维数据，二维数据既有行也有列，相当于Excel里的表格。

Numpy中通过array创建二维数组，pandas中通过DataFrame（数据框）创建二维数组。

numpy创建二维数组

通过array创建二维数组，用中括号包括起来，中括号里面是中括号（列表）包括起来的每一行数据，列表之间通过逗号隔开。每个列表中元素个数代表列个数。

查询和获取元素：

查询二维数组中的元素，通过行号和列号查找，二维数组的行列号都是从0开始的，数组名.[a,b]，其中a代表行号，b代表列号：

查询其中一个元素：

获取第一行（切片功能‘：’）：

获取第一列（切片功能‘：’）：

numpy二维数组描述统计

如果直接使用sum(),mean()统计数组，得出的是包含所有元素的描述统计信息。如：

但在实际数据分析中，对于一个二维表格，通常行列是不同类型的数据，一般不会统计所有元素的描述统计信息，只需要统计某些列/行的描述统计信息，这时可以在函数后面加axis指定行列计算，即为numpy的数轴参数，这种方式叫做按轴计算。其中axis=1代表按行计算每行的描述统计信息，axis=0代表按列计算。

Numpy一维数组中的元素必须都是同一类型，同样的，二维数组中的元素也必须都是同一类型，但对于表述Excel中的数据，就不适用了，因为Excel中每列的数据类型一般都不一样。这时就需要用pandas中的二维数组dataframe数据框。

（二）pandas创建二维数据

Pandas二维数组相比numpy二维数组有两个优点：

数据框的每一列都可以是不同类型的数据，方便表示Excel中的数据。
有类似pandas中series里的索引功能，即二维数组的每行每列都有一个索引值，很适合用来存放表格数据。

创建一个二维数组，首先通过键（列名）值（列名对应的值）对创建一个字典，再用pandas中的dataframe将字典转换成二维数组。

上图中可以看出数组中的列顺序与定义字典时的顺序不一致，为了更好的展示原数据结构，可以通过有序字典OrderedDict先对字典排序，再转换成数组，见下图：

求平均值

由于数据框中每一列数据类型不同，在计算平均值时，pandas是按照每列计算平均值的，而且只是对数据类型是数值的列计算平均值。数组名.mean()

查询获取数据框中的数据

方法一：iloc，是根据元素的位置查询的

查询元素：数组名.iloc[a,b] ，a,b为元素的位置

获取某一行：数组名.iloc[a,:] ，a为行号

获取某一列：数组名.iloc[:,b] ，b为列号

方法二：loc，是根据元素的索引查询的

在数据较多的时候，查找行号和列号不太方便，这时可以用loc属性，通过索引来查询元素。查询元素，数组名.loc[a,b]，a、b为索引值：

获取某一行，数组名.loc[a,:] a为索引（在本例中行的索引默认为行号）

获取某一列，通过切片功能，数组名.loc[:,’b’] b为列名：

如果获取连续的多列，可以使用切片功能，数组名.loc[:,列名1:列名2]：

获取某一列的简单方法是直接在数组名后面的方括号中给出列名即可，数组名[‘列名’]：

也可以在后面列出多个列名，获取多列（不连续），数组名.[[列名1，列名2]]，注意是方括号里加了指定列名的列表（两个方括号）：

通过条件判断筛选

有两步，第一：构建查询条件第二：应用查询条件

数据框还可以查看数据集里的描述统计信息

首先通过pandas的ExcelFile功能读入Excel文件：

要注意文件路径中应为，不然会报错：

在数据较多时，可以通过数据框的head()功能查看前五行数据，了解表格结构：

可以通过loc属性和dtype查看某一列的数据类型：

通过shape属性，可以查看数据框有多少行多少列：

接下来可以用describe获取数据集的描述统计信息（每一列的总数、平均数、标准差、四分位数）：

三、案例：销售数据分析

数据分析的过程：

提出问题：数据分析的目标是为了解决生活和工作中的问题，明确问题可以为以后的分析提供大的方向和目标
理解数据：包括采集数据（根据问题采集相关数据）、导入数据（Excel中，数据库中，接口中，需要导入到pandas中）、查看数据信息（从整理上理解数据，比如描述统计信息）
数据清洗：数据预处理。
构建模型：对清洗后的数据进行分析，得出指标或者用机器学习算法训练模型
数据可视化：将得出的结果用图表表示出来

以下通过一个实例展示怎么用Python进行数据分析。

提出问题

有一份医院的药品销售数据，需要知道以下业务指标是多少？

月均消费次数
月均消费金额
客单价
消费趋势

如果对提出问题部分中的业务指标含义不理解，可以先上网搜索含义，如果找不到，再向提供数据的部门进行询问。

2.理解数据

首先用pandas的ExcelFile方法将销售数据文件读取到数据框中，为了保证某些列的数据在读取之后保持正确，可以用dtype=’object’使导入的数据都是字符串格式，并用head()打印出前5行，查看数据导入是否正确，都有哪些数据，以便了解原数据的特点（比如应收金额是药品原价，实收金额是打折优惠之后的价格），通过describe()了解数据的描述统计信息。

上图中的describe()方法，得出的结果的索引是count（非空值数），unique（唯一值数），top（频数最高者），freq（最高频次）。

通过描述统计信息可以看出，

购药时间的计数一共是6576个，而数据框大小的结果是6578行，说明有2行的购药时间为空值。统计时间一共202天，在2018年4月15日这一天销售次数最多，达到了228次。
一共有2426名患者有购药记录，其中社保卡号为001616528的患者购买次数最多，达到了253次。
售出的药物一共有78中，购买频次最多的是苯磺酸氨氯地平片（安内真），有899次的购买记录。
有3345次药品购买数量都是2。

Pandas中的describe()方法说明：

在本文第二部分二维数据分析中（见下图），我们也使用了describe()方法，但是当时的结果的索引值是count,mean,std,四分位数。这是因为第一次我们导入数据的时候，由于我们没有限定导入数据的类型，社保卡号、商品编码、销售数量、应收实收金额都以数值的形式导入了，describe()在默认情况下是对数值型的列进行统计，所以统计了刚说的5列，而购药时间、商品名称没有统计到。在第二次使用describe()时，因为我们在导入数据时限定了都以字符串的形式导入（dtype=’object’），数值型数据的描述统计结果索引不适用字符串数据，所以字符串描述统计结果是count,unique,top,freq。

3.数据清洗

数据清洗的目标是把数据处理成易于分析的样子，便于后续的探索和分析。

数据清洗的过程：

选择子集：选择我们需要的列作为研究的对象
列名重命名：列名不符合阅读习惯，不便于书写理解时，进行列名重命名
缺失值处理：对空值进行处理
数据类型转换：将应是数值类型的数据从字符串类型转换为数据类型。
数据排序：排序有助于发现更多有价值的东西
异常值处理：数值太大、太小，超出定义的范围，需要进行处理

选择子集：

可以通过loc的切片功能从数据框中选择子集，本文要分析所有的数据，不用选择子集，但通过以下代码了解下怎么选择子集。

选取指定连续的列，通过loc的切片功能：

选取不连续的列：用loc属性，里面包含要选取的列名组成的列表：

列名重命名

使用columns和rename进行指定列重命名。

在数据框中使用columns可以返回一个列索引的列表，先用columns构建一个新旧列名对应的字典，再通过rename进行重命名。

这里要注意rename后面的括号里，逗号前面的格式一定要是columns=字典名或columns=具体的字典，其他形式无效；

默认inplace等于False，代表原数据框不变，会创建一个更改后新的数据框，inplace等于True时，表示在数据框本身进行改动。

删除缺失值

如果缺失值较少，可以删除缺失值，如果缺失值太多，可以通过建立模型，通过插值补充缺失值。本文因为缺失值较少，直接删除。

在第2步理解数据中，我们得到了数据框的描述统计信息，里面的购药时间，社保卡号的非空值数都小于6578，说明有缺失值存在。

按销售实际情况分析，购药时间和社保卡号不能有缺失值，故将这两列含有缺失值的行删除掉。用dropna删掉，要配合subset,how,inplace,axis一起使用

subset:list，表示在哪些列中查看缺失值，
how='any'与省略掉的默认的axis=0配合使用，表示如何删掉缺失值：any表示只要有缺失值，就删掉对应行。
inplace=False，表示将修改后的数据框新建一个

从上图可以看到删除缺失值之后剩余6575行了。

转换数据类型

销售数量，应收实收金额应为数值类型数据，通过astype进行转换。

销售时间原来为日期加星期，通过字符串分割（split(‘分隔符’)）拆分（选取列表指定元素）出日期，首先看一下怎么对单个日期进行分割：

如果要对销售时间这一列进行分割，就需要列中的每个元素进行上述步骤，可以通过定义一个分割时间的函数。

接下来对取出销售数据中的销售时间列，并应用函数：

这里出现了报错：浮点型对象没有split属性。报错的原因是因为取得是salesdf中的销售时间，里面是有两个空值NaN（属于浮点型）。在第3步删除缺失值的时候，我们使用的dropna()里的inplace=False，表示将修改后的数据框新建一个:

所以新建的salesdf2里才没有空值，而salesdf里保留着空值。所以应从salesdf2中取出时间列进行分割：

再将分割之后的日期替换原来的销售时间：

这里的销售时间在导入和分割之后都保持字符串的格式，应把其变为日期格式，用pandas里的to_datetime进行转换。

可以看到转换之后的数据格式为datetime64，错误值都被空值NaT填充了。

再用dropna()将缺失值删掉：

排序

为了方便分析和看到更多有用的信息，我们对销售时间进行排序.

用df.sort_values(by='列名', axis=0（默认为0，按列排序）, ascending=True（升序排序）, inplace=False（默认新建表）)

可以看到排序之后的行索引比较乱，为了方便以后根据行号查询数据，将行索引进行重置，即从0到N-1的整数升序排列。

用df.reset_index(self,drop=True,inplace=False)，drop等于True时，表示删除原索引，用新的索引替换。为False时，表示将原索引转换为列，同时新的索引替换原索引位置。本文使用drop=True。

异常值处理：

截止目前数据清洗的工作已完成大部分，接下来用df.describe()方法获取数据框的描述统计信息，从整体上了解数据集信息，并查看是否有异常值。

可以看到这三列的最小值都是负数，为异常值，销售数量为负数造成了金额为负数，应将销售数量小于0的删掉。

到此数据清洗的工作已完成。

4.构建模型

本部分内容为计算出提出问题部分的四个指标。

月均消费次数
月均消费金额
客单价
消费趋势

月均消费次数

月均消费次数=总消费次数/月份数（本文将同一天内一个人的多条消费记录一起看做一次消费）

首先计算总消费次数，应将销售时间和社保卡号都一样的重复数据删除，通过df.drop_duplicates(subset=[列名1,列名2],keep='first',inplace=True)

subset表示将选取的列对应值相同的行进行去重
keep=’fisrt’为默认值
first表示保留第一次出现的重复行

去重之后一共5342行，即总消费次数=5342。

计算月份数的思路：先计算按天计算的时间跨度，再除以30得出月份数

将kpi1_df的销售时间按升序排列，得到最早最晚的销售时间：

计算时间间隔，并除以30得出月份数，计算指标1：

得出指标1月均消费次数=890。

月均消费金额

月均消费金额=总消费金额/月份数

指标2月均消费金额为50668元

客单价

客单价=总消费金额/总消费次数

指标3客单价为56

消费趋势

需要用到pandas里更高级的功能和可视化内容，之后的文章再进行实操~

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
直抒《紫罗兰永恒花园外传》雷姆的黑色童话
没看过《紫罗兰永恒花园》的我莫名的看完了《紫罗兰永恒花园外传》，又莫名的被故事中的姐妹之情狠狠地感动了的一把。感动何在：困苦中相依为命的姐妹二人被迫分离，用一个人的自由换取另一个人的幸福。之后，虽相隔不知几许依旧心心念念彼此牵挂。这种深深的姐妹情谊就是令我为之动容的所在。贝拉和泰勒分别影片开始，海天之间一个孩童凭栏眺望，手中拿着折旧的信纸。镜头一转，挑灯伏案的薇尔莉特正在打字机前奋笔疾书。这些片段
今日囧事唯愿岁月可回首
今天晚上，房东打来电话说晚上过来取个东西。晚上到家后，洗了一下水果，把卧室的空调打开，在卧室的阳台叠衣服。不一会儿，听见了敲门声，老公和丫头出去开门，果然是房东来了。由于我在叠衣服，床上比较乱，老公随手就把卧室门带上了。我赶紧把衣服收在柜子里，一拧门，好吧，打不开。听见外面热热闹闹的，我喊老公帮我开门，开了几次都开不开。丫头说：妈妈，你先在里面休息一会，我们正在找钥匙。听见外面房东拿了自己东西，老
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
读《人世间》有感一0一
这个寒假，就如同朋友圈中的一段话：一闭眼，一睁眼假期还有5天，在一闭眼一睁眼假期还有12天；再一闭眼一睁眼假期还有20天；不敢睡，不敢睡啊……受疫情影响，这个假期变得漫长又煎熬，我也无时无刻不关注着疫情的变化。当然这样的一个假期，我还真得要感谢周翔，因为他有个爱看书的习惯，所以家里有不少他看过的书，可以让我随意挑选，因此也让我的假期不至于那么无所事事。这次我选了一本梁晓声的《人世间》，作为一名语文
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

numpy数组按某一维度相加_Numpy/Pandas数据分析基础知识及案例应用

一、一维数据分析

二、二维数据分析

三、案例：销售数据分析

你可能感兴趣的:(numpy数组按某一维度相加,pandas,取excel,中的某一列,pandas打印某一列)