平平无奇的搬砖仔

pandas数据

pandas

一、Series（一维数据）(创建、查找、属性、日期类型数据)

Series可以理解为一个一维的数组，只是index名称可以自己改动。类似于定长的有序字典，有Index和 value。

个人理解，Series生成的是行数的一维数组，

的一维数组是指列数的一维数组。因为二维数组，如果将一维数组转为二维数组，是一行一行的填充，将数充满整个数组！

1、创建（空/Series（ndarray）/字典/标量

1)创建空Serise

import pandas as pd
s=pd.Serier()
##注意括号
##创建一个空的Series

2)Series通过ndarray创建一个Series

import pandas as pd
import numpy as py
data=np.arrary(['张三','李四','王五','赵柳'])
s=pd.Series(data)
#这里默认生成0-3的行级索引
s=pd.Series(data,index=['100','101','102','103'])
#这里可以通过给index赋值，生成对应的索引

3）通过字典创建一个Series(字典的键作为行的索引名，字典值作为数据值)

import pandas as pd
data = {'100' : '张三', '101' : '李四', '102' : '王五'}
s = pd.Series(data)

4）通过标量创建Series（可以创建同样数字的，不同行数的Series。可以通过index=[]、index=range()、index=np.arrary()）

import pandas as pd
import numpy as np
s = pd.Series(5, index=[0, 1, 2, 3])
s = pd.Series(5, index=range(101))
s = pd.Series(5, index=np.array(101))

2、查找

1）通过索引

# 使用索引检索元素
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
print(s[0], s[:3], s[-3:])

2）通过标签名(切片是左右都包含的)

import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
# 使用标签检索数据
print(s['a'], s['a':'d'])
通过标签名拿到的索引，是左右元素都包含的，与索引切片不同！

索引切片与标签切片的区别！：
使用索引位置切片： end不会拿到
使用索引名字切片： end会拿到的
s[0:3]
s[‘a’:‘c’]

3）索引/标签掩码数组Series（可以间隔显示行的数据）

格式： s.[[]] 列表嵌套列表，其中列表可以是切片也可以是需要显示的行的索引/标签

import pandas as pd
#也可以用于索引掩码数组    
#区分与numpy中的掩码数组，numpy中的掩码数组一般是通过bool值来将不需要的数据盖掉
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
print(S[[0,2,3]])#0 2 3是索引
print(S[['zs','ww','zq']])#'zs','ww','zq' 是标签

3、属性

s1.values	所有的值返回一个ndarray数组，一维数组
s1.index	所有的索引返回索引对象，可迭代对象！！需要循环才可以打印出来 for i in s.index: print(s[i]) -->可以逐步打印每一行的值
s1.dtype	数据类型
s1.size	数据个数
s1.ndim	数据维数
s1.shape	数据维度

4、日期类型数据处理（将别的数据类型，如ndarray中的数组的日期类型的数据转为pandas的Series日期类型）

1）接口：pd.to_datetime(dates)

-
通过date=pd.datetime(2020,01,01)可以生成>>>2020-01-01 00:00:00  但是运行时程序会有警告！

# pandas识别的日期字符串格式
dates = pd.Series(['2011', '2011-02', '2011-03-01', '2011/04/01', 
                   '2011/05/01 01:01:01', '01 Jun 2011','Jun 01 2011',
                   '20110701','2011/8/1'])
					只要数字的数量能对上年月日，以及英文，都可以转为日期类型，
    				果是940922识别会出问题！


# to_datetime() 转换日期数据类型
dates = pd.to_datetime(dates)
print(dates, dates.dtype, type(dates))
# 获取时间的某个日历字段的数值
print(dates.dt.day)

Series.dt提供了很多日期相关操作(经过pd.to_datetime()提取后的才可以用这些属性，

如下：提取时间类型的年月日时分秒等

Series.dt.year	The year of the datetime.  年
Series.dt.month	The month as January=1, December=12.  月
Series.dt.day	The days of the datetime. 日
Series.dt.hour	The hours of the datetime. 时
Series.dt.minute	The minutes of the datetime. 分
Series.dt.second	The seconds of the datetime. 秒
Series.dt.microsecond	The microseconds of the datetime. 微秒
Series.dt.week	The week ordinal of the year. 一年当中的第几周
Series.dt.weekofyear	The week ordinal of the year.一年当中的第几周
Series.dt.dayofweek	The day of the week with Monday=0, Sunday=6. 星期几
Series.dt.weekday	The day of the week with Monday=0, Sunday=6.星期几
Series.dt.dayofyear	The ordinal day of the year. 一年当中的第几天
Series.dt.quarter	The quarter of the date. 季度
Series.dt.is_month_start	Indicates whether the date is the first day of the month.
Series.dt.is_month_end	Indicates whether the date is the last day of the month.
Series.dt.is_quarter_start	Indicator for whether the date is the first day of a quarter.
Series.dt.is_quarter_end	Indicator for whether the date is the last day of a quarter.
Series.dt.is_year_start	Indicate whether the date is the first day of a year.
Series.dt.is_year_end	Indicate whether the date is the last day of the year.
Series.dt.is_leap_year	Boolean indicator if the date belongs to a leap year.
Series.dt.days_in_month	The number of days in the month.

2）日期运算

# datetime日期运算
delta = dates - pd.to_datetime('1970-01-01')
print(delta, delta.dtype, type(delta))
# 把时间偏移量换算成天数
print(delta.dt.days)   
#只能看days其他的不行，与查看天数不同，这个是复数，上面的是day单数的形式

3）date_range（）生成指定的周期和频率的Series日期

3.1）date_range（date,periods= ,freq=‘D’）

import pandas as pd
# 以日为频率
datelist = pd.date_range('2019/08/21', periods=5)
print(datelist)
# 以月为频率  生成的是每个月最后一天的日期！！！不是月初   #指定的日期只有含有月份即可，不管有没有日期
datelist = pd.date_range('2020/01/21', periods=5,freq='M')
print(datelist)
>>DatetimeIndex(['2020-01-31', '2020-02-29', '2020-03-31', '2020-04-30',
               '2020-05-31'],
              dtype='datetime64[ns]', freq='M')
#以年为频率，生成的也是每年的最后一天，然后递增！！！  指定的日期只要有年份即可，生成的都是含年月日的日期
datalist=pd.date_range('2020-01-31',periods=5,freq='Y')
print(datalist)
>>>atetimeIndex(['2020-12-31', '2021-12-31', '2022-12-31', '2023-12-31','2024-12-31'],dtype='datetime64[ns]', freq='A-DEC')

## 构建某个区间的时间序列
start = pd.datetime(2017, 11, 1)
end = pd.datetime(2017, 11, 5)
dates = pd.date_range(start, end)
print(dates)


#特殊，生成商业时间：
freq = 'B'
`bdate_range()`用来表示商业日期范围，不同于`date_range()`，它不包括星期六和星期天。
import pandas as pd
datelist = pd.bdate_range('2011/11/03', periods=5)
print(datelist)

3.2）date_range（star，end) 构建某个区间的时间序列

import pandas as pd
start = pd.datetime(2017, 11, 1)
end = pd.datetime(2017, 11, 5)
dates = pd.date_range(start, end)
print(dates)

二、DataFrame（二维数据）（创建/属性/数据增删改查/复合索引！数据合并）

DataFrame是一个类似于表格（有行有列）的数据类型，可以理解为一个二维数组，索引有两个维度（行级索引，列级索引），可更改。

DataFrame具有以下特点：

列和列之间可以是不同的类型：不同的列的数据类型可以不同
大小可变（扩容）
标记轴(行级索引和列级索引)
针对行与列进行轴向统计（水平，垂直）

1、创建（空/列表嵌套(列表/字典)/字典）

1)创建空DataFrame

import pandas as pd
# 创建一个空的DataFrame
df = pd.DataFrame()
print(df)

2)列表创建DataFrame(嵌套列表，嵌套字典)

2.1）单列表

import pandas as pd
data = [1,2,3,4,5]  一维列表   #5行1列
df = pd.DataFrame(data)
print(df)
>>>生成5行1列的的列表

2.2）列表嵌套列表[[],[],[]]（一个列表元素代表一条记录，即行)

import pandas as pd
data = [['Alex',10],['Bob',12],['Clarke',13]]
df = pd.DataFrame(data,index=[s01,s02,s03],columns=['Name','Age'])
df = pd.DataFrame(data,columns=['Name','Age'])
print(df)

data = [['Alex',10],['Bob',12],['Clarke',13]]
df = pd.DataFrame(data,columns=['Name','Age'],dtype=float)
print(df)

#index代表的是行级索引，可以自定义，columns是列表索引，也是可以修改，如果不指定，默认从0开始作为索引的起始值！也可以通过dtype修改数据的类型

2.3）列表嵌套字典[{},{},{}](一个列表元素作为一条记录，字典内的键作为列的索引，字典的值作为值)

data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data)
print(df)

#这里体现的就是可扩容
#这里的一个字典代表一行数据，键作为列级索引，如果不存在的键，则自动填充NAN（not a number）

3)字典创建DataFrame({ key1:[value1]，key2:[value2] })

通过字典创建DataFrame，字典的键作为列的索引，而字典的值作为该列的值。这里需要分两种情况，值的类型，如果是正常的列表数值结构，需要字典间各个元素的value长度一致，如果是通过Series创建的值，则可以长度不一致，通过NaN来补充

3.1）字典的值是一般的列表数据

data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky'],'Age':[28,34,29,42]}
df = pd.DataFrame(data, index=['s1','s2','s3','s4'])
print(df)
# 这里的字典元素之间的值需要长度一致，不然会报错！

3.2）字典的值是Series类型的数据

data = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
        'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(data)
print(df)
>>>这里会在第四列中的第一个元素添加NaN。可以通过指定的列名来确定NaN的位置！

data = {'one' : pd.Series([1, 2, 3], index=['a', 'c', 'd']),
        'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(data)
print(df)
>>>这里会在第二列中的第一个元素添加NaN。可以通过指定的列名来确定NaN的位置
从字典来创建DataFrame 字典的值不一致，通过Series来补充NAN,默认是在最后补充NAN，如果需要在指定的位置添加NAN，需要通过给行做索引来对应值，添加index值

2、常用属性

编号	属性或方法	描述
1	`axis`	返回行/列标签（index）列表。
2	`columns`	返回列标签
3	`index`	返回行标签
4	`dtype`	返回对象的数据类型(`dtype`)。
5	`empty`	如果系列为空，则返回`True`。
6	`ndim`	返回底层数据的维数，默认定义：`1`。
7	`size`	返回基础数据中的元素数。
8	`values`	将系列作为`ndarray`返回。
9	`head(n)`	返回前`n`行。
10	`tail(n)`	返回最后`n`行。

import pandas as pd

data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky'],'Age':[28,34,29,42]}
df = pd.DataFrame(data, index=['s1','s2','s3','s4'])
df['score']=pd.Series([90, 80, 70, 60], index=['s1','s2','s3','s4'])
print(df)
print(df.axes)
print(df['Age'].dtype)
print(df.empty)   
print(df.ndim)
print(df.size)
print(df.values)
print(df.head(3)) # df的前三行
print(df.tail(3)) # df的后三行

3、行和列的增删改查

3.1）列的增删改查

3.1.1列的查找/访问 #通过索引 df[[‘列名’，‘列名’]] 、df[df.columns[:2]]

DataFrame的单列数据为一个Series。根据DataFrame的定义可以知晓DataFrame是一个带有标签的二维数组，每个标签相当每一列的列名。

d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
     'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd']), 
     'three' : pd.Series([1, 3, 4], index=['a', 'c', 'd'])}

df = pd.DataFrame(d)

#通过列名，可以访问到列的内容，如果是多列，则添加多个列名。
#df.columns[:2]获取的是列名!
df['one']
df[df.columns[:2]]

3.1.2列的添加

DataFrame添加一列的方法非常简单，只需要新建一个列索引。并对该索引下的数据进行赋值操作即可。

类似字典添加值的操作。df[‘列名’]=pd.Series([ num，num1，],index=)

#需要注意的一点是，新添加的列，如果是Series类型，需要和原来的列表的行索引即index一致**，如果不一致，无法将数据添加上去，不报错，添加了NAN。如果添加的是列表，只需要保证列的长度和dataframe的行数一致！！如果不一致，则报错。

import pandas as pd

df['four']=pd.Series([90, 80, 70, 60], index=['a', 'b', 'c', 'd'])
print(df)

注意：
	创建新的列时，要给出原有dataframe的index

3.1.3列的删除（del pop drop)

1）del(df[‘列名’]) #只能删除一列

2）df.pop(‘列名’) #只能删除一列

#调用pop方法删除一列这里也会返回被删除的值用法和列表一致！！！

3）df.drop([‘列名’，‘列名’,…],axis=0/1,inplace=False) #不删除原数据

#多列删除，但是不会删除原数据，而是生成一个新的删除了指定的列的数据。

axis=0是指删除行

axis=1是指删除列

inplace=False，默认值是False，则是在生成新的数据，在新的数据上进行删除。如果是inplace=True，则是在原来的数据上进行修改！

import pandas as pd

d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']), 
     'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd']), 
     'three' : pd.Series([10, 20, 30], index=['a', 'b', 'c'])}
df = pd.DataFrame(d)
print("dataframe is:")
print(df)

# 删除一列： one
del(df['one'])
print(df)

#调用pop方法删除一列  这里也会返回被删除的值  用法和列表一致！！！
df.pop('two')
print(df)

#如果想要删除多列呢？  axis=0默认的意思是水平方向！
#删除多列  drop 轴向axis=1是必须给的    默认axis=0删除行的 ,不会修改原数据。
#所以需要用一个变量去接收，只是用来显示数据！！
#如果需要筛选数据，去掉少数几列，可以通过返回值来看到剩余的数据！，而且不影响原数据
df2 = df.drop(['one','four'],axis=1)
print(df2)

3.2) 行的增删改查

3.2.1）行的查找/访问 #通过切片 df[:2] df.loc[’index’] df.iloc[‘标签名’]

如果只是需要访问DataFrame某几行数据的实现方式则采用数组的选取方式，使用 “:” 即可：

对于dataframe

loc函数：通过行索引 “Index” 中的具体值来取行数据（如取"Index"为"A"的行）

iloc函数：通过行号来取行数据（如取第二行的数据）

直接索引：访问的是列
直接切片：访问的是行

#通过切片访问的，如果Series一样，如果切片是标签，最后一个会拿到，
#如果是下标，最后一个不会拿到
import pandas as pd

d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']), 
    'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}

df = pd.DataFrame(d)
print(df[2:4])
print(df['a':'c'])

loc是针对DataFrame索引名称的切片方法。loc方法使用方法如下：

只支持索引名称，不支持索引位置。

import pandas as pd

d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']), 
     'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}

df = pd.DataFrame(d)
print(df.loc['b']) #返回的是series！！
print(df.loc['a':'c'])#返回的是a-c的行列式
print(df.loc[['a', 'b']])#可以返回'a'和'b'行，也可以间隔开来

注意区别loc和iloc行索引和列索引的位置

iloc和loc区别是iloc接收的必须是行索引和列索引的位置（数字下标，不是标签，索引值）。iloc方法的使用方法如下：

import pandas as pd

d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
     'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}

df = pd.DataFrame(d)
print(df.iloc[2])
print(df.iloc[[2, 3]])#列表嵌套列表的是显示不同行

##注意区别，print(df.iloc[2])/print(df.iloc[2:3])
print(df.iloc[2])>>>返回的是series  与loc一样
print(df.iloc[2:3])>>>这个返回的是横着的一行的数据，不是series

3.2.2）行的添加（df.append())

import pandas as pd

df = pd.DataFrame([['zs', 12], ['ls', 4]], columns = ['Name','Age'])
df2 = pd.DataFrame([['ww', 16], ['zl', 8]], columns = ['Name','Age'])

df = df.append(df2)#四行两列
print(df)
####
df = pd.DataFrame([['zs', 12], ['ls', 4]], columns = ['Name','Age'])
df2 = pd.DataFrame([['ww', 16], ['zl', 8]], columns = ['name','age'])

df = df.append(df2)  #四行四列，因为列的名字不一样
print(df)

3.2.3)行的删除 drop(索引/标签名，axis=0,inplace=True)

使用索引标签从DataFrame中删除或删除行。如果标签重复，则会删除多行。

import pandas as pd

df = pd.DataFrame([['zs', 12], ['ls', 4]], columns = ['Name','Age'])
df2 = pd.DataFrame([['ww', 16], ['zl', 8]], columns = ['Name','Age'])
df = df.append(df2)
# 删除index为0的行   原数据不会被修改，需要新的变量去接收
df = df.drop(0)
print(df)
#也可以通过删除标签名来删除行，df.drop['a']

#如果需要通过drop修改原数据，可以通过修改drop中的一个参数，inplace。inplace=False默认不修改原数据
#如果将inplace=True 则会直接修改原数据。也不需要新的变量去接收，直接修改原数据
df = df.drop(0,axis=0,inplace=True)#将第0行在原数据中删除！！

3.3）行或列的修改（只有通过列找行才能修改成功）

修改DataFrame中的数据 （访问）（只能通过列找行才能修改成功）

更改DataFrame中的数据，原理是将这部分数据提取出来，重新赋值为新的数据。

import pandas as pd

df = pd.DataFrame([['zs', 12], ['ls', 4]], columns = ['Name','Age'])
df2 = pd.DataFrame([['ww', 16], ['zl', 8]], columns = ['Name','Age'])
df = df.append(df2)
df['Name'][0] = 'Tom'
print(df)

#如果想要通过访问数据，赋值修改的话
# 只能采用通过列，找行的方式，（但是修改的过程会有警告）因为底层有赋值的过程    #先列再行 

# 如果通过行找列，因为底层没有赋值的过程，所以没有效果，不会修改成功

4、复合索引

DataFrame的行级索引与列级索引都可以设置为复合索引，表示从不同的角度记录数据。

					  scroes                 info 
			  Chinese   Math   English   age     weight
classA    M     100      100     100      18       80
                 F     120      120     120      18       50
 
classB    M     101      101     101      18       90
                 F     121      121     121      18       45

 classC   M     102      102     102      18       70
                F     122      122     122      18       55

data = np.floor(np.random.normal(85, 3, (6,3)))
	np.floor  向下取整
    np.random 随机数模块
    np.random.normal 正态分布  ：钟形曲线 
    
    85期望值
    3 标准差     标准差越大，数据波动越大
                标准差越小，数据波动越小
    (6,3) 维度
    
    
df = pd.DataFrame(data)
index = [('classA', 'F'), ('classA', 'M'), ('classB', 'F'), ('classB', 'M'), ('classC', 'F'), ('classC', 'M')]

df.index = pd.c.from_tuples(index)
columns = [('Age', '20+'), ('Age', '30+'), ('Age', '40+')]
df.columns = pd.MultiIndex.from_tuples(columns)

复合索引的访问：同行列的访问的一样

# 访问行
df.loc['classA']
df.loc['classA', 'F']
df.loc[['classA', 'classC']]

# 访问列
df.Age
df.Age['20+']
df['Age']
df['Age', '20+']

5、数据合并（concat、merge & join）

5.1）concat()

concat函数是在pandas的方法，可以根据不同的轴合并数据集。

根据axis=0/1来进行纵向合并（行合并）和横向合并（列合并）！

#合并不同的DataFrame根据实际的列名和index名合并，没有共同的会自动补充NaN

参考：https://www.pypandas.cn/docs/user_guide/merging.html#concatenating-objects

r = pd.concat(datas, axis=0, join='outer', ignore_index=False, 
              keys=['x', 'y', 'z'])
axis=0  纵向合并   默认值为0
axis=1  横向合并
join='outer'  表示并集   默认值是outer
join='inner'  表示并集
ignore_index 默认值是False  使用原本的index索引，如果设置为True则将所有的index 索引重新编号为0-n
keys  复合索引，如果需要对每个合并前的数据做索引标记，则需要用keys


#关于横向合并，也就是行的合并，可以使用append的方式将多个数据合并到一起，其他参数，也适用，如ignore_index,keys等
result= df1.append(df2)
result= df1.append([df2, df3])

5.2)merge&join

panda具有全功能、高性能的内存连接操作，与SQL之类的关系数据库非常相似。与其他开源实现相比，这些方法的性能要好得多(在某些情况下要好一个数量级以上)

pandas提供了merge函数实现高效的内存链接操作：

#注意，这里默认的一般是通过列名相同来进行合并，如果需要将行进行合并，需要注意参数left_index和right_index，这两个参数一般一起搭配使用，如果是True指用原来的index，如果是False则是重新对索引进行编号！

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,left_index=False, right_index=False)

参数名称	说明
left	接收DataFrame或Series。表示要添加的新数据。无默认。
right	接收DataFrame或Series。表示要添加的新数据。无默认。。
how	接收inner，outer，left，right。表示数据的连接方式。默认为inner。
on	接收string或sequence。表示外键字段名。默认为None。 #自动寻找相同列表名的字段作为连接关键字
left_on	接收string或sequence。关联操作时左表中的关联字段名。
right_on	接收string或sequence。关联操作时右表中的关联字段名。
left_index	接收boolean。表示是否将left参数接收数据的index作为连接主键。默认为False。
right_index	接收boolean。表示是否将right参数接收数据的index作为连接主键。默认为False。
sort	接收boolean。表示是否根据连接键对合并后的数据进行排序。默认为False。
suffixes	接收接收tuple。表示用于追加到left和right参数接收数据重叠列名的尾缀默认为(’_x’, ‘_y’)。

其他合并方法同数据库相同：

合并方法	SQL等效	描述
`left`	`LEFT OUTER JOIN`	使用左侧对象的键 #左外连接，保留左表中的数据，连不上的也会显示，自动绑定NaN
`right`	`RIGHT OUTER JOIN`	使用右侧对象的键 #右外连接，保留右表中的数据，连不上的也会显示，自动绑定NaN
`outer`	`FULL OUTER JOIN`	使用键的联合 #外连接，只要有的，都能显示，连不上的自动绑定NaN
`inner`	`INNER JOIN`	使用键的交集 #内连接，只返回连上的数据

实验：

# 合并两个DataFrame (左连接)
rs = pd.merge(left,right,on='subject_id', how='right')
print(rs)
# 合并两个DataFrame (左连接)
rs = pd.merge(left,right,on='subject_id', how='outer')
print(rs)
# 合并两个DataFrame (左连接)
rs = pd.merge(left,right,on='subject_id', how='inner')
print(rs)

6、分组聚合（groupby、apply）

pandas提供了功能类似于数据库中group by语句的用于拆分(spilt)数据组的方法pd.groupby()；该方法提供的是分组聚合步骤中的拆分功能，能根据索引或字段对数据进行分组（Split）进而针对得到的多组数据执行聚合操作（Apply），最终合并为最终结果（Combine）。

过程：

分组聚合：分组、聚合、输出结果

6.1）分组 df.groupby(by= ,axis=,as_index,sort=)

groupby方法的参数及其说明：

DataFrame.groupby(by=None, axis=0, as_index=True, sort=True)

参数名称	说明
by	接收list，string，mapping或generator。用于确定进行分组的依据。无默认。
axis	接收int。表示操作的轴向，默认对行进行操作。默认为0。
as_index	接收boolearn。表示聚合后的聚合标签是否以DataFrame索引形式输出。默认为True。
sort	接收boolearn。表示是否对分组依据分组标签进行排序。默认为True。

用groupby方法分组后的结果并不能直接查看，而是被存在内存中，输出的是内存地址。实际上分组后的数据对象（Groupby对象）类似Series与DataFrame，是pandas提供的一种对象。

Groupby对象的常用方法：

方法	说明
groupObject.get_group(‘A’)	返回A组的详细数据
groupObject.size()	返回每一组的频数

grouped = data.groupby(by=['class_id', 'gender'])
grouped.get_group((1, 'M'))
grouped = data.groupby(by=['class_id', 'gender'])
grouped.get_group((1, 'M'))

6.2)聚合 grouped.agg()

聚合函数为每个组返回聚合值。当创建了分组(groupby)对象，就可以对每个分组的其他字段数据执行求和、求标准差等操作。

对于某个字段希望只做求均值操作，而对另一个字段则希望只做求和操作，可以使用字典的方式，将两个字段名分别作为key：

grouped['score'].agg({'age':np.max, 'score':np.mean})

还可以这样：

result = grouped['score'].agg(
    {'age':np.max, 'score':[np.mean, np.max]})
result

先通过group_by进行分组，拿到分组对象 by:通过那个字段进行分组

size:求每组的频数

get_group() :查看每组的数据

在用过 agg进行聚合，传入一个字典：每个键值对就是对字段进行的聚合操作

pandas支持的聚合函数有：

方法名称	说明
count	计算分组的数目，包括缺失值。
head	返回每组的前n个值。
max	返回每组最大值。
mean	返回每组的均值。
median	返回每组的中位数。
cumcount	对每个分组中组员的进行标记，0至n-1。
size	返回每组的大小。
min	返回每组最小值。
std	返回每组的标准差。
sum	返回每组的和。

7、透视表

透视表(pivot table)是各种电子表格程序和其他数据分析软件中一种常见的数据汇总工具。它根据一个或多个键对数据进行分组聚合，并根据每个分组进行数据汇总。

在某些程度上：透视表比groupby&agg代码更简单

透视表不能完全的替代groupby&agg

groupby&agg 一次可以做多种聚合

透视表一次只能做一个

##透视表的聚合操作，默认的是均值聚合！

##如果没有给显示指定的列，会将原数据中的所有数值列都做均值操作，并显示

# 以class_id与gender做分组汇总数据，默认聚合统计所有列
print(data.pivot_table(index=['class_id', 'gender']))

# 以class_id与gender做分组汇总数据，聚合统计score列
print(data.pivot_table(index=['class_id', 'gender'], values=['score']))

# 以class_id与gender做分组汇总数据，聚合统计score列，针对age的每个值列级分组统计
print(data.pivot_table(index=['class_id', 'gender'], values=['score'], columns=['age']))

# 以class_id与gender做分组汇总数据，聚合统计score列，针对age的每个值列级分组统计，添加行、列小计-->这个也是均值！！！
print(data.pivot_table(index=['class_id', 'gender'], values=['score'], columns=['age'], margins=True))

# 以class_id与gender做分组汇总数据，聚合统计score列，针对age的每个值列级分组统计，添加行、列小计
print(data.pivot_table(index=['class_id', 'gender'], values=['score'],  columns=['age'], margins=True, aggfunc='max'))#-->aggfunc指定分组的想要的类型，比如，均值，最大值，最小值，标准差

#group by/pivot_table,聚合后的计算，pivot_table只能用一种计算方式，而group by可以做不同类型的操作！

你可能感兴趣的:(笔记,pandas)

C语言结构体学习笔记 BUG 劝退师 c语言 c语言学习笔记
C语言结构体学习笔记目录结构体基本概念结构体变量定义结构体初始化结构体数组结构体指针共用体枚举类型typedef自定义类型总结结构体基本概念1.什么是结构体？结构体：一种用户自定义的数据类型，用于将多个不同类型的变量组合成一个整体。用途：表示复杂数据（如学生信息：学号、姓名、成绩等）。2.结构体定义struct结构体名{数据类型成员1;数据类型成员2;//可以嵌套结构体struct子结构体名子成员
TT无人机零散笔记 xzal12 TT无人机无人机笔记
TT扩展板上传模式：sdk：软件开发工具包。一键安装驱动：扩展模块使用Mind+编程是通过USB串口，因此在首次使用Mind+连接扩展模块时需要一键安装驱动。恢复设备初始设置：由于扩展模块可编程，如果扩展模块中存在程序则会导致实时模式的控制无法生效，因此在使用实时模式前需要将扩展模块恢复默认固件。serial.begin(9600)#初始化串口通信，设置数据传输速率(波特率)为9600。波特率：表
《JavaScript高级程序设计》——第四章：变量、作用域与内存管理 dorabighead javascript 开发语言 ecmascript
《JavaScript高级程序设计》——第四章：变量、作用域与内存管理大家好！我是小哆啦，欢迎回到《JavaScript高级程序设计》的读书笔记大本营！在这章中，我们要聊的是两个让人头疼又迷人的话题——变量、作用域与内存管理。有些人一提到这些，就会感到一阵头晕目眩，恍若置身一场JavaScript版的迷宫大冒险！但今天，小哆啦会带你们轻松过关，深入了解这些概念，并且保持足够的幽默感，让你既能笑着学
python 自动化数据提取之正则表达式_python 正则提取(2) m0_60607245 程序员 python 学习面试
一、Python所有方向的学习路线Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了，安装就可直接上手！三、最新Python学习笔记当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理
Mysql学习笔记-Mysql基础进阶少年无为 Mysql Mysql 数据库多表查询数据库备份 Mysql查询
#知识点1.DQL:查询语句1.排序查询2.聚合函数3.分组查询4.分页查询2.约束3.多表之间的关系4.范式5.数据库的备份和还原#DQL:查询语句1.排序查询*语法：orderby子句*orderby排序字段1排序方式1，排序字段2排序方式2...*排序方式：*ASC：升序，默认的。*DESC：降序。*注意：*如果有多个排序条件，则当前边的条件值一样时，才会判断第二条件。2.聚合函数：将一列数
嵌入式学习DAY28 --- 线程、同步和互斥问题、如何实现同步和互斥？楼台的春风嵌入式学习多线程 c语言嵌入式 linux ubuntu
嵌入式入门学习笔记，遇到的问题以及心得体会！DAY28概述：一、线程二、同步和互斥问题三、如何实现同步四、如何实现互斥笔记：一、线程1、什么是线程：（1）线程是轻量级的进程（2）线程存在于进程内，不能独立存在（3）线程参与CPU调度，进程是系统资源分配最小单位，线程是系统调度的最小单位（4）在单核CPU中，多线程并发属于伪并发，但是不牵扯虚拟地址空间的切换，所以开销比进程间切换要小很多（5）在多核
Centos7 搭建 Jupyter + Nginx 服务某龙兄 python nginx linux centos
JupyterNotebook（此前被称为IPythonnotebook）是一个交互式笔记本，支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流，请勿用于商业用途一
Java 运行时常量池笔记（详细版小猫猫猫◍˃ᵕ˂◍ java 笔记 python
Java运行时常量池笔记（详细版）Java的运行时常量池（RuntimeConstantPool）是JVM方法区的一部分，用于存储编译期生成的字面量和符号引用。它是Java类文件常量池的运行时表示，具有动态性和共享性。运行时常量池的核心概念1.什么是运行时常量池？运行时常量池是JVM方法区的一部分，存储类文件中常量池的内容。它包含：字面量：如字符串、整数、浮点数等。符号引用：如类名、方法名、字段名
侯捷 C++ 课程学习笔记：C++ 面向对象开发的艺术孤寂大仙v c++c++学习笔记
在侯捷老师的C++系列课程中，《C++面向对象开发》这门课程让我对面向对象编程有了更深入的理解。面向对象编程（OOP）是现代软件开发中最重要的编程范式之一，而C++作为支持OOP的语言，提供了强大的工具和特性。侯捷老师通过系统的讲解和实战案例，帮助我掌握了如何在C++中高效地使用面向对象技术。以下是我对这门课程的学习笔记和心得体会。一、课程核心内容：C++面向对象开发的关键特性![侯捷老师的课程详
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战傻啦嘿哟 pandas
目录一、准备工作二、抓取网页数据三、数据清洗四、数据处理五、保存数据六、完整代码示例七、总结在数据分析和机器学习的项目中，数据的获取、清洗和处理是非常关键的步骤。今天，我们将通过一个实战案例，演示如何利用Python中的BeautifulSoup库进行网页数据抓取，并使用Pandas库进行数据清洗和处理。这个案例不仅适合初学者，也能帮助有一定经验的朋友快速掌握这两个强大的工具。一、准备工作在开始之
使用 Docker 基本命令创建并发布带有新功能的镜像到阿里云 2021级计算机网络技术2班梁嘉敏 docker 阿里云容器
1.关于Docker镜像1.基础假定您在开发一个网上商城，您使用的是一台笔记本电脑而且您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。此外，您的企业还拥有标准化的测试和生产环境，且具有自身的配置和一系列支持文件。您希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销。请问？您要如何确保应用能够在这些环境中运行和
【学习笔记】Elasticsearch之环境搭建聪明马的博客 elasticsearch 学习笔记 elasticsearch
Elasticsearch官网本文是自己在学习Elasticsearch的过程中，记下的觉得非常有用的笔记，希望对大家认识Elasticsearch有一点点帮助。1.什么是Elasticsearch官网上是这么介绍的：Elasticsearchisadistributeddocumentstore.Insteadofstoringinformationasrowsofcolumnardata,El
Python:数据从Excel表格链接到Word文档更新Excel即可自动更新Word 一个花生米生花 python excel word
要使用Python来创建或更新一个Word文档，并将数据从Excel表格链接到Word文档中，你可以使用python-docx库来操作Word文档和openpyxl或pandas库来读取Excel文件。不过，需要注意的是，python-docx库并不支持将外部文件链接到Word文档的功能。你可以在Word文档中插入Excel数据的快照，但它们不会自动更新。如果你想要在Word文档中插入Excel数
React学习笔记（组件通信）_千峰教育 react m0_54846402 程序员 react.js 学习笔记
reduxprinciple-+//定义一个dispatch的方法，接收到动作之后，自动调用constdispatch=(action)=>{changeState(action)renderCount(countState)}```创建createStore方法Reduxprinciple02reduxprinciple-+//定义一个方法，用于集中管理state和dispatchconstcr
拯救者机型背光键盘无法开启 famous_pengfei 计算机外设笔记本电脑
如果你是联想拯救者系列笔记本电脑的用户，想必对背光键盘这一酷炫功能十分喜爱。然而，当背光键盘突然无法开启时，这无疑会让人感到困惑和沮丧。别担心，联想官方知识库已经为你准备好了详细的解决方案。文章中提到，Windows10系统下，用户可以通过开始菜单进入LenovoSettings来开启背光键盘。这个方法简单易懂，即使是电脑小白也能轻松上手。此外，文章还提供了详细的图文说明，帮助用户更直观地理解操作
蓝队基础：企业网络安全架构与防御策略重生之物联网转网安网络安全安全
声明学习视频来自B站up主**泷羽sec**有兴趣的师傅可以关注一下，如涉及侵权马上删除文章，笔记只是方便各位师傅的学习和探讨，此文章为对视频内容稍加整理发布，文章所提到的网站以及内容，只做学习交流，其他均与本人以及泷羽sec团队无关，切勿触碰法律底线，否则后果自负！！！！有兴趣的小伙伴可以点击下面连接进入b站主页[B站泷羽sec](https://space.bilibili.com/35032
Python入门笔记「已注销」计算机
文章目录第0周课程导学第1周Python基本语法元素保留字数据类型语句与函数输入函数第2周Python基本图形绘制turtle库绝对坐标海龟坐标turtle角度坐标体系RGB色彩体系画笔控制函数运动控制函数方向控制函数循环语句第3周基本数据类型整型浮点数科学计数法复数类型数值运算操作符二元操作符有对应的增强赋值操作符数值运算函数字符串类型的表示字符串切片字符串类型及操作字符串类型格式化time库时
RT-Thread I2C 驱动框架学习笔记 DgHai RT-Thread mcu 单片机
RT-ThreadI2C驱动框架（5.1.0）II2C驱动包括两大部分，I2C驱动总线驱动和I2C设备驱动。I2C总线驱动负责控制I2C总线的硬件，包括发送和接收数据的时序控制，以及处理总线冲突等。它与嵌入式系统的硬件层交互，实现对I2C总线的底层操作，使得应用程序可以通过I2C总线与外部设备进行通信。I2C设备驱动负责管理和控制连接在I2C总线上的具体外部设备。它与I2C总线驱动和嵌入式系统的驱
CCNP350-401学习笔记（351-400题）殊彦_sy CCNP题库学习
351、WhichnewenhancementwasimplementedinWi-Fi6?A.4096QuadratureAmplitudeModulationModeB.ChannelbondingC.Wi-FiProtectedAccess3D.UplinkandDownlinkOrthogonalFrequencyDivisionMultipleAccess352、HowdoesIGMPf
16、电科院FTU检测标准学习笔记-基本性能2 six2me 配电自动化(FTU)测试笔记学习笔记 FTU 配电检测
作者简介：本人从事电力系统多年，岗位包含研发，测试，工程等，具有丰富的经验在配电自动化验收测试以及电科院测试中，本人全程参与，积累了不少现场的经验————————————————————————————————————目录交流工频电量影响量试验频率带来的影响谐波变化带来的影响不平衡电流对功率的影响三相功率测量元件之间相互作用引起的改变故障电流采集电流过载检测（大电流）状态量输出（遥控）输入SOE分
C语言流程控制学习笔记前端熊猫 C语言 c语言学习笔记
1.顺序结构顺序结构是程序中最基本的控制结构，代码按从上到下的顺序依次执行。大多数C语言程序都是由顺序结构组成的。2.选择结构选择结构根据条件的真假来决定执行哪一段代码。在C语言中，选择结构主要有以下几种：2.1if语句if语句用于根据条件的真假来执行相应的代码块。if(condition){//当条件为真时执行的代码}2.2if-else语句if-else语句用于在条件为真时执行一段代码，为假时
小白入门笔记：CMake编译过程详解 3Ｄ视觉工坊 3D视觉从入门到精通笔记 c++开发语言
作者丨SkyShaw@知乎点击进入—>3D视觉工坊学习交流群1、你好，CMake1.1CMake是什么？我觉得针对这个问题最简单（但不是最正确的）的回答应该是：“CMake是服务于将源代111码转换成可执行的文件的工具”。将源码转换为可工作应用会比较神奇。不仅是效果本身(即设计并赋予生命的工作机制)，而且是将理念付诸于过程的行为本身。CMake本身是一个工具集，由五个可执行的程序组成：cmake、
LLM论文笔记 14: The Impact of Positional Encoding on Length Generalization in Transformers Zhouqi_Hua 大模型论文阅读论文阅读人工智能深度学习笔记语言模型
Arxiv日期：2023.12.15机构：McGillUniversity/IBM/Facebook/ServiceNow关键词长度泛化位置编码CoT核心结论1.decoder-only中不显式使用位置编码（NoPE）可以提高长度泛化性能2.（证明了）decoder-onlytransformer如果NoPE同时具备绝对APE和RPE的能力3.暂存器（cot）对于长度泛化和任务相关，同时关注短期和
Java零基础入门笔记：(3)程序控制 Sherlock Ma Java Java入门 java 笔记开发语言程序人生学习方法改行学it 跳槽
前言本笔记是学习狂神的java教程，建议配合视频，学习体验更佳。【狂神说Java】Java零基础学习视频通俗易懂_哔哩哔哩_bilibiliScanner对象之前我们学的基本语法中我们并没有实现程序和人的交互，但是Java给我们提供了这样一个工具类，我们可以获取用户的输入。Scanner类是Java中的一个实用工具类，位于java.util包中，主要用于从用户输入、文件或其他输入源中读取数据。它提
Java零基础入门笔记：(4)方法 Sherlock Ma Java Java入门 java 笔记开发语言学习方法改行学it 跳槽程序人生
前言本笔记是学习狂神的java教程，建议配合视频，学习体验更佳。【狂神说Java】Java零基础学习视频通俗易懂_哔哩哔哩_bilibili第1-2章：Java零基础入门笔记：(1-2)入门（简介、基础知识）-CSDN博客第3章：Java零基础入门笔记：(3)程序控制-CSDN博客--方法何谓方法Java方法是语句的集合，它们在一起执行一个功能。方法是解决一类问题的步骤的有序组合方法包含于类或对象
江科大51单片机学习笔记（1）悠闲漫步者 51单片机 51单片机学习笔记
点亮一个LEDLED介绍中文名：发光二极管外文名：LightEmittingDiode简称：LED用途：照明、广告灯、指引灯、屏幕。如果想让LED发光，需要让发光二极管两端产生电位差。LED模块中串并联电阻是为了保护电路（限流）电阻的运算(上图电阻中所标注)：102(1010^2=1000=1K)473(4710^3=47000=47K)1001(100*10^1=1000=1K)VCC：电源正极
学习疯狂JAVA讲义——运算符与位运算符红鲤鱼与绿鲤鱼与哈士奇学习 java 开发语言
笔记备忘，方便以后忘了查询（如有错误，敬请指点）★变量：-变量的定义、赋值(简单值、表达式）-8个基本类型：byte、short、int、long、float、double、char、boolean★运算符▲算数运算符(7个)：+、-、*、/、%++：将单个变量的值加1放在变量之后：表示先用变量的值，再自加放在变量之前：表示先自加，再用变量的值--：将单个变量的值减1放在变量之后：表示先用变量的值
如何连接别人的redis服务器吗? 黑客KKKing 网络安全网络工程师计算机电脑 web安全网络安全
电脑怎么连接别的网络“笔记本电脑无法连接无线网络怎么办？”，说到这个问题，小编对这样类型的问题还真的回答了不少了，无非就那么几种情况，一一的排除，就找到问题的所在问题了，那么怎么排除或者解决呢？下面电脑知识吧的小编就简单分享一下吧：解决分析思路:手机可以可以连接到无线网络，说明无线信号没有问题，路由器应该也没问题，问题更大的可能是在电脑的设置、首先，驱动程序是否正常安装、检查这个，通常可以右键“我
python panda下载_pandas python下载|Pandas for python v0.25.0官方版 v0.25.0官方版 - 哩咯下载站... weixin_39647458 python panda下载
Pandas是python的数据分析包，最初被作为金融数据分析工具而开发出来，提供pandas.whl包下载，有需要的赶快下载吧！软件介绍Pandas是python的一个数据分析包，最初由AQRCapitalManagement于2008年4月开发，并于2009年底开源出来，目前由专注于Python数据包开发的PyData开发team继续开发和维护，属于PyData项目的一部分。Pandas最初被
electron学习笔记 weixin_46452138 electron 学习 javascript
electron个人学习笔记一、electron简单了解Electron是一个跨平台的、基于Web前端技术的桌面GUI应用程序开发框架。可以使用HTML、CSS来绘制界面和控制布局，使用JavaScript来控制用户行为和业务逻辑，使用Node.js来通信、处理音频视频等，几乎所有的Web前端技术和框架（jQuery、Vue、React、Angular等）都可以应用到桌面GUI开发中。二、开发前基
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持