twt9628

Pandas Indexing小结

Content

Single Index 的dataframe

basic indexing(1)：loc iloc ix的column alignment机制对赋值的影响
slice object
[ ] 的理解

第一种用法：抽column/row
第二种用法：Boolean array

Boolean array

直接Series或DF中抽列（Series）进行逻辑判断
对Dataframe中所有元素进行逻辑判断
利用isin(values)函数

where / mask 的用法
query的用法：本质都可以用pythonic 的风格代替
loc/iloc的用法
Set/ Reset index的用法
Selection 小结

只抽取row(s) / column(s) 即前者包括所有columns 后者包括所有row

[]：可接受 int 型slice object以及str 型的slice object，str可对应index names或者column names。
.loc() 只接受str 型的slice object，单一slice object是对row操作
.iloc() 只接受接受 int 型slice object

多个条件叠加（即对row 和 column 同时有限定）

MultiIndex的Dataframe

法一：直接用Slicers组成的tuple
法二：用pd.IndexSlice

Single Index 的dataframe

对于Single Index 的dataframe ：主要参照Indexing and Selecting Data 章节

basic indexing(1)：loc iloc ix的column alignment机制对赋值的影响

主要参考 basic indexing

stackflow也有回答

Warning pandas aligns all AXES when setting Series and DataFrame from .loc, and .iloc.
This will not modify df because the column alignment is before value assignment

使用loc进行slice后若要改变原Dataframe内部的值，需要注意直接赋值是没用的。因为loc iloc ix都会优先对齐column（column alignment），然后在赋值（value assignment），即会先把赋值表达式左右两边的column对齐（如此则失去了swap的意义），再赋值

正确做法应该是：使用raw values（这样就不会考虑到column的问题）

df.loc[:, ['B', 'A']] = df[['A', 'B']].values

slice object

所谓slice object，也即a:b形式的表达式。其中 .iloc接受a b分别为int类型的slice object, 如0:8, .loc接受a b分别为str类型的slice object，如 ‘2017-11-29 00:00:00’:‘2017-11-29 00:00:08’

而[]两种都接受。因此df[0:3] 与 df[‘a’:‘c’]是不一样的，前者是取0、1 、2三行（左开右闭），后者是取0 、1、 2、 3四行（左右都闭）。
并且若传入[ ]的是column names组成的slice object，则也是左右都闭的取法，只是此时是对列操作

[ ] 的理解

第一种用法：抽column/row

对于Series来说，得到的就只有对应的"Scalar Value "，因为label那一层消去了。

对于Dataframe来说，则是把对应行抽出来的Series（只选了一个column）/ Dataframe（选择了多个columns，其中这些column name必须组成一个list）

注意！！！
这里的参数必须得是column names，不能是序号 or index name（即类似loc的操作），因为形如[0:3]的操作是对row操作！！在这里0:3实际是一个slice object，int 型的slice object对于[]或者.iloc都是按row操作，都是.iloc是左右都闭，两种操作等价。同理对于loc，只是loc的slice object只接受对应Index的label，而不接受整数，并且统一是左右都闭合，此时[]也可以接受，作用等同于.loc

co2[['co2','pm10']] #取列

如下，是选择第0行至第3行的数据（左闭右开，因此还是取 0 1 2 三行）

co2[0:3] #取行

co2['2017-11-29 00:00:00':'2017-11-29 00:00:03'] #直接用index name取行也可，类似取columns的操作

同理使用iloc()

co2.iloc[0:3]

或者.loc()

co2.loc['2017-11-29 00:00:00':'2017-11-29 00:00:03'] #一样是取第 0 1 2 3行

可以看到
co2[0:3] 与 co2.iloc[0:3]

co2[‘2017-11-29 00:00:00’:‘2017-11-29 00:00:03’]与co2.loc[‘2017-11-29 00:00:00’:‘2017-11-29 00:00:03’]

分别是等价的。

NOTE:注意这里的使用slice object对row进行操作的时候，并不是直接去匹配index，即使index.to_list()后仍是由int组成的list

而是去匹配row number，具体可见下面的例子。

>>> t2.head(10)
       day_id  calling_nbr    called_nbr  ...  raw_dur  call_type  calling_cell
41   20120201       365280  y21344771393  ...       35          2           341
50   20120201       389699         95812  ...      177          2           933
52   20120201       389699         95812  ...      859          2           933
56   20120201       389699         95812  ...       15          2           933
57   20120201       389699         95812  ...      972          2           933
179  20120201       790253       3067516  ...      100          2           432
188  20120201      1024869  y26611924753  ...       36          2          1000
292  20120201       477929         96103  ...      141          2           776
294  20120201       371621  y27036299949  ...      258          2         53831
298  20120201       394657       2909161  ...      171          2           537

[10 rows x 14 columns]
>>> t2.index.to_list()
[41, 50, 52, 56, 57, 179, 188, 292, 294, 298, 317, 318, 321, 329, 332, 377, 389, 442, 601, 602, 635, 640, 659, 731, 732, 826, 921, 926, 931, 936, 938, 1196, 1343, 1406, 1507, 1509, 1634, 1703, 1763, 1774, 1782, 1795, 1870, 1874, 1916, 1921, 2061, 2086, 2094, 2202, 2206, 2212, 2321, 2334, 2377, 2450, 2454, 2554, 2558, 2559, 2815, 2826, 2894, 2923, 2925, 2976, 2978, 3049, 3054, 3103, 3209, 3300, 3332, 3337, 3478, 3479, 3484, 3516, 3517, 3533, 3615, 3628, 3640, 3844, 3848, 3856, 3874, 3918, 3926, 3934, 3951, 3975, 4046, 4052, 4056, 4061, 4062, 4139, 4144, 4147, 4154, 4161, 4168, 4182, 4185, 4235, 4301, 4357, 4359, 4378, 4534, 4589, 4614, 4615, 4695, 4727, 4737, 4749, 4884, 4890, 4901, 4920, 4945, 4951, 4960, 4963, 5088, 5097, 5182, 5292, 5445, 5454, 5462, 5544, 5579, 5583, 5602, 5622, 5637, 5638, 5642, 5643, 5661, 5666, 5680, 5745, 5750, 5829, 6094, 6148, 6155, 6253, 6277, 6320, 6331, 6333, 6354, 6355, 6360, 6364, 6461, 6494, 6498, 6576, 6596, 6612, 6622, 6623, 6629, 6635, 6645, 6648, 6667, 6762, 6781, 6785, 6833, 6841, 6843, 6844, 6845, 6972, 7039, 7082, 7092, 7099, 7103, 7124, 7247, 7276, 7278, 7322, 7343, 7344, 7361, 7365, 7462, 7492, 7514, 7536, 7540, 7574, 7586, 7589, 7611, 7692, 7696, 7761, 7768, 7797, 7999, 8010, 8065, 8074, 8117, 8159, 8164, 8267, 8274, 8327, 8329, 8366, 8416, 8427, 8489, 8567, 8568, 8775, 8784, 8939, 9047, 9136, 9202, 9205, 9244, 9373, 9374, 9390, 9459, 9591, 9599, 9653, 9656, 9822, 9878, 9882, 9887, 9948, 9949, 9950, 9951, 10036, 10037, 10054, 10081, 10084, 10135, 10178, 10221, 10272, 10299, 10303, 10304, 10313, 10337, 10500, 10528, 10596, 10615, 10619, 10622, 10676, 10680, 10682, 10683, 10733, 10768, 10797, 10806, 10810, 10823, 10837, 10840, 10879, 10899, 10930, 10936, 11040, 11081, 11084, 11114, 11119, 11143, 11154, 11244, 11340, 11381, 11404, 11411, 11416, 11519, 11600, 11609, 11610, 11648, 11702, 11735, 11743, 11762, 11866, 11869, 11891, 11892, 11893, 11952, 11954, 11963, 11998, 12053, 12059, 12065, 12068, 12148, 12201, 12256, 12259, 12349, 12377, 12381, 12384, 12387, 12403, 12411, 12445, 12468, 12478, 12555, 12571, 12608, 12733, 12741, 12773, 12823, 12831, 12850, 12876, 12889, 12891, 12893, 12953, 13009, 13095, 13105, 13137, 13148, 13184, 13203, 13289, 13302, 13303, 13304, 13305, 13306, 13307, 13308, 13317, 13325, 13432, 13491, 13498, 13563, 13572, 13682, 13685, 13692, 13698, 13705, 13706, 13707, 13708, 13828, 13831, 13882, 13953, 13954, 13955, 13956, 13967, 13969, 14006, 14025, 14085, 14106, 14171, 14234, 14237, 14255, 14387, 14388, 14399, 14615, 14625, 14650, 14680, 14742, 14744, 14751, 14752, 14753, 14777, 14915, 14917, 14933, 14952, 14957, 14989, 15001, 15029, 15035, 15036, 15040, 15121, 15185, 15192, 15206, 15215, 15337, 15338, 15339, 15340, 15341, 15342, 15380, 15440, 15444, 15460, 15499, 15593, 15603, 15604, 15915, 15932, 15983, 15984, 16001, 16025, 16073, 16092, 16157, 16216, 16217, 16317, 16351, 16451, 16461, 16476, 16507, 16509, 16595, 16642, 16643, 16653, 16681, 16701, 16739, 16740, 16850, 16910, 17069, 17115, 17193, 17211, 17212, 17213, 17214, 17215, 17216, 17250, 17260, 17364, 17383, 17390, 17391, 17392, 17393, 17410, 17412, 17413, 17469, 17479, 17482, 17484, 17504, 17549, 17611, 17618, 17626, 17635, 17644, 17665, 17740, 17742, 17747, 17840, 17860, 17872, 17925, 17952, 17988, 17991, 18058, 18100, 18156, 18159, 18189, 18206, 18210, 18274, 18287, 18338, 18424, 18510, 18540, 18541, 18610, 18645, 18877, 18930, 19028, 19066, 19075, 19105, 19261, 19319, 19338, 19446, 19463, 19469, 19539, 19545, 19559, 19646, 19662, 19927]
>>> type(t2.index.to_list()[0])
<class 'int'>

可以看到下面[0:2]（左闭右开），是取的前两行！！而不是index为0和1的那两行

>>> t2[0:2]
      day_id  calling_nbr    called_nbr  ...  raw_dur  call_type  calling_cell
41  20120201       365280  y21344771393  ...       35          2           341
50  20120201       389699         95812  ...      177          2           933

[2 rows x 14 columns]
>>> t2.iloc[0:2]
      day_id  calling_nbr    called_nbr  ...  raw_dur  call_type  calling_cell
41  20120201       365280  y21344771393  ...       35          2           341
50  20120201       389699         95812  ...      177          2           933

[2 rows x 14 columns]

第二种用法：Boolean array

第二种用法就是用一个和index相同长度的Boolean array来选择row，但是此时默认是把所有columns都加入到新的dataframe中（view）

co2[co2['Day']==0]

在这里选择了column 中 Day 对应为0的index，作为参数。得到Day 0 所对应的数据。

Boolean array

生成的Boolean array的方法有：

直接Series或DF中抽列（Series）进行逻辑判断

利用上面的，对Dataframe中取出的Series或者是直接是Series 进行逻辑判断，得到一个array

co2[co2['Day']==0]

对Dataframe中所有元素进行逻辑判断

或者如下面，直接对Dataframe中的所有元素进行逻辑判断，得到一个原Dataframe相同大小的 Boolean array

co2>20

利用isin(values)函数

不论是是df.isin() 还是 s.isin()，始终是会把values中的值去重，变成一个set，然后把原dataframe或者Series中的元素，一个一个判断是否在i.e. isin values的值组成的set 中，并返回一个与原Dataframe或者是Series同size，对应值位置True / False（即is in 或者 not in ）的Boolean Dataframe/Series （Array）

对于Series/由Dataframe取列操作得到的Series，isin()要求传入的参数（values）必须是个set/list，返回一个原有Series中set/list元素对应位置的index，所组成的Series(array)

print('Slicing using [] into DataFrame result is a type {} \n'.format(type(co2['Day'])))
co2['Day'].isin([0])

　　
而对于Dataframe， isin()函数，若传入的是一个Seires，则会将这个Series的index去匹配Dataframe的index（默认是single index，因此可以匹配），Series对应的值去匹配dataframe的各列**（而不管原来Series的name是否匹配上Dataframe的columns name）**，返回与原Dataframe相同大小，index与值都匹配成功的对应位置为True的Boolean Dataframe

（即本质还是把那个Series的values提出，组成一个set（即去了重），把Dataframe的每一列中的每个元素依次判断是否在那个set中）

在下面的例子可以看到，即使Series的name被设为‘co2’，isin（）函数仍只匹配上了Day，而不会去匹配co2。因此传入的isin()的Series不一定要设定name。

index_series=pd.Series(co2.loc[co2['Day']==0,'Day'],name='co2')
co2.isin(index_series)

对于Dataframe，还可以传入dictionary，其中dictionary的key是对应列名即可，且不必包含原DataFrame中所有列（即其余列的位置都是False）。返回值仍然是一个和原Dataframe相同大小，但其中值为True/False 的Boolean Dataframe(array)

co2.isin({'Day':[0], 'pm10':[49, 52, 53, 54]})

若只是单纯对Dataframe.isin() 传入一个list，则用这个list其中的元素去匹配原Dataframe中值，而不管index或者columns，最后还是返回一个同大小的Boolean Dataframe(Array)。即Dataframe.values中的元素，有任何一个是在list中的，就把对应位置设为True，找不到则为False

co2.isin([49, 52, 53, 54])

where / mask 的用法

二者的可参入的参数都一样：

df.where(cond， other=Nan, axis=None, level=None)

df.mask(cond， other=Nan, axis=None, level=None)

其中other是用于替代原df对应位置的值，axis是用于alignment时指定沿着column align还是沿着row align，level主要是用于指定MultiIndex 时的align

二者区别在于，where是把满足cond的地方（True的地方）设为保留原来的值（即df对应位置的值），把False的位置设为other中对应的值（other默认为Nan，传入别的参数则为对应的参数，或者align后的参数）

而mash则是把不满足cond的地方（Fasle对应的地方）设为原来的值，True的地方用other 或者align 后的other进行替换

where() / mask() 主要用于Partial Selection，并对原Dataframe的局部进行赋值等操作

where()的具体用法可参考：https://www.cnblogs.com/waltertong/p/10316259.html

query的用法：本质都可以用pythonic 的风格代替

df[(df.a < df.b) & (df.b < df.c)] #选出a列值小于b列值且b列值小于c列值的行
df.query('(a < b) & (b < c)') #与上面代码相同效果

little trick：用query() 把index当做一列，与原有的列进行比较

df.query('a < b and b < c') # 将所谓“a”列，与b列，c列的值进行比较，找出index值小于b列值小于c列值的行
 
df.query('index < b < c') # 若未命名index，或者index name与column重合，则可以直接用index代替。（二者重合的情况下以column name优先）

df.query 也支持python的in / not in方法

df.query('a in b') # 判断a列中哪些元素是在b列组成的set中，并返回对应的一整行
df[df.a.isin(df.b)] # 利用isin() 的pythonic代码

df.query('a not in b') # 判断a中的哪些元素是在b列组成的set中，并返回对应的一整行
df[~df.a.isin(df.b)] #pythonic way

loc/iloc的用法

二者联系：

都是按照[row_indexer, column_indexer]来进行操作，
也可以按照[slice object]来操作，但此时就是只选择row

因为如下原因

Getting values from an object with multi-axes selection uses the following notation (using .loc as an example, but the following applies to .iloc as well). Any of the axes accessors may be the null slice :. Axes left out of the specification are assumed to be :, e.g. p.loc[‘a’] is equivalent to p.loc[‘a’, :, :].

因此只传入一个slice object，等价于只对第一个维度也就是row slice

都包含了Boolean array作为参数：具体方法详参本文的Boolean array章节

二者区别：
.loc() 主要是用于select by label（包含indexes name/ columns name）
loc() 主要用于select by position（即传入具体的某一row number / column number）
大概用法有

df.loc[df[c]\==0,'a'] #选择df 的第0行，第a列元素

df.iloc[df\==0,3] #选择df 的第0行，第3列元素

df.loc[df]

Set/ Reset index的用法

Set_index 主要是把原Dataframe中的某一（几）列抽出来（包含column names），插入到index中，并将对应index name设为column name。

Reset index 则是逆过程，把index（MultiIndex）中的某一个（几个）level的index抽出来，作为columns插入到原有的Dataframe中。

Selection 小结

只抽取row(s) / column(s) 即前者包括所有columns 后者包括所有row

[]：可接受 int 型slice object以及str 型的slice object，str可对应index names或者column names。

不接受两个以及以上的index（即只能对列或者行操作，而不能像iloc loc那样同时操作）

co2[0:3]
co2['2017-11-29 00:00:00':'2017-11-29 00:00:03'] 
#直接用index name取行也可，类似取columns的操作

.loc() 只接受str 型的slice object，单一slice object是对row操作

co2.loc['2017-11-29 00:00:00':'2017-11-29 00:00:03']
 #直接用index name取行也可，类似取columns的操作。取0 1 2 3 rows

co2.loc[:,'Day':'time'] 
#取所有rows，对columns操作

.iloc() 只接受接受 int 型slice object

co2.iloc[0:3] #取 0 1 2 rows

co2.iloc[:,0:3] #左开右闭，取第0 1 2列

多个条件叠加（即对row 和 column 同时有限定）

中心思想就是：先用条件语句或者binary operation的组合得到对于row的Boolean array（Series），然后再对想要的column进行操作

其中对于row的Boolean array

可以通过直接逻辑判断(>/2 共同筛选
也可以通过isin()函数，来更加具体的对row进行筛选

得到row 的Boolean array之后，再用loc iloc进行选择，注意最好避免chained indexing，因为不知道到底最后到底拿到是view 还是 copy

Example：
值得注意的是，第一个例子中是直接用index的isin()函数进行操作

#首先得到名为interested_period的对于row的Boolean Sereis，然后在对column限制。以下例子同理
co2.loc[co2.index.isin(interested_period),'co2':'pm10']

第二个例子中，利用到了逻辑判断语句的组合，但是要**注意加()标明语句间的顺序**，否则会报错

# 筛选出第0天中co2指数大于500的天
co2[(co2['Day']==0)&(co2['co2']>500)]

MultiIndex的Dataframe

参考：Using Slicers
推荐：利用slicers 。而且注意用.loc时，要把column indexer写全

法一：直接用Slicers组成的tuple

In[109]: single_grouper.corr()
Out[109]: 
                                         co2    ...        pm2d5
Location datetime                               ...             
C215011  2017-09-06 02:00:00 co2    1.000000    ...     0.598060
                             pm10   0.308473    ...     0.644924
                             pm1d0  0.657444    ...     0.784459
                             pm2d5  0.598060    ...     1.000000
         2017-09-06 03:00:00 co2    1.000000    ...     0.357272
                             pm10   0.323055    ...     0.819824
                             pm1d0  0.282845    ...     0.826196
                             pm2d5  0.357272    ...     1.000000
         2017-09-06 04:00:00 co2    1.000000    ...    -0.142768
                             pm10  -0.189648    ...     0.698958
                             pm1d0 -0.114981    ...     0.748531
                             pm2d5 -0.142768    ...     1.000000
         2017-09-06 05:00:00 co2    1.000000    ...    -0.248906
                             pm10  -0.222500    ...     0.780316
                             pm1d0 -0.318003    ...     0.745051
                             pm2d5 -0.248906    ...     1.000000
         2017-09-06 06:00:00 co2    1.000000    ...     0.093987
                             pm10   0.100579    ...     0.705466
                             pm1d0  0.161602    ...     0.661447
                             pm2d5  0.093987    ...     1.000000
         2017-09-06 07:00:00 co2    1.000000    ...     0.233881
                             pm10   0.160716    ...     0.720342
                             pm1d0  0.165083    ...     0.749352
                             pm2d5  0.233881    ...     1.000000
         2017-09-06 08:00:00 co2    1.000000    ...     0.569747
                             pm10   0.458880    ...     0.814600
                             pm1d0  0.591406    ...     0.843094
                             pm2d5  0.569747    ...     1.000000
         2017-09-06 09:00:00 co2    1.000000    ...    -0.074258
                             pm10   0.003474    ...     0.690436
                                      ...    ...          ...
C215020  2018-04-14 18:00:00 pm1d0  0.472544    ...     0.869046
                             pm2d5  0.383395    ...     1.000000
         2018-04-14 19:00:00 co2    1.000000    ...     0.763890
                             pm10   0.740061    ...     0.933293
                             pm1d0  0.754770    ...     0.864587
                             pm2d5  0.763890    ...     1.000000
         2018-04-14 20:00:00 co2    1.000000    ...     0.196739
                             pm10   0.247260    ...     0.645505
                             pm1d0  0.210897    ...     0.568587
                             pm2d5  0.196739    ...     1.000000
         2018-04-14 21:00:00 co2    1.000000    ...     0.389391
                             pm10   0.293694    ...     0.913022
                             pm1d0  0.193768    ...     0.769192
                             pm2d5  0.389391    ...     1.000000
         2018-04-14 22:00:00 co2    1.000000    ...    -0.194604
                             pm10  -0.229500    ...     0.910552
                             pm1d0 -0.134890    ...     0.731365
                             pm2d5 -0.194604    ...     1.000000
         2018-04-14 23:00:00 co2    1.000000    ...    -0.356215
                             pm10  -0.272154    ...     0.940299
                             pm1d0 -0.388168    ...     0.851133
                             pm2d5 -0.356215    ...     1.000000
         2018-04-15 00:00:00 co2    1.000000    ...    -0.777221
                             pm10  -0.696396    ...     0.939822
                             pm1d0 -0.809884    ...     0.883817
                             pm2d5 -0.777221    ...     1.000000
         2018-04-15 01:00:00 co2    1.000000    ...    -0.403618
                             pm10  -0.328394    ...     0.841657
                             pm1d0 -0.336217    ...     0.684951
                             pm2d5 -0.403618    ...     1.000000

[101220 rows x 4 columns]

法二：用pd.IndexSlice

同样是要注意loc要指定好row index和column index

In[112]: idx=pd.IndexSlice
In[113]: single_grouper.corr().loc[idx[:, :, 'co2'], :]
Out[113]: 
                                  co2      pm10     pm1d0     pm2d5
Location datetime                                                  
C215011  2017-09-06 02:00:00 co2  1.0  0.308473  0.657444  0.598060
         2017-09-06 03:00:00 co2  1.0  0.323055  0.282845  0.357272
         2017-09-06 04:00:00 co2  1.0 -0.189648 -0.114981 -0.142768
         2017-09-06 05:00:00 co2  1.0 -0.222500 -0.318003 -0.248906
         2017-09-06 06:00:00 co2  1.0  0.100579  0.161602  0.093987
         2017-09-06 07:00:00 co2  1.0  0.160716  0.165083  0.233881
         2017-09-06 08:00:00 co2  1.0  0.458880  0.591406  0.569747
         2017-09-06 09:00:00 co2  1.0  0.003474 -0.101632 -0.074258
         2017-09-06 10:00:00 co2  1.0  0.672076  0.752501  0.742146
         2017-09-06 11:00:00 co2  1.0  0.681013  0.787290  0.813576
         2017-09-06 12:00:00 co2  1.0  0.190242  0.297774  0.234162
         2017-09-06 13:00:00 co2  1.0  0.561493  0.608962  0.624777
         2017-09-06 14:00:00 co2  1.0  0.452426  0.589878  0.585418
         2017-09-06 15:00:00 co2  1.0  0.434273  0.493025  0.513818
         2017-09-06 16:00:00 co2  1.0  0.272358  0.210343  0.261101
         2017-09-06 17:00:00 co2  1.0  0.170626  0.277740  0.236819
         2017-09-06 18:00:00 co2  1.0  0.271029  0.295988  0.349979
         2017-09-06 19:00:00 co2  1.0  0.239557  0.203991  0.246133
         2017-09-06 20:00:00 co2  1.0  0.163458  0.217716  0.179887
         2017-09-06 21:00:00 co2  1.0 -0.003819 -0.061599  0.020957
         2017-09-06 22:00:00 co2  1.0 -0.065252  0.014226 -0.069327
         2017-09-06 23:00:00 co2  1.0 -0.153153 -0.070683 -0.146687
         2017-09-07 00:00:00 co2  1.0  0.865989  0.875561  0.885547
         2017-09-07 01:00:00 co2  1.0  0.864904  0.932527  0.920687
         2017-09-07 02:00:00 co2  1.0  0.405383  0.550483  0.476642
         2017-09-07 03:00:00 co2  1.0 -0.301033 -0.414535 -0.478034
         2017-09-07 04:00:00 co2  1.0 -0.305678 -0.396347 -0.366256
         2017-09-07 05:00:00 co2  1.0 -0.007007 -0.003598  0.022409
         2017-09-07 06:00:00 co2  1.0  0.680386  0.817571  0.802834
         2017-09-07 07:00:00 co2  1.0  0.244700  0.316053  0.340574
                               ...       ...       ...       ...
C215020  2018-04-13 20:00:00 co2  1.0 -0.179131 -0.249228 -0.302983
         2018-04-13 21:00:00 co2  1.0  0.204458  0.304093  0.204479
         2018-04-13 22:00:00 co2  1.0  0.107506  0.024135  0.125214
         2018-04-13 23:00:00 co2  1.0 -0.220059 -0.093451 -0.168481
         2018-04-14 00:00:00 co2  1.0 -0.115291 -0.192982 -0.064253
         2018-04-14 01:00:00 co2  1.0  0.467321  0.406377  0.562045
         2018-04-14 02:00:00 co2  1.0 -0.183294 -0.303493 -0.145360
         2018-04-14 03:00:00 co2  1.0 -0.196301 -0.284329 -0.142990
         2018-04-14 04:00:00 co2  1.0  0.184860  0.157116  0.181162
         2018-04-14 05:00:00 co2  1.0  0.094443  0.085902 -0.026815
         2018-04-14 06:00:00 co2  1.0 -0.600708 -0.466155 -0.618530
         2018-04-14 07:00:00 co2  1.0 -0.534604 -0.567308 -0.592667
         2018-04-14 08:00:00 co2  1.0  0.090428 -0.182726 -0.113695
         2018-04-14 09:00:00 co2  1.0  0.372609  0.028516  0.402602
         2018-04-14 10:00:00 co2  1.0 -0.281948  0.058078 -0.225148
         2018-04-14 11:00:00 co2  1.0 -0.345226 -0.529968 -0.342974
         2018-04-14 12:00:00 co2  1.0 -0.107841  0.129580 -0.041739
         2018-04-14 13:00:00 co2  1.0 -0.796716 -0.759900 -0.827842
         2018-04-14 14:00:00 co2  1.0  0.345321  0.251140  0.317384
         2018-04-14 15:00:00 co2  1.0 -0.227834 -0.233218 -0.171758
         2018-04-14 16:00:00 co2  1.0 -0.488537 -0.449984 -0.392343
         2018-04-14 17:00:00 co2  1.0 -0.681828 -0.615714 -0.719129
         2018-04-14 18:00:00 co2  1.0  0.345293  0.472544  0.383395

你可能感兴趣的:(Pandas)

Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
python pandas 读取excel单元门公式值_Python pandas对excel的操作实现示例 weixin_39585761 python pandas 读取excel单元门公式值
最近经常看到各平台里都有Python的广告，都是对excel的操作，这里明哥收集整理了一下pandas对excel的操作方法和使用过程。本篇介绍pandas的DataFrame对列(Column)的处理方法。示例数据请通过明哥的gitee进行下载。增加计算列pandas的DataFrame，每一行或每一列都是一个序列(Series)。比如：importpandasaspddf1=pd.read_e
pandas整表写入excel指定位置_pandas操作Excel的常用场景及问题那个吴小明
很多场景下使用pandas就能够胜任手上的excel处理任务，之前写的用python操作具体到excel单元格的方法参考：贺霆：python操作Excel实现自动化报表zhuanlan.zhihu.com现在主要介绍使用pandas读取excel的几种常用场景：一、常规读取importpandasaspdfrompandasimportDataFrame,Seriesimportosos.chdi
pandas 读取某一单元格的值_07-Pandas Excel新建/读取/填充（一）扇贝编程 pandas 读取某一单元格的值
Excel是微软的经典之作，几乎可以满足我们日常工作的所有需求，但是在处理海量数据时，Excel在效率及性能方面就显得很吃力。正因为Pandas在数据处理方面有着独特的优势，所有掌握pandas库处理excel格式的数据就显得十分必要。目录excel文档新建读取excel文档行列操作空值自动填充行列函数运算excel数据排序excel数据按条件筛选#1.创建excel文件在jupyter中导入pa
如何用Python批量将CSV文件编码转换为UTF-8并转为Excel格式？字节王德发 python python excel 开发语言
在处理数据时，CSV文件格式常常用作数据的交换格式。不过，很多情况下我们会遇到编码问题，特别是当文件不是UTF-8编码时。为了更好地处理这些文件，可能需要将它们转换为UTF-8编码，并且将其转换为Excel格式，这样可以方便后续的数据分析和使用。今天就来聊聊如何用Python实现这一过程。准备工作：安装必要的库我们需要确保安装了所需的Python库。主要用到的库有pandas和openpyxl。p
Pandas完全指南：数据处理与分析从入门到实战 xiaoyu❅ python python pandas 开发语言
目录引言一、Pandas环境配置与核心概念1.1安装Pandas1.2导入惯例1.3核心数据结构二、数据结构详解2.1Series创建与操作2.2DataFrame创建三、数据查看与基本操作3.1数据预览3.2索引与选择3.3数据排序四、数据清洗实战4.1处理缺失值4.2处理重复值4.3数据类型转换4.4字符串处理五、数据处理进阶5.1数据筛选5.2列操作5.3应用函数六、数据分组与聚合6.1基础
焊接性能分析代码（Python）骑蜗牛上月亮 python 开发语言
welding_performance_data.xls数据文件。welding_strengthtoughness5001052012480855015490953013510115401447075601690018600121500139111578115importpandasaspdimportmatplotlib.pyplotaspltimporttkinterastkfrommatp
Python常用的库讲解（易懂版）不辉放弃 python 开发语言
NumPy：用于科学计算的基础库，提供多维数组对象、各种派生对象和对数组执行操作的工具。importnumpyasnp#创建一个numpy数组arr=np.array([1,2,3,4,5])print(arr)Pandas：数据处理库，提供数据结构和数据分析工具，特别适合处理结构化数据。importpandasaspd#创建一个Pandas数据帧df=pd.DataFrame({'A':[1,2
基于Geopandas的地理空间数据可视化与分析方法研究一键难忘信息可视化 Geopandas python
地理空间数据可视化是数据科学中重要的应用之一。通过有效地展示地理信息，我们能够深入理解空间数据的分布和模式。Python的Geopandas库为地理空间数据处理和可视化提供了强大的支持，它基于pandas并集成了shapely、fiona等多个库，能够方便地进行地理数据的读取、处理和展示。本文将介绍如何使用Geopandas进行地理空间数据可视化，示范数据处理的基本流程，并通过具体的代码实例，深入
如何用python做一个小程序进行炒股？大懒猫软件 python 小程序开发语言
使用Python分析股票的完整程序以下是一个完整的Python程序，展示如何获取股票数据、进行数据清洗、计算技术指标、并进行简单的价格走势分析。1.安装必要的库首先，确保安装了必要的库：bash复制pipinstallrequestspandasmatplotlibyfinance2.获取股票数据使用yfinance库获取股票数据。yfinance是一个流行的库，可以方便地从雅虎财经获取股票数据。
批量将将xlsx转为csv，将csv转为csv utf-8 Znnjcidmslz 数据 python pandas
csv转换为csvutf-8将csv格式文件批量转换为csvutf-8格式文件，以下为使用Python处理的代码：importosimportpandasaspd#存有文件的路径current_path=os.getcwd()#current_path=os.path.dirname('G:/weather_output2')#转换之后存放的路径为“UTF8”，会检查当前路径是否有，没有就创建ut
csv转为utf8编码_中文的csv文件的编码改成utf8的方法 John Sheppard csv转为utf8编码
直奔主题：把包含中文的csv文件的编码改成utf-8的方法：啰嗦几句：在用pandas读取hive导出的csv文件时，经常会遇到类似UnicodeDecodeError:'gbk'codeccan'tdecodebyte0xa3inposition12这样的问题，这种问题是因为导出的csv文件包含中文，且这些中文的编码不是gbk，直接用excel打开这些文件还会出现乱码，但用记事本打开这些csv则
1.4使用pandas读取和写入Excel文件的基本操作林伽一 python处理excel pandas excel python
读取和写入Excel文件是使用Python处理Excel的基本操作。在Python中，可以使用不同的库来实现这些操作，例如pandas、openpyxl等。以下是读取和写入Excel文件的基本操作示例：读取Excel文件使用pandas库读取Excel文件非常方便。下面的示例演示了如何使用pandas读取Excel文件：importpandasaspd#读取Excel文件df=pd.read_ex
【Python】爬取高校数据（名字，院校特色，所在地，性质）。可用于判断高校是否为双一流，本科/专科等分析 llzcxdb Python python 开发语言爬虫
源网站：http://college.gaokao.com/schlist/p1利用Python的lxml库进行html解析，源代码：importrequestsfromlxmlimportetreeimportpandasaspdimportcsv#请求URLurl='http://college.gaokao.com/schlist/p'#构建请求头headers={'User-Agent':
机器学习Pandas_learn4 XW-ABAP 机器学习机器学习 pandas 人工智能
importpandasaspddefcalculate_goods_covariance():#定义商品销售数据字典goods_sales_data={"时期":["一期","二期","三期","四期"],"苹果":[15,16,3,2],"橘子":[12,14,16,18],"石榴":[11,8,7,1]}#将字典转换为DataFrame对象goods_dataframe=pd.DataFra
如何使用Python对Excel、CSV文件完成数据清洗与预处理？ Python 集中营 python数据分析应用 python excel 开发语言
在数据分析和机器学习项目中，数据清洗与预处理是不可或缺的重要环节。现实世界中的数据往往是不完整、不一致且含有噪声的，这些问题会严重影响数据分析的质量和机器学习模型的性能。Python作为一门强大的编程语言，提供了多种库和工具来帮助我们高效地完成数据清洗与预处理任务，其中最常用的库包括Pandas、NumPy、SciPy等。本文将详细介绍如何使用Python对Excel和CSV格式的数据文件进行清洗
Pandas与PySpark混合计算实战：突破单机极限的智能数据处理方案 Eqwaak00 Pandas pandas 学习 python 科技开发语言
引言：大数据时代的混合计算革命当数据规模突破十亿级时，传统单机Pandas面临内存溢出、计算缓慢等瓶颈。PySpark虽能处理PB级数据，但在开发效率和局部计算灵活性上存在不足。本文将揭示如何构建Pandas+PySpark混合计算管道，在保留Pandas便捷性的同时，借助Spark分布式引擎实现百倍性能提升，并通过真实电商用户画像案例演示全流程实现。一、混合架构设计原理1.1技术栈优势分析维度P
pandas 根据给定的条件动态筛选 Aa123456789_55 pandas pandas python
defdynamic_filter(df,conditions):"""根据给定的条件动态筛选DataFrame。:paramdf:pandasDataFrame:paramconditions:字典，键为列名，值为筛选条件（单个值、列表或其他布尔表达式）:return:筛选后的DataFrame"""mask=pd.Series(True,index=df.index)#初始化全True的mas
机器学习Pandas_learn3 XW-ABAP 机器学习 pandas
frompandasimportDataFrameimportnumpypaints={"车名":["奥迪Q5L","哈弗H6","奔驰GLC"],"最低报价":[numpy.nan,9.80,numpy.nan],"最高报价":[49.80,23.10,58.78]}goods_in=DataFrame(paints,index=[1,2,3])print(goods_in)goods_in_n
python绘制密度散点图龟速前进 anaconda 可视化 python
头大，外行人做个图咋这么难，趋势线还没有研究出来怎么加上去，哎importmatplotlib.pyplotaspltfromscipy.statsimportgaussian_kdefrommpl_toolkits.axes_grid1importmake_axes_locatableimportnumpyasnpimportpandasaspdfromdbfreadimportDBFdata=
pandas 读写excel jimox_ai pandas
在Python中，使用Pandas库读写Excel文件是一个常见的操作。Pandas提供了`read_excel`和`to_excel`方法来分别实现读取和写入Excel文件的功能。以下是一些基本的示例：###读取Excel文件```pythonimportpandasaspd#读取Excel文件df=pd.read_excel('path_to_your_excel_file.xlsx')#显示
大话 Python：python 操作 excel 系列 -- pandas 读取、分析、保存 2401_84140734 程序员 python excel pandas
read_excel()直接读取excel文件df=pd.read_excel(‘C:/test.xlsx’)4，读取当前字段计算后生成新字段获取原有字段paymount值paymount=df[‘paymount’]业务计算（金额-10）paymount_new=paymount-10添加新字段paymount_newdf[‘paymount_new’]=paymount_new这个步骤可以加入
pandas寻找四分位数及判断离群点 SXxtyz python
importpandasaspdtrain_df=pd.read_csv("train.csv")q1,q3=train_df['price'].quantile([0.25,0.75])iqr=q3-
Python----数据分析（Pandas四：一维数组Series的统计计算，分组和聚合）蹦蹦跳跳真可爱589 数据分析 Python pandas python 数据分析
一、统计计算1.1、count用于计算Series中非NaN（非空）值的数量。importpandasaspds=pd.Series([1,2,None,4,None])count_non_na=s.count()print(count_non_na)1.2、sumsum()函数会计算所有值的总和。Series.sum(axis=None,skipna=True,numeric_only=None
Python----数据分析（Pandas三：一维数组Series的数据操作：数据清洗，数据转换，数据排序，数据筛选，数据拼接）蹦蹦跳跳真可爱589 数据分析 Python python 数据分析 pandas
一、数据清洗1.1、dropna()删除包含NaN值的行。series.dropna(axis=0,inplace=False)描述说明axis可选参数，用于指定按哪个轴删除缺失值。对于Series对象，因为它是一维数据结构，只有一个轴，所以此参数默认值为0，且一般不需要修改这个参数（在处理DataFrame时该参数才有更多实际意义，如除，axis=1表示按列删除）。inplace可选参数，用于指
房产租赁数据分析与可视化学习只是用户态数据分析信息可视化数据挖掘
【实训目的】通过本次实训，要求了解Python用于数据可视化的常用包：matplotlib、seaborn、pyecharts等基本使用，及各种图形的使用。【实训环境】 Jupyter环境、Pandas、NumPy、Matplotlib。【实训内容】 1.数据统计与分析方面的可视化； 2.数据分析与预测方面的可视化； 3.数据多类型的可视化。本次实验以温州市三区房屋租赁数据（res
selenium+pyquery爬取《鱿鱼游戏》评论2000+条铁憨憨0304 python爬虫 selenium python 测试工具
IMDB网址爬取《鱿鱼游戏》的全部评论评论排名评论标题id评论时间评论内容导入所需要的包selenium:模拟浏览器，这里使用的是Edge浏览器，需要安装Edge浏览器驱动解析库：PyQuery保存数据：pandas，保存为csv文件fromseleniumimportwebdriverfromselenium.webdriver.support.uiimportWebDriverWaitfrom
Python——文件读取一颗小松松 python 开发语言
Python可以读取不同格式的文件，下面简单来介绍一下：1、使用read_excel或read_csv读取文件，若在路径前加r，使用“\”importpandasaspd#在路径前加r,使用“\”df=pd.read_excel(r'C:\Users\merit\Desktop\测试.xlsx')#导入.csv文件，以“，”为分隔符data=pd.read_csv(r'C:\Users\merit
Python处理CSV文件的12个高效技巧宇宙大豹发 python 开发语言
今天，我们的Python之旅，目标是那片由逗号分隔的宝藏——CSV文件。别看它简单，掌握这些技巧，你的数据处理能力将直线上升，轻松驾驭千行万列的数据海洋。让我们一起，用Python的魔力，让CSV舞动起来吧！1.初次见面，你好，CSV！安装pandas，是这场冒险的起点。它，是Python数据分析的瑞士军刀。pipinstallpandas导入我们的英雄——pandas，并亲切地叫它pd。impo
Python中三种表示NA的方式风语者666 python
Python中三种表示NA的方式#-*-coding:utf-8-*-importnumpyasnpimportpandasaspd#data_frame=np.load('a.npy',allow_pickle=True)#print(data_frame.columns)df=pd.DataFrame({'one':[1,2,3,pd.NA]})df=pd.DataFrame({'one':[
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc