moshanghuali

pandas库学习笔记

> dataframe与series

pandas中有两种常用的数据结构，分别是dataframe和series两种。

dataframe数据结构

import numpy as np
import pandas as pd
dataframe = pd.DataFrame([[1,2,3],[4,5,6],[7,8,9]],index = ['No.1','No.2','No.3'],columns = ['a','b','c'])
dataframe

	a	b	c
No.1	1	2	3
No.2	4	5	6
No.3	7	8	9

series数据结构

series = pd.Series([1,2,3,4,5],index = ['No1','No2','No3','No4','No5'])
series

No1    1
No2    2
No3    3
No4    4
No5    5
dtype: int64

> dataframe的常规属性

查看dataframe属性的方法有:

values -------------------------获取元素
index --------------------------获取索引
columns ----------------------获取列名
dtype --------------------------获取类型
size ----------------------------获取元素个数
ndim ---------------------------获取维度数
shape -------------------------获取数据形状

# values
dataframe.values

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]], dtype=int64)

# values类型
type(dataframe.values)

numpy.ndarray

# index
dataframe.index

Index(['No.1', 'No.2', 'No.3'], dtype='object')

# columns
dataframe.columns

Index(['a', 'b', 'c'], dtype='object')

# dtype
dataframe.dtypes

a    int64
b    int64
c    int64
dtype: object

# dtype返回类型是 series
type(dataframe.dtypes)

pandas.core.series.Series

# size
dataframe.size

# size返回类型
type(dataframe.size)

numpy.int32

# ndim
dataframe.ndim

# shape    返回类型是tuple
dataframe.shape

(3, 3)

> dataframe的增删查改操作

> 查

▲普通方法

字典访问形式获取单列数据

dataframe['a']   # 或者写成dataframe.a

No.1    1
No.2    4
No.3    7
Name: a, dtype: int64

tips。。。。不可以使用dataframe[‘行索引名称’]。括号中默认是列索引名称。

获取单列多行数据

dataframe['a'][:2]

No.1    1
No.2    4
Name: a, dtype: int64

获取多列数据

dataframe[['a','b']]   # 将多列数据以List的数据类型传入

	a	b
No.1	1	2
No.2	4	5
No.3	7	8

获取多行数据

dataframe[:][:2]      # 与单列多行数据的获取方法有着异曲同工之妙

	a	b	c
No.1	1	2	3
No.2	4	5	6

head方法获取首部数据

'''默认获取首5行，但是当数据不够五行的时候，并不会报错，此时会取最大行数。'''
dataframe.head()   # dataframe的形状是(3,3)

	a	b	c
No.1	1	2	3
No.2	4	5	6
No.3	7	8	9

tail方法获取尾部数据

#获取倒数1行数据
dataframe.tail(1)    # 注意传入数字表示获取的数据的行数 ,默认deault获取5行。

	a	b	c
No.3	7	8	9

>>★★iloc与loc切片方法

loc

# loc切片方法--------------根据索引名称的切片方法。传入的必须是索引名称，否则没有办法执行。
dataframe.loc[:,'b']           # 很类似matlab中矩阵的切片方法 dataframe.iloc[行索引名称，列索引名称]

No.1    2
No.2    5
No.3    8
Name: b, dtype: int64

iloc

# iloc切片方法--------------根据索引位置的切片方法。dataframe.iloc[行索引位置，列索引位置]
dataframe.iloc[:,1]

No.1    2
No.2    5
No.3    8
Name: b, dtype: int64

>>★多列切片

# loc多列切片    dataframe.loc[:,[列索引名称1，列索引名称2,.....,列索引名称n]]
dataframe.loc[:,['a','b']]   # 多个列索引名称以列表的形式传入

	a	b
No.1	1	2
No.2	4	5
No.3	7	8

# iloc多列切片   dataframe.iloc[:,[列索引位置1，列索引位置2,......，列索引位置n]]
dataframe.iloc[:,[0,1]]

	a	b
No.1	1	2
No.2	4	5
No.3	7	8

★★条件切片

loc条件切片

dataframe

	a	b	c
No.1	1	2	3
No.2	4	5	6
No.3	7	8	9

dataframe.loc[dataframe['a']>2,:] # 获取dataframe中a列数值大于2的数据。

	a	b	c
No.2	4	5	6
No.3	7	8	9

dataframe['a']>2   # 观察得知，a列中数值大于2的只有第二和第三个满足。

No.1    False
No.2     True
No.3     True
Name: a, dtype: bool

dataframe.loc[dataframe['b']>5]  # 获取dataframe中b列数据大于5的数据。

	a	b	c
No.3	7	8	9

归纳一下
dataframe.loc[条件,:] # 其中条件数据中数值类型是bool型，数据结构可以是series或者list。但是需要注意当条件数据是series类型的时候,条件数据index必须与待切片数据一致，否则会报错，index不匹配。如下例。

dataframe.loc['No.1']>2  # 此时index为a,b,c，与待切片数据不一致。

a    False
b    False
c     True
Name: No.1, dtype: bool

dataframe['a']>2 # 该条件数据index为No.1,No.2,No.3 与待切片数据index一致。

No.1    False
No.2     True
No.3     True
Name: a, dtype: bool

dataframe.loc[dataframe.loc['No.1']>2,:]  #  报错

---------------------------------------------------------------------------

IndexingError                             Traceback (most recent call last)

 in ()
----> 1 dataframe.loc[dataframe.loc['No.1']>2,:]


E:\anaconda3.5\lib\site-packages\pandas\core\indexing.py in __getitem__(self, key)
   1323             except (KeyError, IndexError):
   1324                 pass
-> 1325             return self._getitem_tuple(key)
   1326         else:
   1327             key = com._apply_if_callable(key, self.obj)


E:\anaconda3.5\lib\site-packages\pandas\core\indexing.py in _getitem_tuple(self, tup)
    854                 continue
    855 
--> 856             retval = getattr(retval, self.name)._getitem_axis(key, axis=i)
    857 
    858         return retval


E:\anaconda3.5\lib\site-packages\pandas\core\indexing.py in _getitem_axis(self, key, axis)
   1506             return self._get_slice_axis(key, axis=axis)
   1507         elif is_bool_indexer(key):
-> 1508             return self._getbool_axis(key, axis=axis)
   1509         elif is_list_like_indexer(key):
   1510 


E:\anaconda3.5\lib\site-packages\pandas\core\indexing.py in _getbool_axis(self, key, axis)
   1339     def _getbool_axis(self, key, axis=0):
   1340         labels = self.obj._get_axis(axis)
-> 1341         key = check_bool_indexer(labels, key)
   1342         inds, = key.nonzero()
   1343         try:


E:\anaconda3.5\lib\site-packages\pandas\core\indexing.py in check_bool_indexer(ax, key)
   1937         mask = isnull(result._values)
   1938         if mask.any():
-> 1939             raise IndexingError('Unalignable boolean Series provided as '
   1940                                 'indexer (index of the boolean Series and of '
   1941                                 'the indexed object do not match')


IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match

dataframe.loc[dataframe['a']>2,:]   # 正常

	a	b	c
No.2	4	5	6
No.3	7	8	9

iloc条件切片

# dataframe.iloc[条件,条件]     条件不可以是series数据。可以是array。
dataframe.iloc[dataframe['a']>2,:]   # 报错

---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

 in ()
      1 # dataframe.iloc[条件,条件]     条件不可以是series数据。可以是array。
----> 2 dataframe.iloc[dataframe['a']>2,:]   # 报错


E:\anaconda3.5\lib\site-packages\pandas\core\indexing.py in __getitem__(self, key)
   1323             except (KeyError, IndexError):
   1324                 pass
-> 1325             return self._getitem_tuple(key)
   1326         else:
   1327             key = com._apply_if_callable(key, self.obj)


E:\anaconda3.5\lib\site-packages\pandas\core\indexing.py in _getitem_tuple(self, tup)
   1660     def _getitem_tuple(self, tup):
   1661 
-> 1662         self._has_valid_tuple(tup)
   1663         try:
   1664             return self._getitem_lowerdim(tup)


E:\anaconda3.5\lib\site-packages\pandas\core\indexing.py in _has_valid_tuple(self, key)
    187             if i >= self.obj.ndim:
    188                 raise IndexingError('Too many indexers')
--> 189             if not self._has_valid_type(k, i):
    190                 raise ValueError("Location based indexing can only have [%s] "
    191                                  "types" % self._valid_types)


E:\anaconda3.5\lib\site-packages\pandas\core\indexing.py in _has_valid_type(self, key, axis)
   1588                                               "indexing on an integer type "
   1589                                               "is not available")
-> 1590                 raise ValueError("iLocation based boolean indexing cannot use "
   1591                                  "an indexable as a mask")
   1592             return True


ValueError: iLocation based boolean indexing cannot use an indexable as a mask

dataframe.iloc[dataframe['a'].values>2,:]

	a	b	c
No.2	4	5	6
No.3	7	8	9

dataframe.iloc[dataframe.loc['No.1'].values>2,:]   # 因为iloc方法中条件不可以是series，因此不需要与待切片数据index或者columns一致。

	a	b	c
No.3	7	8	9

loc使用区间切割时，区间前后都为闭。而iloc使用区间切割的时候前闭后开。

dataframe.loc[:,'a':'b']  # 包含a 和 b

	a	b
No.1	1	2
No.2	4	5
No.3	7	8

dataframe.iloc[:,0:1]   # 只包含一个

	a
No.1	1
No.2	4
No.3	7

loc与iloc方法，当只传入一个索引的时候，默认是行索引。
dataframe.loc[列索引]是不可以的

> 改

dataframe中改变数据原理就是将数据提取出来，然后重新赋值。

dataframe.iloc[1,1]  # 原本的数据

dataframe.iloc[1,1] = 4 
dataframe.iloc[1,1]   # 改变后的数据

> 增

dataframe中增加数据，类似与dict，只要新建一个列索引，然后在赋值即可。

dataframe['add'] = ['a','d','d']
dataframe    # 增加一列后的数据

	a	b	c	add
No.1	1	2	3	a
No.2	4	4	6	d
No.3	7	8	9	d

> 删

删除某行或者某列，需使用pandas的drop方法。

# dataframe.drop(labels,axis,inplace)    labels表示待删除的行列标签名称，inplace表示是否对原数据执行，默认为false.inplace为true的时候，将会改变原数据
# axis 默认为0。

dataframe.drop('add',axis = 1)  # 删除add列。但是并为改变原dataframe数据

	a	b	c
No.1	1	2	3
No.2	4	4	6
No.3	7	8	9

dataframe  # 未发生改变

	a	b	c	add
No.1	1	2	3	a
No.2	4	4	6	d
No.3	7	8	9	d

dataframe.drop('add',axis = 1,inplace=True)  # 不返回数据，就地执行

dataframe   # 数据发生改变。

	a	b	c
No.1	1	2	3
No.2	4	4	6
No.3	7	8	9

> 描述分析dataframe数据

数值型描述分析统计
min/max/mean/std/var/cov/median
ptp 极差
sem 标准误差
skew 样本偏度
kurt 样本峰度
count 非空值数目
quantitle 四分位数
describe 描述性统计
mad 平均绝对误差
mode 众数

dataframe

	a	b	c
No.1	1	2	3
No.2	4	5	6
No.3	7	8	9

# decribe描述统计
dataframe.describe()

	a	b	c
count	3.0	3.0	3.0
mean	4.0	5.0	6.0
std	3.0	3.0	3.0
min	1.0	2.0	3.0
25%	2.5	3.5	4.5
50%	4.0	5.0	6.0
75%	5.5	6.5	7.5
max	7.0	8.0	9.0

# 最大值max   默认axis = 0。
dataframe.max()

a    7
b    8
c    9
dtype: int64

dataframe.max(axis=1)

No.1    3
No.2    6
No.3    9
dtype: int64

#mean平均值    axis的deault为0
dataframe.mean()

a    4.0
b    5.0
c    6.0
dtype: float64

dataframe.mean(axis=1)

No.1    2.0
No.2    5.0
No.3    8.0
dtype: float64

# 非空数目值count   也可以设置axis
dataframe.count()

No.1    3
No.2    3
No.3    3
dtype: int64

# 众数              axis默认为0
dataframe.mode()

	0	1	2
No.1	1	2	3
No.2	4	5	6
No.3	7	8	9

类别特征的描述分析统计

# 类别特征统计使用value_counts方法  注意dataframe对象没有value_counts方法
dataframe.value_counts()

---------------------------------------------------------------------------

AttributeError                            Traceback (most recent call last)

 in ()
      1 # 类别特征统计使用value_counts方法  注意dataframe对象没有value_counts方法
----> 2 dataframe.value_counts()


E:\anaconda3.5\lib\site-packages\pandas\core\generic.py in __getattr__(self, name)
   3079             if name in self._info_axis:
   3080                 return self[name]
-> 3081             return object.__getattribute__(self, name)
   3082 
   3083     def __setattr__(self, name, value):


AttributeError: 'DataFrame' object has no attribute 'value_counts'

# 可以这样来设置类别统计   返回数据是series类型。
dataframe['a'].value_counts()

7    1
1    1
4    1
Name: a, dtype: int64

> 转换与处理时间序列数据

pandas中与时间相关的类有很多。 Timestamp 最基础的时间类，表示某个时间。 Period 表示某个时间跨度或者某个时间段。 Timedelta 表示不同单位的时间，例如1h,20min,30s。 DatatimeIndex 一组Timestamp构成的Index,可以用来作为series或者Dataframe的索引。 PeriodIndex Period构成的index，可以用来作为series或者dataframe的索引。 TimedeltaIndex Timedelta构成的index,可以用来作为series或者dataframe的索引。

# 最常用的是Timestamp。着重介绍。
data = pd.read_excel(r'E:\Dell.xlsx')

pandas中pd.to_datatime()方法，可以将数据转为datatime类型数据。

data['评论时间'].head()

0    2018-10-18 07:16
1    2019-04-01 21:54
2    2019-01-02 09:46
3    2019-03-01 15:52
4    2018-10-03 09:40
Name: 评论时间, dtype: object

data.dtypes

评论时间    object
订单类型    object
评论内容    object
追加评论    object
dtype: object

data['评论时间'] = pd.to_datetime(data['评论时间'])

data.dtypes   # 评论时间转换为datatime64类型了

评论时间    datetime64[ns]
订单类型            object
评论内容            object
追加评论            object
dtype: object

# 将时间字符串转换为DatetimeIndex和PeriodIndex
dateindex = pd.DatetimeIndex(data['评论时间'])
type(dateindex)

pandas.core.indexes.datetimes.DatetimeIndex

periodIndex = pd.PeriodIndex(data['评论时间'],freq = 'S')  #  必须要指定freq。否则会报错。freq表示时间间隔的频率。
type(periodIndex)

pandas.core.indexes.period.PeriodIndex

提取时间序列数据信息
year/month/day/hour/minute/second/date/time(时间)
week 一年中第几周
quarter 季节
weekofyear 一年中第几周
dayofyear 一年中的第几周
weekday 一周中第几天
weekdayname 星期名称
is_leap_year 是否是闰年

data['评论时间'].head()

0   2018-10-18 07:16:00
1   2019-04-01 21:54:00
2   2019-01-02 09:46:00
3   2019-03-01 15:52:00
4   2018-10-03 09:40:00
Name: 评论时间, dtype: datetime64[ns]

for i in data['评论时间'].head():
    print('年{},月{},日{},时{},秒{},日期{}'.format(i.year,i.month,i.day,i.hour,i.second,i.date))

年2018,月10,日18,时7,秒0,日期
年2019,月4,日1,时21,秒0,日期
年2019,月1,日2,时9,秒0,日期
年2019,月3,日1,时15,秒0,日期
年2018,月10,日3,时9,秒0,日期

data['评论时间'][1].year      # 注意series数据没有.year等方法，即不可以直接用series.year这种想要图简单的方法获取所有的年份。

data['评论时间'][:].year   # 例如

---------------------------------------------------------------------------

AttributeError                            Traceback (most recent call last)

 in ()
----> 1 data['评论时间'][:].year


E:\anaconda3.5\lib\site-packages\pandas\core\generic.py in __getattr__(self, name)
   3079             if name in self._info_axis:
   3080                 return self[name]
-> 3081             return object.__getattribute__(self, name)
   3082 
   3083     def __setattr__(self, name, value):


AttributeError: 'Series' object has no attribute 'year'

data['评论时间'][1].weekday_name   #星期名称

'Monday'

加减时间

某一时间点加减一段时间。这其中就要涉及到Timedelta。Timedelta中单位说明

名称	说明
weeks	星期
days	天
hours/minutes/seconds	xx
milliseconds	毫秒

# 原来数据
data['评论时间'][1]

Timestamp('2019-04-01 21:54:00')

data['评论时间'][1]-pd.Timedelta(days =1)  # 减去一天后的时间。

Timestamp('2019-03-31 21:54:00')

# 两个时间点也也可以相减（Timestamp)
data['评论时间'][1]-data['评论时间'][2]

Timedelta('89 days 12:08:00')

> 分组聚合方法

依据某个或者某几个字段对数据集进行分组，并对各组应用一个函数，无论是聚合还是转换，都是数据分析的常用操作。

pandas提供了一个灵活高效的groupby方法，配合agg及apply方法能够实现分组聚合的操作。groupby方法提供的是分组聚合步骤中的拆分功能能够根据字段对数据进行分组。

data.head(15)

	评论时间	订单类型	评论内容	追加评论
0	2018-10-18 07:16:00	U2717D【27英寸2K】	京东物流确实神速，次日达，包装完好，宝贝好沉，辛苦快递小哥了！宝贝做工确实不错，看上去很奢侈...	None
1	2019-04-01 21:54:00	S2419HM【23.8英寸纤薄时尚】	屏幕很清晰边框很窄很舒服 hdr效果相当不错使用过程发现一些问题玩英雄联盟中途会自动关...	不知你们开hdr再开游戏的时候会不会闪屏
2	2019-01-02 09:46:00	S2719DGF【27英寸2K电竞】	显示器很不错，2k屏办公，娱乐画面看起来都清晰多了，而且用时间长眼睛也没有不适，tn屏刚拿来...	None
3	2019-03-01 15:52:00	U2417H【23.8英寸升降旋转】	有了这个屏幕极大提高了办公效率，可以上下左右调整角度，高度也很合适，比起低头看笔记本电脑对颈...	None
4	2018-10-03 09:40:00	U2518DR【25英寸2K】	质量没的说，首先是支架，左右上下移动很方便，质量厚重。其次，2k显示，由于我没有好的显卡，只...	None
5	2017-12-09 17:17:00	U2417H【23.8英寸】	满意，色彩比较准，看着也不累，边框缝隙不小。有轻微颗粒感。边框很赞，支架很厉害。外观好看。	None
6	2019-03-21 20:53:00	U2415【24英寸16:10升降旋转】	一分钱一分货，这是我想要的显示器，显示效果太好了，没有漏光啥的，连接surface pro太...	None
7	2018-08-25 15:53:00	U2518DR【25英寸2K】	NaN	None
8	2017-12-22 18:03:00	U2417H【23.8英寸】	美滋滋，24寸体验很不错，27寸就大了，色彩确实不错，挺细腻的，插口也很多，usb3.0也能...	None
9	2018-11-25 18:57:00	U2717D【27英寸2K】	从U2311H到U2717D，戴尔显示器真的很不错，质量没问题，显示器非常不错，色彩很好，U...	None
10	2018-10-18 07:16:00	U2717D【27英寸2K】	京东物流确实神速，次日达，包装完好，宝贝好沉，辛苦快递小哥了！宝贝做工确实不错，看上去很奢侈...	None
11	2019-04-01 21:54:00	S2419HM【23.8英寸纤薄时尚】	屏幕很清晰边框很窄很舒服 hdr效果相当不错使用过程发现一些问题玩英雄联盟中途会自动关...	不知你们开hdr再开游戏的时候会不会闪屏
12	2019-01-02 09:46:00	S2719DGF【27英寸2K电竞】	显示器很不错，2k屏办公，娱乐画面看起来都清晰多了，而且用时间长眼睛也没有不适，tn屏刚拿来...	None
13	2019-03-01 15:52:00	U2417H【23.8英寸升降旋转】	有了这个屏幕极大提高了办公效率，可以上下左右调整角度，高度也很合适，比起低头看笔记本电脑对颈...	None
14	2018-10-03 09:40:00	U2518DR【25英寸2K】	质量没的说，首先是支架，左右上下移动很方便，质量厚重。其次，2k显示，由于我没有好的显卡，只...	None

GroupBy常用描述性统计方法及说明

方法名称	说明
count	计算分组的数目包括缺失值
head	返回每组的前n个值
max	返回每组的最大值
min	返回每组的最小值
mean	返回每组的平均值
median	返回每组的中位数
size	返回每组的大小
sum	返回每组的和
std	返回每组的标准差

Groupdata = data[["订单类型","评论时间"]].groupby(by="订单类型")
# count
Groupdata.count()

	评论时间
订单类型
S2419HM【23.8英寸纤薄时尚】	20
S2719DGF【27英寸2K电竞】	20
U2415【24英寸16:10升降旋转】	20
U2417H【23.8英寸】	40
U2417H【23.8英寸升降旋转】	20
U2518DR【25英寸2K】	40
U2717D【27英寸2K】	40

#head
Groupdata.head(1)

	订单类型	评论时间
0	U2717D【27英寸2K】	2018-10-18 07:16:00
1	S2419HM【23.8英寸纤薄时尚】	2019-04-01 21:54:00
2	S2719DGF【27英寸2K电竞】	2019-01-02 09:46:00
3	U2417H【23.8英寸升降旋转】	2019-03-01 15:52:00
4	U2518DR【25英寸2K】	2018-10-03 09:40:00
5	U2417H【23.8英寸】	2017-12-09 17:17:00
6	U2415【24英寸16:10升降旋转】	2019-03-21 20:53:00

# size
Groupdata.size()

订单类型
S2419HM【23.8英寸纤薄时尚】     20
S2719DGF【27英寸2K电竞】      20
U2415【24英寸16:10升降旋转】    20
U2417H【23.8英寸】          40
U2417H【23.8英寸升降旋转】      20
U2518DR【25英寸2K】         40
U2717D【27英寸2K】          40
dtype: int64

type(Groupdata)  # 分组的数据类型

pandas.core.groupby.DataFrameGroupBy

type(Groupdata.size())   # series类型

pandas.core.series.Series

>使用agg方法聚合数据

在pandas 0.20 版本以后，agg函数能够对DataFrame对象进行操作。

DataFrame.agg(func,axis = 0,*args, **kwargs)

参数名称	说明
func	接受list,dict,function，表示应用于每行或者每列的函数，无默认。
axis	接受0或者1.表示操作的轴向，默认为0

操作dataframe

dataframe

	a	b	c
No.1	1	2	3
No.2	4	5	6
No.3	7	8	9

dataframe.agg(np.sum,axis = 0)  # 返回的是一个series类型的数据

a    12
b    15
c    18
dtype: int64

dataframe.agg([np.sum,np.max])  # 应用两个函数

	a	b	c
sum	12	15	18
amax	7	8	9

dataframe.agg({
     "a":np.sum,"b":np.max,'c':np.min})   # 不同的字段用用不同的函数

a    12
b     8
c     3
dtype: int64

dataframe.agg({
     "a":[np.sum,np.max]})    # 针对指定字段应用多个函数。

	a
sum	12
amax	7

在使用自定义函数时，必须多列数据同时计算，单列得出的结果异常

dataframe[‘列1’,‘列2’，…,‘列n’].agg(自定义函数，axis = 0 or 1) # 正确用法之一

>使用apply方法聚合数据

apply方法相比agg，其不可以对每个字段应用不同的函数。传入的函数只能作用于整个dataframe或者series。

DataFrame.apply(func,axis = 0,broadcast = False,raw = False,reduce = None,args = (),**kwds)

参数名称	说明
func	表示应用于每行或每列的函数
axis	代表操作的轴向
broadcast	表示是否进行广播
raw	表示是否直接将ndarray对象传递给函数。默认为False

dataframe.apply(np.mean)  # 对整个dataframe

a    4.0
b    5.0
c    6.0
dtype: float64

Groupdata['订单类型'].apply(np.sum)

订单类型
S2419HM【23.8英寸纤薄时尚】     S2419HM【23.8英寸纤薄时尚】S2419HM【23.8英寸纤薄时尚】S2419HM【...
S2719DGF【27英寸2K电竞】      S2719DGF【27英寸2K电竞】S2719DGF【27英寸2K电竞】S2719DGF【2...
U2415【24英寸16:10升降旋转】    U2415【24英寸16:10升降旋转】U2415【24英寸16:10升降旋转】U2415【...
U2417H【23.8英寸】          U2417H【23.8英寸】U2417H【23.8英寸】U2417H【23.8英寸】U241...
U2417H【23.8英寸升降旋转】      U2417H【23.8英寸升降旋转】U2417H【23.8英寸升降旋转】U2417H【23....
U2518DR【25英寸2K】         U2518DR【25英寸2K】U2518DR【25英寸2K】U2518DR【25英寸2K】U...
U2717D【27英寸2K】          U2717D【27英寸2K】U2717D【27英寸2K】U2717D【27英寸2K】U271...
Name: 订单类型, dtype: object

>使用transform方法聚合数据

transform方法能够对整个dataframe的所有元素进行操作。transform方法只有一个参数"func"，表示对dataframe操作的函数。

dataframe.transform(lambda x:x*2)   #可以使用transform方法实现组内离差标准差。

	a	b	c
No.1	2	4	6
No.2	8	10	12
No.3	14	16	18

dataframe.transform(np.max)

a    7
b    8
c    9
dtype: int64

创建透视表于交叉表

数据透视表是数据分析中常见的工作之一，根据一个或者多个键值对数据进行聚合，根据行或者列的分组键将数据划分到各个区域。在pandas中，除了可以使用groupby对数据进行分组聚合实现透视功能外还提供了更为简单的方法。

pandas.pivot_table(data,values=None,index = None,columns = None,aggfunc=‘mean’,fill_value = None,margins=False,dropna=True,margins_name = ‘All’)

参数名称	说明
data	接受dataframe，表示创建表的数据，无默认
values	接受string，用于指定要聚合的数据字段，默认使用全部数据。默认为None
index	接受string或者List，表示行分组键。默认为None
columns	接受string或者list，表示列分组键
aggfunc	接受functions，表示聚合函数。默认为mean
margins	接受boolean。表示汇总（Total)功能的开关，设置为True后，结果集中会出现名为‘ALL’的行或者列。默认为True
dropna	接受Boolean。表示是否删除全为NaN的列。默认为False
fill_value	表示填空值

pd.pivot_table(data,index = '订单类型',aggfunc=np.sum).head()  # index表示要依据的列名。这个地方不好理解。

	评论时间	追加评论
订单类型
S2419HM【23.8英寸纤薄时尚】	2019-04-01 21:542019-04-01 21:542019-04-01 21:...	不知你们开hdr再开游戏的时候会不会闪屏不知你们开hdr再开游戏的时候会不会闪屏不知你们...
S2719DGF【27英寸2K电竞】	2019-01-02 09:462019-01-02 09:462019-01-02 09:...	None None None None None None None None None N...
U2415【24英寸16:10升降旋转】	2019-03-21 20:532019-03-21 20:532019-03-21 20:...	None None None None None None None None None N...
U2417H【23.8英寸】	2017-12-09 17:172017-12-22 18:032017-12-09 17:...	None None None None None None None None None N...
U2417H【23.8英寸升降旋转】	2019-03-01 15:522019-03-01 15:522019-03-01 15:...	None None None None None None None None None N...

values参数可以指定要显示自己关心的列。

pd.pivot_table(data,index = '订单类型',values='追加评论',aggfunc=np.sum).head()

	追加评论
订单类型
S2419HM【23.8英寸纤薄时尚】	不知你们开hdr再开游戏的时候会不会闪屏不知你们开hdr再开游戏的时候会不会闪屏不知你们...
S2719DGF【27英寸2K电竞】	None None None None None None None None None N...
U2415【24英寸16:10升降旋转】	None None None None None None None None None N...
U2417H【23.8英寸】	None None None None None None None None None N...
U2417H【23.8英寸升降旋转】	None None None None None None None None None N...

pd.pivot_table(data,index = '订单类型',values='追加评论',aggfunc=np.sum,fill_value=0).head()

	追加评论
订单类型
S2419HM【23.8英寸纤薄时尚】	不知你们开hdr再开游戏的时候会不会闪屏不知你们开hdr再开游戏的时候会不会闪屏不知你们...
S2719DGF【27英寸2K电竞】	None None None None None None None None None N...
U2415【24英寸16:10升降旋转】	None None None None None None None None None N...
U2417H【23.8英寸】	None None None None None None None None None N...
U2417H【23.8英寸升降旋转】	None None None None None None None None None N...

交叉表忽略不学。

ending

你可能感兴趣的:(数据分析之Pandas库学习,python,pandas)

飞书二维码联合登录，对接起来太简单了王念博客飞书
1.先创建一个飞书应用2.引入JS库3.自定义jsconstgoto="https://passport.feishu.cn/suite/passport/oauth/authorize?client_id=cli_&redirect_uri=httindex&response_type=code&state=STATE";constQRLoginObj=QRLogin({id:"login_co
企业级RAG开源项目分享：Quivr、MaxKB、Dify、FastGPT、RagFlow Ainnle 开源人工智能
企业级RAGGitHub开源项目深度分享：Quivr、MaxKB、Dify、FastGPT、RagFlow及私有化LLM部署建议随着生成式AI技术的成熟，检索增强生成（RAG）已成为企业构建智能应用的关键技术。RAG技术能够有效地将大型语言模型（LLM）与企业私域知识库连接，在保证数据安全和模型可控性的前提下，释放LLM的强大能力。本文将深入探讨GitHub上五个备受瞩目的开源企业级RAG项目：Q
【全栈】SprintBoot+vue3迷你商城-细节解析（2）：分页杰九 vue.js spring boot java
【全栈】SprintBoot+vue3迷你商城-细节解析（2）：分页往期的文章都在这里啦，大家有兴趣可以看一下后端部分：【全栈】SprintBoot+vue3迷你商城（1）【全栈】SprintBoot+vue3迷你商城（2）【全栈】SprintBoot+vue3迷你商城-扩展：利用python爬虫爬取商品数据【全栈】SprintBoot+vue3迷你商城（3）【全栈】SprintBoot+vue3
有需要2025年参加蓝桥杯比赛的同学往下看！！！岱宗夫up 教程蓝桥杯职场和发展
有需要2025年参加蓝桥杯比赛的同学往下下看！！！以下是关于近两年（2023年和2024年）蓝桥杯Python组考点的详细总结：一、2023年蓝桥杯Python考点分析在2023年的蓝桥杯Python竞赛中，考点主要集中在基础算法、数据结构、动态规划、数学、高精度计算以及二分查找等方面。（一）基础算法基础算法是竞赛的基石，包括枚举、排序（如冒泡排序、选择排序、插入排序等）、搜索（如BFS和DFS）
为AI聊天工具添加一个知识系统之113 详细设计之54 Chance：偶然和适配之2 一水鉴天软件智能智能制造人工语言开发语言人工智能
本文要点要点祖传代码中的”槽“（占位符变量）和它在实操中的三种槽（占据槽，请求槽和填充槽，实时数据库（source）中数据(流入ETL的一个正序流程行列并发靶向整形绑定变量）是如何通过“命名所依的AI行为”、“分类所缘的因果结构”和“求实所据的机器特征”（元数据仓库OLAP的三个行式并行服务进程锚定配形-限定变量）来精确锚定ETL任务绑定中的这个绑定到底是，谁和谁的什么绑定（资源存储库随着ETL的
2024年网络安全最全【玄机】常见攻击事件分析--钓鱼邮件，网络相关+网络安全三方库的源码分析+数据结构与算法 2401_84302583 程序员网络安全学习面试
还有兄弟不知道网络安全面试可以提前刷题吗？费时一周整理的160+网络安全面试题，金九银十，做网络安全面试里的显眼包！王岚嵚工程师面试题（附答案），只能帮兄弟们到这儿了！如果你能答对70%，找一个安全工作，问题不大。对于有1-3年工作经验，想要跳槽的朋友来说，也是很好的温习资料！【完整版领取方式在文末！！】93道网络安全面试题内容实在太多，不一一截图了黑客学习资源推荐最后给大家分享一份全套的网络安全
CTF解题技能之MISC基础（持续更新） l2xcty 网络安全
CTF解题技能之MISC基础文章目录CTF解题技能之MISC基础前言一、文件类型识别二、文件分离1.binwalk分离2.foremost分离3.dd4.fcrackzip5.010editor总结前言本篇主要介绍杂项基础题目的知识点以及所需的工具以及案例。通过百度网盘分享的文件：第二次小组活动链接：https://pan.baidu.com/s/1p02AwZDKCPyGeBbh1YhmDg?p
Ubuntu22 安装多个版本的python 莫忘初心丶 python 数据库开发语言
前言使用pyenv是一个很好的选择，尤其是在需要管理多个Python版本时。它提供了一个简单的方法来安装、切换和管理多个版本的Python，而不必依赖系统的包管理器或update-alternatives。特别是当你需要在同一系统中频繁切换Python版本时，pyenv会显得更加方便。目录前言为什么使用`pyenv`安装`pyenv`1.安装依赖2.安装`pyenv`3.配置shell环境4.安装
python的继承 zhangbeizhen18 L01-基础
记录：备忘录。1.继承classPerson(object):def__init__(self,p_name,p_addr,p_age):self.name=p_nameself.addr=p_addrself.age=p_ageclassGirl(Person):def__init__(self,g_name,g_addr,g_age,g_bra_cup):Person.__init__(sel
咱们一起学C++ 第二百四十八篇之C++中的向上类型转换与拷贝构造函数一杯年华@编程空间咱们一起学习C++c++java 开发语言
咱们一起学C++第二百四十八篇之C++中的向上类型转换与拷贝构造函数大家好呀！我一直觉得学习是一件很有趣的事，尤其是像C++这种功能强大又有点复杂的编程语言。在学习C++的过程中，我发现很多知识点都特别有意思，今天就想和大家一起分享一下C++中的向上类型转换与拷贝构造函数，咱们一起学习进步！一、C++中的向上类型转换（一）什么是向上类型转换在C++里，向上类型转换是个很重要的概念。简单来说，就是把
面试基础--高并发订单系统如何设计 WeiLai1112 后端面试职场和发展
一、总体思路高并发与可扩展采用微服务架构，将订单、用户、商品、支付、库存等功能拆分，服务间通过RPC或消息队列交互。对订单核心数据库进行分库分表，配合缓存（如Redis）减少数据库读写压力。通过消息队列（如Kafka/RabbitMQ）实现异步处理与延迟任务。订单状态机订单通常有多个状态：创建、待支付、已支付、已发货、已签收、已取消等。通过有向状态机实现状态流转，并将状态流转的业务逻辑封装在Ord
面试基础--分布式任务调度系统设计方案 WeiLai1112 后端面试 java 后端架构中间件
分布式任务调度系统设计方案以下是一个基于实际项目经验设计的分布式任务调度系统方案，结合北京互联网大厂面试要求，涵盖架构图、调用关系图、设计图和数据流转时序图。1.系统概述分布式任务调度系统主要用于处理高并发、大规模的任务分发和执行场景。常见应用场景包括：异步任务处理（如邮件发送、消息通知）定时任务调度（如统计报表生成）分布式计算任务（如数据分析）本方案设计一个高可用、可扩展的分布式任务调度系统，包
Go语言操作Redis集群实战指南 Jump小酱
本文还有配套的精品资源，点击获取简介：Redis作为高性能的键值存储数据库，常用于缓存、消息队列等场景。Go语言，因其简洁语法和高效性能，是分布式服务的首选语言。本文将展示如何利用Go语言操作Redis集群，包括安装依赖、配置连接、执行基本操作、处理哈希数据、实现发布订阅功能、事务处理以及错误处理。通过实践案例，读者将学会如何将Redis集群集成到Go应用中，并运用其强大的API来满足不同的开发需
【Golang学习之旅】分布式任务队列（使用 RabbitMQ / Kafka）程序员林北北分布式 golang 学习云原生 kafka rabbitmq java
文章目录前言1.什么是分布式任务队列？1.1消息队列的特点2.为什么使用RabbitMQ和Kafka？2.1RabbitMQ2.2Kafka3.RabbitMQ和Kafka的基本原理3.1RabbitMQ的基本原理3.2Kafka的基本原理前言在微服务架构中，处理异步任务是不可避免的需求。为了处理任务的异步执行，系统需要一个可靠的消息队列机制。消息队列能够保证消息的持久化、顺序性和可靠性，并且能够
主要空间数据挖掘方法 CodeYoung7 总结归纳数据挖掘地理信息
文章出自：http://blog.csdn.net/shaoz/article/details/6847925张新长马林兵等，《地理信息系统数据库》[M]，科学出版社，2005年2月第二章第二节空间数据空间数据挖掘是多学科和多种技术交叉综合的新领域，其挖掘方法以人工智能、专家系统、机器学习、数据库和统计等成熟技术为基础。下面介绍近年来出现的主要空间数据挖掘方法。1、空间分析方法利用GIS的各种空间
aop解决防重复提交小羊炒饭 java spring
背景描述虽然前端控制了按钮不能连续点击，但是在网络信号弱的情况下，仍然会出现第一次点击，请求A网络信号弱，这个时候前端按钮仍然可以点击，然后用户点击第二次。结果两次请求全部成功，数据库生成了两条除了ID以外一模一样的数据。（业务上不允许这种数据出现）解决方式采用AOP，对于不能重复提交的接口在后端加上控制。第一步自定义注解/***@Authorztc*@Description防止重复提交自定义注解
在 Vue 2 中使用 Three.js 导入本地 3D 模型 cherryzm88 web vue2 javascript vue.js 前端 3d
引言Three.js是一个流行的JavaScript库，它能够帮助开发者轻松地在Web页面上创建3D内容。而Vue.js作为前端框架，可以与Three.js结合，构建交互式3DWeb应用。本篇博客将介绍如何在Vue2中使用Three.js加载本地3D模型。1.初始化Vue2项目如果你的项目还没有Vue2环境，可以使用VueCLI初始化：```shvuecreatemy-threejs-appcdm
【MySQL】表空间丢失处理（Tablespace is missing for table 错误处理） m0_74824823 面试学习路线阿里巴巴 mysql 数据库
问题背景最近，我在运行一个基于Python爬虫的项目时，爬虫需要频繁与MySQL数据库交互。不幸的是，在数据爬取过程中，Windows系统突然强制更新并重启。这次意外中断导致MySQL数据库的三个表格（2022年、2023年和2024年的数据表）出现了“Tablespaceismissing”的错误。起初，我尝试了常规的CHECKTABLE和REPAIRTABLE方法，但这些都没有解决问题。最终，
全开源商城源码后台php全端uniapp 全开源可二开功能强大商城系统源码专业软件系统开发源码下载全开源商城源码
内容目录一、详细介绍二、效果展示1.部分代码2.效果图展示三、学习资料下载一、详细介绍内置8中搭配主色(可自行扩展更多配色)、自由快捷切换适应各大行业需求已支持小程序（微信、QQ、百度、支付宝、头条&抖音、快手）+H5+APPApp.vue中修改request_url和static_url地址为自己的商城地址即可使用主题默认为红色(red)，如更改主题App.vue文件中修改default_the
鸿蒙初学者学习手册(HarmonyOSNext_API14)_组件截图（@ohos.arkui.componentSnapshot (组件截图) ）余多多_zZ harmonyos 学习华为鸿蒙鸿蒙系统
前言：这个模块可以截取组件的图片，无论组件是否已加载。截图只能拍到组件本身的大小区域。如果组件或其子组件画得超出了自己的区域，超出的部分不会出现在截图中。截图不会拍到与当前组件平级的（兄弟）组件。模块简介和注意：-XComponent场景建议：如果你正在开发一个视频播放器，应该直接从视频画面获取图片，而不是使用组件的截图功能。-组件截图注意事项：如果有一个按钮，但按钮周围有空白，截图时会显示这些空
threejs将stl文件格式类型转为drc压缩文件类型 ccc陈陈陈 c++前端 javascript
前言项目中通过添加文件后，将stl格式的模型文件加载到场景中，后续发现stl格式文件太大，普遍是十几兆，最后研究出将stl格式文件转为drc格式文件加载，场景加载模型的过程只需要几秒即可，接上来上代码//整个项目是vue3+js的项目，通过vite进行打包，使用的pinia来替代的vuex，因为vuex已经很久没更新最新版本了，pinia是尤大神推荐的库，小伙伴可以了解下，使用方法类似但是更为简便
Kafka消息服务之Java工具类不会飞的小龙人 Java kafka java 消息队列 mq
注：此内容是本人在另一个技术平台发布的历史文章，转载发布到CSDN；ApacheKafka是一个开源分布式事件流平台，也是当前系统开发中流行的高性能消息队列服务，数千家公司使用它来实现高性能数据管道、流分析、数据集成和关键任务应用程序。Kafka可以很好地替代更传统的消息代理。消息代理的使用原因多种多样（将处理与数据生产者分离开来、缓冲未处理的消息等）。与大多数消息系统相比，Kafka具有更好的吞
【数据挖掘】ARFF格式与数据收集布鲁惠比寿数据挖掘数据挖掘人工智能
【数据挖掘】ARFF格式与数据收集三级目录1.ARFF格式与数据收集2.稀疏数据3.属性类型4.缺失值与不正确的值5.了解数据6.知识表达7.聚类机器学习算法训练数据挖掘分析数据共享与交换三级目录1.ARFF格式与数据收集ARFF（Attribute-RelationFileFormat）是一种用于存储数据集的文本文件格式，常用于机器学习和数据挖掘领域。它可以表示结构化数据，包括属性定义、关系信息
Python 继承详解江湖一条鱼 python
继承是面向对象编程（OOP）的一个重要特性，允许一个类（子类）从另一个类（父类）继承属性和方法。继承可以提高代码的重用性，增强程序的可扩展性和可维护性。目录一、继承的作用二、继承的语法1.单继承2.多继承三、子类扩展1.添加新功能2.重写父类方法3.调用父类方法四、继承的特殊情况1.子类初始化父类2.方法解析顺序（MRO）五、抽象类与接口1.抽象类2.接口3.ABC类4.使用方法1.定义抽象基类2
【如何学习商城源码】启山智软商城源码微信小程序小程序 java
学习商城源码是一个系统而深入的过程，需要掌握多种方法和技巧。以下是一些建议，帮助你有效地学习商城源码：一、搭建学习环境准备开发工具编程语言相关：根据商城源码使用的编程语言，安装相应的集成开发环境（IDE）。例如，若源码是Java语言编写的，可安装IntelliJIDEA或Eclipse；若是Python语言，可选择PyCharm等。这些IDE能帮助你高效地编辑、调试代码，提供语法高亮、自动补全等功
从零创建一个 Django 项目 m0_74824823 面试学习路线阿里巴巴 django python 后端
1.准备环境在开始之前，确保你的开发环境满足以下要求：安装了Python(推荐3.8或更高版本)。安装pip包管理工具。如果要使用MySQL或PostgreSQL，确保对应的数据库已安装。创建虚拟环境在项目目录中创建并激活虚拟环境，保证项目依赖隔离：#创建虚拟环境python-mvenvenv#激活虚拟环境#WindowsenvScriptsactivate#Linux/Macsourceenv/
anaconda中的python在pycharm中用不了_Pycharm中使用Anaconda 白白前
Pycharm中使用Anaconda问题：安装完Pycharm和Anaconda后，想让Pycharm能调用Anaconda中包含的各种包。这样就不用重复安装各种包了。Anaconda下载安装Anaconda指的是一个开源的Python发行版本，其包含了conda、Python等180多个科学包及其依赖项。因为包含了大量的科学包，Anaconda的下载文件比较大(约515MB)。安装Anacond
agoda获取酒店数据风云路上想改名笔记 python agoda爬取报错重启
最近改了改代码，正好解决了一些报错问题，更新出来。个别处会加蜜数据库以及线程控制fromDBUtils.PooledDBimportPooledDBimportrequestsimportdemjsonimporttimeimportrandomimportjsonimportpymysqlimportdatetimeimportthreadingb={"user":"root","passwd"
python - 永久存储 susie0815 python python 服务器
打开文件使用open()函数打开文件时，openfilemode（文件打开模式）是一个决定了以何种方式打开文件以及对文件可以进行哪些操作的重要参数。基本模式只读模式（‘r’）默认的打开模式，用于读取文件。如果文件不存在，会抛出FileNotFoundError异常。try:file=open('test.txt','r')content=file.read()print(content)file.
自动化测试的学习路线 Ws＿学习
自动化测试是提高软件开发效率和质量的关键手段。学习自动化测试通常涉及多个方面的技能，从基础的编程语言知识到测试工具的使用，再到实际的测试脚本编写和执行。以下是一个学习自动化测试的路线图，帮助你有条不紊地掌握相关技能：1.基础知识在开始自动化测试之前，首先要具备一定的编程和软件测试基础：编程语言：Python、Java、JavaScript或者Ruby（根据你选择的自动化测试工具决定）软件测试基础：
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_