pandas索引(分组运算，数据聚合，时间重采样，数据可视化，股票数据分析，时间事件日志)

文章目录

- pandas索引
- pandas分组运算
- 数据的聚合运算
- 数据IO
- 时间日期
- 时间重采样
- 数据可视化
- 实例：股票数据分析
- 实例：时间事件日志

pandas索引

1、创建s序列

import pandas as pd
import numpy as np
s = pd.Series(np.random.randn(5),index = list('abcde'))
s
'''
a   -0.206894
b    1.042893
c   -0.495746
d   -0.178118
e    0.531067
dtype: float64
'''

2、s序列的索引

s.index
'''Index(['a', 'b', 'c', 'd', 'e'], dtype='object')'''
s.index.name = 'alpha'
s
'''
alpha
a   -0.206894
b    1.042893
c   -0.495746
d   -0.178118
e    0.531067
dtype: float64
'''

3、创建df的DataFrame

df = pd.DataFrame(np.random.randn(4,3),columns = ['one','two','three'])
df

4、df的行索引，列索引，以及命名

df.index
'''
RangeIndex(start=0, stop=4, step=1)
'''
df.columns
'''
Index(['one', 'two', 'three'], dtype='object')
'''
df.index.name = 'row'
df.columns.name = 'col'
print(df)
'''
col  a  b    c  d
row              
0    0  7  one  0
1    1  6  one  1
2    2  5  one  2
3    3  4  two  0
4    4  3  two  1
5    5  2  two  2
6    6  1  two  3
'''

5、创建多级索引

a  =[['a','a','a','b','b','c','c'],[1,2,3,1,2,2,3]]
t = list(zip(*a))
t
'''
[('a', 1), ('a', 2), ('a', 3), ('b', 1), ('b', 2), ('c', 2), ('c', 3)]
'''
index = pd.MultiIndex.from_tuples(t,names = ['level1','level2'])
index
'''
MultiIndex(levels=[['a', 'b', 'c'], [1, 2, 3]],
           codes=[[0, 0, 0, 1, 1, 2, 2], [0, 1, 2, 0, 1, 1, 2]],
           names=['level1', 'level2'])
'''
s = pd.Series(np.random.rand(7),index = index)
s
'''
level1  level2
a       1         0.561636
        2         0.907344
        3         0.782276
b       1         0.674353
        2         0.203832
c       2         0.591604
        3         0.615422
dtype: float64
'''
df = pd.DataFrame(np.random.randint(1,10,(4,3)),
                 index = [['a','a','b','b'],[1,2,1,2]],
                 columns = [['one','one','two'],['blue','red','blue']])
df.index.names = ['row-1','row-2']
df.columns.names = ['col-1','col-2']
df
'''
col-1        one      two
col-2       blue red blue
row-1 row-2              
a     1        1   1    3
      2        4   4    7
b     1        6   4    9
      2        2   7    3
'''
type(df.loc['a'])
'''
pandas.core.frame.DataFrame
'''
df.loc['a',1]
'''
col-1  col-2
one    blue     1
       red      1
two    blue     3
Name: (a, 1), dtype: int32
'''
#交换
df2 = df.swaplevel('row-1','row-2')
print(df2)
'''
col-1        one      two
col-2       blue red blue
row-2 row-1              
1     a        1   1    3
2     a        4   4    7
1     b        6   4    9
2     b        2   7    3
'''
#排序
df2.sort_index(1)
'''
col-1        one      two
col-2       blue red blue
row-2 row-1              
1     a        1   1    3
2     a        4   4    7
1     b        6   4    9
2     b        2   7    3
'''
#求和
print(df.sum(level = 0))
'''
col-1  one      two
col-2 blue red blue
row-1              
a        5   5   10
b        8  11   12
'''
df = pd.DataFrame({
                  'a':range(7),
                  'b':range (7,0,-1),
                  'c':['one','one','one','two','two','two','two'],
                  'd':[0,1,2,0,1,2,3]})
df 
'''
  a  b    c  d
0  0  7  one  0
1  1  6  one  1
2  2  5  one  2
3  3  4  two  0
4  4  3  two  1
5  5  2  two  2
6  6  1  two  3
'''
print(df2.reset_index().sort_index('columns'))
'''
col-1  one     row-1 row-2  two
col-2 blue red             blue
0        1   1     a     1    3
1        4   4     a     2    7
2        6   4     b     1    9
3        2   7     b     2    3
'''

pandas分组运算

1、分组计算三部曲：
拆分、应用、合并
拆分：根据什么进行分组
应用：每个分组进行什么样的计算
合并：把每个分组的计算结果合并起来。

2、对Series,DataFrame的分组

import pandas as pd
import numpy as np
df = pd.DataFrame({'key1':['a','a','b','b','a'],
                   'key2':['one','two','one','two','one'],
                   'data1':np.random.randint(1,10,5),
                   'data2':np.random.randint(1,10,5)})
print(df)
'''
  key1 key2  data1  data2
0    a  one      9      3
1    a  two      3      8
2    b  one      2      5
3    b  two      3      4
4    a  one      9      7
'''

对Series的分组

df['data1'].groupby(df['key1']).mean()
'''
key1
a    7.0
b    2.5
'''
#自己创建key
key = [1,2,1,1,2]
df['data1'].groupby(key).mean()
'''
1    4.666667
2    6.000000
'''
#自己创建的key可为多层列表(求和)
df['data1'].groupby([df['key1'],df['key2']]).sum()
'''
key1  key2
a     one     18
      two      3
b     one      2
      two      3
'''
#求个数
df['data1'].groupby([df['key1'],df['key2']]).size()
key1  key2
a     one     2
      two     1
b     one     1
      two     1
Name: data1, dtype: int64
#key1，key2分组求和转化成DataFrame
mean = df.groupby(['key1','key2']).sum()['data1']
mean
'''
key1  key2
a     one     18
      two      3
b     one      2
      two      3
'''
print(mean.unstack())
'''
key2  one  two
key1          
a      18    3
b       2    3
'''
#for迭代
for name,group in df.groupby('key1'):
    print (name)
    print (group)
'''
a
  key1 key2  data1  data2
0    a  one      9      3
1    a  two      3      8
4    a  one      9      7
b
  key1 key2  data1  data2
2    b  one      2      5
3    b  two      3      4
'''
#转化成字典
dict(list(df.groupby('key1')))
'''
{'a':   key1 key2  data1  data2
 0    a  one      9      3
 1    a  two      3      8
 4    a  one      9      7, 'b':   key1 key2  data1  data2
 2    b  one      2      5
 3    b  two      3      4}
'''
#每一列的数据类型
df.dtypes
'''
key1     object
key2     object
data1     int32
data2     int32
'''
#根据dtypes按列分组
df.groupby(df.dtypes,axis = 1).sum()
'''
   int32
0     27
1     19
2     26
3     24
4     24
'''

3、通过函数进行分组

df = pd.DataFrame(np.random.randint(1,10,(5,5)),
                  columns = ['a','b','c','d','e'],
                  index = ['Alice','Bob','Candy','Dark','Emily'])
df.ix[1,1:3] = np.NaN
df
'''
       a    b    c  d  e
Alice  6  3.0  3.0  9  3
Bob    7  NaN  NaN  2  3
Candy  9  6.0  3.0  7  8
Dark   3  9.0  9.0  3  7
Emily  3  5.0  6.0  3  3
'''
mapping = {'a':'red','b':'red','c':'blue','d':'orange','e':'blue'}
grouped = df.groupby(mapping,axis = 1)
grouped.sum()
'''
      blue  orange  red
Alice   3.0     6.0  7.0
Bob     2.0     7.0  8.0
Candy   6.0     9.0  4.0
Dark    5.0     8.0  8.0
Emily   8.0     3.0  7.0
'''
grouped.size()
'''
blue      2
orange    1
red       2
'''
grouped.count()
'''
       blue  orange  red
Alice     2       1    2
Bob       1       1    1
Candy     2       1    2
Dark      2       1    2
Emily     2       1    2
'''

通过索引级别进行分组（多级索引分组）

df = pd.DataFrame(np.random.randint(1,10,(5,5)),
                 columns = ['a','b','c','d','e'],
                 index = ['Alice','Bob','Candy','Dark','Emily'])
'''
      a  b  c  d  e
Alice  1  8  6  6  3
Bob    6  3  8  6  1
Candy  7  7  5  6  5
Dark   9  5  2  5  5
Emily  9  8  7  3  7
'''
def _group_key(idx):
    print(idx)
    return len(idx)
df.groupby(_group_key).size()
'''
Alice
Bob
Candy
Dark
Emily
Out[32]:
3    1
4    1
5    3
'''
print(df.groupby(len).sum())
'''
   a   b   c   d   e
3   6   3   8   6   1
4   9   5   2   5   5
5  17  23  18  15  15
'''
columns = pd.MultiIndex.from_arrays([['China','USA','China','USA','China'],
                                    ['A','A','B','C','B']],names = ['country','index'])
df = pd.DataFrame(np.random.randint(1,10,(5,5)),columns = columns)
df
'''
       a  b  c  d  e
Alice  1  8  6  6  3
Bob    6  3  8  6  1
Candy  7  7  5  6  5
Dark   9  5  2  5  5
Emily  9  8  7  3  7
'''
print(df.groupby(level = 'country',axis = 1).sum())
'''
country  China  USA
0            9    9
1           22    9
2           10    4
3           19    7
4           20   11
'''
print(df.groupby(level = 'index',axis=1).sum())
'''
index   A   B  C
0       4   7  7
1      14  13  4
2       4   8  2
3       9  11  6
4      11  11  9
'''

数据的聚合运算

1、内置聚合函数

df = pd.DataFrame({'key1':['a','a','b','b','a'],
                  'key2':['one','two','one','two','one'],
                  'data1':np.random.randint(1,10,5),
                  'data2':np.random.randint(1,10,5)})
print(df)
#根据key1分组求各类函数计算
df.groupby('key1').describe()  #max(),mean(),min(),sum()

2、自定义聚合函数agg

grouped = df.groupby('key1')
def peek_range(s):
    print(type(s))
    return s.max()-s.min()
grouped.agg(peek_range)

结果如下：

grouped.agg(['std','mean','sum',('range',peek_range)])

结果如下：

d ={'data1':['mean',('range',peek_range)],
    'data2':'sum'}
grouped.agg(d)

结果如下：

#不把key1当做索引
grouped.agg(d).reset_index()
df.groupby('key1',as_index = False).agg(d)

3、不同的列应用不同聚合函数

#新加两列（方法一）
df = pd.DataFrame({'key1':['a','a','b','b','a'],
                  'key2':['one','two','one','two','one'],
                  'data1':np.random.randint(1,10,5),
                  'data2':np.random.randint(1,10,5)})
df
k1_mean = df.groupby('key1').mean().add_prefix('mean_')
k1_mean
pd.merge(df,k1_mean,left_on = 'key1',right_index=True)
#方法二
k1_mean = df.groupby('key1').transform(np.mean).add_prefix('mean_')
k1_mean
df[k1_mean.columns] = k1_mean
df

结果如下：

用自定义函数调用transform（矩平方）

df = pd.DataFrame(np.random.randint(1,10,(5,5)),
                 columns = ['a','b','c','d','e'],
                 index = ['Alice','Bob','Candy','Dark','Emily'])
print(df)
def demean(s):
    return s - s.mean()

key = ['one','one','two','one','two']
demeaned = df.groupby(key).transform(demean)
demeaned

demeaned.groupby(key).mean()

聚合分组运算column方法

df = pd.DataFrame({'key1':['a','a','b','b','a','a','b','a','a','b'],
                   'key2':['one','two','one','two','one','one','two','one','one','two'],
                   'data1':np.random.randint(1,10,10),
                   'data2':np.random.randint(1,10,10)})
print(df)
def top(g,n = 2,column = 'data1'):
    return g.sort_values(by = column,ascending = False)[:n]
top(df,n=3)
df.groupby('key1').apply(top,n=3,column = 'data2')

结果如下：

states = ['Ohio','New York','Vermont','Florida',
          'Oregon','Nevada','Califrnia','Idaho']
group_key = ['East']*4+['West']*4
data = pd.Series(np.random.randn(8),index = states)
data[['Vermont','Nevada','Idaho']] = np.nan
data
'''
Ohio         1.138370
New York    -2.095708
Vermont           NaN
Florida      0.845250
Oregon       0.610225
Nevada            NaN
Califrnia   -0.173735
Idaho             NaN
'''
data.groupby(group_key).mean()
'''
East   -0.037362
West    0.218245
'''
data.groupby(group_key).apply(lambda g :g.fillna(g.mean()))
'''
Ohio         1.138370
New York    -2.095708
Vermont     -0.037362
Florida      0.845250
Oregon       0.610225
Nevada       0.218245
Califrnia   -0.173735
Idaho        0.218245
'''

数据IO

1、索引：将一个列或者多个列读取出来构成DataFrame。其中涉及是否从文件中读取索引以及列名
2、类型推断和数据转换:包括用户自定义的转换以及缺失值标记
3、日期解析
4、迭代：针对大文件进行逐块迭代。
5、不规整数据问题：跳过一些行，或注释等

数据的导入导出
1、数据的读入：

df = pd.read_csv('cho4/ex5_out.csv')
df

2、数据的导出：

df.to_csv('cho4/ex5_out.csv',index = False,header = None,columns = ['b','c','message'],sep = '|')

时间日期

时间戳timestamp：固定的时刻
固定时期period
时间间隔interval：由起始时间和结束时间来表示。

1、python里的datetime

import pandas as pd
import numpy as np
from datetime import datetime
from datetime import timedelta
now = datetime.now()
now
'''
datetime.datetime(2020, 6, 8, 16, 8, 13, 972841)
'''
now.year,now.month,now.day
'''
(2020, 6, 8)
'''
#时间差
data1 = datetime(2020,4,20)
date2 = datetime(2020,4,16)
delta = data1 - date2
delta
'''
datetime.timedelta(days=4)
'''
delta.days
4
delta.total_seconds()
'''345600.0'''
date2+delta
'''datetime.datetime(2020, 4, 20, 0, 0)'''
date2+timedelta(4.5)
'''datetime.datetime(2020, 4, 20, 12, 0)
'''
date = datetime(2020,3,20,8,30)
date
'''datetime.datetime(2020, 3, 20, 8, 30)'''
str(date)
'''2020-03-20 08:30:00'  '''
date.strftime("%y/%m/%d %H:%M:%S")
''
'20/03/20 08:30:00'
'''
datetime.strptime('2020-03-20 09:30','%Y-%m-%d %H:%M')
'''datetime.datetime(2020, 3, 20, 9, 30)
'''

2、时间序列

dates = [datetime(2020,3,1),datetime(2020,3,2),datetime(2020,3,3),datetime(2020,3,4)]
s= pd.Series(np.random.randn(4),index = dates)
s

2020-03-01 -0.929979
2020-03-02 -0.780578
2020-03-03 0.661065
2020-03-04 -0.795269

type(s.index)
pandas.core.indexes.datetimes.DatetimeInde
type(s.index[0])
pandas._libs.tslibs.timestamps.Timestamp
#生成时间戳
pd.date_range('20200320 16:32:38',periods = 10,normalize = True)
DatetimeIndex(['2020-03-20', '2020-03-21', '2020-03-22', '2020-03-23',
               '2020-03-24', '2020-03-25', '2020-03-26', '2020-03-27',
               '2020-03-28', '2020-03-29'],
              dtype='datetime64[ns]', freq='D')
pd.date_range(start = '20200320',periods = 10,freq = 'M')
DatetimeIndex(['2020-03-31', '2020-04-30', '2020-05-31', '2020-06-30',
               '2020-07-31', '2020-08-31', '2020-09-30', '2020-10-31',
               '2020-11-30', '2020-12-31'],
              dtype='datetime64[ns]', freq='M')
p = pd.Period(2010,freq = 'M')
p
Period('2010-01', 'M'
p + 2
Period('2010-03', 'M')

3、生成日期范围和时间频率及其转换

pd.period_range('2020-01','2020-12',freq = 'M')
PeriodIndex(['2020-01', '2020-02', '2020-03', '2020-04', '2020-05', '2020-06',
             '2020-07', '2020-08', '2020-09', '2020-10', '2020-11', '2020-12'],
            dtype='period[M]', freq='M')
pd.period_range('2020Q1',periods = 10,freq = 'Q')
PeriodIndex(['2020Q1', '2020Q2', '2020Q3', '2020Q4', '2021Q1', '2021Q2',
             '2021Q3', '2021Q4', '2022Q1', '2022Q2'],
            dtype='period[Q-DEC]', freq='Q-DEC')

a = pd.Period(2020)
a
Period('2020', 'A-DEC')
a.asfreq('M',how = 'start')
Period('2020-01', 'M')
p = pd.Period('2020-04',freq = 'M')
p
Period('2020-04', 'M')
p.asfreq('A-DEC')
Period('2020', 'A-DEC')
p.asfreq('A-MAR')
Period('2021', 'A-MAR')
p = pd.Period('2020Q4','Q-JAN')
p
Period('2020Q4', 'Q-JAN')
#转化后
p.asfreq('M',how = 'start'),p.asfreq('M',how = 'end')
(Period('2019-11', 'M'), Period('2020-01', 'M'))
#获取该季度倒数第二个工作日下午4点20分
(p.asfreq('B')-1).asfreq('T')+16*60+20
Period('2020-01-31 16:19', 'T')

时间重采样

1、降采样：高频率 ——低频率
2、升采样：低频率——高频率
3、其他采样：如每周三（W-WED）转换为每周五（W-FRI）

timestamp和Period相互转换

#时间戳的时间序列转换为基于时期的序列
s = pd.Series(np.random.randn(5),index = pd.date_range('2020-04-01',periods = 5,freq = 'M'))
s
s.to_period()

#时间序列转换为Period
ts = pd.Series(np.random.randn(5),index = pd.date_range('2020-12-29',periods = 5,freq = 'D'))
ts
pts = ts.to_period(freq = 'M')
pts
pts.index
PeriodIndex(['2020-12', '2020-12', '2020-12', '2021-01', '2021-01'], dtype='period[M]', freq='M')
#合并
pts.groupby(level = 0).sum()
#转换成时间戳
pts.to_timestamp(how = 'end')

重采样

ts = pd.Series(np.random.randint(0,50,60),index = pd.date_range('2020-04-25 09:30',periods = 60,freq = 'T'))
ts
#每5分钟的数据
ts.resample('5min',how = 'sum',label = 'right')
ts.resample('5min',how = 'ohlc')

#通过groupby重采样
ts = pd.Series(np.random.randint(0,50,100),index = pd.date_range('2020-03-01 ',periods = 100,freq = 'D'))
ts
ts.groupby(lambda x:x.month).sum()
ts.groupby(ts.index.to_period('M')).sum()
df = pd.DataFrame(np.random.randint(1,50,2),index = pd.date_range('2020-04-22',periods = 2,freq = 'W-FRI'))
df
df.resample('D',fill_method = 'ffill',limit = 3)
df.resample('W-MON',fill_method = 'ffill')
#DataFrame重采样
df = pd.DataFrame(np.random.randint(2,30,(24,4)),
                 index = pd.period_range('2020-01','2021-12',freq = 'M'),
                 columns = list('ABCD'))
df
df.resample('A-MAR',how = 'sum')

数据可视化

1、线形图

%matplotlib inline
import pandas as pd
import numpy as np
ts =pd.Series(np.random.randn(1000),index = pd.date_range('2000/1/1',periods = 1000))
ts = ts.cumsum()
ts.describe()
'''
count    1000.000000
mean      -12.174947
std        10.107622
min       -37.407623
25%       -17.154878
50%       -11.377877
75%        -5.015530
max         7.568705
'''
ts.plot(title = 'cumsum',style = 'r-',figsize=(8,6));

df = pd.DataFrame(np.random.randn(1000,4),index = ts.index,columns = list("ABCD"))
df = df.cumsum()
df.describe()
'''                 A            B            C            D
count  1000.000000  1000.000000  1000.000000  1000.000000
mean     30.752918    -6.230675     5.665692     3.441014
std      13.410542     6.858038    16.830513     7.712553
min       2.941364   -24.438904   -20.542397    -9.713529
25%      18.600660   -10.927068    -9.766875    -3.046695
50%      30.680158    -7.450857     3.328111     1.749199
75%      40.536079    -1.211294    22.291788    10.100250
max      68.939141    11.776751    39.743450    21.136880
'''
df.plot(subplots = True,figsize =(6,12),sharey = True);

df['ID'] = np.arange(len(df))
print(df.describe())
'''
                 A            B            C            D           ID
count  1000.000000  1000.000000  1000.000000  1000.000000  1000.000000
mean     30.752918    -6.230675     5.665692     3.441014   499.500000
std      13.410542     6.858038    16.830513     7.712553   288.819436
min       2.941364   -24.438904   -20.542397    -9.713529     0.000000
25%      18.600660   -10.927068    -9.766875    -3.046695   249.750000
50%      30.680158    -7.450857     3.328111     1.749199   499.500000
75%      40.536079    -1.211294    22.291788    10.100250   749.250000
max      68.939141    11.776751    39.743450    21.136880   999.000000
'''
df.plot(x = 'ID',y = ['A','C'])

2、柱状图

df = pd.DataFrame(np.random.rand(10,4),columns = ['A','B','C','D'])
df
df.ix[0].plot(kind = 'bar')

df.plot.barh(stacked = True)

3、直方图

df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),
                  'c':np.random.randn(1000)-1},columns = ['a','b','c'])
df
df['a'].hist(bins = 20)

df.plot.hist(subplots = True,sharex = True,sharey = True);

df.plot.hist(alpha = 0.3,stacked = True)

4、概率密度图

df['a'].plot.kde()

df.plot.kde()

5、散点图

df = pd.DataFrame(np.random.rand(10,4),columns = ['a','b','c','d'])
df
df.plot.scatter(x='a',y='c');

df = pd.DataFrame({'a':np.concatenate([np.random.normal(0,1,200),np.random.normal(6,1,200)]),
                   'b':np.concatenate([np.random.normal(10,2,200),np.random.normal(0,2,200)]),
                   'c':np.concatenate([np.random.normal(10,4,200),np.random.normal(0,4,200)])})
df.describe()
df.plot.scatter(x ='a',y='c')

6、饼图

s = pd.Series(3 * np.random.rand(4),index = ['a','b','c','d'],name = 'series')
s
s.plot.pie(figsize =(6,6),labels = ["AA","BB","CC","DD"],autopct = "%0.2f",fontsize = 20)

实例：股票数据分析

股票数据获取

%matplotlib inline
import pandas as pd
import numpy as np
import os
import matplotlib.pyplot as plt
ls yahoo-data
data = pd.read_csv('yahoo-data/600690.csv',index_col = "Date",parse_dates = True)
data

股票波动幅度分析

#除群数据
adj_price = data['Adj Close']
adj_price
#重采样
resampled = adj_price.resample('m',how = 'ohlc')
resampled
#波动幅度 = （最高价-最低价）/最低价
ripple = (resampled.high - resampled.low)/resampled.low
ripple
#取平均值
ripple.mean()
#画图
adj_price.plot(figsize =(8,6))

#最大波动幅度
(adj_price.max()-adj_price.min())/(adj_price.min())
'''
1112.2977809591985
'''

**年平均增长幅度 **

total_growth = adj_price.ix[0]/adj_price.ix[-1]
total_growth
old_date = adj_price.index[-1]
new_date =adj_price.index[0]
old_date.year,new_date.year
#复合增长率
total_growth**(1.0/(new_date.year - old_date.year))
#分组
price_in_year = adj_price.to_period("A").groupby(level=0).first()
price_in_year
#画图
price_in_year.plot()

判断每年变化情况

diff = price_in_year.diff()
diff
#每年的增长率
rate = diff/(price_in_year - diff)
rate
#画图
rate.plot(kind = 'bar')

实例：时间事件日志

个人时间统计工具。要点：

使用 dida365.com 来作为 GTD 工具
使用特殊格式记录事件类别和花费的时间，练习数据下载
导出数据
分析数据

数据读取

%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
# 定义解析函数
from matplotlib.pylab import mpl
mpl.rcParams['font.sans-serif'] = ['Arial Unicode MS'] #指定默认字体
mpl.rcParams['axes.unicode_minus'] = False #解决保存图像是负号‘-’显示为方块的问题
# 定义时间解析函数
def _parse_date(dsstr):
    return pd.Timestamp(dsstr).date()
ata = pd.read_csv('data/dida365.csv', header=3, index_col='Due Date', parse_dates=True, date_parser=_date_parser)
ata

数据清洗
只关心己完成或己达成的事件，即 status != 0 的事件
只需要 List Name 和 Title 字段

df = data[data.Status != 0][['List Name','Title']]
df

数据解析
解析事件类别和和花费的时间

import re

# 定义标签解析函数
def parse_tag(value):
    m = re.match(r'^(\[(.*?)\])?.*$', value)
    if m and m.group(2):
        return m.group(2)
    else:
        return '其他'

# 定义时间解析函数
def parse_duration(value):
    m = re.match(r'^.+?\[(.*?)([hm]?)\]$', value)
    if m:
        dur = 0
        try:
            dur = float(m.group(1))
        except e:
            print('parse duration error: \n%s' % e)
        if m.group(2) == 'm':
            dur = dur / 60.0
        return dur
    else:
        return 0
    
titles = df['Title']
df['Tag'] = titles.map(parse_tag)
df['Duration'] = titles.map(parse_duration)
df.head()

df.count()

[Out:]
List Name    232
Title        232
Tag          232
Duration     232
dtype: int64

# 数据起始时间
start_date = df.index.min().date()
start_date

[Out:]
datetime.date(2015, 12, 2)

# 截止时间
end_date = df.index.max().date()
end_date

[Out:]
datetime.date(2016, 5, 24)

数据分析
时间总览
平均每天投资在自己身上的时间是多少？-> 全部时间 / 总天数

end_date - start_date

[Out:]
datetime.timedelta(174)

df['Duration'].sum() 

[Out:]
482.19999999999999

df['Duration'].sum() / (end_date - start_date).days
2.7712643678160918

精力分配

tag_list = df.groupby(['Tag']).sum()
tag_list

tag_list.Duration.plot(kind = 'pie',figsize = (8,8),fontsize = 16,autopct = '%1.02f')

专注力
长时间学习某项技能的能力

programming = df[df.Tag == '编程']
programming
programming.Duration.plot(kind = 'bar',figsize =(16,8))

m = programming.resample('m',how ='sum').to_period(freq ='m')
m
m.Duration.plot(kind ='bar',figsize = (8,8))

df.ix[-6:-1].pivot(columns ='Tag',values = 'Duration')
df2 = df.reset_index().groupby(['Due Date','Tag']).sum()
df2
df3 = df2.reset_index().pivot(index = 'Due Date',columns = 'Tag',values = 'Duration')
df3
df3.fillna(0)
# 补足连续时间，可以看到哪些天没有在学习
df4 = df3.reindex(pd.date_range(start_date,end_date)).fillna(0)
df4

# 画出柱状图
full_dates.plot(kind='bar', stacked=True, figsize=(16, 8))

df4.resample('m',how = 'sum').to_period(freq = 'm').plot(kind = 'bar',figsize = (8,8),stacked = True)

你可能感兴趣的:(pandas索引(分组运算，数据聚合，时间重采样，数据可视化，股票数据分析，时间事件日志))

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
30天风格练习-DAY2 黄希夷
Day2（重义）在一个周日/一周的最后一天，我来到位于市中心/市区繁华地带的一家购物中心/商场，中心内人很多/熙熙攘攘。我注意到/看见一个独行/孤身一人的年轻女孩/，留着一头引人注目/长过腰际的头发，上身穿一件暗红色/比正红色更深的衣服/穿在身体上的东西。走下扶梯的时候，她摔倒了/跌向地面，在她正要站起来/让身体离开地面的时候，过长/超过一般人长度的头发被支撑身体/躯干的手掌压/按在下面，她赶紧用
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
感赏日志133 马姐读书
图片发自App感赏自己今天买个扫地机，以后可以解放出来多看点书，让这个智能小机器人替我工作了。感赏孩子最近进步很大，每天按时上学，认真听课，认真背书，主动认真完成老师布置的作业。感赏自己明白自己容易受到某人的影响，心情不好，每当此刻我就会舒缓，感赏，让自己尽快抽离，想好的一面。感赏儿子今天在我提醒他事情时，告诉我谢谢妈妈对我的提醒我明白了，而不是说我啰嗦，管事情，孩子更懂事了，懂得感恩了。投射父母
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
郎朗大婚娶公主：所有光环的背后，都是十年如一日的自律简小尘
近日，关于郎朗大婚的新闻上了热搜，看了新娘的照片，既有天使般的面容，更有魔鬼般的身材，关键是人家还身世好，又有才华，这真的是让所有男人羡慕嫉妒恨哪。有些人不禁会想，“凭什么郎朗的人生就象开挂了一样，可我却每天都活得这么狼狈！”其实，每个开挂的人生背后，都是苦行僧般的自律。01欲戴王冠，必承其重。练琴不能只靠兴趣，更需要自律！我们先来看一下朗朗在小时候的作息时间表：早晨5:45起床，练琴1小时。中午
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S