不秃头小白

利用python进行数据分析之时间序列--小白笔记

时间序列（time series）数据是一种重要的结构化数据形式。

时间戳（timestamp），特定的时刻
固定时期（period），如2007年1月或2010年全年
时间间隔（interval），由起始和结束时间戳表示。时期（period）可以被看做间隔（interval）的特例
实验或过程时间，每个时间点都是相对于特定起始时间的一个度量

import numpy as np
import pandas as pd 

import datetime,time
from datetime import datetime

日期和时间数据类型及工具

python标准库包含用于日期（date）和时间（time）数据的数据类型，而且还有日历方面的功能。

主要用到datetime、time以及calendar模块

datetime.datetime是用到最多的数据类型

now=datetime.now()
now

datetime.datetime(2023, 9, 8, 15, 48, 53, 805615)

now.year,now.month,now.day

(2023, 9, 8)

datetime以毫秒形式存储日期和时间。timedelta表示两个datetime对象之间的时间差

delta=datetime(2011,1,7)-datetime(2008,6,24,8,15)
delta

datetime.timedelta(days=926, seconds=56700)

delta.days,delta.seconds

(926, 56700)

可以给datetime对象加上（或减去）一个或多个timedelta，这样会产生一个新对象

from datetime import timedelta
start=datetime(2011,1,7)
start+timedelta(12)

datetime.datetime(2011, 1, 19, 0, 0)

start-2*timedelta(12)

datetime.datetime(2010, 12, 14, 0, 0)

datetime模块中的数据类型

类型	说明
date	以公历形式存储日历日期（年、月、日）
time	将时间存储为时、分、秒、毫秒
datetime	存储日期和时间
timedelta	表示两个datetime值之间的差（日、秒、毫秒）

字符串和datetime的相互转换

利用str或strftime方法（传入一个格式化字符串），datetime对象和pandas的timestamp对象可以被格式化为字符串

stamp=datetime(2011,1,3)
str(stamp)

'2011-01-03 00:00:00'

stamp.strftime('%Y-%m-%d')

'2011-01-03'

datetime格式定义

代码	说明
%Y	4位数的年
%y	2位数的年
%m	2位数的月
%d	2位数的日
%H	时（24小时制）
%l	时（12小时制）
%M	2位数的分
%S	秒00-61(秒60和61用于表示闰秒)
%w	用整数表示的星期几
%U	每年的第几周，星期天被认为每周的第一天
%W	每年的第几周，星期一被认为每周的第一天
%z	以+HHMM或-HHMM表示UTC时区偏移量。市区为naive，返回空字符串
%F	%Y-%m-%d
%D	%m/%d/%y

datetime.strptime可以用这些格式化编码将字符串转换为日期

value='2011-01-03'
datetime.strptime(value,'%Y-%m-%d')

datetime.datetime(2011, 1, 3, 0, 0)

datestrs=['7/6/2011','8/6/2011']
[datetime.strptime(x,'%m/%d/%Y') for x in datestrs]

[datetime.datetime(2011, 7, 6, 0, 0), datetime.datetime(2011, 8, 6, 0, 0)]

datetime.strptime是通过已知格式进行日期解析的一种方式

dateutil这个第三方包中的parser.parser方法可以直接解析日期格式

from dateutil.parser import parse
parse('2011-01-03')

datetime.datetime(2011, 1, 3, 0, 0)

parse('Jan 31 2011 10:45 PM')

datetime.datetime(2011, 1, 31, 22, 45)

在国际通用的格式中，日出现在月的前面很普遍，传入dayfirst=True即可解决这个问题

parse('6/11/2011',dayfirst=True)

datetime.datetime(2011, 11, 6, 0, 0)

pandas通常处理成组日期，不管这些日期是DateFrame的轴索引还是列。to_datetime方法可以解析多种不同的日期表现形式。对标准日期格式的解析非常快

datestrs=['2011-07-06 12:00:00','2011-08-06 00:00:00']
pd.to_datetime(datestrs)

DatetimeIndex(['2011-07-06 12:00:00', '2011-08-06 00:00:00'], dtype='datetime64[ns]', freq=None)

还可以处理缺失值（None、空字符串）

idx=pd.to_datetime(datestrs+[None])
idx

DatetimeIndex(['2011-07-06 12:00:00', '2011-08-06 00:00:00', 'NaT'], dtype='datetime64[ns]', freq=None)

idx[2]

NaT

pd.isnull(idx)

array([False, False,  True])

NaT(Not a Time)是pandas中时间戳数据的null值

注：dateutil.parser是一个实用但不完美的工具。比如，他会把一些原本不是日期的字符串认作日期

时间序列基础

pandas最基本的时间序列类型就是以时间戳（通常以Python字符串或datetime对象表示）为索引的Series

from datetime import datetime 
dates = [datetime(2011, 1, 2), datetime(2011, 1, 5),
         datetime(2011, 1, 7), datetime(2011, 1, 8),
         datetime(2011, 1, 10), datetime(2011, 1, 12)]
ts=pd.Series(np.random.randn(6),index=dates)
ts

2011-01-02   -0.399861
2011-01-05    0.403928
2011-01-07    0.193208
2011-01-08   -0.750923
2011-01-10    1.727515
2011-01-12    1.031623
dtype: float64

这些datetime对象实际上是被放在一个DatetimeIndex中

ts.index

DatetimeIndex(['2011-01-02', '2011-01-05', '2011-01-07', '2011-01-08',
               '2011-01-10', '2011-01-12'],
              dtype='datetime64[ns]', freq=None)

跟其他Series一样，不同索引的时间序列之间的算术运算会自动按日期对齐

ts+ts[::2]#ts[::2]每隔两个取一个

2011-01-02   -0.799723
2011-01-05         NaN
2011-01-07    0.386416
2011-01-08         NaN
2011-01-10    3.455029
2011-01-12         NaN
dtype: float64

pandas用Numpy的datetime64数据类型以纳秒的形式存储时间戳

ts.index.dtype

dtype('

 
  DatetimeIndex中的各个标量值是pandas的Timestamp对象 
  stamps=ts.index[0]
stamps
 
  Timestamp('2011-01-02 00:00:00')
 
  索引、选取、子集构造 
  当你根据标签索引选取数据时，时间序列和其他pandas.Series很像 
  stamp=ts.index[2]
ts[stamp]
 
  0.19320782215895874
 
  还可以传入一个可以被解释为日期的字符串 
  ts['1/07/2011']
 
  0.19320782215895874
 
  ts['20110107']
 
  0.19320782215895874
 
  对于较长的时间序列，只需传入“年”或“年月”即可进行数据切片 
  longer_ts=pd.Series(np.random.randn(1000),index=pd.date_range('1/1/2000',periods=1000))
longer_ts
 
  2000-01-01   -0.994092
2000-01-02    0.243258
2000-01-03    0.929323
2000-01-04   -0.168871
2000-01-05   -0.381879
                ...   
2002-09-22   -1.876726
2002-09-23   -0.611525
2002-09-24   -0.515910
2002-09-25   -0.282035
2002-09-26    0.787776
Freq: D, Length: 1000, dtype: float64
 
  longer_ts['2001']
 
  2001-01-01    1.009665
2001-01-02   -0.824374
2001-01-03    2.138398
2001-01-04   -1.191215
2001-01-05   -1.053082
                ...   
2001-12-27    0.819645
2001-12-28   -0.743881
2001-12-29    0.633011
2001-12-30    0.733222
2001-12-31    0.497886
Freq: D, Length: 365, dtype: float64
 
  longer_ts['2001-05']
 
  2001-05-01   -2.195268
2001-05-02    0.419152
2001-05-03   -0.709574
2001-05-04   -1.131150
2001-05-05   -0.244608
2001-05-06    0.050070
2001-05-07    0.141571
2001-05-08   -1.966103
2001-05-09   -1.262891
2001-05-10    2.052505
2001-05-11    0.132736
2001-05-12   -0.870929
2001-05-13    0.997271
2001-05-14    0.032981
2001-05-15   -1.039543
2001-05-16    0.753542
2001-05-17    0.132935
2001-05-18   -0.794148
2001-05-19    0.490096
2001-05-20    1.279849
2001-05-21   -0.347668
2001-05-22    0.685715
2001-05-23    0.756410
2001-05-24   -0.073984
2001-05-25   -1.147314
2001-05-26    0.606999
2001-05-27   -0.427986
2001-05-28   -0.242120
2001-05-29   -0.250834
2001-05-30   -2.505071
2001-05-31    0.674570
Freq: D, dtype: float64
 
  ts[datetime(2011,1,7):]
 
  2011-01-07    0.193208
2011-01-08   -0.750923
2011-01-10    1.727515
2011-01-12    1.031623
dtype: float64
 
  由于大部分时间序列数据都是按照时间先后排序的，因此你也可以用不存在于该时间序列中的时间戳对其进行切片（即范围查询） 
  ts
 
  2011-01-02   -0.399861
2011-01-05    0.403928
2011-01-07    0.193208
2011-01-08   -0.750923
2011-01-10    1.727515
2011-01-12    1.031623
dtype: float64
 
  ts['1/6/2011':'1/11/2011']
 
  2011-01-07    0.193208
2011-01-08   -0.750923
2011-01-10    1.727515
dtype: float64
 
  一个等价的实例方法truncate也可以截取两个日期之间的TimeSeries 
  ts.truncate(after='1/9/2011')
 
  2011-01-02   -0.399861
2011-01-05    0.403928
2011-01-07    0.193208
2011-01-08   -0.750923
dtype: float64
 
  对DateFrame也有效 
  dates = pd.date_range('1/1/2000', periods=100, freq='W-WED')
long_df = pd.DataFrame(np.random.randn(100, 4),
                       index=dates,
                       columns=['Colorado', 'Texas','New York', 'Ohio'])
long_df
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2000-01-05 
     -0.405523 
     0.908071 
     1.822543 
     -0.562963 
     
     
     2000-01-12 
     -0.049467 
     0.485990 
     -0.279052 
     -0.723333 
     
     
     2000-01-19 
     0.750311 
     1.042382 
     0.225140 
     1.395041 
     
     
     2000-01-26 
     0.270467 
     0.469076 
     0.040557 
     0.113861 
     
     
     2000-02-02 
     0.439021 
     -0.097106 
     -0.970282 
     0.491808 
     
     
     ... 
     ... 
     ... 
     ... 
     ... 
     
     
     2001-10-31 
     0.515944 
     -0.564199 
     -0.286108 
     1.551582 
     
     
     2001-11-07 
     1.012778 
     -0.002377 
     -2.118233 
     -0.595119 
     
     
     2001-11-14 
     0.568788 
     -0.546481 
     -0.688155 
     -0.106262 
     
     
     2001-11-21 
     0.404215 
     0.649409 
     -0.479882 
     -0.521904 
     
     
     2001-11-28 
     1.975573 
     -1.068704 
     1.411288 
     -0.924625 
     
    
   
  100 rows × 4 columns 
  long_df.loc['5-2001']
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2001-05-02 
     -0.613960 
     0.135393 
     -0.826061 
     -0.323646 
     
     
     2001-05-09 
     -0.086363 
     -0.045427 
     -0.890787 
     0.175619 
     
     
     2001-05-16 
     -0.492947 
     -0.565851 
     0.253310 
     0.877704 
     
     
     2001-05-23 
     -0.339650 
     -0.191218 
     -0.703612 
     -1.292313 
     
     
     2001-05-30 
     -0.795876 
     0.732028 
     -1.208615 
     1.682128 
     
    
   
  带有重复索引的时间序列 
  dates = pd.DatetimeIndex(['1/1/2000', '1/2/2000', '1/2/2000','1/2/2000', '1/3/2000'])
dup_ts = pd.Series(np.arange(5), index=dates)
dup_ts
 
  2000-01-01    0
2000-01-02    1
2000-01-02    2
2000-01-02    3
2000-01-03    4
dtype: int32
 
  dup_ts.index.is_unique
 
  False
 
  对这个时间序列进行索引，要么产生标量值，要么产生切片，具体要看所选的时间点是否重复 
  dup_ts['1/3/2000']
 
  4
 
  dup_ts['1/2/2000']
 
  2000-01-02    1
2000-01-02    2
2000-01-02    3
dtype: int32
 
  假设你想要对具有非唯一时间戳的数据进行聚合。一个办法是使用groupby，并传入level=0 
  grouped=dup_ts.groupby(level=0)
grouped.mean()
 
  2000-01-01    0.0
2000-01-02    2.0
2000-01-03    4.0
dtype: float64
 
  grouped.count()
 
  2000-01-01    1
2000-01-02    3
2000-01-03    1
dtype: int64
 
  日期的范围、频率、以及移动 
  ts
 
  2011-01-02   -0.399861
2011-01-05    0.403928
2011-01-07    0.193208
2011-01-08   -0.750923
2011-01-10    1.727515
2011-01-12    1.031623
dtype: float64
 
  resampler=ts.resample('D')
resampler
 
  
 
  生成日期范围 
  pandas.date_range可用于根据指定的频率生成指定长度的DatetimeIndex 
  index=pd.date_range('2012-04-01','2012-06-01')
index
 
  DatetimeIndex(['2012-04-01', '2012-04-02', '2012-04-03', '2012-04-04',
               '2012-04-05', '2012-04-06', '2012-04-07', '2012-04-08',
               '2012-04-09', '2012-04-10', '2012-04-11', '2012-04-12',
               '2012-04-13', '2012-04-14', '2012-04-15', '2012-04-16',
               '2012-04-17', '2012-04-18', '2012-04-19', '2012-04-20',
               '2012-04-21', '2012-04-22', '2012-04-23', '2012-04-24',
               '2012-04-25', '2012-04-26', '2012-04-27', '2012-04-28',
               '2012-04-29', '2012-04-30', '2012-05-01', '2012-05-02',
               '2012-05-03', '2012-05-04', '2012-05-05', '2012-05-06',
               '2012-05-07', '2012-05-08', '2012-05-09', '2012-05-10',
               '2012-05-11', '2012-05-12', '2012-05-13', '2012-05-14',
               '2012-05-15', '2012-05-16', '2012-05-17', '2012-05-18',
               '2012-05-19', '2012-05-20', '2012-05-21', '2012-05-22',
               '2012-05-23', '2012-05-24', '2012-05-25', '2012-05-26',
               '2012-05-27', '2012-05-28', '2012-05-29', '2012-05-30',
               '2012-05-31', '2012-06-01'],
              dtype='datetime64[ns]', freq='D')
 
  默认情况下，date_range会产生按天计算的时间点。如果只传入起始或结束日期，那还得传入一个表示一段时间的数字 
  pd.date_range(start='2012-04-01',periods=20)
 
  DatetimeIndex(['2012-04-01', '2012-04-02', '2012-04-03', '2012-04-04',
               '2012-04-05', '2012-04-06', '2012-04-07', '2012-04-08',
               '2012-04-09', '2012-04-10', '2012-04-11', '2012-04-12',
               '2012-04-13', '2012-04-14', '2012-04-15', '2012-04-16',
               '2012-04-17', '2012-04-18', '2012-04-19', '2012-04-20'],
              dtype='datetime64[ns]', freq='D')
 
  pd.date_range(end='2012-06-01',periods=20)
 
  DatetimeIndex(['2012-05-13', '2012-05-14', '2012-05-15', '2012-05-16',
               '2012-05-17', '2012-05-18', '2012-05-19', '2012-05-20',
               '2012-05-21', '2012-05-22', '2012-05-23', '2012-05-24',
               '2012-05-25', '2012-05-26', '2012-05-27', '2012-05-28',
               '2012-05-29', '2012-05-30', '2012-05-31', '2012-06-01'],
              dtype='datetime64[ns]', freq='D')
 
  起始和结束日期定义了日期索引的严格边界。
 例如，如果你想要生成一个由每月最后一个工作日组成的日期索引，可以传入BM频率（表示business end of month），这样就只会包含时间间隔内（或刚好在边界上的）符合频率要求的日期 
  pd.date_range('2023-01-01','2023-12-01',freq='BM')
 
  DatetimeIndex(['2023-01-31', '2023-02-28', '2023-03-31', '2023-04-28',
               '2023-05-31', '2023-06-30', '2023-07-31', '2023-08-31',
               '2023-09-29', '2023-10-31', '2023-11-30'],
              dtype='datetime64[ns]', freq='BM')
 
  基本的时间序列频率（部分） 
   
    
     
     别名 
     偏移量类型 
     说明 
     
    
    
     
     D 
     Day 
     每日历日 
     
     
     B 
     BusinessDay 
     每工作日 
     
     
     H 
     Hour 
     每小时 
     
     
     T或min 
     Minute 
     每分 
     
     
     S 
     Second 
     每秒 
     
     
     L或ms 
     Milli 
     每毫秒 
     
     
     U 
     Micro 
     每微秒 
     
     
     M 
     MonthEnd 
     每月最后一个日历日 
     
     
     BM 
     BussinessMonthEnd 
     每月最后一个工作日 
     
     
     MS 
     MonthBegin 
     每月第一个日历日 
     
     
     BMS 
     BussinessMonthBegin 
     每月第一个工作日 
     
    
   
  date_range默认会保留起始和结束时间戳的时间信息 
  pd.date_range('2012-05-02 12:56:31',periods=5)
 
  DatetimeIndex(['2012-05-02 12:56:31', '2012-05-03 12:56:31',
               '2012-05-04 12:56:31', '2012-05-05 12:56:31',
               '2012-05-06 12:56:31'],
              dtype='datetime64[ns]', freq='D')
 
  虽然起始和结束日期带有时间信息，但你希望产生一组被规范化
 （normalize）到午夜的时间戳。normalize选项即可实现该功能 
  pd.date_range('2012-05-02 12:56:31',periods=5,normalize=True)
 
  DatetimeIndex(['2012-05-02', '2012-05-03', '2012-05-04', '2012-05-05',
               '2012-05-06'],
              dtype='datetime64[ns]', freq='D')
 
  频率和日期偏移量 
  pandas中的频率是由一个基础频率（base frequency）和一个乘数组成的。基础频率通常以一个字符串别名表示，比如"M"表示每月，"H"表示每小时。对于每个基础频率，都有一个被称为日期偏移量（date offset）的对象与之对应。 
  from pandas.tseries.offsets import Hour, Minute
hour=Hour()
hour
 
  
 
  four_hour=Hour(4)
four_hour
 
  <4 * Hours>
 
  一般来说，无需明确创建这样的对象，只需使用诸如H或4H这样的字符串别名即可。在基础频率前面放上一个整数即可创建倍数 
  pd.date_range('2000-01-01', '2000-01-03 23:59',freq='4h')
 
  DatetimeIndex(['2000-01-01 00:00:00', '2000-01-01 04:00:00',
               '2000-01-01 08:00:00', '2000-01-01 12:00:00',
               '2000-01-01 16:00:00', '2000-01-01 20:00:00',
               '2000-01-02 00:00:00', '2000-01-02 04:00:00',
               '2000-01-02 08:00:00', '2000-01-02 12:00:00',
               '2000-01-02 16:00:00', '2000-01-02 20:00:00',
               '2000-01-03 00:00:00', '2000-01-03 04:00:00',
               '2000-01-03 08:00:00', '2000-01-03 12:00:00',
               '2000-01-03 16:00:00', '2000-01-03 20:00:00'],
              dtype='datetime64[ns]', freq='4H')
 
  大部分偏移量都可通过加法连接 
  Hour(2)+Minute(30)
 
  <150 * Minutes>
 
  也可以传入频率字符串 
  pd.date_range('2000-01-01',periods=10,freq='1h30min')
 
  DatetimeIndex(['2000-01-01 00:00:00', '2000-01-01 01:30:00',
               '2000-01-01 03:00:00', '2000-01-01 04:30:00',
               '2000-01-01 06:00:00', '2000-01-01 07:30:00',
               '2000-01-01 09:00:00', '2000-01-01 10:30:00',
               '2000-01-01 12:00:00', '2000-01-01 13:30:00'],
              dtype='datetime64[ns]', freq='90T')
 
  有些频率所描述的时间点并不是均匀分隔的。例如，“M”（日历月末）和"BM"（每月最后一个工作日）就取决于每月的天数，对于后者，还要考虑月末是不是周末。由于没有更好的术语，我将这些称为锚点偏移量（anchored offset） 
  WOM日期 
  WOM（Week Of Month）是一种非常实用的频率类，它以WOM开头。它使你能获得诸如“每月第3个星期五”之类的日期 
  rng=pd.date_range('2012-01-01','2012-09-01',freq='WOM-3FRI')
list(rng)
 
  [Timestamp('2012-01-20 00:00:00'),
 Timestamp('2012-02-17 00:00:00'),
 Timestamp('2012-03-16 00:00:00'),
 Timestamp('2012-04-20 00:00:00'),
 Timestamp('2012-05-18 00:00:00'),
 Timestamp('2012-06-15 00:00:00'),
 Timestamp('2012-07-20 00:00:00'),
 Timestamp('2012-08-17 00:00:00')]
 
  移动（超前和滞后）数据 
  移动（shifting）指的是沿着时间轴将数据迁移或后移。Series和DateFrame都有一个shift方法用于执行单纯的前移或后移操作，保持索引不变 
  ts=pd.Series(np.random.randn(4),
            index=pd.date_range('1/1/2000',periods=4,freq='M'))
ts
 
  2000-01-31   -0.517793
2000-02-29    1.572669
2000-03-31   -1.304866
2000-04-30    0.621373
Freq: M, dtype: float64
 
  ts.shift(2)
 
  2000-01-31         NaN
2000-02-29         NaN
2000-03-31   -0.517793
2000-04-30    1.572669
Freq: M, dtype: float64
 
  ts.shift(-2)
 
  2000-01-31   -1.304866
2000-02-29    0.621373
2000-03-31         NaN
2000-04-30         NaN
Freq: M, dtype: float64
 
  当我们进行移动时，就会在时间序列的前面或后面产生缺失数据 
  shift通常用于计算一个时间序列或多个时间序列（如DateFrame）中的百分比变化 
  ts/ts.shift(2)-1
 
  2000-01-31         NaN
2000-02-29         NaN
2000-03-31    1.520056
2000-04-30   -0.604892
Freq: M, dtype: float64
 
  由于单纯的移位操作不会修改索引，所以部分数据会被丢弃。因此，如果频率已知，则可以将其传给shift以便实现对时间戳进行位移而不是对数据进行简单位移 
  ts.shift(2,freq='M')
 
  2000-03-31   -0.517793
2000-04-30    1.572669
2000-05-31   -1.304866
2000-06-30    0.621373
Freq: M, dtype: float64
 
  还可以使用其他频率，可以非常灵活的进行超前和滞后处理 
  ts.shift(3,freq='D')
 
  2000-02-03   -0.517793
2000-03-03    1.572669
2000-04-03   -1.304866
2000-05-03    0.621373
dtype: float64
 
  通过偏移量对日期进行位移 
  pandas的日期偏移量还可以用在datetime和timestamp对象上 
  from pandas.tseries.offsets import Day,MonthEnd
now=datetime(2011,11,17)
now+3*Day()
 
  Timestamp('2011-11-20 00:00:00')
 
  如果加的是锚点偏移量（比如MonthEnd），第一次增量会将原日期向前滚动到符合频率规则的下一个日期 
  now+MonthEnd()
 
  Timestamp('2011-11-30 00:00:00')
 
  now+MonthEnd(2)
 
  Timestamp('2011-12-31 00:00:00')
 
  通过锚点偏移量的rollforward和rollback方法，可明确的将日期向前或向后滚定动 
  offset=MonthEnd()
offset.rollforward(now)
 
  Timestamp('2011-11-30 00:00:00')
 
  offset.rollback(now)
 
  Timestamp('2011-10-31 00:00:00')
 
  日期偏移量还有一个巧妙的用法，即结合groupby使用上述两个滚动方法 
  ts = pd.Series(np.random.randn(20),index=pd.date_range('1/15/2000', periods=20, freq='4d'))
ts
 
  2000-01-15   -0.211794
2000-01-19    0.462626
2000-01-23    0.329880
2000-01-27    1.114397
2000-01-31   -0.677630
2000-02-04   -0.349137
2000-02-08   -0.886134
2000-02-12    1.142536
2000-02-16   -0.863100
2000-02-20   -0.692893
2000-02-24   -1.139926
2000-02-28   -0.339441
2000-03-03    2.008366
2000-03-07    0.004030
2000-03-11    1.049552
2000-03-15   -1.150146
2000-03-19   -0.087416
2000-03-23   -2.220171
2000-03-27    1.279052
2000-03-31   -1.409034
Freq: 4D, dtype: float64
 
  list(ts.groupby(offset.rollforward))
 
  [(Timestamp('2000-01-31 00:00:00'),
  2000-01-15   -0.211794
  2000-01-19    0.462626
  2000-01-23    0.329880
  2000-01-27    1.114397
  2000-01-31   -0.677630
  Freq: 4D, dtype: float64),
 (Timestamp('2000-02-29 00:00:00'),
  2000-02-04   -0.349137
  2000-02-08   -0.886134
  2000-02-12    1.142536
  2000-02-16   -0.863100
  2000-02-20   -0.692893
  2000-02-24   -1.139926
  2000-02-28   -0.339441
  Freq: 4D, dtype: float64),
 (Timestamp('2000-03-31 00:00:00'),
  2000-03-03    2.008366
  2000-03-07    0.004030
  2000-03-11    1.049552
  2000-03-15   -1.150146
  2000-03-19   -0.087416
  2000-03-23   -2.220171
  2000-03-27    1.279052
  2000-03-31   -1.409034
  Freq: 4D, dtype: float64)]
 
  ts.groupby(offset.rollforward).mean()
 
  2000-01-31   -0.325854
2000-02-29   -0.400242
2000-03-31    0.162939
dtype: float64
 
  resample 
  list(ts.resample('M'))
 
  [(Timestamp('2000-01-31 00:00:00'),
  2000-01-15   -0.211794
  2000-01-19    0.462626
  2000-01-23    0.329880
  2000-01-27    1.114397
  2000-01-31   -0.677630
  Freq: 4D, dtype: float64),
 (Timestamp('2000-02-29 00:00:00'),
  2000-02-04   -0.349137
  2000-02-08   -0.886134
  2000-02-12    1.142536
  2000-02-16   -0.863100
  2000-02-20   -0.692893
  2000-02-24   -1.139926
  2000-02-28   -0.339441
  Freq: 4D, dtype: float64),
 (Timestamp('2000-03-31 00:00:00'),
  2000-03-03    2.008366
  2000-03-07    0.004030
  2000-03-11    1.049552
  2000-03-15   -1.150146
  2000-03-19   -0.087416
  2000-03-23   -2.220171
  2000-03-27    1.279052
  2000-03-31   -1.409034
  Freq: 4D, dtype: float64)]
 
  ts.resample('M').mean()
 
  2000-01-31   -0.325854
2000-02-29   -0.400242
2000-03-31    0.162939
Freq: M, dtype: float64
 
  时期及其算术运算 
  时期（period）表示的是时间区间，比如数日、数月、数季、数年等。Period类所表示的就是这种数据类型，其构造函数需要用到一个字符串或整数，以及频率 
  p = pd.Period(2007, freq='A-DEC')
p
 
  Period('2007', 'A-DEC')
 
  这个Period对象表示的是从2007年1月1日到2007年12月31日之间的整段时
 间。
 只需对Period对象加上或减去一个整数即可达到根据其频率进行位移的效果 
  p+5
 
  Period('2012', 'A-DEC')
 
  p-2
 
  Period('2005', 'A-DEC')
 
  pd.Period('2014',freq='A-DEC')-p
 
  <7 * YearEnds: month=12>
 
  period_range函数可用于创建规则的时期范围 
  rng=pd.period_range('2000-01-01','2000-06-30',freq='M')
rng
 
  PeriodIndex(['2000-01', '2000-02', '2000-03', '2000-04', '2000-05', '2000-06'], dtype='period[M]')
 
  PeriodIndex类保存了一组Period，time可以在任何pandas数据结构中被用作轴索引 
  pd.Series(np.random.randn(6),index=rng)
 
  2000-01   -1.664397
2000-02    0.677680
2000-03    0.074917
2000-04    1.056093
2000-05    0.849702
2000-06   -0.173546
Freq: M, dtype: float64
 
  如果你有一个字符串数组，你也可以使用PeriodIndex类 
  values = ['2001Q3', '2002Q2', '2003Q1']
index=pd.PeriodIndex(values,freq='Q-DEC')
index
 
  PeriodIndex(['2001Q3', '2002Q2', '2003Q1'], dtype='period[Q-DEC]')
 
  时期的频率转换 
  Period和PeriodIndex对象都可以通过其asfreq方法被转换成别的频率。假设我们有一个年度时期，希望将其转换为当年年初或年末的一个月度时期 
  p=pd.Period('2007',freq='A-DEC')
p
 
  Period('2007', 'A-DEC')
 
  p.asfreq('M',how='start')
 
  Period('2007-01', 'M')
 
  p.asfreq('M',how='end')
 
  Period('2007-12', 'M')
 
  对于一个不以12月结束的财政年度，月度子时期的归属情况就不一样了 
  p = pd.Period('2007', freq='A-JUN')
p
 
  Period('2007', 'A-JUN')
 
  p.asfreq('M', 'start')
 
  Period('2006-07', 'M')
 
  p.asfreq('M', 'end')

 
  Period('2007-06', 'M')
 
  在将高频率转换为低频率时，超时期（superperiod）是由子时期（subperiod）所属的位置决定的。例如，在A-JUN频率中，月份“2007年8月”实际上是属于周期“2008年”的 
  p = pd.Period('Aug-2007', 'M')
p
 
  Period('2007-08', 'M')
 
  p.asfreq('A-JUN')
 
  Period('2008', 'A-JUN')
 
  完整的PeriodIndex或TimeSeries的频率转换方式也是如此 
  rng = pd.period_range('2006', '2009', freq='A-DEC')
ts = pd.Series(np.random.randn(len(rng)), index=rng)
ts
 
  2006   -0.925806
2007   -0.170260
2008    0.691124
2009    0.493400
Freq: A-DEC, dtype: float64
 
  ts.asfreq('M', how='start')
 
  2006-01   -0.925806
2007-01   -0.170260
2008-01    0.691124
2009-01    0.493400
Freq: M, dtype: float64
 
  根据年度时期的第一个月，每年的时期被取代为每月的时期。如果我们想要每年的最后一个工作日，我们可以使用“B”频率，并指明想要该时期的末尾 
  ts.asfreq('B', how='end')
 
  2006-12-29   -0.925806
2007-12-31   -0.170260
2008-12-31    0.691124
2009-12-31    0.493400
Freq: B, dtype: float64
 
  按季度计算的时期频率 
  季度型数据在会计、金融等领域中很常见。许多季度型数据都会涉及“财年末”的概念，通常是一年12个月中某月的最后一个日历日或工作日。就这一点来说，时期"2012Q4"根据财年末的不同会有不同的含义。pandas支持12种可能的季度型频率，即Q-JAN到Q-DEC 
  p = pd.Period('2012Q4', freq='Q-JAN')
p
 
  Period('2012Q4', 'Q-JAN')
 
  p.asfreq('D', 'start')

 
  Period('2011-11-01', 'D')
 
  p.asfreq('D', 'end')

 
  Period('2012-01-31', 'D')
 
  #工作日的前一天
p4pm = (p.asfreq('B', 'e') - 1).asfreq('T', 's') + 16* 60
p4pm
 
  C:\Users\Dell\AppData\Local\Temp\ipykernel_7528\2800287024.py:2: FutureWarning: Period with BDay freq is deprecated and will be removed in a future version. Use a DatetimeIndex with BDay freq instead.
  p4pm = (p.asfreq('B', 'e') - 1).asfreq('T', 's') + 16* 60





Period('2012-01-30 16:00', 'T')
 
  p4pm.to_timestamp()

 
  Timestamp('2012-01-30 16:00:00')
 
  #工作日的倒数第二天,2012/1/31是星期二
p4am=(p.asfreq('B','e')-2).asfreq('T','s')+16*60
p4am
 
  C:\Users\Dell\AppData\Local\Temp\ipykernel_7528\4207756690.py:2: FutureWarning: Period with BDay freq is deprecated and will be removed in a future version. Use a DatetimeIndex with BDay freq instead.
  p4am=(p.asfreq('B','e')-2).asfreq('T','s')+16*60





Period('2012-01-27 16:00', 'T')
 
  period_range可用于生成季度型范围。季度型范围的算术运算也跟上面是一样的 
  rng = pd.period_range('2011Q3', '2012Q4', freq='Q-JAN')
rng
 
  PeriodIndex(['2011Q3', '2011Q4', '2012Q1', '2012Q2', '2012Q3', '2012Q4'], dtype='period[Q-JAN]')
 
  ts = pd.Series(np.arange(len(rng)), index=rng)
ts
 
  2011Q3    0
2011Q4    1
2012Q1    2
2012Q2    3
2012Q3    4
2012Q4    5
Freq: Q-JAN, dtype: int32
 
  new_rng = (rng.asfreq('B', 'e') - 1).asfreq('T', 's')+ 16 * 60
ts.index = new_rng.to_timestamp()
ts
 
  2010-10-28 16:00:00    0
2011-01-28 16:00:00    1
2011-04-28 16:00:00    2
2011-07-28 16:00:00    3
2011-10-28 16:00:00    4
2012-01-30 16:00:00    5
dtype: int32
 
  将Timestamp转换为Period（及其反向过程） 
  通过使用to_period方法，可以将由时间戳索引的Series和DataFrame对象转换为以时期索引 
  rng = pd.date_range('2000-01-01', periods=3, freq='M')
ts = pd.Series(np.random.randn(3), index=rng)
ts
 
  2000-01-31    0.319421
2000-02-29    0.697313
2000-03-31   -0.332460
Freq: M, dtype: float64
 
  pts = ts.to_period()
pts
 
  2000-01    0.319421
2000-02    0.697313
2000-03   -0.332460
Freq: M, dtype: float64
 
  由于时期指的是非重叠时间区间，因此对于给定的频率，一个时间戳只能属于一个时期。新PeriodIndex的频率默认是从时间戳推断而来的，也可以指定任何别的频率 
  rng = pd.date_range('1/29/2000', periods=6, freq='D')
ts2 = pd.Series(np.random.randn(6), index=rng)
ts2
 
  2000-01-29   -0.055344
2000-01-30    1.570756
2000-01-31    1.288053
2000-02-01   -0.084722
2000-02-02   -0.962208
2000-02-03   -0.693205
Freq: D, dtype: float64
 
  ts2.to_period('M')
 
  2000-01   -0.055344
2000-01    1.570756
2000-01    1.288053
2000-02   -0.084722
2000-02   -0.962208
2000-02   -0.693205
Freq: M, dtype: float64
 
  要转回时间戳，使用to_timestamp即可 
  pts=ts2.to_period()
pts
 
  2000-01-29   -0.055344
2000-01-30    1.570756
2000-01-31    1.288053
2000-02-01   -0.084722
2000-02-02   -0.962208
2000-02-03   -0.693205
Freq: D, dtype: float64
 
  pts.to_timestamp(how='end')
 
  2000-01-29 23:59:59.999999999   -0.055344
2000-01-30 23:59:59.999999999    1.570756
2000-01-31 23:59:59.999999999    1.288053
2000-02-01 23:59:59.999999999   -0.084722
2000-02-02 23:59:59.999999999   -0.962208
2000-02-03 23:59:59.999999999   -0.693205
Freq: D, dtype: float64
 
  rng = pd.period_range('2011Q3', '2012Q4', freq='Q-JAN')
ts3 = pd.Series(np.arange(len(rng)), index=rng)
ts3
 
  2011Q3    0
2011Q4    1
2012Q1    2
2012Q2    3
2012Q3    4
2012Q4    5
Freq: Q-JAN, dtype: int32
 
  ts3.to_timestamp()
 
  2010-08-01    0
2010-11-01    1
2011-02-01    2
2011-05-01    3
2011-08-01    4
2011-11-01    5
Freq: QS-NOV, dtype: int32
 
  通过数组创建PeriodIndex 
  固定频率的数据集通常会将时间信息分开存放在多个列中。例如，在下面这个宏观经济数据集中，年度和季度就分别存放在不同的列中 
  data = pd.read_csv('F:/项目学习/利用Pyhon进行数据分析（第二版）/利用Pyhon进行数据分析/pydata-book-2nd-edition/examples/macrodata.csv')
data.head()
 
   
   
   
    
     
      
     year 
     quarter 
     realgdp 
     realcons 
     realinv 
     realgovt 
     realdpi 
     cpi 
     m1 
     tbilrate 
     unemp 
     pop 
     infl 
     realint 
     
    
    
     
     0 
     1959.0 
     1.0 
     2710.349 
     1707.4 
     286.898 
     470.045 
     1886.9 
     28.98 
     139.7 
     2.82 
     5.8 
     177.146 
     0.00 
     0.00 
     
     
     1 
     1959.0 
     2.0 
     2778.801 
     1733.7 
     310.859 
     481.301 
     1919.7 
     29.15 
     141.7 
     3.08 
     5.1 
     177.830 
     2.34 
     0.74 
     
     
     2 
     1959.0 
     3.0 
     2775.488 
     1751.8 
     289.226 
     491.260 
     1916.4 
     29.35 
     140.5 
     3.82 
     5.3 
     178.657 
     2.74 
     1.09 
     
     
     3 
     1959.0 
     4.0 
     2785.204 
     1753.7 
     299.356 
     484.052 
     1931.3 
     29.37 
     140.0 
     4.33 
     5.6 
     179.386 
     0.27 
     4.06 
     
     
     4 
     1960.0 
     1.0 
     2847.699 
     1770.5 
     331.722 
     462.199 
     1955.5 
     29.54 
     139.6 
     3.50 
     5.2 
     180.007 
     2.31 
     1.19 
     
    
   
  index=pd.PeriodIndex(year=data.year,quarter=data.quarter,freq='Q-DEC')
index
 
  PeriodIndex(['1959Q1', '1959Q2', '1959Q3', '1959Q4', '1960Q1', '1960Q2',
             '1960Q3', '1960Q4', '1961Q1', '1961Q2',
             ...
             '2007Q2', '2007Q3', '2007Q4', '2008Q1', '2008Q2', '2008Q3',
             '2008Q4', '2009Q1', '2009Q2', '2009Q3'],
            dtype='period[Q-DEC]', length=203)
 
  data.index=index
data.infl
 
  1959Q1    0.00
1959Q2    2.34
1959Q3    2.74
1959Q4    0.27
1960Q1    2.31
          ... 
2008Q3   -3.16
2008Q4   -8.79
2009Q1    0.94
2009Q2    3.37
2009Q3    3.56
Freq: Q-DEC, Name: infl, Length: 203, dtype: float64
 
  重采样及频率转换 
  重采样（resampling）指的是将时间序列从一个频率转换到另一个频率的处理过程。
 将高频率数据聚合到低频率称为降采样（downsampling），而将低频率数据转换到高频率则称为升采样（upsampling）。并不是所有的重采样都能被划分到这两个大类中。例如，将W-WED（每周三）转换为W-FRI既不是降采样也不是升采样。 
  pandas对象都带有一个resample方法，它是各种频率转换工作的主力函数。resample有一个类似于groupby的API，调用resample可以分组数据，然后会调用一个聚合函数 
  rng=pd.date_range('2000-01-01',periods=100,freq='D')
ts=pd.Series(np.random.randn(len(rng)),index=rng)
ts
 
  2000-01-01   -0.669571
2000-01-02   -1.044461
2000-01-03   -0.481993
2000-01-04   -1.133404
2000-01-05   -1.288657
                ...   
2000-04-05    1.080972
2000-04-06   -0.360568
2000-04-07    1.406234
2000-04-08   -0.120072
2000-04-09    0.935523
Freq: D, Length: 100, dtype: float64
 
  list(ts.resample('M'))
 
  [(Timestamp('2000-01-31 00:00:00'),
  2000-01-01   -0.669571
  2000-01-02   -1.044461
  2000-01-03   -0.481993
  2000-01-04   -1.133404
  2000-01-05   -1.288657
  2000-01-06   -0.272591
  2000-01-07   -0.528013
  2000-01-08    0.504589
  2000-01-09    0.534209
  2000-01-10   -0.195754
  2000-01-11   -0.681871
  2000-01-12   -1.112560
  2000-01-13    2.096374
  2000-01-14   -1.520705
  2000-01-15   -0.254708
  2000-01-16   -0.375709
  2000-01-17   -1.130941
  2000-01-18   -1.390601
  2000-01-19   -0.237225
  2000-01-20   -0.633101
  2000-01-21    0.942845
  2000-01-22   -0.993924
  2000-01-23   -1.456749
  2000-01-24   -0.006961
  2000-01-25    0.956246
  2000-01-26   -0.367833
  2000-01-27   -1.756500
  2000-01-28   -0.832491
  2000-01-29    0.678083
  2000-01-30    0.406221
  2000-01-31   -0.736602
  Freq: D, dtype: float64),
 (Timestamp('2000-02-29 00:00:00'),
  2000-02-01    0.464724
  2000-02-02   -0.105031
  2000-02-03    2.260643
  2000-02-04   -0.291663
  2000-02-05   -0.231378
  2000-02-06   -0.911392
  2000-02-07    1.369952
  2000-02-08    0.328929
  2000-02-09    0.666395
  2000-02-10   -0.784090
  2000-02-11   -0.987542
  2000-02-12   -0.190643
  2000-02-13    1.067442
  2000-02-14    1.305757
  2000-02-15    0.707780
  2000-02-16    0.752850
  2000-02-17    0.307574
  2000-02-18   -1.372087
  2000-02-19   -0.009484
  2000-02-20   -0.415510
  2000-02-21   -0.524290
  2000-02-22   -0.410307
  2000-02-23    1.618978
  2000-02-24   -1.994847
  2000-02-25   -0.924586
  2000-02-26    2.621486
  2000-02-27   -0.886171
  2000-02-28   -0.792322
  2000-02-29   -0.353683
  Freq: D, dtype: float64),
 (Timestamp('2000-03-31 00:00:00'),
  2000-03-01    0.101989
  2000-03-02    1.386227
  2000-03-03    0.378749
  2000-03-04    1.376517
  2000-03-05    0.530842
  2000-03-06    1.112294
  2000-03-07    0.991104
  2000-03-08   -1.196767
  2000-03-09    0.118670
  2000-03-10   -0.910018
  2000-03-11    0.576264
  2000-03-12   -0.142747
  2000-03-13   -1.161403
  2000-03-14   -0.334490
  2000-03-15    0.556489
  2000-03-16   -0.587923
  2000-03-17    0.089454
  2000-03-18   -0.234425
  2000-03-19   -0.829286
  2000-03-20    0.973448
  2000-03-21    0.759351
  2000-03-22    0.115352
  2000-03-23   -0.561077
  2000-03-24   -1.165458
  2000-03-25    0.161576
  2000-03-26    0.185810
  2000-03-27   -0.058259
  2000-03-28   -1.500683
  2000-03-29    0.703913
  2000-03-30   -1.543016
  2000-03-31    0.525858
  Freq: D, dtype: float64),
 (Timestamp('2000-04-30 00:00:00'),
  2000-04-01   -0.072181
  2000-04-02    0.845489
  2000-04-03    0.256463
  2000-04-04    0.552494
  2000-04-05    1.080972
  2000-04-06   -0.360568
  2000-04-07    1.406234
  2000-04-08   -0.120072
  2000-04-09    0.935523
  Freq: D, dtype: float64)]
 
  ts.resample('M').mean()
 
  2000-01-31    0.383776
2000-02-29   -0.180275
2000-03-31   -0.086058
2000-04-30    0.083742
Freq: M, dtype: float64
 
  ts.resample('M',kind='period').mean()
 
  2000-01    0.383776
2000-02   -0.180275
2000-03   -0.086058
2000-04    0.083742
Freq: M, dtype: float64
 
  resample是一个灵活高效的方法，可用于处理非常大的时间序列 
  resample方法参数说明 
   
    
     
     参数 
     说明 
     
    
    
     
     freq 
     表示重采样频率的字符串或DateOffset 
     
     
     axis 
     重采样的轴，默认axis=0 
     
     
     fill_method 
     升采样如何插值，比如‘ffill’或‘bfill’，默认不插值 
     
     
     closed 
     在降采样中，各时间段的哪一端是闭合的，right（默认）或left 
     
     
     label 
     在降采样中，如何设置聚合值标签，right或left 
     
     
     loffset 
     面元标签的时间校正值 
     
     
     limit 
     在前向或后向填充时，允许填充的最大时期数 
     
     
     kind 
     聚合到周期（period）或时间戳（timestamp），默认聚合到时间序列的索引类型 
     
     
     convention 
     当对周期进行重采样，将低频周期转换为高频的惯用法（start或end），默认end 
     
    
   
  降采样 
   
   端点如何选 
   如何标记各个聚合面元，用区间的开头还是末尾 
   
  rng = pd.date_range('2000-01-01', periods=12, freq='T')
ts = pd.Series(np.arange(12), index=rng)
ts
 
  2000-01-01 00:00:00     0
2000-01-01 00:01:00     1
2000-01-01 00:02:00     2
2000-01-01 00:03:00     3
2000-01-01 00:04:00     4
2000-01-01 00:05:00     5
2000-01-01 00:06:00     6
2000-01-01 00:07:00     7
2000-01-01 00:08:00     8
2000-01-01 00:09:00     9
2000-01-01 00:10:00    10
2000-01-01 00:11:00    11
Freq: T, dtype: int32
 
  ts.resample('5min').sum()
#左端点
 
  2000-01-01 00:00:00    10
2000-01-01 00:05:00    35
2000-01-01 00:10:00    21
Freq: 5T, dtype: int32
 
  #以求和的方式将数据聚合到5分钟块中
ts.resample('5min', closed='right').sum()
 
  1999-12-31 23:55:00     0
2000-01-01 00:00:00    15
2000-01-01 00:05:00    40
2000-01-01 00:10:00    11
Freq: 5T, dtype: int32
 
  ts.resample('5min', closed='right', label='right').sum()
 
  2000-01-01 00:00:00     0
2000-01-01 00:05:00    15
2000-01-01 00:10:00    40
2000-01-01 00:15:00    11
Freq: 5T, dtype: int32
 
  ts.resample('5min', closed='right', label='right',offset='1s').sum()
#loffset现改为offset，
 
  2000-01-01 00:00:01     0
2000-01-01 00:05:01    15
2000-01-01 00:10:01    40
2000-01-01 00:15:01    11
Freq: 5T, dtype: int32
 
  ts.resample?
 
  OHLC重采样 
  金融领域中有一种无所不在的时间序列聚合方式，即计算各面元的四个值：第一个值（open，开盘）、最后一个值（close，收盘）、最大值（high，最高）以及最小值（low，最低） 
  ts.resample('5min').ohlc()
 
   
   
   
    
     
      
     open 
     high 
     low 
     close 
     
    
    
     
     2000-01-01 00:00:00 
     0 
     4 
     0 
     4 
     
     
     2000-01-01 00:05:00 
     5 
     9 
     5 
     9 
     
     
     2000-01-01 00:10:00 
     10 
     11 
     10 
     11 
     
    
   
  升采样和插值 
  低频率转换到高频率 
  frame = pd.DataFrame(np.random.randn(2, 4),
                     index=pd.date_range('1/1/2000', periods=2,freq='W-WED'),
                     columns=['Colorado', 'Texas', 'New York', 'Ohio'])
frame
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2000-01-05 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-12 
     -0.615524 
     -0.037849 
     -1.418894 
     0.653989 
     
    
   
  df_daily=frame.resample('D').asfreq()
df_daily
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2000-01-05 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-06 
     NaN 
     NaN 
     NaN 
     NaN 
     
     
     2000-01-07 
     NaN 
     NaN 
     NaN 
     NaN 
     
     
     2000-01-08 
     NaN 
     NaN 
     NaN 
     NaN 
     
     
     2000-01-09 
     NaN 
     NaN 
     NaN 
     NaN 
     
     
     2000-01-10 
     NaN 
     NaN 
     NaN 
     NaN 
     
     
     2000-01-11 
     NaN 
     NaN 
     NaN 
     NaN 
     
     
     2000-01-12 
     -0.615524 
     -0.037849 
     -1.418894 
     0.653989 
     
    
   
  frame.resample('D').ffill()
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2000-01-05 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-06 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-07 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-08 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-09 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-10 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-11 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-12 
     -0.615524 
     -0.037849 
     -1.418894 
     0.653989 
     
    
   
  frame.resample('D').ffill(limit=2)#limit限制前面的观测值的持续使用距离
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2000-01-05 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-06 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-07 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-08 
     NaN 
     NaN 
     NaN 
     NaN 
     
     
     2000-01-09 
     NaN 
     NaN 
     NaN 
     NaN 
     
     
     2000-01-10 
     NaN 
     NaN 
     NaN 
     NaN 
     
     
     2000-01-11 
     NaN 
     NaN 
     NaN 
     NaN 
     
     
     2000-01-12 
     -0.615524 
     -0.037849 
     -1.418894 
     0.653989 
     
    
   
  frame.resample('W-THU').ffill()
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2000-01-06 
     0.039652 
     0.408064 
     -0.510078 
     0.185826 
     
     
     2000-01-13 
     -0.615524 
     -0.037849 
     -1.418894 
     0.653989 
     
    
   
  通过时期进行重采样 
  对那些使用时期索引的数据进行重采样与时间戳相似 
  frame=pd.DataFrame(np.random.randn(24,4),
                  index=pd.period_range('1-2000','12-2001',freq='M'),
                  columns=['Colorado','Texas','New York','Ohio'])
frame[:5]
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2000-01 
     -0.638649 
     -1.405857 
     0.415621 
     -1.001946 
     
     
     2000-02 
     1.266635 
     0.550081 
     -0.212091 
     -0.355084 
     
     
     2000-03 
     1.703974 
     0.651728 
     0.990770 
     0.323334 
     
     
     2000-04 
     -0.482890 
     -0.609073 
     1.771766 
     0.546269 
     
     
     2000-05 
     1.356010 
     1.584438 
     0.788411 
     -2.729561 
     
    
   
  annual_frame=frame.resample('A-DEC').mean()
annual_frame
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2000 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2001 
     0.127696 
     0.079421 
     0.186049 
     0.064369 
     
    
   
  升采样要稍微麻烦一些，必须要决定在新频率中各区间的哪端用于放置原来的值，就像asfreq方法。convention参数默认‘start’，也可设置‘end’ 
  annual_frame.resample('Q-DEC').ffill()#Q-DEC每季度一次，截止到12月
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2000Q1 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2000Q2 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2000Q3 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2000Q4 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2001Q1 
     0.127696 
     0.079421 
     0.186049 
     0.064369 
     
     
     2001Q2 
     0.127696 
     0.079421 
     0.186049 
     0.064369 
     
     
     2001Q3 
     0.127696 
     0.079421 
     0.186049 
     0.064369 
     
     
     2001Q4 
     0.127696 
     0.079421 
     0.186049 
     0.064369 
     
    
   
  annual_frame.resample('Q-DEC',convention='end').ffill()
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2000Q4 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2001Q1 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2001Q2 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2001Q3 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2001Q4 
     0.127696 
     0.079421 
     0.186049 
     0.064369 
     
    
   
  由于时期指的是时间区间，所以升采样和降采样的规则就比较严格： 
   
   降采样中，目标频率必须是源频率的子时期（subperiod） 
   升采样中，目标频率必须是源频率的超时期（superperiod）
 不满足上述条件，就会引发异常 
   
  annual_frame.resample('Q-MAR').ffill()
 
   
   
   
    
     
      
     Colorado 
     Texas 
     New York 
     Ohio 
     
    
    
     
     2000Q4 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2001Q1 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2001Q2 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2001Q3 
     0.446096 
     -0.051901 
     0.142156 
     -0.407821 
     
     
     2001Q4 
     0.127696 
     0.079421 
     0.186049 
     0.064369 
     
     
     2002Q1 
     0.127696 
     0.079421 
     0.186049 
     0.064369 
     
     
     2002Q2 
     0.127696 
     0.079421 
     0.186049 
     0.064369 
     
     
     2002Q3 
     0.127696 
     0.079421 
     0.186049 
     0.064369 
     
    
   
  移动窗口函数 
  在移动窗口（可以带有指数衰减权数）上计算的各种统计函数也是一类常见于时间序列的数组变换。这样可以圆滑噪音数据或断裂数据。我将它们称为移动窗口函数（moving window function），其中还包括那些窗口不定长的函数（如指数加权移
 动平均）。跟其他统计函数一样，移动窗口函数也会自动排除缺失值 
  close_px_all = pd.read_csv('F:/项目学习/利用Pyhon进行数据分析（第二版）/利用Pyhon进行数据分析/pydata-book-2nd-edition/examples/stock_px_2.csv',parse_dates=True, index_col=0)
close_px=close_px_all[['AAPL','MSFT','XOM']]
close_px
 
   
   
   
    
     
      
     AAPL 
     MSFT 
     XOM 
     
    
    
     
     2003-01-02 
     7.40 
     21.11 
     29.22 
     
     
     2003-01-03 
     7.45 
     21.14 
     29.24 
     
     
     2003-01-06 
     7.45 
     21.52 
     29.96 
     
     
     2003-01-07 
     7.43 
     21.93 
     28.95 
     
     
     2003-01-08 
     7.28 
     21.31 
     28.83 
     
     
     ... 
     ... 
     ... 
     ... 
     
     
     2011-10-10 
     388.81 
     26.94 
     76.28 
     
     
     2011-10-11 
     400.29 
     27.00 
     76.27 
     
     
     2011-10-12 
     402.19 
     26.96 
     77.16 
     
     
     2011-10-13 
     408.43 
     27.18 
     76.37 
     
     
     2011-10-14 
     422.00 
     27.27 
     78.11 
     
    
   
  2214 rows × 3 columns 
  
close_px=close_px.resample('B').ffill()
close_px
 
   
   
   
    
     
      
     AAPL 
     MSFT 
     XOM 
     
    
    
     
     2003-01-02 
     7.40 
     21.11 
     29.22 
     
     
     2003-01-03 
     7.45 
     21.14 
     29.24 
     
     
     2003-01-06 
     7.45 
     21.52 
     29.96 
     
     
     2003-01-07 
     7.43 
     21.93 
     28.95 
     
     
     2003-01-08 
     7.28 
     21.31 
     28.83 
     
     
     ... 
     ... 
     ... 
     ... 
     
     
     2011-10-10 
     388.81 
     26.94 
     76.28 
     
     
     2011-10-11 
     400.29 
     27.00 
     76.27 
     
     
     2011-10-12 
     402.19 
     26.96 
     77.16 
     
     
     2011-10-13 
     408.43 
     27.18 
     76.37 
     
     
     2011-10-14 
     422.00 
     27.27 
     78.11 
     
    
   
  2292 rows × 3 columns 
  
close_px.AAPL.plot()
 
  
 
   
  close_px.AAPL.plot()
close_px.AAPL.rolling(250).mean().plot()
 
  
 
   
  表达式rolling(250)与groupby很像，但不是对其进行分组，而是创建一个按照250天分组的滑动窗口对象。然后，我们就得到了苹果公司股价的250天的移动窗口。 
  默认情况下，rolling函数需要窗口中所有的值为非NA值。可以修改该行为以解决缺失数据的问题。其实，在时间序列开始处尚不足窗口期的那些数据就是个特例 
  appl_std250 = close_px.AAPL.rolling(250, min_periods=10).std()
appl_std250[5:12]
 
  2003-01-09         NaN
2003-01-10         NaN
2003-01-13         NaN
2003-01-14         NaN
2003-01-15    0.077496
2003-01-16    0.074760
2003-01-17    0.112368
Freq: B, Name: AAPL, dtype: float64
 
  appl_std250.plot()
 
  
 
   
  要计算扩展窗口平均（expanding window mean），可以使用expanding而不是rolling。“扩展”意味着，从时间序列的起始处开始窗口，增加窗口直到它超过所有的序列。 
  expanding_mean = appl_std250.expanding().mean()
 
  close_px.rolling(60).mean().plot(logy=True)
 
  
 
   
  rolling函数也可以接受一个指定固定大小时间补偿字符串，而不是一组时期。这样可以方便处理不规律的时间序列。这些字符串也可以传递给resample 
  close_px.rolling('20D').mean()
 
   
   
   
    
     
      
     AAPL 
     MSFT 
     XOM 
     
    
    
     
     2003-01-02 
     7.400000 
     21.110000 
     29.220000 
     
     
     2003-01-03 
     7.425000 
     21.125000 
     29.230000 
     
     
     2003-01-06 
     7.433333 
     21.256667 
     29.473333 
     
     
     2003-01-07 
     7.432500 
     21.425000 
     29.342500 
     
     
     2003-01-08 
     7.402000 
     21.402000 
     29.240000 
     
     
     ... 
     ... 
     ... 
     ... 
     
     
     2011-10-10 
     389.351429 
     25.602143 
     72.527857 
     
     
     2011-10-11 
     388.505000 
     25.674286 
     72.835000 
     
     
     2011-10-12 
     388.531429 
     25.810000 
     73.400714 
     
     
     2011-10-13 
     388.826429 
     25.961429 
     73.905000 
     
     
     2011-10-14 
     391.038000 
     26.048667 
     74.185333 
     
    
   
  2292 rows × 3 columns 
  指数加权函数 
  另一种使用固定大小窗口及相等权数观测值的办法是，定义一个衰减因子（decayfactor）常量，以便使近期的观测值拥有更大的权数。衰减因子的定义方式有很多，比较流行的是使用时间间隔（span），它可以使结果兼容于窗口大小等于时间间隔的简单移动窗口（simple moving window）函数。 
  由于指数加权统计会赋予近期的观测值更大的权数，因此相对于等权统计，它能“适应”更快的变化。 
  除了rolling和expanding，pandas还有ewm运算符。 
  aapl_px = close_px.AAPL['2006':'2007']
ma60 = aapl_px.rolling(30, min_periods=20).mean()
ewma60 = aapl_px.ewm(span=30).mean()
ma60.plot(style='k--', label='Simple MA')
ewma60.plot(style='k-', label='EW MA')
plt.legend()
 
  
 
   
  二元移动函数 
  有些统计运算（如相关系数和协方差）需要在两个时间序列上执行。例如，金融分析师常常对某只股票对某个参考指数（如标准普尔500指数）的相关系数感兴趣 
  spx_px = close_px_all['SPX']
spx_rets = spx_px.pct_change()
returns = close_px.pct_change()
corr = returns.AAPL.rolling(125, min_periods=100).corr(spx_rets)
corr.plot()

 
  
 
   
  只需传入一个TimeSeries和一个DataFrame，rolling_corr就会自动计算TimeSeries（本例中就是spx_rets）与DataFrame各列的相关系数 
  corr = returns.rolling(125, min_periods=100).corr(spx_rets)
corr.plot()
 
  
 
   
  用户自定义函数 
  rolling_apply函数使你能够在移动窗口上应用自己设计的数组函数。唯一要求的就是：该函数要能从数组的各个片段中产生单个值（即约简） 
  from scipy.stats import percentileofscore
score_at_2percent = lambda x: percentileofscore(x, 0.02)
result = returns.AAPL.rolling(250).apply(score_at_2percent)
result.plot()

	Colorado	Texas	New York	Ohio
2000-01-05	-0.405523	0.908071	1.822543	-0.562963
2000-01-12	-0.049467	0.485990	-0.279052	-0.723333
2000-01-19	0.750311	1.042382	0.225140	1.395041
2000-01-26	0.270467	0.469076	0.040557	0.113861
2000-02-02	0.439021	-0.097106	-0.970282	0.491808
...	...	...	...	...
2001-10-31	0.515944	-0.564199	-0.286108	1.551582
2001-11-07	1.012778	-0.002377	-2.118233	-0.595119
2001-11-14	0.568788	-0.546481	-0.688155	-0.106262
2001-11-21	0.404215	0.649409	-0.479882	-0.521904
2001-11-28	1.975573	-1.068704	1.411288	-0.924625

	Colorado	Texas	New York	Ohio
2001-05-02	-0.613960	0.135393	-0.826061	-0.323646
2001-05-09	-0.086363	-0.045427	-0.890787	0.175619
2001-05-16	-0.492947	-0.565851	0.253310	0.877704
2001-05-23	-0.339650	-0.191218	-0.703612	-1.292313
2001-05-30	-0.795876	0.732028	-1.208615	1.682128

别名	偏移量类型	说明
D	Day	每日历日
B	BusinessDay	每工作日
H	Hour	每小时
T或min	Minute	每分
S	Second	每秒
L或ms	Milli	每毫秒
U	Micro	每微秒
M	MonthEnd	每月最后一个日历日
BM	BussinessMonthEnd	每月最后一个工作日
MS	MonthBegin	每月第一个日历日
BMS	BussinessMonthBegin	每月第一个工作日

	year	quarter	realgdp	realcons	realinv	realgovt	realdpi	cpi	m1	tbilrate	unemp	pop	infl	realint
0	1959.0	1.0	2710.349	1707.4	286.898	470.045	1886.9	28.98	139.7	2.82	5.8	177.146	0.00	0.00
1	1959.0	2.0	2778.801	1733.7	310.859	481.301	1919.7	29.15	141.7	3.08	5.1	177.830	2.34	0.74
2	1959.0	3.0	2775.488	1751.8	289.226	491.260	1916.4	29.35	140.5	3.82	5.3	178.657	2.74	1.09
3	1959.0	4.0	2785.204	1753.7	299.356	484.052	1931.3	29.37	140.0	4.33	5.6	179.386	0.27	4.06
4	1960.0	1.0	2847.699	1770.5	331.722	462.199	1955.5	29.54	139.6	3.50	5.2	180.007	2.31	1.19

参数	说明
freq	表示重采样频率的字符串或DateOffset
axis	重采样的轴，默认axis=0
fill_method	升采样如何插值，比如‘ffill’或‘bfill’，默认不插值
closed	在降采样中，各时间段的哪一端是闭合的，right（默认）或left
label	在降采样中，如何设置聚合值标签，right或left
loffset	面元标签的时间校正值
limit	在前向或后向填充时，允许填充的最大时期数
kind	聚合到周期（period）或时间戳（timestamp），默认聚合到时间序列的索引类型
convention	当对周期进行重采样，将低频周期转换为高频的惯用法（start或end），默认end

	open	high	low	close
2000-01-01 00:00:00	0	4	0	4
2000-01-01 00:05:00	5	9	5	9
2000-01-01 00:10:00	10	11	10	11

	Colorado	Texas	New York	Ohio
2000-01-05	0.039652	0.408064	-0.510078	0.185826
2000-01-12	-0.615524	-0.037849	-1.418894	0.653989

	Colorado	Texas	New York	Ohio
2000-01-05	0.039652	0.408064	-0.510078	0.185826
2000-01-06	NaN	NaN	NaN	NaN
2000-01-07	NaN	NaN	NaN	NaN
2000-01-08	NaN	NaN	NaN	NaN
2000-01-09	NaN	NaN	NaN	NaN
2000-01-10	NaN	NaN	NaN	NaN
2000-01-11	NaN	NaN	NaN	NaN
2000-01-12	-0.615524	-0.037849	-1.418894	0.653989

	Colorado	Texas	New York	Ohio
2000-01-05	0.039652	0.408064	-0.510078	0.185826
2000-01-06	0.039652	0.408064	-0.510078	0.185826
2000-01-07	0.039652	0.408064	-0.510078	0.185826
2000-01-08	0.039652	0.408064	-0.510078	0.185826
2000-01-09	0.039652	0.408064	-0.510078	0.185826
2000-01-10	0.039652	0.408064	-0.510078	0.185826
2000-01-11	0.039652	0.408064	-0.510078	0.185826
2000-01-12	-0.615524	-0.037849	-1.418894	0.653989

	Colorado	Texas	New York	Ohio
2000-01-05	0.039652	0.408064	-0.510078	0.185826
2000-01-06	0.039652	0.408064	-0.510078	0.185826
2000-01-07	0.039652	0.408064	-0.510078	0.185826
2000-01-08	NaN	NaN	NaN	NaN
2000-01-09	NaN	NaN	NaN	NaN
2000-01-10	NaN	NaN	NaN	NaN
2000-01-11	NaN	NaN	NaN	NaN
2000-01-12	-0.615524	-0.037849	-1.418894	0.653989

	Colorado	Texas	New York	Ohio
2000-01-06	0.039652	0.408064	-0.510078	0.185826
2000-01-13	-0.615524	-0.037849	-1.418894	0.653989

	Colorado	Texas	New York	Ohio
2000-01	-0.638649	-1.405857	0.415621	-1.001946
2000-02	1.266635	0.550081	-0.212091	-0.355084
2000-03	1.703974	0.651728	0.990770	0.323334
2000-04	-0.482890	-0.609073	1.771766	0.546269
2000-05	1.356010	1.584438	0.788411	-2.729561

	Colorado	Texas	New York	Ohio
2000	0.446096	-0.051901	0.142156	-0.407821
2001	0.127696	0.079421	0.186049	0.064369

	Colorado	Texas	New York	Ohio
2000Q1	0.446096	-0.051901	0.142156	-0.407821
2000Q2	0.446096	-0.051901	0.142156	-0.407821
2000Q3	0.446096	-0.051901	0.142156	-0.407821
2000Q4	0.446096	-0.051901	0.142156	-0.407821
2001Q1	0.127696	0.079421	0.186049	0.064369
2001Q2	0.127696	0.079421	0.186049	0.064369
2001Q3	0.127696	0.079421	0.186049	0.064369
2001Q4	0.127696	0.079421	0.186049	0.064369

	Colorado	Texas	New York	Ohio
2000Q4	0.446096	-0.051901	0.142156	-0.407821
2001Q1	0.446096	-0.051901	0.142156	-0.407821
2001Q2	0.446096	-0.051901	0.142156	-0.407821
2001Q3	0.446096	-0.051901	0.142156	-0.407821
2001Q4	0.127696	0.079421	0.186049	0.064369

	Colorado	Texas	New York	Ohio
2000Q4	0.446096	-0.051901	0.142156	-0.407821
2001Q1	0.446096	-0.051901	0.142156	-0.407821
2001Q2	0.446096	-0.051901	0.142156	-0.407821
2001Q3	0.446096	-0.051901	0.142156	-0.407821
2001Q4	0.127696	0.079421	0.186049	0.064369
2002Q1	0.127696	0.079421	0.186049	0.064369
2002Q2	0.127696	0.079421	0.186049	0.064369
2002Q3	0.127696	0.079421	0.186049	0.064369

	AAPL	MSFT	XOM
2003-01-02	7.40	21.11	29.22
2003-01-03	7.45	21.14	29.24
2003-01-06	7.45	21.52	29.96
2003-01-07	7.43	21.93	28.95
2003-01-08	7.28	21.31	28.83
...	...	...	...
2011-10-10	388.81	26.94	76.28
2011-10-11	400.29	27.00	76.27
2011-10-12	402.19	26.96	77.16
2011-10-13	408.43	27.18	76.37
2011-10-14	422.00	27.27	78.11

	AAPL	MSFT	XOM
2003-01-02	7.40	21.11	29.22
2003-01-03	7.45	21.14	29.24
2003-01-06	7.45	21.52	29.96
2003-01-07	7.43	21.93	28.95
2003-01-08	7.28	21.31	28.83
...	...	...	...
2011-10-10	388.81	26.94	76.28
2011-10-11	400.29	27.00	76.27
2011-10-12	402.19	26.96	77.16
2011-10-13	408.43	27.18	76.37
2011-10-14	422.00	27.27	78.11

	AAPL	MSFT	XOM
2003-01-02	7.400000	21.110000	29.220000
2003-01-03	7.425000	21.125000	29.230000
2003-01-06	7.433333	21.256667	29.473333
2003-01-07	7.432500	21.425000	29.342500
2003-01-08	7.402000	21.402000	29.240000
...	...	...	...
2011-10-10	389.351429	25.602143	72.527857
2011-10-11	388.505000	25.674286	72.835000
2011-10-12	388.531429	25.810000	73.400714
2011-10-13	388.826429	25.961429	73.905000
2011-10-14	391.038000	26.048667	74.185333

10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

利用python进行数据分析之时间序列--小白笔记

日期和时间数据类型及工具

字符串和datetime的相互转换

时间序列基础

索引、选取、子集构造

带有重复索引的时间序列

日期的范围、频率、以及移动

生成日期范围

频率和日期偏移量

WOM日期

移动（超前和滞后）数据

通过偏移量对日期进行位移

时期及其算术运算

时期的频率转换

按季度计算的时期频率

将Timestamp转换为Period（及其反向过程）

通过数组创建PeriodIndex

重采样及频率转换

降采样

OHLC重采样

升采样和插值

通过时期进行重采样

移动窗口函数

指数加权函数

二元移动函数

用户自定义函数

你可能感兴趣的:(python,数据分析,笔记)