DataWhale_python训练营task8

文章目录

  • 一、任务大纲
  • 二、模块
    • 2.1 什么是模块
    • 2.2 命名空间
    • 2.3导入模块
    • 2.4 if __name__ == '__main__'
    • 2.5 搜索路径
    • 2.6 包(package)
    • 2.7 练习题
  • 三、datatime模块
    • 3.1 datetime类
    • 3.2 date类
    • 3.3 time类
    • 3.4 timedelta类
    • 3.5 练习题

一、任务大纲

Task11:模块与datetime模块(2天)
理论部分

  • 了解python的模块定义,理解python的命名空间。
  • 熟悉python模块的引用方法与搜索路径。
  • 了解并应用datetime模块。

练习部分

  • 课后思考题
  • 编程实践

二、模块

模块是一个包含所有你定义的函数和变量的文件,其后缀名是 .py 。模块可以被别的程序引入(import),以使用该模块中的函数等功能。这也是使用 Python 标准库的方法。

2.1 什么是模块

  1. 容器 -> 数据的封装
  2. 函数 -> 语句的封装
  3. 类 -> 方法和属性的封装
  4. 模块 -> 程序文件
    创建一个hello.py文件。
# hello.py
def hi():
print('Hi everyone, I love lsgogroup!')

2.2 命名空间

命名空间因为对象的不同,也有所区别,可以分为如下几种:

  • 内置命名空间(Built-in Namespaces):**Python 运行起来,它们就存在了。**内置函数的命名空间都属于内置命名空间,所以,我们可以在任何程序中直接运行它们,比如 id() ,不需要做什么操作,拿过来就直接使用了
  • 全局命名空间(Module:Global Namespaces):每个模块创建它自己所拥有的全局命名空间,不同模块的全局命名空间彼此独立,不同模块中相同名称的命名空间,也会因为模块的不同而不相互干扰。
  • 本地命名空间(Function & Class:Local Namespaces):模块中有函数或者类,每个函数或者类所定义的命名空间就是本地命名空间。如果函数返回了结果或者抛出异常,则本地命名空间也结束了。
    程序在查询上述三种命名空间的时候,就按照从里到外的顺序,即:Local Namespaces --> Global Namesspaces -->Built-in Namesspaces。
    DataWhale_python训练营task8_第1张图片

2.3导入模块

导入模块有三种方法,通过下面例子介绍。

  • import 模块名
  • from 模块名 import 函数名
  • import 模块名 as 新名字
    创建一个模块 TemperatureConversion.py。
# TemperatureConversion.py
def c2f(cel):
    fah = cel * 1.8 + 32
    return fah
def f2c(fah):
    cel = (fah - 32) / 1.8
    return cel

第一种:import 模块名

import TemperatureConversion

print('32摄氏度 = %.2f华氏度' % TemperatureConversion.c2f(32))
print('99华氏度 = %.2f摄氏度' % TemperatureConversion.f2c(99))

# 32摄氏度 = 89.60华氏度
# 99华氏度 = 37.22摄氏度

第二种:from 模块名 import 函数名(函数名使用*可导入所有函数)

from TemperatureConversion import c2f, f2c
from TemperatureConversion import *
print('32摄氏度 = %.2f华氏度' % c2f(32))
print('99华氏度 = %.2f摄氏度' % f2c(99))

# 32摄氏度 = 89.60华氏度
# 99华氏度 = 37.22摄氏度

第三种:import 模块名 as 新名字

import TemperatureConversion as tc

print('32摄氏度 = %.2f华氏度' % tc.c2f(32))
print('99华氏度 = %.2f摄氏度' % tc.f2c(99))

# 32摄氏度 = 89.60华氏度
# 99华氏度 = 37.22摄氏度

2.4 if name == ‘main

对于很多编程语言来说,程序都必须要有一个入口,而 Python 则不同,它属于脚本语言,不像编译型语言那样先将程序编译成二进制再运行,而是动态的逐行解释运行。也就是从脚本第一行开始运行,没有统一的入口。

if __name__ == '__main__'的意思是:当 .py 文件被直接运行时,if __name__ == '__main__'之下的代码块将被运行;当 .py 文件以模块形式被导入时,if __name__ == '__main__'之下的代码块不被运行。

2.5 搜索路径

当解释器遇到 import 语句,如果模块在当前的搜索路径就会被导入。

import sys

print(sys.path)

# ['C:\\ProgramData\\Anaconda3\\DLLs', 'C:\\ProgramData\\Anaconda3\\lib', 'C:\\ProgramData\\Anaconda3', 'C:\\ProgramData\\Anaconda3\\lib\\site-packages',...]

我们使用 import 语句的时候,Python 解释器是怎样找到对应的文件的呢?
这就涉及到 Python 的搜索路径,搜索路径是由一系列目录名组成的,Python 解释器就依次从这些目录中去寻找所引入的模块。这看起来很像环境变量,事实上,也可以通过定义环境变量的方式来确定搜索路径。
**搜索路径是在 Python 编译或安装的时候确定的,安装新的库应该也会修改。**搜索路径被存储在 sys 模块中的 path 变量中

2.6 包(package)

包是一种管理 Python 模块命名空间的形式,采用"点模块名称"。
创建包分为三个步骤:

  • 创建一个文件夹,用于存放相关的模块,文件夹的名字即包的名字。
  • 在文件夹中创建一个 __init__.py 的模块文件,内容可以为空。
  • 将相关的模块放入文件夹中。

这里给出了一种可能的包结构(在分层的文件系统中):

sound/                          顶层包
      __init__.py               初始化 sound 包
      formats/                  文件格式转换子包
              __init__.py
              wavread.py
              wavwrite.py
              aiffread.py
              aiffwrite.py
              auread.py
              auwrite.py
              ...
      effects/                  声音效果子包
              __init__.py
              echo.py
              surround.py
              reverse.py
              ...
      filters/                  filters 子包
              __init__.py
              equalizer.py
              vocoder.py
              karaoke.py
              ...

在导入一个包的时候,Python 会根据 sys.path 中的目录来寻找这个包中包含的子目录。目录只有包含一个叫做 __init__.py 的文件才会被认作是一个包,最简单的情况,放一个空的 __init__.py 就可以了。
假设要导入effects下echo模块的echofilter函数

import sound.effects.echo
sound.effects.echo.echofilter(input, output, delay=0.7, atten=4)
# --------------------------
from sound.effects import echo
echo.echofilter(input, output, delay=0.7, atten=4)
# --------------------------
from sound.effects.echo import echofilter
echofilter(input, output, delay=0.7, atten=4)

注意当使用 from package import item 这种形式的时候,对应的 item 既可以是包里面的子模块(子包),或者包里面定义的其他名称,比如函数,类或者变量。
设想一下,如果我们使用 from sound.effects import * 会发生什么?

Python 会进入文件系统,找到这个包里面所有的子模块,一个一个的把它们都导入进来。

导入语句遵循如下规则:
如果包定义文件 __init__.py 存在一个叫做 __all__ 的列表变量,那么在使用 from package import * 的时候就把这个列表中的所有名字作为包内容导入。
如果 __all__ 真的没有定义,那么使用from sound.effects import *这种语法的时候,就不会导入包 sound.effects 里的任何子模块。他只是把包 sound.effects 和它里面定义的所有内容导入进来(可能运行__init__.py里定义的初始化代码)。

2.7 练习题

1、怎么查出通过 from xx import xx导⼊的可以直接调⽤的⽅法?
2、了解Collection模块,编写程序以查询给定列表中最常见的元素。
题目说明:
输入:language = [‘PHP’, ‘PHP’, ‘Python’, ‘PHP’, ‘Python’, ‘JS’, ‘Python’, ‘Python’,‘PHP’, ‘Python’]
输出:Python
1.
当包内的__init__.py模块下有__all__列表时,则为__all__列表内定义的所有子模块。没有__all__列表时,需要看__init__.py内的代码做具体判断。
2.

"""
Input file
language = ['PHP', 'PHP', 'Python', 'PHP', 'Python', 'JS', 'Python', 'Python','PHP', 'Python']
   
Output file
Python
"""
def most_element(language):
    """ Return a list of lines after inserting a word in a specific line. """
    obj = Counter(language)
    ret = obj.most_common(1)
    return(ret[0][0])
    # your code here
me = most_element(language)
print(me)   

三、datatime模块

datetime 是 Python 中处理日期的标准模块,它提供了 4 种对日期和时间进行处理的类datetimedatetimetimedelta

3.1 datetime类

代码中pass表示忽略类的方法的具体实现,关注方法怎么用本身。

class datetime(date):
    def __init__(self, year, month, day, hour, minute, second, microsecond, tzinfo)
        pass
    def now(cls, tz=None):
        pass
    def timestamp(self):
        pass
    def fromtimestamp(cls, t, tz=None):
        pass
    def date(self):
        pass
    def time(self):
        pass
    def year(self):
        pass
    def month(self):
        pass
    def day(self):
        pass
    def hour(self):
        pass
    def minute(self):
        pass
    def second(self):
        pass
    def isoweekday(self):
        pass
    def strftime(self, fmt):
        pass
    def combine(cls, date, time, tzinfo=True):
        pass
  • datetime.now(tz=None) 获取当前的日期时间,输出顺序为:年、月、日、时、分、秒、微秒。
  • datetime.timestamp() 获取以 1970年1月1日为起点记录的秒数。
  • datetime.fromtimestamp(tz=None) 使用 unixtimestamp时间戳创建一个 datetime。

创建一个datatime对象。

import datetime

dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=23, second=59)
print(dt)  # 2020-06-25 11:23:59
print(dt.timestamp())  # 1593055439.0

dt = datetime.datetime.fromtimestamp(1593055439.0)
print(dt)  # 2020-06-25 11:23:59
print(type(dt)) # 

dt = datetime.datetime.now()
print(dt)  # 2020-06-25 11:11:03.877853
print(type(dt))  # 
  • datetime.strftime(fmt) 格式化 datetime 对象。
符号 说明
%a 本地简化星期名称(如星期一,返回 Mon)
%A 本地完整星期名称(如星期一,返回 Monday)
%b 本地简化的月份名称(如一月,返回 Jan)
%B 本地完整的月份名称(如一月,返回 January)
%c 本地相应的日期表示和时间表示
%d 月内中的一天(0-31)
%H 24小时制小时数(0-23)
%I 12小时制小时数(01-12)
%j 年内的一天(001-366)
%m 月份(01-12)
%M 分钟数(00-59)
%p 本地A.M.或P.M.的等价符
%S 秒(00-59)
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%y 两位数的年份表示(00-99)
%Y 四位数的年份表示(0000-9999)
%Z 当前时区的名称(如果是本地时间,返回空字符串)
%% %号本身
import datetime

dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49)
s = dt.strftime("'%Y/%m/%d %H:%M:%S")
print(s)  # '2020/06/25 11:51:49

s = dt.strftime('%d %B, %Y, %A')
print(s)  # 25 June, 2020, Thursday

将给定日期转换为 “mmm-dd, YYYY” 的格式

import datetime

d1 = datetime.date(2010, 9, 28)
print(d1.strftime('%b-%d,%Y'))
# Sep-28,2010
  • datetime.date() 返回日期部分
  • datetime.time() 返回时间部分, with tzinfo None.
  • datetime.year
  • datetime.month
  • datetime.day
  • datetime.hour 小时
  • datetime.minute 分钟
  • datetime.second
  • datetime.isoweekday 星期几
import datetime

dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49)
print(dt.date())  # 2020-06-25
print(type(dt.date()))  # 
print(dt.time())  # 11:51:49
print(type(dt.time()))  # 
print(dt.year)  # 2020
print(dt.month)  # 6
print(dt.day)  # 25
print(dt.hour)  # 11
print(dt.minute)  # 51
print(dt.second)  # 49
print(dt.isoweekday())  # 4

在处理含有字符串日期的数据集或表格时,我们需要一种自动解析字符串的方法,无论它是什么格式的,都可以将其转化为 datetime 对象。这时,就要使用到 dateutil 中的 parser 模块。

  • parser.parse(timestr, parserinfo=None, **kwargs)
    在 python 中将字符串解析为 datetime对象
from dateutil import parser

s = '2020-06-25'
dt = parser.parse(s)
print(dt)  # 2020-06-25 00:00:00
print(type(dt))  # 

s = 'March 31, 2010, 10:51pm'
dt = parser.parse(s)
print(dt)  # 2010-03-31 22:51:00
print(type(dt))  # 

计算以下列表中连续的天数。

import numpy as np
from dateutil import parser

dateString = ['Oct, 2, 1869', 'Oct, 10, 1869', 'Oct, 15, 1869', 'Oct, 20, 1869', 'Oct, 23, 1869']
dates = [parser.parse(i) for i in dateString]
td = np.diff(dates)
print(td)
# [datetime.timedelta(days=8) datetime.timedelta(days=5)
#  datetime.timedelta(days=5) datetime.timedelta(days=3)]
d = [i.days for i in td]
print(d)  # [8, 5, 5, 3]

3.2 date类

class date:
    def __init__(self, year, month, day):
        pass
    def today(cls):
        pass
  • date.today() 获取当前日期信息。
import datetime

d = datetime.date(2020, 6, 25)
print(d)  # 2020-06-25
print(type(d))  # 

d = datetime.date.today()
print(d)  # 2020-06-25
print(type(d))  # 

统计两个日期之间有多少个星期六

import datetime

d1 = datetime.date(1869, 1, 2)
d2 = datetime.date(1869, 10, 2)
dt = (d2 - d1).days
print(dt)
print(d1.isoweekday())  # 6
print(dt // 7 + 1)  # 40

3.3 time类

class time:
    def __init__(self, hour, minute, second, microsecond, tzinfo):
        pass
  • 1秒 = 1000 毫秒(milliseconds)
  • 1毫秒 = 1000 微妙(microseconds)
import datetime

t = datetime.time(12, 9, 23, 12980)
print(t)  # 12:09:23.012980
print(type(t))  # 

将给定日期转换为当天开始的时间

import datetime

date = datetime.date(2019, 10, 2)
dt = datetime.datetime(date.year, date.month, date.day)
print(dt)  # 2019-10-02 00:00:00

dt = datetime.datetime.combine(date, datetime.time.min)
print(dt)  # 2019-10-02 00:00:00

3.4 timedelta类

timedelta 表示具体时间实例中的一段时间。你可以把它们简单想象成两个日期或时间之间的间隔。它常常被用来从 datetime 对象中添加或移除一段特定的时间。

class timedelta(SupportsAbs[timedelta]):
    def __init__(self, days, seconds, microseconds, milliseconds, minutes, hours, weeks,):
        pass
    def days(self):
        pass
    def total_seconds(self):
        pass

如何使用timedelta

import datetime

td = datetime.timedelta(days=30)
print(td)  # 30 days, 0:00:00
print(type(td))  # 
print(datetime.date.today())  # 2020-07-01
print(datetime.date.today() + td)  # 2020-07-31

dt1 = datetime.datetime(2020, 1, 31, 10, 10, 0)
dt2 = datetime.datetime(2019, 1, 31, 10, 10, 0)
td = dt1 - dt2
print(td)  # 365 days, 0:00:00
print(type(td))  # 

td1 = datetime.timedelta(days=30)  # 30 days
td2 = datetime.timedelta(weeks=1)  # 1 week
td = td1 - td2
print(td)  # 23 days, 0:00:00
print(type(td))  # 

如果将两个 datetime 对象相减,就会得到表示该时间间隔的 timedelta 对象
同样地,将两个时间间隔相减,可以得到另一个 timedelta 对象。

from dateutil import parser
import datetime
bDay = 'Oct 2, 1969'
d1 = parser.parse(bDay).date()
d2 = datetime.date.today()
d3 = datetime.date(d2.year,d1.month,d1.day)
print(d1,d2,d3,sep='\n')
td1 = d2 - d1
td2 = d3 - d2
print(td1.days)
print(td2.days)
print(td2.days * 24 * 60 *60)
# 1969-10-02
# 2020-07-30
# 2020-10-02
# 18564
# 64
# 5529600

3.5 练习题

1、假设你获取了用户输入的日期和时间如2020-1-21 9:01:30,以及一个时区信息如UTC+5:00,均是str,请编写一个函数将其转换为timestamp:

"""
   
Input file
example1: dt_str='2020-6-1 08:10:30', tz_str='UTC+7:00'
example2: dt_str='2020-5-31 16:10:30', tz_str='UTC-09:00'
   
Output file
result1: 1590973830.0
result2: 1590973830.0
"""
import re
from datetime import datetime, timedelta, timezone
from dateutil import parser,tz

def to_timestamp(dt_str, tz_str):
    # your code here
    dt1 = parser.parse(dt_str)
    utc_group = re.match(r'([UTC]+)([+-])(\d+):(\d)',tz_str)#字符串匹配,分组
    i = int(utc_group.group(3))#时区数字
    if utc_group.group(2) == '+':#时区正负号
        tz_utc = timezone(timedelta(hours=i))
    elif utc_group.group(2) == '-':
        tz_utc = timezone(timedelta(hours=-i))
    dt = dt1.replace(tzinfo=tz_utc)#给tzinfo属性赋值
    return dt.timestamp()
dt_str='2020-6-1 08:10:30'
tz_str='UTC+7:00'
print(to_timestamp(dt_str, tz_str))
dt_str='2020-5-31 16:10:30'
tz_str='UTC-09:00'
print(to_timestamp(dt_str, tz_str))
# 1590973830.0
# 1590973830.0

2、编写Python程序以选择指定年份的所有星期日。

"""
   
Input file
   2020
   
Output file
   2020-01-05                         
   2020-01-12              
   2020-01-19                
   2020-01-26               
   2020-02-02     
   -----
   2020-12-06               
   2020-12-13                
   2020-12-20                
   2020-12-27 
"""
from datetime import datetime, date   
def all_sundays(year):
    ret = []
    # your code here
    startday = date(year,1,1)
    endday = date(year,12,31)
    d = startday
    while(d != endday ):
        if d.isoweekday() == 7:
            sd = datetime(year,d.month,d.day,hour=0,minute=0, second=0)
            sd = sd.strftime("%Y-%m-%d")
            ret.append(sd)
        d = d + timedelta(days=1)
        
    return ret
print(all_sundays(2020))
'''
['2020-01-05', '2020-01-12', '2020-01-19', '2020-01-26', '2020-02-02', '2020-02-09', '2020-02-16', '2020-02-23', 
 '2020-03-01', '2020-03-08', '2020-03-15', '2020-03-22', '2020-03-29', '2020-04-05', '2020-04-12', '2020-04-19',
 '2020-04-26', '2020-05-03', '2020-05-10', '2020-05-17', '2020-05-24', '2020-05-31', '2020-06-07', '2020-06-14', 
 '2020-06-21', '2020-06-28', '2020-07-05', '2020-07-12', '2020-07-19', '2020-07-26', '2020-08-02', '2020-08-09', 
 '2020-08-16', '2020-08-23', '2020-08-30', '2020-09-06', '2020-09-13', '2020-09-20', '2020-09-27', '2020-10-04', 
 '2020-10-11', '2020-10-18', '2020-10-25', '2020-11-01', '2020-11-08', '2020-11-15', '2020-11-22', '2020-11-29', 
 '2020-12-06', '2020-12-13', '2020-12-20', '2020-12-27']
 '''

你可能感兴趣的:(DataWhale_python训练营task8)