第三章 数据获取与展示

本地数据获取

file_obj= open(filename, mode='r', buffering=-1, …)
文件的操作流程:打开-->操作-->关闭,一定要形成一个完整的闭环

  • mode为可选参数,默认值为r
  • buffering也为可选参数,默认值为-1(0代表不缓冲,1或大于1的值表示缓冲一行或指定缓冲区大小)
  • open函数mode


    图1 open函数mode
  • 文件操作相关函数
    (1)open()函数返回一个文件(file)对象
    (2)文件对象可迭代
    (3)有关闭和读写文件相关的函数/方法:f.read(),f.write(),f.readline(), f.readlines(),f.writelines(),f.close(),f.seek()


    图2 向文件写入字符串

    图3 读取文件

网络数据获取

网络数据的通用获取方法是:爬取 + 解析

  • 爬取:urllib内建模块urllib.requests;requests第三方库;scrapy框架
  • 解析:BeautifulSoup库,re模块

你可能感兴趣的:(第三章 数据获取与展示)