【python数据分析】获取or可视化

目录

1,准备

2,数据获取

1,例子(正常)

2,例子2(出来异常)

3,数据存取与洗涤

open . close

json 文件存取

openpyxl  (读取xlsx)

数据清洗(pandas库为主)

4,数据的分析和可视化


1,准备

  • 安装:Python,MySQL,pytcharm
  • 基础介绍:
    • 1,if__name__=='__name__'
    •  
      def A():
          print(“你好”)
      
      if__name__=='__name__'
          A()
       
      >>你好
      
      其他文件调用A()
      
      >>你好
      • 2,列表解析,

      • 3,装饰器

      • 4,递归函数

      • 5,面向对象

2,数据获取

  • 1,例子(正常)

    import requests
    import pandas as pd
    import bs4 import BrautifulSoup
    
    #1.请求数据
    
    def get():
        url =
        headers=
        data=
        data =requets.get(url,headers,data)
        return data
    
    
    #2.解析数据
    
    def jiexi(data):
        soup = BrautifulSoup(data,'lxml')
        
        #2.1数据爬取
        A1 =soup.xpath('//li')
        A2 =soup.xpath('//li')
        return A1,A2
    
    #3.存储数据
    def save_data(A1,A2):
    
        with open('boowk.json','w') as fp:     >>打开创建写入名称
        json.dump(books,fp)                >>引入写入字典
    
    
    #end开始爬取
    
    def run():
        data=get()
        A1,A2 = jiexi(data)
        save_data(A1,A2)
    
    if__name__=='__name__'
        run()
    
    
    

    2,例子2(出来异常)

  • try:
        代码块,所有逻辑
        pass
    
    excepy Exception:
        上面代码出错,知道执行当前内容
    
    
    while True:
        try:
            inp=input("输入整数")                          #代码块,所有逻辑
            i=int(inp)
    
        excepy Exception as e:                 #错误返回 ==e
             pringt(e)                         #上面代码出错,知道执行当前内容

     

3,数据存取与洗涤

  • open . close

    f =  open('hello.txt','w')

    w  ---写入

    a  ---文件最后写入

    r   ---只读

    r+  --读+写

    wb  ----二进制写入

    打开文件
    f . write('写入内容') 写入内容
    f .close() 关闭文件

     

  • json 文件存取

  • json.dumps 和json.loads
1.汉子存取

data ={'lang','汉字'}

json_str =json.dumps(data,ensure_ascii =False)

data >>
{'lang','汉字'}
  • sort_key排序
json_str =json.dumps(data,surt_keys=FTrue)
  • indent 美化输出
    json_str =json.dumps(data,indent = 4)

     

  • openpyxl  (读取xlsx)

    from openpyxl import load_workbook
    
    f =load_workbook('abc.xlsx')  --打开文件
    
    print("表名:",wb.get_sheet_names())  ----查看所有表名
    
    

     

  • 数据清洗(pandas库为主)

  • 具体看  Python数据分析-02

4,数据的分析和可视化

你可能感兴趣的:(python数据分析)