python好用的包

Office

import xlrd
import xlwt
import docx
from xlutils.copy import copy
import xlsxwriter
这几个是我常用的自动化处理word和excel的库,自动生成docx,excel,读取excel转化为docx,骚操作很多

爬虫

selenium这个最牛了,模拟人类操作,基本上不会触发反扒,逻辑简单(可以自动填写问卷星)
import requests
from lxml import etree
这两个就是基础组件,只是模拟请求,好的方面就是快,能挖到一些界面不显示的内容,坏的方面的就是特别容易被反扒,需要的爬虫技术比较高

re

这个是自带的库,他是我们处理文字最常用的库
包括正则,切分,去除空格,查找替换,功能强大

json

这个库一定要学,常用的函数一定要掌握loads、dumps非常重要
文字识别
import ddddocr
Ocr文字识别,比较好用

大数据

import pandas
import numpy
用python处理大数据都知道的必备库就是pandas、numpy

机器学习

tensorflow、pytorch,这个火了好久了
Ps要学机器学习推荐b站的吴恩达和李宏毅的,讲的深入浅出,基本上看完之后常用的模型都可以上手

强化学习

我是看b站的莫烦Python学的,因为强化学习具有更好的可解释性,不像机器学习的那种黑盒,也是最近的流行趋势

你可能感兴趣的:(机器学习,python,开发语言,excel)