初学python遇到的问题大全

我真的是一个超级超级无敌小白,最近关注了一个特别好的数据分析的公众号,定时会给一些有趣的数据分析和代码,因此准备在国庆实践一下的,结果一拖就是一周到了今天……上午终于实现python爬取数据了。

    • 关于python的配置,网上一抓一大把(配置太久,我都忘了……),我用的是sublime text来写
    • 在sublime text中运行python(需要交互的话),需要通过tools -> sublimeREPL -> python -> RUN current files
    • 第一个问题出现在此处:
      page = requests.get(url.format(i)).content
      selector = etree.HTML(page)
      这个etree在lxml包里,但是最新版本(4.4)的包(通过 pip install lxml直接安装的)里面已经没有了,因此我用的是 3.7.3版本的(我的python是3.6.1版本的),通过百度知道的方法安装即可。
      注意:page需要加“.content”,目的是将Unicode的类型转化为Bytes,因为etree.html()只能处理string类型的
    • 第二个问题:因为要使用数据框架,所以需要引入pandas包(使用里面的DataFrame函数)——如果直接install会很慢,可以使用豆瓣源”pip install -i https://pypi.douban.com/simple pandas“ (可以直接将默认设为豆瓣源,)
    • 第三个问题:python语法非常严格,对于空格要求也很严格:IndentationError: unexpected indent 这句话的意思就是:出现了没必要的缩进,找到地方,把空格删掉就好了
    • 现在回头一看,其实就这么几个小问题……竟然花了很多时间……

你可能感兴趣的:(python)