【python学习笔记】学习目的、资料汇总

【目的】为了做网络爬虫,在百度上搜索新闻,并记录在txt内,学习python。

【入门】
了解python:
文件:保存,文本文档 .py
运行: 终端运行, python name.py
注释:#  “”“    ”“”
函数:

def function():
	print 'function'

库、模块导入:

import urllib2

变量:无明显类型区别,不需要先声明


安装 开发环境:

在python.org上下载python2.7
解释器shell  python.exe ,
修改环境参数:在path环境变量上加上python.exe所在的路径
IDLE编辑,可自带格式、有颜色地编写代码,可按F5运行程序
编写hello world程序:直接print 'hello world'就行了,十分简单


网落功能:

实现网页抓取的功能,用urllib2模块实现


beautifulsoup:
第三方模块,需要另外下载,用来处理html,不符合规范的html也可以被理顺,可以按照标签抓取
soup.find_all('div',{class,"articleBody"})
http://www.crifan.com/python_third_party_lib_html_parser_beautifulsoup/ http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html 中文介绍
http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/ 安装了3.0.6


python资料:
在线手册:http://shouce.jb51.net/python/
本地的模块、函数搜索:f1帮助, documentation

你可能感兴趣的:(【学习笔记】Python系列,python,网络爬虫,新闻抓取)