1. python抓取网页基础知识:
http://blog.csdn.net/ithomer/article/details/13999845
2. python爬虫技巧总结 -- 解决登陆等问题
http://www.pythonclub.org/python-network-application/observer-spider
3.使用Python模拟浏览器登录并抓取数据:使用Mechanize和BeautifulSoup
http://site.douban.com/146782/widget/notes/15468638/note/355611270/
4.模拟登陆网站 之 Python版(内含两种版本的完整的可运行的代码)
http://www.crifan.com/emulate_login_website_using_python/