Python和Web:
Tidy并不能修复HTML文件存在的所有问题,但确实能够确保文件是格式良好的(即 所有元素都嵌套正确),这让解析工作容易得多。
Beautiful Soup是一个小巧而出色的模块,用于解析你在Web上可能遇到的不严谨且格式糟糕 的HTML。
2使用 CGI 创建动态网页: 要让CGI脚本能够通过Web进行访问(和运行),必须将其放在Web服务器能够访问的地方、 添加!#行并设置合适的文件权限。接下来依次介绍这三个步骤: 第一步:准备 Web 服务器; 第二步:添加#!行; 第三步:设置文件权限
3使用 Web 框架
4 Web 服务:更高级的抓取