[python每日一练]--0008:找出html中正文

题目链接:https://github.com/Show-Me-the-Code/show-me-the-code
我的github链接:https://github.com/wjsaya/python_spider_learn/tree/master/python_daily
个人博客地址:https://wjsaya.github.io
第 0008 题:一个HTML文件,找出里面的正文。

思路:

  1. 打开html文件;
  2. 呃。。。卡住了,不知道怎么搞了;

代码:

#!/usr/bin/env python3
#coding: utf-8
#Auther: wjsaya
#第 0008 题:一个HTML文件,找出里面的正文。
import re
import os

def analyze(file_name):
    os.listdir()
    print(os.getcwd())
    line = open(file_name,'r',encoding='utf-8').read()
    print (line)
        # re.findal(r'',)

if __name__ == "__main__": 
    html = "./test.html"
    analyze(html)


效果图:


你可能感兴趣的:(python)