Html、Markdown的信息提取

目录

  • 一、前言
  • 二、核心代码
    • 1、解析提取html文档
    • 2、提取Markdown文档信息

一、前言

【python】 mistune转换md为HTML,BeautifulSoup解析读取。
【python】Html文档,使用BeautifulSoup解析读取。

二、核心代码

1、解析提取html文档

def extract_all_content(soup):
    content = {
   
        'text': []

你可能感兴趣的:(知识图谱,python)