html 文件 转 markdown 文件

HTML和Markdown是两种非常重要的格式。HTML是用于创建网页的格式,而Markdown则是一种简单易读的文本格式,用于将文本转换为HTML。

如果正在寻找一种方法来将HTML文件转换为Markdown文件,那么可以使用Python来轻松完成这项任务。

下载模块   html2text
pip install html2text

python代码:


import html2text as ht

def html_2_text(input_file, output_file):  # 两个形参

    text_maker = ht.HTML2Text()

    # 读取html格式文件
    with open('D:\\Desktop\\index.html', 'r', encoding='UTF-8') as f:
        htmlpage = f.read()

    # 处理html格式文件中的内容
    text = text_maker.handle(htmlpage)

    # 写入处理后的内容
    with open('D:\\Desktop\\index.md', 'w', encoding='UTF-8') as f:
        f.write(text)


if __name__ == "__main__":
    input_file = "test.html"
    output_file = "result.md"

    html_2_text(input_file, output_file)

你可能感兴趣的:(html,python)