第二周 2(信息标记与提取)

 

标记后的信息可形成信息组织结构,增加了信息维度
标记的结构与信息一样具有重要价值
标记后的信息可用于通信、存储或展示
标记后的信息更利于程序理解和运用

 

第二周 2(信息标记与提取)_第1张图片

 

 

第二周 2(信息标记与提取)_第2张图片

 

 

 

信息标记的三种形式:

XML
JSON
YAML

 第二周 2(信息标记与提取)_第3张图片

 

 

第二周 2(信息标记与提取)_第4张图片

 

 

第二周 2(信息标记与提取)_第5张图片

 

第二周 2(信息标记与提取)_第6张图片

 

 

 

第二周 2(信息标记与提取)_第7张图片

 

第二周 2(信息标记与提取)_第8张图片

 

 

第二周 2(信息标记与提取)_第9张图片

 

 

 

第二周 2(信息标记与提取)_第10张图片

 

第二周 2(信息标记与提取)_第11张图片

 

 

第二周 2(信息标记与提取)_第12张图片

第二周 2(信息标记与提取)_第13张图片

 

 基于bs4库的HTML内容查找方法

from bs4 import BeautifulSoup
import requests

r = requests.get("http://python123.io/ws/demo.html")
demo = r.text

soup = BeautifulSoup(demo, 'html.parser')
soup.find_all('a')
soup.find_all(['a', 'b'])
for tag in soup.find_all(True):
    print(tag.name)

  

 

第二周 2(信息标记与提取)_第14张图片

 

第二周 2(信息标记与提取)_第15张图片

 

 

 

第二周 2(信息标记与提取)_第16张图片

 

第二周 2(信息标记与提取)_第17张图片

 

 

第二周 2(信息标记与提取)_第18张图片

 

 

 第二周 2(信息标记与提取)_第19张图片

 

 第二周 2(信息标记与提取)_第20张图片

第二周 2(信息标记与提取)_第21张图片

 

 第二周 2(信息标记与提取)_第22张图片

 

转载于:https://www.cnblogs.com/key221/p/9524062.html

你可能感兴趣的:(第二周 2(信息标记与提取))