python提出HTML中的连接和文本。

49



import re

if __name__ == '__main__':
    n = int(input())  #输入的行数
    for i in range(n):
        html=input()
        pattern = r']*>(.*?)'
        matches = re.findall(pattern, html)
        for match in matches: 
            s = match[1].strip()
            s = re.sub(r'<.*?>', '', s)
            print(f"{match[0]},{s}")
//simple.wikipedia.org/wiki/,Simple English
//ar.wikipedia.org/wiki/,
//id.wikipedia.org/wiki/,Bahasa Indonesia
//ms.wikipedia.org/wiki/,Bahasa Melayu
//bg.wikipedia.org/wiki/,
//ca.wikipedia.org/wiki/,Catal
//cs.wikipedia.org/wiki/,esky
//da.wikipedia.org/wiki/,Dansk
//de.wikipedia.org/wiki/,Deutsch
//et.wikipedia.org/wiki/,Eesti
//el.wikipedia.org/wiki/,
//es.wikipedia.org/wiki/,Espaol
//eo.wikipedia.org/wiki/,Esperanto
//eu.wikipedia.org/wiki/,Euskara
//fa.wikipedia.org/wiki/,
//fr.wikipedia.org/wiki/,Franais
//gl.wikipedia.org/wiki/,Galego
//ko.wikipedia.org/wiki/,
//he.wikipedia.org/wiki/,
//hr.wikipedia.org/wiki/,Hrvatski
//it.wikipedia.org/wiki/,Italiano
//lt.wikipedia.org/wiki/,Lietuvi
//hu.wikipedia.org/wiki/,Magyar
//nl.wikipedia.org/wiki/,Nederlands
//ja.wikipedia.org/wiki/,
//no.wikipedia.org/wiki/,Norsk bokml
//nn.wikipedia.org/wiki/,Norsk nynorsk
//pl.wikipedia.org/wiki/,Polski
//pt.wikipedia.org/wiki/,Portugus
//ro.wikipedia.org/wiki/,Romn
//ru.wikipedia.org/wiki/,
//sk.wikipedia.org/wiki/,Slovenina
//sl.wikipedia.org/wiki/,Slovenina
//sr.wikipedia.org/wiki/,/ srpski
//sh.wikipedia.org/wiki/,Srpskohrvatski /
//fi.wikipedia.org/wiki/,Suomi
//sv.wikipedia.org/wiki/,Svenska
//th.wikipedia.org/wiki/,
//vi.wikipedia.org/wiki/,Ting Vit
//tr.wikipedia.org/wiki/,Trke
//uk.wikipedia.org/wiki/,
//zh.wikipedia.org/wiki/,

你可能感兴趣的:(Python,前端,服务器,linux)