CCF CSP认证 历年题目自练Day50

题目

试题编号: 201809-3
试题名称: 元素选择器
时间限制: 1.0s
内存限制: 256.0MB
问题描述:
CCF CSP认证 历年题目自练Day50_第1张图片

CCF CSP认证 历年题目自练Day50_第2张图片
CCF CSP认证 历年题目自练Day50_第3张图片
CCF CSP认证 历年题目自练Day50_第4张图片

题目分析(个人理解)

  1. 还是先理解题意,关于html的部分,可以按照样例画出树状图(html数据结构类似树,画图更清楚的明白子类父类的关系)。两个点就是第一层级,四个点就是第二层级,依次类推。
  2. 如图所示,框起来的就是后代选择器,查找要做的就是返回他们在html文档的行号。CCF CSP认证 历年题目自练Day50_第5张图片
  3. 对于html的内容无非是查找时的选择器的种类不同,对于查找有三种情况:(1)单个标签选择器(2)单个id选择器(3)对于此题理解的有难度的地方在于出现后代选择器的情况,迭代选择器出现的情况有两种,第一种多个标签选择器,第二种多个ID选择器
  4. 做此类模拟题要根据输出选择输入内容的容器类型,(本人️的教训)此题最后返回的是行数,又因为要判断标签还是id还是后代选择器还要判断父子关系,因此在存入html文档的内容时采用字典存储。存储每一行html文档的层级,标签和id选择器内容。对于查询语句的存储还是选择列表,利用split方法切分字符串,再用append方法追加写入即可。
  5. 下面进行判断,到底是查找的哪种情况,很容易,如果查询语句的长度是1则是ID或标签选择器;否则就是后代选择器。
  6. 之后利用函数分别实现三种选择器的方法,进入的参数是查询的语句,返回值是满足条件的行号。后面的代码注释写的非常清楚了,我就不多赘述。
  7. 上代码!!!
def Level(String):#此函数将实现存储html文档每一行的内容;并且以字典的形式返回缩进层级,标签和ID
    for i in range(len(String)):
        if String[i] != '.':#统计表示缩进的符号
            break
    level = i // 2#计算当前缩进
    label = ''#存储标签
    ID = ''#存储ID
    if len(String[i:].split()) == 1:#只有一个选择器
        label = String[i:]#写入
    else:#后代迭选择器
        label, ID = String[i:].split()#写入
    return {'level': level,'label': label, 'id': ID}

row, test = map(int, input().split())#输入html总行号和测试数量
html = [None] # 存放html文档全部内容,位序表示行号;由于从一开始,列表位序从0开始所以,0号位用None占位html[]内的元素表示{'level': level,'label': label, 'id': ID}
#print(html)
for i in range(row):#输入
    html.append(Level(input()))#直接进入函数判断,注意返回的是字典
search = []#存放查询的操作
for i in range(test):
    search.append(list(input().split()))#存放到对应列表

def LabelOrId(String):#判断是哪种选择器,ID还是标签
    temp = [0]#设置选择器个数初始值
    for i in range(1, len(html)):#遍历整个html文件的结构
        if String.lower() == html[i]['label'].lower() or String == html[i]['id']:#判断查询的标签是否在输入的html文档中;如果存在
            temp[0] += 1#temp[0]表示有几个选择器(IDorLabel)temp[1]表示行号;也就是temp[]存储的是每一行选择器的个数
            temp.append(i)
    return temp

def ParentRow(row):#利用缩进关系确定html文档的父子关系
    if row == 0:#html文档没内容
        return 0
    else:#有内容
        level = html[row]['level']#返回html文档最高缩进层数
        for i in range(row, 0, -1): # html第0位为None
            if html[i]['level'] == level - 1:#只相差一层则存在父节点;注意存在爷爷父亲儿子的情况(三级或更多)
                return i#返回父节点行号
        return 0 # 不存在父节点

def Descendant(List):#后迭代选择器;参数是search[]
    row = []#存放合法的,满足条件的行数、行号(输出的内容)
    temp_answer = LabelOrId(List[-1])#前面都是相同的ID选择器或者元素选择器;返回的是最后一个选择器的行号
    for i in range(temp_answer[0]):#遍历html文档
        flag = []#利用此列表判断合法性
        son_row = temp_answer[i + 1]#返回子节点行号;
        family_row = [son_row]#把最小层级子节点行号存入family_row[]
        while True:
            parent_row = ParentRow(son_row)#返回存在子节点的行号
            if parent_row == 0:#没有子节点
                break
            else:
                family_row.append(parent_row)#把存在子节点的行号存入family_row[]
                son_row = parent_row#更新子节点行号
        family_row.reverse()#翻转;此时family_row[]的元素是从小到大的子节点行号
        j, k = 0, 0#j记录查询个数,k记录子节点个数
        while k < len(family_row):
            if List[j].lower() == html[family_row[k]]['label'].lower() or List[j] == html[family_row[k]]['id']:#判断输入合法性
                flag.append(True)
                k += 1
                j += 1
                if j >= len(List): 
                	break
            	else:
                	k += 1
        if flag == [True] * len(List):#全部合法
            row.append(temp_answer[i + 1])#返回子节点的行号
    l = len(row)
    row.insert(0, l)#等价于row[0]记录row的长度
    return row

result = []
for i in range(test):
    if len(search[i]) == 1:#长度为一不存在迭代
        answer = LabelOrId(search[i][0]) # 标签和ID选择器
        result.append(answer)
    else:#迭代
        answer = Descendant(search[i]) # 后代选择器
        result.append(answer)

for i in range(len(result)):#按照格式输出
    print(' '.join(map(str, result[i])))

# 测试样例
'''
11 5
html
..head
....title
..body
....h1
....p #subtitle
....div #main
......h2
......p #one
......div
........p #two
p
#subtitle
h3
div p
div div p
'''

总结

Joker!
CCF CSP认证 历年题目自练Day50_第6张图片

你可能感兴趣的:(CCF,CSP认证,ccf,csp,学习,学习方法,python)