【CSP模拟测试】201809-3元素选择器

题意:

解题思路:
(这个题的长度我是服气的哈,看了快半个小时)

这里采用树来存储文档结构信息,可以根据输入顺序对文档结构树进行先序遍历,再根据选择器的查找方式可以确定使用树的双亲表示法的存储结构就已经能满足查找要求。
将一行文档结构信息视为树的一个结点信息(后文的文档结构信息简称为结点信息),所有的结点用一个向量或数组来保存。
定义结点类型。一个结点应至少记录以下信息:元素(标签)、属性和父结点在向量中的位置(这里用下标来表示)。由于对于每行输入信息需要自行确定其父结点的位置,且输入字符串中唯一能利用做到这一点的数据就是“.”的个数(相当于结点的深度)。因此结点信息中还要记录结点的深度

代码:

#include 
#include 
#include 
 
using namespace std;
 
typedef struct HTML
{
	string elem = ""; //记录元素即标签
	string id = ""; //记录属性
	int deep = 0; //记录深度,规定根节点即html的深度为0
	int father = 0; //此结点的父亲在向量中的下标
}HTML;
 
vector<HTML> v(110); //存放各结点,下标等于行号,故从1开始存储
 
HTML readString(string s) 
{
	HTML temp;
	enum STATE { BEGIN, DOT, ELEM, ID };
	STATE state = BEGIN;
	int deep = 0;
	bool even = false; //用来判断‘.’出现次数是否为偶数次
	for(unsigned i = 0; i < s.size(); i++)
	{
		switch(state)
		{
		case BEGIN:
			if(s[i] == '.') { i--; state = DOT; break; }
			else { i--; state = ELEM; break; }
		case DOT:
			if(s[i] != '.') { temp.deep = deep; i--; state = ELEM; break; } //记录结点深度
			deep = even ? deep + 1 : deep; //计算结点深度
			even = !even;
			break;
		case ELEM:
			if(s[i] == ' ') { state = ID; break; }
			temp.elem += tolower(s[i]); //元素对大小写不敏感故统一按小写存储
			break;
		case ID:
			temp.id += s[i]; //属性对大小写敏感故直接存储
		}
	}
	return temp;
}
 
void findFather(int k) //查找结点的父结点下标(行号)
{
	//其实这是一个多余的判断,由于已经设置father默认为0,因此k=1时仍能正确计算该结点father为0
	if(k != 1)
	{
		for(int i = k - 1;; i--) //从上一个存储的结点开始向前查找,通过深度判断结点关系
		{
			//两结点深度一致说明其为兄弟关系,拥有同一个父亲
			if(v[i].deep == v[k].deep) { v[k].father = v[i].father; break; }
			//若已存储结点的深度恰好比待查结点深度少1,则说明二者是父子关系
			else if (v[i].deep == v[k].deep - 1) { v[k].father = i; break; }
			//其他情况不予理会
		}
	}
}
 
void readCommand(string s, vector<string> &cmd) //读取选择器
{
	string buf = "";
	enum STATE {BEGIN, ELEM, ID, STORE};
	STATE state = BEGIN;
	for(unsigned i = 0; i < s.size(); i++)
	{
		switch(state)
		{
		case BEGIN:
			if(s[i] == '#') { i--; state = ID; break; }
			else { i--; state = ELEM; break; }
		case ELEM:
			if(s[i] == ' ') { state = STORE; break; }
			buf += tolower(s[i]);
			break;
		case ID:
			if(s[i] == ' ') { state = STORE; break; }
			buf += s[i];
			break;
		case STORE:
			if(s[i] == '#') { cmd.push_back(buf); buf = ""; i--; state = ID; break; }
			else { cmd.push_back(buf); buf = ""; i--; state = ELEM; break; }
		}
	}
	cmd.push_back(buf);
}
 
void search(vector<string> &cmd, vector<int> &ans, int n) //查找函数
{
	int all = 0; //记录查找到的结果总数
	for(unsigned i = n; i > 0; i--) //在v向量中从后向前查找,从而保证输出顺序由小到大(栈的性质)
	{
		if(v[i].elem == cmd.back() || v[i].id == cmd.back()) //第一次的匹配必须要成功,否则不符题目要求
		{
			int k = v[i].father; //v向量中定位到父结点
			for(unsigned j = cmd.size() - 2;;) //命令向量(命令栈)中定位到下一条查找命令
			{
				if(j == -1) { all++; ans.push_back(i); break; } //命令栈为空说明查找成功
				if(k == 0) break; //命令栈非空但v向量已到达根结点则必定失败故不必再去尝试(提高查找效率)
				if(v[k].elem != cmd[j] && v[k].id != cmd[j])
					k = v[k].father; //匹配失败则命令栈不动,v向量前移到新的父结点
				else { k = v[k].father; j--; } //匹配成功则二者同时移动
			}
		}
	}
	ans.push_back(all);//最后将结果的总个数入栈
}
 
int main()
{
 
	int n, m;
	cin >> n >> m;
	getchar(); //提取缓冲区中的换行符
	for(int i = 1; i < n + 1; i++)
	{
		string s;
		getline(cin, s); 
		v[i] = readString(s); 
		findFather(i);
	}
	vector<vector<string>> vcmd(m); //存储命令向量的向量或者说是命令栈的向量
	for(int i = 0; i < m; i++)
	{
		string c;
		getline(cin, c);
		readCommand(c, vcmd[i]); //读取并存储选择器
	}
	vector<vector<int>> vans(m); //存储各选择器的结果栈的向量
	for(int i = 0; i < m; i++) search(vcmd[i], vans[i], n);
	for(auto &e : vans)
	{
		while(!e.empty()) //用栈的方式弹出数据并输出
		{
			cout << e.back() << ' ';
			e.pop_back();
		}
		cout << endl;
	}
 
	
	return 0;
}

你可能感兴趣的:(CSP模测)