CSP-201809-3元素选择器

CSP-201809-3元素选择器

题目链接:http://118.190.20.162/view.page?gpid=T77

题意理解:
  • 文档的基本组成为元素,元素的关键信息包括:文档当中的位置及缩进、标签、ID属性值;标签大小写不敏感,所以可以同一转换成大写或者小写;ID属性值大小写敏感;

  • 除最后一级外,前面的部分都可以尽量匹配层级小的元素。

    注意整个文档的结构类似于一棵树(由缩进决定之间的父子关系),因此后代选择器实际上对应着一条路径,根据这里的提示,我们应该从路径末尾往“根”走。

思路:
  • 考虑使用结构体表示元素,包括三个变量:缩进、标签、ID。注意行数是其在结构体数组中的下标,从1开始;

  • 选择器的判断:如果是单一选择器,那么不存在空格;否则必然是后代选择器;

    • 对于前面两种可以直接遍历匹配;

    • 对于后代选择器,因此其包含的字符串可能有多个,而且需要逐级匹配,所以考虑使用vector保存。之后遍历整个数组判断是否存在某个元素满足后代选择器中最后一级,如果满足,由于题目提示:

      多级的后代选择器在匹配时,可以采用贪心的策略:除最后一级外,前面的部分都可以尽量匹配层级小的元素。

      所以我们从后往前遍历,不断地判断是否匹配vector当中的字符串,如果一直到文档开始都没有匹配完全,那么说明匹配失败,继续判断下一行的元素。

  • 结果的输出:注意需要输出元素数量、匹配元素的行数,所以使用vector进行保存。

样例:
11 5
html
..head
....title
..body
....h1
....p #subtitle
....div #main
......h2
......p #one
......div
........p #two
p
#subtitle
h3
div p
div div p
实现:
#include
#include
#include
#include
#include
using namespace std;
const int maxn = 110;
struct element
{
	string label,id;
	int ind;//缩进 
};

element x[maxn];
vector<string> des;//存储后代选择器的字符串
vector<int> ans; 

void init()
{
	ans.clear();
	des.clear();
}

int n,m,cnt,pos;
string tmp,temp;

bool check(int index)
{
	int num = x[index].ind,d = des.size()-2;
	for(int j=index-1;j>=1;--j)
	{	
		if(x[j].ind == num-1)
		{
			if(des[d][0]!='#' && des[d]==x[j].label)d--;
			else if(des[d][0]=='#' && des[d]==x[j].id)d--;
			//cout<<"此时d = "<
			if(d < 0)return true;
			num = x[j].ind;//往父亲元素走
		}
	}
	return false;
}
int main()
{
	cin >> n >> m;
	getchar();
	for(int i=1;i<=n;++i)
	{
		getline(cin,tmp);
		//根据'.'计算层级 
		pos = count(tmp.begin(),tmp.end(),'.');
		x[i].ind = pos/2;
		//判断是否含有ID选择器
		tmp.erase(0,pos);
		
		pos = tmp.find('#');
		if(pos==string::npos)
		{
			transform(tmp.begin(),tmp.end(),tmp.begin(),::toupper);
			x[i].label = tmp;
			x[i].id = "";
		}
		else
		{
			if(pos == 0)x[i].label="";
			else 
			{
				temp = tmp.substr(0,pos-1);
				transform(temp.begin(),temp.end(),temp.begin(),::toupper);
				x[i].label = temp;
			}
			x[i].id = tmp.substr(pos);
		}			
	}
	
	for(int i=1;i<=m;++i)
	{
		getline(cin,tmp);
		init();
		if(count(tmp.begin(),tmp.end(),' ') == 0)
		{//不是多级 
			if(tmp[0]=='#')
			{
				for(int j=1;j<=n;++j)
					if(x[j].id == tmp)ans.push_back(j);
			}		
			else
			{
				transform(tmp.begin(),tmp.end(),tmp.begin(),::toupper);
				for(int j=1;j<=n;++j)
				{
					if(x[j].label == tmp)ans.push_back(j);
				}
					
			}
		}
		else
		{
			int index = tmp.find(' ');
			while(index!=string::npos)
			{
				temp = tmp.substr(0,index);
				if(temp[0]=='#')des.push_back(temp);
				else
				{
					transform(temp.begin(),temp.end(),temp.begin(),::toupper);
					des.push_back(temp);
				}
				tmp.erase(0,index+1);
				index = tmp.find(' ');
			}
			if(tmp[0]=='#')des.push_back(tmp);
			else
			{
				transform(tmp.begin(),tmp.end(),tmp.begin(),::toupper);
				des.push_back(tmp);
			}
			int size = des.size();
			for(int j=1;j<=n;++j)
			{
				if((des[size-1][0]=='#'&&des[size-1]==x[j].id) || (des[size-1][0]!='#' && des[size-1]==x[j].label))
				{
					//cout<<"此时j = "<
					if(check(j))ans.push_back(j); 
				}	
			}
		}
		cout<<ans.size();
        for(int j=0;j<ans.size();j++)
            cout<<" "<<ans[j];   //输出
        cout<<endl;
	}
	
	return 0;
}
错误记录:
  • 后代选择器根据空格进行拆分的时候,刚开始由于substr(0,index+1)导致字符串末尾会被加上空格,因此后面查询错误,花了很长时间才发现这个错误。(因为输出判断的时候也没有注意到末尾的空格,最后在字符串中间加上-----才发现不对劲…)注意find函数返回的是空格的位置,因此末尾应该在index-1处;由于从0至index-1共有index个字符,因此substr函数的参数应该是index。
总结:
  • 首先思路方面需要理解题意。题面比较长,需要耐心、仔细阅读。
  • 具体实现方面用到了很多字符串函数及操作,这方面需要比较熟悉。

你可能感兴趣的:(程序设计思维与实践)