ACM题目中关于数据的生成以及OJ上Linux和Windows里回车和换行的处理

ACM题目中关于数据的生成以及OJ上Linux和Windows里回车和换行的处理

前言:都是一些浅层的理解,求各位大佬轻喷。

基本的随机数生成

一个好的题目需要有强大的数据来支撑,数据一般由两部分组成,一是边界数据,二是随机数据。对于前者,可能需要手写数据来生成,而后者可以借助rand()函数一次性生成多组随机数据。

因为rand()函数的内部是利用线性同余法实现的,周期较长导致随机性并不强,所以需要在main开始时借助srand()函数设置随机数种子,增强随机性。

代码:

srand(time(0));

对于整数的生成,我们可以借助rand()函数和%来生成固定范围的整数。比如,我想要获得[a,b)内的随机整数,就可以

int tmp=rand()%(b-a)+a;

其实写法有很多种,具体参考:传送门

为了提高生成随机数的随机性,我们可以加一点小优化(maybe有用)

int m=(rand()*rand()+rand())%1000+1;

这时候要注意,如果有题目要求一些数不能重复,比如山理工数据结构实验的选课名单,生成数据的时候就需要用map加一个判重的环节。

map<int,bool>mp;
for(int j=1;j<=cnt;j++){
	int x=(rand()*rand()+rand())%m+1;
	if(mp1[x]){
		j--;
		continue;
	}
	mp1[x]=1;
	cout<<x<<" ";
}

对于随机字母的生成,我们只需要在生成随机数后将随机数转化为字母,代码如下:(全是小写字母的情况)

string name;
int x=(rand()*rand()+rand())%26;
name+=(x+'a');

如果想要不区分大小写的话,可以在增设一个rand()生成固定区间的数,根据区间中点来判断是生成大写还是小写字母。其他方法可以自行寻找~

随机生成多个文件

懂得了以上的随机数生成法则,我们就可以愉快的造数据了。一般OJ的判题规则是在后台有多组数据,每组数据有两种文件,in文件表示该组数据的输入,out文件表示该组数据的输出,后台会运行你的代码并且将in文件的运行结果与out文件对比从而得到AC,WA,PE等多种结果。

生成数据的时候我们要做的就是一次性生成多个对应的in与out文件,上传服务器。

直接就给出学长的代码了,注释已加。

生成数据的题的题面:(好绕口啊) http://icpc.ldu.edu.cn/acm/problem.php?id=2871

大家可以先阅读题目和所给的要求再来结合代码理解(其实主要就是套板子)

#include
using namespace std;
#define PI 3.1415926
typedef long long ll;
const int maxn=1e6+7;
const ll mod=1e16;
map<string,bool>mp;///判断名字是否有重复 
map<int,bool>mp1;///判断选课的序号是否有重复 
int main() {
	srand(time(0));//随机数种子 
	for(int qi=1; qi<=15; qi++) {///想生成数据的组数 
	///以下是修改生成文件的名字 
		char str[120]= {"2871"};//可增加名字,最好为英文,中文容易乱码 
		int len=strlen(str);
		int temp=qi;
		char save[50000];
		int q=0;
		while(temp) {
			save[q++]=(char)((temp%10)+'0');
			temp/=10;
		}
		for(int i=q-1; i>=0; i--)
			str[len++]=save[i];
		str[len]='\0';
		strcat(str,".in");
		freopen(str,"w",stdout);
//------------------------------------------------------------------------------------------------ 
		///in start
		//(替换为想生成的) 
		//以下是生成in文件的数据,生成数据后输出,因为前面加了文件操作所以会输出到文件里 
		///	int m=(rand()*rand()+rand())%1000+1;
		int n=(rand()*rand()+rand())%350+1,m=(rand()*rand()+rand())%100+1;//生成学生总数和课程数量 
		mp.clear();//清空学生名字的map 
		cout<<n<<" "<<m<<endl;//将学生总数和课程数量输出到文件 
		for(int i=1;i<=n;i++){///生成每一个学生对应的信息 
			mp1.clear();///清空每个学生的选课列表 
			///生成名字 
			string name;
			int namelen=(rand()*rand()+rand())%6+2;///名字中字母的长度,为了不超长度所以设的小了一点,个人习惯 
			for(int j=0;j<namelen;j++){
				int x=(rand()*rand()+rand())%26; 
				name+=(x+'a');//可以优化为生成大写或小写字母 
			}
			for(int j=0;j<2;j++){//生成名字里的学号 
				int x=(rand()*rand()+rand())%10;
				name+=(x+'0');//转成字符串 
			}
			///去重名字 
			while(mp[name]){
				name="";
				namelen=(rand()*rand()+rand())%6+2;
				for(int j=0;j<namelen;j++){
					int x=(rand()*rand()+rand())%26;
					name+=(x+'a');
				}
				for(int j=0;j<2;j++){
					int x=(rand()*rand()+rand())%10;
					name+=(x+'0');
				}
			}
			mp[name]=1;//标记名字 
			cout<<name<<" ";//将名字输出到文件里 
		
			int cnt=(rand()*rand()+rand())%m+1;	///生成该学生的选课数量
			cout<<cnt<<" ";//将该学生的选课数量输出到文件里 
			for(int j=1;j<=cnt;j++){ 
				int x=(rand()*rand()+rand())%m+1;//生成该学生选课的序号 
				if(mp1[x]){//判断之前是否已经出现过,如果出现则该序号不算数 
					j--;
					continue;
				}
				mp1[x]=1;//标记 
				cout<<x<<" ";//将选课序号输出到文件 
			}
			puts("");//输出回车 
		}
//------------------------------------------------------------------------------------------------ 
		///in end
		//以下为文件读写操作 
		fclose(stdout);
		len=strlen(str);
		str[len-2]='\0';
		strcat(str,"out");
		freopen(str,"w",stdout);
		///out start
		///可以加标程什么的 
        ///out end
		fclose(stdout);
	}
	return 0;
}

以上是in文件的数据的生成,对于out文件的数据生成,可以在上述代码里的标程部分添加对应的标程,也可以在数据所在的文件夹里新建cpp文件并将标程放入,在main开头加入:

freopen("1.in","r",stdin);
freopen("1.out","w",stdout);

表示从文件1.in里读取并且输出到1.out文件里。

两种方法各有利弊,看喜好选择啦就。

到这里基本的数据生成已经结束了,大家可以自己出完整的题目啦!

接下来说一下我鼓捣的一下午的事情。

对于有些字符或字符串的题目,可能有时候玄学的标程都会不过,这是因为大部分OJ是Linux系统,而生成数据的时候用的Windows系统,而 windows中的换行符是\r\n, linux/unix下的换行符是\n。 具体的详细的解释可以看博客。

我们要做的就是将Windows的换行符转化为Linux格式的。

这个问题大体可以分为三步,大前提是你要有Linux系统,可以装一个VMware虚拟机,具体的安装教程就不说了(实际上是我不会)

1.将想要更改格式的文件导入虚拟机

2.在虚拟机内完成格式的转化

3.将更改完后的文件导出虚拟机

对于1.3步,可以借助VMware的VMware Tools完成,也可以直接在虚拟机里登入服务器,在虚拟机里进行格式的转化后再将文件上传至服务器。

关键是第二步,有很多方法,这里介绍一种比较好用的,其他方法可参考网上博客

将想要转化的文件所在的文件夹在终端中打开,输入 dos2unix ,后面加文件名,可以是多个。我的虚拟机把语言换了,默认是英文的。

[root@localhost-live 2860]# dos2unix 1.in 2.in 3.in 4.in 5.in 6.in 7.in 8.in 9.in 10.in 11.in 12.in 13.in 14.in 15.in 16.in 17.in 18.in 19.in 20.in
dos2unix: 正在转换文件 1.in 为Unix格式...
dos2unix: 正在转换文件 2.in 为Unix格式...
dos2unix: 正在转换文件 3.in 为Unix格式...
dos2unix: 正在转换文件 4.in 为Unix格式...
dos2unix: 正在转换文件 5.in 为Unix格式...
dos2unix: 正在转换文件 6.in 为Unix格式...
dos2unix: 正在转换文件 7.in 为Unix格式...
dos2unix: 正在转换文件 8.in 为Unix格式...
dos2unix: 正在转换文件 9.in 为Unix格式...
dos2unix: 正在转换文件 10.in 为Unix格式...
dos2unix: 正在转换文件 11.in 为Unix格式...
dos2unix: 正在转换文件 12.in 为Unix格式...
dos2unix: 正在转换文件 13.in 为Unix格式...
dos2unix: 正在转换文件 14.in 为Unix格式...
dos2unix: 正在转换文件 15.in 为Unix格式...
dos2unix: 正在转换文件 16.in 为Unix格式...
dos2unix: 正在转换文件 17.in 为Unix格式...
dos2unix: 正在转换文件 18.in 为Unix格式...
dos2unix: 正在转换文件 19.in 为Unix格式...
dos2unix: 正在转换文件 20.in 为Unix格式...

然后再说说如何将“下载”这个文件夹在终端打开。因为终端只能输入英文字符(maybe),我们右击就会出现该选项。

ACM题目中关于数据的生成以及OJ上Linux和Windows里回车和换行的处理_第1张图片
这个问题还是很烦人的0.0.
结束。

你可能感兴趣的:(笔记)