国内某大型搜素引擎公司笔试题

一、简答题

1、列举几个常见的哈希算法,简述哈希算法的主要用途


主要用途:查找关键字、文件校验、数字签名

2、描述OSI的7层架构,并指出HTTP、UDP、ARP协议在那一层?

应用层:为应用程序提供网络服务

表示层:确保不同应用信息的识别

会话层:建立数据传输通路

传输层:进行流量控制、分割数据包,以及定义一些传输协议

网络层:提供IP地址服务、进行IP到MAC地址的转化

数据链路层:确保帧的无差错传输

物理层:提供bit或者电压的处理

ARP属于网络层,UDP属于传输层、HTTP属于应用层

3、简述让一段C语言代码运行起来的代码要求和执行过程。

         编译,编译程序读取源程序(字符流),对之进行词法和语法的分析,将高级语言指令转换为功能等效的汇编代码,再由汇编程序转换为机器语言,并且按照操作系统对可执行文件格式的要求链接生成可执行程序。

编译的过程:源代码-->预处理-->编译-->优化-->汇编-->链接-->执行


二、算法与程序设计

1、 小杨拉来一车苹果进行包装,如果3个包一袋剩下2个,5个包一袋剩下3个,7个包一袋剩下2个,设计算法,求出N个符合条件的苹果个数。

思路: X%3 = 2; X%5 = 3; X%7 = 2;    X+2是3和7的倍数,那么X至少为23,经验证此数符合条件。而且,3,5,7的最小公倍数是105。那么满足条件的数23 + 105 * n (n = 0,1,2,3.....

2、 编写递归算法,查找字符串中相同字符连续出现的最大次数,例如:aaabbcc,最大连续重复数为3,abbc,最大连续重复数为2。

分析:每次处理完,记录连续字符的最大长度及其下一段连续字符的首位置。

/*
2、 编写递归算法,查找字符串中相同字符连续出现的最大次数,
例如:aaabbcc,最大连续重复数为3,abbc,最大连续重复数为2。

*/

int FindLen(char * str, int len, int num)
{
	int len1=1;
	if(*(str+num) == '\0')
		return len;
	char temp = str[num];
	while(temp == str[++num])
		len1++;
	if(len < len1)
		len = len1;
	FindLen(str, len, num);
}

int main()
{
	char str[] = "aaabbbbbbbbccddeefghjaaaaaaafdaaaaaa";
	cout << FindLen(str,0, 0) << endl;
	return 0;
}


3、涉及到数据库的基本知识。建立各种表。增删改查。基本的语法。C语句和SQL语句。

三、有一个数量大于100亿的整型数组,从小到大有序排列,现在该有序数组被分成若干字段,已知每段的数据个数不超过20个,但每个段内的数量不相同,且将每段内的数据重新进行打乱,得到一个新的数组。要求对得到的新的数组重新进行从小到大排序,求效率最高的算法,并给出时间复杂度分析。

         分析:我的思路是分成100亿/20个数组。对每个数组进行快排;然后再对每个排好的数组进行归并排序。nlgn。





你可能感兴趣的:(国内某大型搜素引擎公司笔试题)