最近忙着面试,很意外接到百度的面试电话,在经过电话面试之后(招聘HR好好玩好NICE啊),百度邀请我去上海研发中心进一步面试,于是在昨天就花了一天跑去上海百度面试了。
因为之前面过阿里和京东,两家都通过了,说实话去百度还是被问了个措手不及,因为当时觉的问题应该和阿里京东差不多,所以一点都没准备,结果去了之后才知道百度看重的是什么,是编程能力和算法能力,基本每问一个问题,都会让你现场编写代码,问题都非常细节(都到代码层了会不细吗)Java会问到某某生僻关键字是干嘛用的,然后写段代码。。。而且现场时间很紧,面试官又会催着你,总之就是面出一身汗,第一轮是面Java,完了之后会来一个Level更高的面其他方面。让我觉的NB的是,第二轮那个面试官一开口就是“你最擅长什么”。。让我想到倚天屠龙记里面金毛狮王谢逊和张翠山那段。。。
由于之前被Java那家伙问慌了,所以就选了数据库,当时心态是这样的:数据库SQL,哼哼,我可是无论什么都能搞定的那种,结果面试官问你非常奇葩的问题:三维以上的结果集查询混合把列名当成结果集一起查询,外加一条SQL搞定。。好吧,我承认我用的两种方法他都不认可,我说做出来就好了你用得着管这么多,我不知道你心理价位是什么。。。
二轮过了就没了,我想应该是没戏,不然就会有后续的项目经验面试,好歹我大老远跑趟上海不容易。。。
现在说个Java里面问到的算法题目吧:
给定一个字符序列"abcd",要求在一个超长的字符数组中(比如几百万),以最快速度找出包含这4个字符的最短子串
最快速度,当然就是O(n)时间内了。
说实话,我当时做出50%,为什么这么说呢,因为我当时想到的是时间(O(n2))级的算法,我当时想到的算法是这样的:给定一个字符串"abcd"然后用indexOf判断包含关系,另外给定一个判别数组比如{0,0,0,0}分别对应这4个字符,如果找到一个,则把字符数组中的位置记录在判别数组中,每次循环判断数组相乘是否为0,如果为0,证明全部找到了。那么就记录下子串长度和位置,然后把判别数组清零重新开始,比较再次找到的子串长度,一直到最短为止。。
那么这样会有什么问题呢?问题就在于比如给定
eroapycinbsldfbnsdfikqiytfewkgbkfahgasdasfqwwerq这么一串时候,如果找到了第一个子串apycinbsld,那么事实上第二个子串的开始位置,不是从子串apycinbsld之后开始,应该从apycinbsld里面的c开始,因此如果用这个算法,会导致重复多次判别,时间复杂度是n2.
当时特别紧张,因为他一直等着我给答案,这种算法,越急越想不出,所以我就给了个50%。。
后来开车时回杭州路上,把这个问题给想通了,时间复杂度为O(n)级别,解法为这样:
用4个游标来标记即可
首先先找到第一个子串,找法是利用一个游标数组,比如int[] c = {0,0,0,0}这样,分别对应a,b,c,d 4个字符,然后开始循环查找大字符串,找到a,则修改第一个游标值为a当前位置,找到b则第二个以此类推,如果找到重复的,则用重复的位置替换前面位置,判别方法仍然可以用游标相乘是否为0,如果不为0,则认为4个位置都找到了,因此就找到一个子串,接下来就把最小的游标标记为0,把第二大的标记为头,重新往后找,如果找到字符不为新的头字符,则把相应的游标位置更新,每次找到新的都比较是否最短,如果是最短,就存起来,最后输出,这样就能达到O(n)级别的时间复杂度
今天抽空把代码实现了下,测试结果为:10,000,000规模下,用我的PC机,找出一个最短子串大概在350毫秒左右
因为我里面找到最小和第二小游标,都用了循环,可以把数据结构变成队列,速度能进一步提升
时间关系,我懒得写队列了,有兴趣的同学可以自行实现下
运行结果如下:
用时:369毫秒
找到最短子串:
adbac
代码如下,代码说真的也很短,但是当时就是没想出来,哎。。。
public class FindChar {
public static void main(String[] args) {
String x = "abcd";
int[] c = new int[] { 0, 0, 0, 0 };
char[] y = createCharSequence();
char s = 0;
boolean find = false, first = false;
int rs = 0, re = 0, rl = Integer.MAX_VALUE;
long a = System.currentTimeMillis();
for (int i = 1; i < y.length + 1; i++) {
int p = x.indexOf(y[i - 1]);
if (p != -1) {
if (!first) {
s = y[i - 1];
first = true;
}
if (c[0] * c[1] * c[2] * c[3] == 0) {
// if (!find) {
int k = 0;
for (int j = 0; j < c.length; j++) {
if (c[j] != 0)
++k;
}
if (k > 1) {
if (s != x.charAt(p)) {
c[p] = i;
}
} else {
c[p] = i;
}
// } else {
// c[p] = i;
// }
} else {
if (!find)
find = true;
int _rs = Math.min(Math.min(c[0], c[1]),
Math.min(c[2], c[3]));
int _re = Math.max(Math.max(c[0], c[1]),
Math.max(c[2], c[3]));
if (_re - _rs < rl) {
re = _re - 1;
rs = _rs - 1;
rl = re - rs;
}
s = x.charAt(find2ndStartPos(c));
c[findStartPos(c)] = 0;
}
}
}
System.out.println("用时:" +(System.currentTimeMillis()-a)+"毫秒");
// print
for (int i = rs; i < y.length; i++) {
if (i > re) {
break;
}
System.out.print(y[i]);
}
}
private static int findStartPos(int[] s) {
int p = Integer.MAX_VALUE;
int pos = 0;
for (int i = 0; i < s.length; i++) {
if (s[i] < p) {
p = s[i];
pos = i;
}
}
return pos;
}
private static int find2ndStartPos(int[] s) {
int pp = findStartPos(s);
int p = Integer.MAX_VALUE;
int pos = 0;
for (int i = 0; i < s.length; i++) {
if(i == pp) continue;
if (s[i] < p) {
p = s[i];
pos = i;
}
}
return pos;
}
private static char[] createCharSequence() {
char[] d = new char[] { 'a', 'a', 'a', 'b', 'c', 'd', 'e', 'f', 'g',
'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's',
't', 'u', 'v', 'w', 'x', 'y', 'z' };
char[] e = new char[10000000];
for (int i = 0; i < 10000000; i++) {
int x = (int) ((Math.round(Math.random() * 10000000)) % 28);
e[i] = d[x];
}
return e;
}
[size=medium][/size]