在blogspot上看到一个十分有趣的字符串算法题目,原文在这里。作者讲述了自己面试google的一次经历。本文不理会这个故事,只来讨论一下里面着个有趣的算法。
算法题目:有两个字符串由不同的字母组成,一长一短,长的为A短的为B。设计一个算法,如果所有在B中出现的字符都在A中出现,则返回true,否则返回false。
例子:
如下字符串:
字符串A: abddfdioegdddffsfagj
字符串B: dofsjadg
字符串B中每个字符都在A中出现,返回true。
如下字符串:
字符串A: aaaabbbbbbdddddd
字符串B: acc
字符串B中有字符没在A中出现,返回false。
这只是个很基础的算法题目,相信很多人都能够立刻想出答案。
答案1:对字符串B中的每个字母在A中都遍历一遍。这个答案很烂,其时间复杂度为O(n*m)
答案2:设一个哈希表,对字符串A的字符遍历,将每个字符对应的哈希表中的值设为1。然后对B中的字符进行遍历,如果所有字符对应的hash值都为1,则返回true,否则返回false。
这个答案的时间复杂度是O(m+n),应该是大多数面试者想要的答案,相信大多数人也能想到。这样结束了?如果真结束了,那就谈不上有趣了!如果我们对空间要求比较高该怎么办?
答案3:我们可以观察到,字母总共就有26个,而且在上面答案中,hash表的值只有1和0两种情况。那就好办了,我们知道int类型是32位,如果用1位(bit)来表示一个字母是否出现,那么只需1个int类型就能够表示所有的字母了。
答案3实际上跟答案2类似,换汤不换药。有趣的不是他,实际上还存在一种更有意思的方法:
答案4:我们为每个字母(假设字母的数量是一定的)分配一个不重复素数,比如a为2, b为3, c为5,以此类推。这样在对字符串A进行遍历时,将每个字符表示的素数相乘,最终得到一个比较大的整数。然后从字符串B中第一个字母开始,用每个字母所代表的数除这个整数,如果余数不为0,那么就返回false。如果整个遍历过程中都没有余数,则返回true。
在我第一次从原文中看到着个答案的时候,有一种眼前一亮的感觉。实际上仔细推敲,这种算法的效率并不一定比之前的答案要高,因为往往一个乘法/除法的效率要小于加减法或者比较运算。但是却给出了一种全新的考虑问题的角度,有种奇思妙想的感觉!这种方法更为巧妙,有趣!
在每个算法题目中,你在得到一个公认的比较有效的方法后,是否考虑过更简单、有趣的方法呢?