今日头条爬虫实习生

这是很早的一次面试了,不过考了两道现在看来比较简单但是当时看来比较难的题目:

1、tfidf的原理是什么,请写出计算公式
2、去除字符串中连续的ac 和 b,比如aaccd,去除之后就是d,因为去除中间的ac后,剩下acd,则再去除ac,剩下d。
这道题当时完全没有考虑到用栈来解决,写了一个递归的很麻烦的办法,结果可想而知啦。
用栈很好解决啦,遇到一个c,判断栈顶是不是a,如果是a,则栈顶元素出栈,如果遇到b,则不做任何操作,如果遇到其他情况,将元素压入栈顶。
3、将一个字符串变为数字,这其实考察的是python内部str转int的知识,可以通过看源码了解内部的实现机理。

你可能感兴趣的:(今日头条爬虫实习生)