写在前面:
- 搜索一个问题,虽说了解得越彻底越好,但我们得考虑自己的时间成本。人生是一道资源配置选择题,对于工具,刨根究底虽然是好事,但更应该考虑的是「我应该投入多少精力来了解这玩意儿」,合适且够用就好。
- 任何事物都是不完美的,这篇文章也是。虽然我自己已经改了十几稿了,但错误和偏颇之处难免,在此提前致歉,也欢迎宁补充建议。我会不定期重新修改更新,并在文章标题注明版本。本文目前结构:P1是关于善用搜索的重要性和干货部分的筛选标准(啰嗦,但必要),P2是干货(即推荐的搜索引擎和适合用作搜索社区)。
- 本作品采用知识共享署名 4.0 国际许可协议进行许可,您可「共享」和「演绎」,但须遵守「署名」约定。
Part 1(时间有限,干货党不用读系列)
1.1 为什么要回到「搜索工具」问题上?
写这篇文章的初衷,是前一阵帮朋友找到了一些「怎么找也找不到」的数据,顺带分享过去一些搜索工具,但寻思着单几个工具也不系统,不能解决以后的很多搜索问题,于是乎有了写文的想法。而让自己反复修改这篇文章的原因,则是因为感觉我们主动搜索能力需要提升。
这里不讨论这次疫情暴露的信息公开、民智开化、真伪辨析等较为宏大的话题。仅就获取信息而言,可能很多人都是一直在被动地从一些推送、转发中了解发展动态(并不否认被动获取的价值),即使主动搜索了,也因没有善用搜索而得不到更多有价值的信息。相反,好像身边却总有一些人,能通过综合搜索整理多渠道信息,做出有限理性下的最优决策,然后又比我们更高效地学习工作去了。
信息不对称永远存在,但主动搜索能力的提升,可以帮很多非内部人士(即作为吃瓜群众的我们)获取到那些「不明觉厉、但实则已面向公众开放」的信息,帮助自己更好地认识事物、更好地做出决策。
1.2 为什么是推荐「搜索引擎」和「适合用作搜索的社区」?
主动搜索不像被动获取那般舒服,它需要我们投入时间成本。当下干货时代,很流行收集各种实用网站和资源(这当然是一个很好的方法,我也很沉迷于使用付费数据库和垂直网站,以后会写合集介绍),但由于各个网站自身的内容数据库有限,且网站之间相互孤立,如果我们仅在自己收藏的各个网站中轮流搜索的话,很可能事倍功半。
于是就回到了「搜索引擎」身上。关于为什么要用它,这就涉及它的原理了,比如蜘(爬)蛛(虫)、引文分析、PageRank等等。这玩意儿我讲不清,请移步Google的官方科普:© Google - How Search Works,他们在2019年出了一个更新版介绍:© Google - How Google Search Works (in 5 minutes),B站有搬运(BV1PE411Y7F2)
但搜索,绝不仅限于使用搜索引擎。在如今互联网越发割裂、付费内容兴起的情况下,仅仅依赖单个工具单个源头是远远不够的。正如虫部落站长 @虫子 所言:
在顶层思想中要树立「搜索引擎的形态和获取信息的渠道是多元化」的意识,这样才能在接下来的搜索过程中做到不拘一格、多管齐下、触类旁通。
在需要一定较真程度的场域下(无论是办公还是个人查资料),PC端的搜索效率是高于移动端的;但在很多灵光一现和网上冲浪意外惊喜的瞬间,移动互联网的好处无须累述;在小众资源、需要扣很多细节or耗费很多时间整理的情况下,提问、付费、自有渠道等又是很好的方法。
由于垂直领域内容的丰富程度和专业性,一些站内搜索也适合当作搜索引擎。考虑到大公司有其商业化收益考虑,一些小众的工具也值得一试。关键的关键,就在于我们能不能发现这些搜索利器,以及如何使用它们。
1.3 为什么是这些工具?它们适合搜索哪类问题?
试过很多算法推荐&他人推荐搜索引擎,只留下同类中(个人感觉)综合使用体验最好的。遍历所有工具是不可能的,但因广告、美观、地区等尝试过但放弃的工具有:Baidu, Sogou, 360搜索, Yandex, Yahoo, Bing, LYCOS, Dogpile, info等;本非搜索引擎但当搜索工具玩过,觉得很好但会在其他篇推荐的有SimilarSites、Medium、reddit、少数派、等。
留下来的这些,适合:
- 自然语句搜索(即想到什么就搜什么)& 简单关键词(简单提炼关键词),虽然高级搜索也很好,但会在搜索技巧篇另外讲。
- 5W1H - 工作泛专业向+生活轻知识向:想快速、准确、有一定深度地了解某个概念&问题、获取某种资源等。严谨的学术搜索、愉快的生活搜索等,各自是很大的话题,以后会专门写。
Part 2 - 把搜索问题放回到5W1H分类中
百度在简体中文区搜索引擎霸主的地位,不是因为它现在有多厉害,而是因为它曾经真的很流啤(在此向李彦宏老师和俞军老师磕头),留下了很多好东西(虽然糟粕也很多)。当黑百度成为政治正确的时候,其实更应该去了解了解它值得使用的产品。
在简体中文区待着很正确,只是有一些很好的东西在简体中文区外,不去看的话会错过很多精彩(即使有搬运的东西,也有很多涉及侵权问题)。而关于愿不愿意去用虚拟专用网,就看自己的需求强烈程度了(毕竟工信部想查的话很容易)。
2.1 What & Who: 「XXX」体,快速了解新听到的实词
涉及定义or概念的东西,扯远了就是学术问题了,再扯远就是本体论这种哲学问题了(据说在维基百科搜索任何一个词条,通过点击页面第一个链接,最终都能回到「Philosophy」这个词条)。
所以把这里的「What」,限制为「通过搜索能免费快速了解某一词」的狭小范围。对于「Who」,也是类似。如果想了解细节,那传记、评论、吃瓜、社区、私有渠道等都是很好的选择,这里「仅限于电子化公开的部分」。
有了上述限定,便有推荐如下:
2.1.1(墙)万物始于Google (www.google.com)
优点:很多,不再累述
缺点:简体中文区外,用户隐私问题
值得注意:搜索技巧提升一点点,快乐生活每天笑嘻嘻
2.1.2(墙)如果宁介意隐私,那DuckDuckGo不容错过(duckduckgo.com)
优点:保护隐私(当年branding的口号就是「Google tracks you. We don't.」)
缺点:简体中文区外,中文搜索结果略逊于Google
仅就主观印象而言,DuckDuckGo 在英文搜索结果上与 Google 并无明显水平差异,至少与 Bing 等二线搜索引擎处于同一基准上(事实上,DuckDuckGo 在组织搜索结果时会参考 Bing、Yahoo、Yandex 等服务的结果),大多数情况下可代替 Google 使用;但在中文搜索上,离 Google 或百度的结果尚有一定差距,对国内主要站点的索引有待加强。 (© PlatyHsu)
背后的团队从2008年开始组建,创始人Gabriel Weinberg本硕都毕业于MIT(跪拜大佬),目前团队成员的足迹如下:
它们的创立&商业故事也很有趣:揭秘DuckDuckGo :Google最渺小但最强悍的竞争对手. (© boxi),没有人能真正阻挡谷歌,但至少 DuckDuckGo 在尝试. (© 井岛俊一)
惊喜:中文简体区有类似的产品:秘迹搜索(https://mijisou.com/)
2.1.3 盆友,虫部落聚合搜索了解一下(search.chongbuluo.com)
优点:聚合了很多搜索引擎(不是镜像)搜索和扩展搜索工具都很方便,把学术、电子书、图片、资源等分开后很适合不同搜索场景,在虫部落讨论区冲浪时总是会有很多惊喜发现(下文会反复出现)
缺点:暂时没发现(爱得深沉,但不是托er)
就是一个很强悍很民间很让人爱不释手的神器,创始人 @虫子 也在知乎回答问题。
2.1.4 简体中文区,DogeDoge是你的宝藏男孩(www.dogedoge.com)
优点:给了行业网站和专业论坛等很大的权重,没啥乱七八糟的内容和广告(即使是搜娱乐八卦也没啥营销号文章,而是偏知识向科普向)
缺点:暂时还没发现(把它和Google一起作为主力搜索是有理由的)
2.1.5 搜索名词,Magi打开你的新世界(magi.com)
Magi是Peak Labs研发的(国内团队,跪拜),官方对这个搜索引擎的介绍
是基于机器学习的信息抽取和检索系统,它能将任何领域的自然语言文本中的知识提取成结构化的数据,通过终身学习持续聚合和纠错,进而为人类用户和其他人工智能提供可解析、可检索、可溯源的知识体系。(© magi.com)
优点:语义网和机器学习带来的全新搜索体验,列出「学习来源」可判断信源权威性
缺点:属性的提取有时会出错,不太适合搜索冷词(冷热词搜索对比如下)
很多「不明觉厉」的内容,都可以用上述5个工具找到。
但是,在各个问题方向上,还各自有一些其他利器推荐
2.2 Why & When: 「为什么XXX」体,「什么时候XXX」体,科普向,吃瓜向
2.2.1(墙)ASK (ask.com)
虽说ask.com是个问答工具,但把它当作搜索工具来用,也是会带来极度舒适。譬如搜BTS时,就会在前排出现youtube、quara等的内容,例如
2.2.2(墙)Quora (www.quora.com)
知乎的学习对象,也是一个有各行各业专业人士的神奇产品,例如:
2.2.3 知乎 (www.zhihu.com)
虽然诞生之初被冠以抄袭、现在被冠以bi乎的标签,但用好了会发现很多野生知识。就个人而言,想问问题前,先来这里逛逛话题、再去朋友圈跪求,会为自己省很多麻烦。
推荐 @半佛仙人 老师的恰饭视频《如何科学使用知乎》
2.3 Where: 「跪求XXX」体,找资源
首先,绝对支持正规渠道付费购买,因为付出金钱成本便意味着节省了时间成本,为自己省了很多注册网站、积攒金币等麻烦。但问题在于,一方面,有很多资源正规渠道是「待上架」状态;另一方面,很多手握资源进行要价的,既不是创作人,也不是出版方发行方,而是二道贩子。
2.3.1 电子书
崇尚无纸化的我,电子书是刚需。手机&kindle端固然方便,有微信阅读、京东阅读、亚马逊商店等正版资源,但到了PC端就开始犯难了。最开始检索资源时,简单粗暴的从Google中以「BookName filetype: pdf」进行检索,每次找到了就把某个网站添加到chrome书签以备下次找书。然后,然后就再也没有然后了(效率太低)。
有幸找到了 @杂谈by立行 的PDF检索三部曲:中文教材、英文教材、一般性PDF,整体思路如下:
但遗憾的是,豆瓣资源下载大师现在似乎没怎么维护了,很多资源显示存在但实则不存在或者失效,引擎也没有更新。
于是乎,虫部落电子书搜索 就成了找电子书的最快捷最高效途径。其中发现的资源最全的引擎便是:Google、ePUBee、智奇搜书,希望它们一直都好用。
!虫部落电子书搜索](https://upload-images.jianshu.io/upload_images/7819646-695a210644b49cde.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
2.3.2 电影资源
电视剧&综艺资源一般都靠给各大视频网站打钱&在各大字幕组那里白嫖(其实也想给字幕组打钱),但在国内审查制度下,电影完整版资源就只能自己动手找了。上面找电子书时提到的可能不太好用的 豆瓣资源下载大师,这时就要发挥作用了。请看截图右侧:
2.3.3 软件资源
2.3.3.1 正版中国(getitfree.cn)
当盗版成风时,有聪明人很超前地做了这个正版软件网站,它们的自我介绍如下:
其他的,我又要推荐虫部落了(怎么那么像托),不过是它旗下的老司机导航(额,一开始还以为是什么奇怪的地方):
2.4 How:「如何XXX」体,找方法
除了上述5+3(是5搜索引擎+3问答,不是5年高考3年模拟),还会重点推荐 wikiHow (zh.wikihow.com)
这里会严肃对待每一个傻瓜问题,并有趣地画出来
涉及的话题可以说是全覆盖了
譬如困扰每个人的口腔溃疡,回答得甚至比问医问答平台还全面
然后通过每篇的文末推荐,多了很多奇怪的知识
参考资料(说不定从这里有惊喜发现哦)
© 邱天. (2019). 是谁出的题这么难,到处都是正确答案. 中信出版社.
© idealclover. 和百度说再见——中文搜索引擎推荐. (2019)
© Jason. 除了Google,还有这些找国外客户的搜索引擎. (2017)
© Google. How Search Works. (2010)
© PlatyHsu. 一只叛逆的鸭子——DuckDuckGo 简介. (2017)
© boxi. 揭秘DuckDuckGo :Google最渺小但最强悍的竞争对手. (2014)
© 井岛俊一. 没有人能真正阻挡谷歌,但至少 DuckDuckGo 在尝试. (2019)
© techant. 解密多吉(Dogedoge):民间搜索引擎崛起. (2019)
知乎- 如何评价新国产搜索引擎【DogeDoge】多吉搜索?
© magi. 欢迎使用Magi. (2019)
© 汝晴. 「Peak Labs」发布搜索引擎「magi.com」,用NLU和迁移学习技术为AI提供知识体系. (2019)
知乎 - 如何评价 Peak Labs 出品的 2019 版 Magi 搜索引擎?
© 硬核的半佛仙人. 如何科学使用知乎. (2020)
© 杂谈by立行. 中文教材怎么找——玩转PDF系列01. (2019)
© 杂谈by立行. 英文教材怎么找——玩转PDF系列02. (2019)
© 杂谈by立行. 中文教材怎么找——玩转PDF系列03. (2019)
© 老D博客. 油猴子脚本:豆瓣资源下载大师,在豆瓣上下载电影|音乐|图书. (2019)
简短更新日志:
Ver.1 | 2020.04.08
推荐了Google、DuckDuckGo、秘迹搜索、虫部落、DogeDoge、Magi、ask、Quora、知乎、虫部落电子书搜索、 豆瓣资源下载大师、正版中国、老司机导航、wikiHow
© 本作品采用知识共享署名 4.0 国际许可协议进行许可