2012.3.13 微博热报:Google搜索算法例会;Redis V.S. Memcached;HBase Coprocessor前世今生

Google搜索算法讨论例会如何开

@36氪发布了一条含有视频链接的微博:

Google搜索算法讨论例会,一窥大牛们怎样聚在一起解决问题 | Google的搜索首页看起来很简洁干净,但要完成海量内容的瞬时搜索,后面需要极其复杂的搜索算法支撑。近日Google发布一则每周搜索算法讨论例会的视频,让我们有机会掀开神秘面纱的一角。 http://t.cn/zOIhb3W by @AbnerTsang

KIIS_FM的评论是:

作为一直强调创新的谷歌,该办公室的魅力就在于思路可以最有效率地碰撞,可以作为“改变世界的力量”的讨论参考模式。

Google谷歌(注:这是非官方账号)的评论是:

在视频中,Google工程师对搜索产品可能的改进进行讨论并做出决定。他们讨论的是一个看似很小的问题,即在超过十个条件的搜索查询中如何进行拼写检查。但结果证明,即使是很小的变化也会给系统带来无数的问题。

邓侃的评论是:

老实说,感觉参与会议的人数太多。人太多,会议就没效率了。最有效率的会议应该多少人参加?这个问题说不清。个人体会,3 个人讨论最有创意,10 人左右比较全面,5 人左右比较均衡。

i土豆小王子的评论是:

我之前intern的小公司,老板是做energy专业的,他说不要看你在google搜索只点击那么一下,就那么一下,几十毫秒的搜索,所耗费的能量,足够煮开一杯茶。。。。。搜索背后的人力物力智力动力,根本不是google首页看起来的那么简单。

萍踪遐想回复@i土豆小王子:

Google一个月的搜索量是近120亿,一天4亿,假设一杯水250克,室温20度,每天能耗是8000亿卡的热量,你信么?

i土豆小王子回复@萍踪遐想:

查到一个文章是说有人指责google太耗能,a typical search uses "half the energy as boiling a kettle of water" and produces 7 grams of CO2. 然后google反驳说不可能,说了一大堆,基本结论是困难的搜索耗能较多,但平均下来,一个搜索耗能1000焦,0.2克CO2。1000焦貌似很少

新东方创始人@徐小平的评论是:

这种场景令人肃然起敬——他们的工作,提高了全人类获取知识与信息的水平,提升了人类文明程度。中国何时出现类似能影响世界的奉献?

Redis V.S. Memcached

@nosqlfan一条微博引发大家关注:

这两年Redis火得可以,Redis也常常被当作Memcached的挑战者被提到桌面上来。关于Redis与Memcached的比较更是比比皆是。然而,#Redis#真的在功能、性能以及内存使用效率上都超越了#Memcached#吗?看看Redis作者怎么说 http://t.cn/zOfdbDm

哥哥本善良认为:

后起之秀本身就会在很多方面占据优势,业务场景决定系统选择,简单的KV缓存memcached足以应付

RogerXia:

很多时候选择一种技术是因为他在解决某一个问题时比其他技术更适合我们,而不是他们谁的功能多,性能高。redis数据结构丰富,支持数据持久化和同步

HDiVi认为:

不同应用场景的时候,不好评价! 各有个的好处

戴书文提到:

性能和业务支持应该是两方面的,看实际需要取舍

SE7V7EN认为:

redis的hash确实不错

upup006指出:

能用的优化招术大家都用,性能上差的肯定不多,剩下的就是拼体验了。

马明歌说:

Redis对复杂数据结构的支持、持久化功能比memcached强悍多了。Redis是向快速No-SQL方向发展的。

HBase coprocessor前世今生

@nosqlfan 发布的另一条关于HBase Coprocessor的微博也值得注意:

HBase Coprocessor的分析 - 本文来自于淘宝@庄庄2049 ,他在淘宝从事Hadoop及HBase相关的应用和优化。对Hadoop、HBase都有深入的了解,本文就是他对#HBase Coprocessor#的一些分析,分享给大家 http://t.cn/zOfuORX

大数据技术摘录的是:

hbase coprocessor的实现分为observer与endpoint。observer可以实现权限管理、优先级设置、监控、ddl控制、二级索引等功能,而endpoint可以实现min、max、avg、sum等功能。

_微博卢的评论是:

这是nosql在向sql招手吗?

今日微博推荐

庄庄2049

推荐理由:工作于淘宝的海量数据处理方面大牛,关注互联网后端技术、分布式系统、hadoop生态圈,也思考互联网产品,做过数据仓库/运维/数据库/海量数据同步,目前关注在线存储产品,关注HBase一年。他的博客地址是:http://walkoven.com/

欢迎读者关注@InfoQ,推荐热门话题,可私信@InfoQ,同时请您说明推荐理由。

 

你可能感兴趣的:(2012.3.13 微博热报:Google搜索算法例会;Redis V.S. Memcached;HBase Coprocessor前世今生)