原贴:http://www.dbanotes.net/arch/small_site_arch.html
到处都是什么大规模啊,高流量啊,高性能之类的网站架构设计,这类文章一是满足人们好奇心,但看过之后也就看过了,实际收益可能并不大;另外一个副作用是容易让人心潮澎湃,没学走先学跑,在很多条件仍不具备的情况下,过度设计、过度扩展(高德纳大爷也说过,"过早优化是万恶之源"),所以,这里反弹琵琶,讨论一下小规模、低性能、低流量的网站该如何搞法。
如果站点起步阶段可能就是一台机器(或是一台虚拟机,比如 JobsDigg.com ),这个时候,去关注什么数据拆分啊,负载均衡啊,都是没影子的事情。很多大站点的经验绝不能照搬,辩证的参考才是硬道理。
动手构建站点的时候,不要到处去问别人该用什么,什么熟悉用什么,如果用自己不擅长的技术手段来写网站,等你写完,黄花菜可能都凉了。所以,有现成的软件组件可用,就不要自己重新发明轮子。人家说 Python 牛,但自己只懂 PHP ,那就 PHP 好了,如果熟悉 .net ?,那也不错。用烂技术不是丢人的事情,把好技术用烂才丢人。
起步的阶段应该清楚的确定下来架构的层次。如果都搅和在一起,业务一旦扩增开来,如果原有的一堆东西拆不开就是非常痛苦的事情。
Web Server <--> (AppServer)<-->Cache(eg. Memcached)<-->DB
层次清晰化的一个体现是(以 LAMP 架构为例):即使只有一台机器,也应该起个 Memcached 的实例,效果的确非常好--一般人儿我不告诉他...不要把什么都压到 DB 上,DB 一旦 I/O 压力走到磁盘上,问题要暴露出来是很快的。没错,DB 本身也会利用自己的 Cache,但 DB 的Cache 和 Memcached 设计出发点毕竟不一样。
很多人并不是数据库设计专家,如果应用要自己设计表结构什么的,基本都是临时抱佛脚,但三个范式很多人倒是记得牢,这是大多数小型 Web 站点遇到的一个头疼事儿,一个小小的应用搞了几十个表... 忘掉范式这个玩意儿! 记住,尽可能的冗余数据,你在数据层陷入的时间越多,你在产品上投入的就会越少。用户更关心的是产品的设计。
因为流量低,访客可能也不多,这时候值得注意的是页面不要太大,多数流量低的站点吃亏就在于一个页面动辄几兆(我前两天看到一个Startup的首页有4M之大,可谓惊人),用户看个页面半分钟都打不开,你说咋发展? 先把基本的条件满足,再去研究前端优化。
不是有个 80/20 原则么? 把最重要的精力放在最能给你带来商业价值的地方。有些花里胡哨的功能带来很大的开销,反而收效甚微。记住,小站点,最有价值的是业务模式,而不是你的技术有多牛。技术是为业务服务的,不要炫技。
有些网站不停的添加功能,恰恰是把这些新功能变成了压死自己的稻草。
这一点是可选的,但也重要。设计应用的时候在开始就应考虑 Profile 这件事情。一套应用能否在后期进行有效优化和扩展,很大的程度限制在是否有比较合适的 Profile 机制上。需要补充的是,对性能的考虑必然要把有关的历史数据考虑进来。另请参见网站运维之道的容量规划以及其它小帖子。
这是最后要补充的一点。好的架构和最初的设计有关系,但最重要的是发展中的演化:
发展-->发现问题-->反馈-->解决问题(执行力)--> 改进->进化到下一阶段--新问题出现(循环)
有些站点到了某个阶段停足不前,可能卡在执行力这个地方,来自用户的反馈意见上来了之后,没有驱动力去做改进。最后也是死猪不怕开水烫了。最怕听到的就是"业务不允许"的托词,试想如果不改进业务都没了,那业务还允许么? 其实就是一层心理障碍。
这篇文章有浓重的山寨风格,所以,你不要太认真。如果在用短、平、快的方式构建某些山寨网站的话,可参考其中对你有益的点,不赞同的地方可以直接忽视掉,就没必要费力留言进行争论了。
--EOF--
Generator | Trampoline
猪破或WP改改主题就上了
山寨一般都这么搞的吧,嘿嘿
至理名言,有时真的很容易就陷入到过度设计的尴尬境地,洋洋洒洒的准备了很多东西,却不能在有限的时间中实现出来,商机就这样浪费了。
看来冯大哥很看不起.net技术阿。
我觉得数据冗余上还是不要了,数据冗余的话在维护数据完整性上需要下额外功夫,而数据冗余往往是为了提高性能而冗余的,小站点这方面压力不大,就不要冗余了,现在的ORM框架都能很方便的把关系表现为对象,操作起来很方便,不会带来太多代价。
霍炬大叔最喜欢说啥来着:“提前优化是万恶之源!”
小站点的话,.net 是不咋地。关键是用.net 就要用 Windows,只有一台服务器,几乎一小半的硬件资源被操作系统吃掉,你说还怎么省钱?
数据冗余更是必须的。小站点压力不大更要冗余,冗余不会吧站点搞死,但是遵守范式写两个烂SQL才会让站点奇慢如牛
除了数据冗余,我觉得这篇文章还是很实用的。毕竟技术是用来解决问题的,如果没有那么多需求,那么当然不需要用很复杂的技术。
@西乔
这句话嘎好,俺用了
比较赞同jeffz的关于数据冗余的观点。
那是没有调配好系统才会让操作系统占用很多资源的吧,不该用的服务不用,不该跑得东西不跑,现在Windows Server都可以连GUI都不装了,会占多少额外资源?Windows士别三日改刮目相看了,Windows都别了n久了。
至于冗余问题,看来还是个取舍
1、冗余的优点,查询快捷。缺点:需要更多维护,业务一变,可能还要加不同冗余数据。
2、不冗余的优点,不用维护。缺点:查询需要级联,性能降低。
我的观点是基于:小站点的话,我不知道会不会有复杂查询,级联会不会多。而且小站点的数据甚至都可能完全在内存中,速度很快,数据库自身的优化也很厉害了,再加上你也提到了缓存。真不觉得冗余有什么额外好处——“尽可能的冗余数据”,更是走过了……
我很喜欢这篇文章!太喜欢了!我就喜欢干这种山寨的事情。
每一个人心中的小站都不一样。 看博主的文章都是介绍一个大型网站,至少也是手机之家这种百万流量每日的。
那么什么算小网站呢?一个博客,一个地方信息发布平台。
博主明示!
@杆儿
小型有明确商务目的站点,有赢利点。
不是简单的CMS。
骗子,居然说有美女。
呃呃,正如你所说,python看着好,还在学。只能拿PHP了,好在有诸如wordpress这样的开源系统,架一个网站需要的优化不会太多。