《淘宝技术这十年》读书笔记

      从文章中看到很多需要学习的知识,不仅仅包括数据库、计算机网络、操作系统、数据结构等基础课程;还根据时代的技术变迁讲述了当时最新的编程技术及应用,如数据挖掘、Java\Oracle、搜索引擎分词排序、分布式、大数据GFS、海量文件处理等,这些知识对我都非常有帮助;同时也根据淘宝网发展历程不断讲述了它遇到的问题及解决方法。从最初的通过购买更高端的系统设备到最好的设备也不能满足淘宝网海量数据尤其是图片数据的存储需求,最后自己创造属于自己的针对海量小文件存储的文件系统。        很有价值又很好玩的一本书,可以全面的了解淘宝的技术升级路线。从工程师的角度讲述了淘宝的成长历程,还有几次技术变革的前因后果。                                                      淘宝建立之初对外是以个人网站作宣传,第一版一个月上线,采用LAMP架构。是修改了国外的一个拍卖系统源码,主要对数据库进行分库,读写分离。                                最初只有一台服务器,随着访问量的增加,将数据库服务器独立出来,同时,增加一台Email服务器;商品检索功能最初的实现就是使用sql中的like搜索,对数据库资源消耗严重,于是使用阿里巴巴的iSearch模块替换like方式;2003 年底,MySQL升级,采用 Oracle进行技术替代,Oracle的性能和并发访问能力强大,关键性的设计——连接池;2004 年上半年,淘宝决定更换开发语言,将PHP更改为JAVA,特意请来SUN公司的技术人员,开始采用EJB系统,打造了一个阿里巴巴的MVC框架WebX,易于扩展,方便组件化开发,它的页面模板支持JSP和Velocity等,持久层支持ibatis和hibernate等,控制层可以用EJB和Spring(Spring是后来才有的) ;在接下来的几年,围绕着提高容量、提高性能、节约成本,淘宝逐渐完成了对数据分库、放弃EJB、引入Spring、加入缓存、加入CDN等工作。并且开始创造自己的技术;07年之前,图片存储使用的是NetAPP的文件存储系统,但未对小文件存储进行有针对的优化 ,且扩容成本高昂,网络连接数经常达到极限;在这种背景下,淘宝研发了TFS(淘宝文件系统);TFS文件系统在核心设计上改变,传统的集群系统中元数据只有1份,由管理节点容易成为瓶颈。TFS在设计规划上考虑在图片的保存文件名上赋予一些元数据信息,实际的元数据上,保存的信息很少,元数据结构非常简单。整个系统完全抛弃了传统的目录树结构。2007年6月,TFS正式上线运营。

你可能感兴趣的:(《淘宝技术这十年》读书笔记)