【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解

原文: http://mp.weixin.qq.com/s?__biz=MzAwNzU3NzQ0MA==&mid=209298809&idx=1&sn=70f93b7d71fa7ac9caf3c737fb20a2ad&scene=1&key=c76941211a49ab58a5fed01be2b1651eadbc89e3a9495b276185efdb2282d0fdd5b3aca4129a665495d1b65b77a9a848&ascene=0&uin=Mjk1ODMyNTYyMg%3D%3D&devicetype=iMac+MacBookPro9%2C2+OSX+OSX+10.10.3+build(14D136)&version=11020012&pass_ticket=W1E%2FnPTLAxTViyFDJifA%2BUf0SYmiiOM6y58JX6vapH28VlLG%2FS8KwpGoWVUyTQ8h

文章写的非常深刻, 好文.

2015-07-10 冬瓜哥大话存储

上篇文章《IO时延你被骗了多久》，竟然没有人给瓜哥发红包！很不像话！冬瓜哥起早贪黑打把势卖艺，最终却连五毛党都赶不上，所以瓜哥决定这篇文章之后休息一段时间，玩玩游戏，看看电影，睡睡大觉了。

曾几何时，你可能被“集群FS”“共享FS”“SANFS”“并行FS”“分布式FS”这些名词弄得头晕眼花，冬瓜哥一度也是，而且也找很多人去求证，倒头来每个人的说法都不一样，于是冬瓜哥开始潜心自己研究总结。究其本质原因是集群系统里有好几个逻辑层次，而每个层次又有不同的架构，组合起来之后，花样繁多，而又没有人愿意用比较精准的名字来描述某个集群系统，取而代之只用了能够表征其某个层次所使用的架构来表征整个系统，这是产生理解混乱的原因。本文会对现存的集群文件系统框架进行一个清晰的梳理、划界。即便是大名鼎鼎的维基百科，恐怕也没有一篇文章彻底的梳理所有这些框架，都是零零散散的混乱定义，让人看了摸不着头脑。维基百科中文频道，冬瓜哥之前增加过一条“集群文件系统”的定义，还有百度百科，大家可以去看看，那个条目写的非常概要，而本文则展开讲述。

【主线1】从双机共享访问一个卷说开去

把一个卷/Lun/LogicalDisk/Virtual Disk，管它叫什么的，同时映射给多台主机，管它用什么协议，IP/FC/IB/SAS，这多台主机会不会同时认到这个卷？会。每台主机OS里的驱动触发libfc/libiscsi/libsas等库发出scsi report lun这个指令的时候，存储系统都会将这个卷的基本信息在scsiresponse里反馈回去，包括设备类型、厂商、版本号等，主机再发送scsi inquery lun来探寻更具体的信息，比如是否支持缓存以及是否有电池保护等。接着主机发出scsi read capacity来获取这个卷的容量，最后主机OS会加载一个通用块设备驱动，注册盘符。冬瓜哥说的有点多了，上面这些其实与主题无关，但是冬瓜哥的思路属于线性再叠加类比和发散思维，必须一步一步串起来，所以不得不多说点。

那么在主机1使用NTFS或者EXT等文件系统格式化这个卷，写文件，其他主机上是否可以直接看到这个文件？曾几何时，不少人问冬瓜哥这个问题，瓜哥也测试过不少人对这个问题的看法，喜忧参半。有人天然的认为，如果不能实现这种效果，还玩个屁？持有这种观点的人就是只浮于表面的那些人而且装逼过甚。听到这个问题考虑考虑犹豫地说出”应该可以吧“的那些人，还算能动动脑子不过其知识体系的完整度也真让人捉急。实际上，有一定几率其他主机可以看到新写入的数据，但是大部分时候，其他主机要么看不到，要么错乱（磁盘状态出了问题比如未格式化等等）。所以多主机天然可以共享卷，但是天然却共享不了卷中的文件。咋回事？因为每台主机上的文件系统从来不会知道有人越过它从后门私自更改了磁盘上的数据，你写了东西我不知道，我认为这块地方是未被占用的，我写了东西把你覆盖掉了，你也不知道，最后就错乱了，跑飞了。多主机共同处理同一个卷上的数据，看上去很不错，能够增加并发处理性能，前提是卷的IO性能未达到瓶颈，所以这种场景并不只是思维实验，是切切实实的需求，比如传统企业业务里最典型的一个应用场景就是电视台非线编系统，要求多主机共享访问同一个卷、同一个文件，而且要求高吞吐量。但是，上述问题成为了绊脚石。

咋解决？很显然两个办法，在这方面，人类的思想都是一样的，逃不开几种方案，只要你了解问题根源，稍微动点脑子，就不比那些个底层系统设计者想出的办法差到哪去。

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解
图1

如图1下半部分所示，第一种办法，既然多个FS各干各的又不沟通，那么干脆大伙谁都别管理文件了，找个集中的地方管理文件，大伙想要读写创建删除截断追加任何文件/目录，把指令发给这个人，让它执行，返回结果，这不就可以了么？是啊，这特么不就是所谓NAS么我说。主机端的文件系统没了？非也。还在，只不过只负责访问本地非共享的文件数据，对于那些需要被/与其他主机共享的文件，放到另一个目录里，这个目录实体存在于NAS上，主机端采用NFS/CIFS客户端程序将这个实体目录挂载到本地VFS某个路径下面，凡是访问这个路径的IO请求都被VFS层重定向发送给NFS/CIFS客户端程序代为封装为标准NFS/CIFS包发送给NAS处理。这样，就可以实现多主机同时访问同一份数据了。

【支线】数据一致性问题的谬误

在这里冬瓜哥给各位开一个支线任务。很多人有所迷惑，多个主机共享访问同一个文件，那么就能避免我写的数据不会覆盖你写的么？不能。既然不能，那上面岂不是白说了？倒头来数据还不是要相互覆盖，不一致？估计我问出这个问题之后，一大堆人就干瞪眼了，迷糊了。如果不加任何处理，两个诸如记事本这样的程序打开同一个文件，同时编辑，最后的确是后保存的覆盖先保存的。但是此时的不一致，是应用层的不一致，并不是文件系统层的不一致，也就是说并不会因为主机A写入的数据覆盖掉了主机B写入的数据而导致NAS的文件系统不一致从而需要FSCK或者磁盘格式未知等诡异错误。那么NAS就放任这种应用层的相互乱覆盖么？是的，放任之。为何要放任？为何NAS不负责应用层数据一致？那我要问问你，NAS怎么能保证这一点？A写了个123进去，同时B写了个456进去，NAS是最终把文件保存成123456呢，还是142536呢？还是145236呢？NAS如何能管得了这个？所以NAS根本就不管应用层的一致。那咋整？锁啊。应用打开某个文件的时候，先向NAS申请一个锁，比如要锁住整个文件或者某段字节，允许他人只读，还是读写都不行，这些都可以申请。如果你用MS Office程序比如Word打开某个NAS上的文件，另一台主机再打开一次，就会收到提示只能打开只读副本，就是因为有其他主机对这个文件加了写锁。此时便可保证应用层一致了，而记事本这种程序是根本不加锁的，因为它就不是为了这种企业级协作而设计的，所以谁都能打开和编辑。所以，应用层不一致，与底层不一致根本就是两回事。

【主线2】标准店销模式和超市模式

NAS是成功解决了多主机共享访问存储的问题，但是自身却带来了新问题，第一，走TCPIP协议栈到以太网再到千兆万兆交换机，这条路的开销太大，每一个以太网帧都要经过主机CPU运行TCPIP协议栈进行错误检测丢包重传等，这期间除了CPU要接受大量中断和计算处理之外，还需要多次内存拷贝，而普通Intel CPU平台下是不带DMA Engine的，只有Jasper Forest这种平台才会有，但是即便有，对于一些小碎包的内存拷贝用DMAEngine也无法提升太多性能，主机CPU耗费巨大；第二，系统IO路径较长，主机先要把IO请求发给NAS，NAS翻译成块IO，再发送给磁盘，IO转了一手，增加了时延；第三，NAS本身是个集中式的存储设备，如果NAS设备出现IO或者CPU瓶颈，前端主机数量再多也没用。

这就是店销模式的尴尬之处。你想买什么东西，你不能碰，你得让店员给你拿，如果店员数量有限，顾客多，那就只能排队，或者乌泱泱一帮人你一句我一句与店员交流，这显然出现了瓶颈。后来，对于量大的店，改为了超市模式，顾客先看看货物的分布图，然后自己去对应货架拿货物结账，极大地提升了性能。存储也可以这么干。

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解
图2

如图2所示，如果找一台独立的节点，专门来管理FS元数据，比如块映射信息、bitmap、权限等等，而让原来的两个节点直接认到卷。什么！？你不是说多个主机认到同一个卷，数据会被损毁么？这是没把东西串起来，没动脑子想。冬瓜哥是说过，但是前提是两主机上的FS各管各的。现在我不让它各管各的，还是把FS拿出来，但是拿到旁边去，平时别挡路，让原来的节点直接访问盘，但是节点访问盘之前，必须经过第三个节点也就是图中的FS节点的授权和同意，这样的话就不会不一致，而且还能获得更高的速度，因为此时可以使用比如FC/SAS/IB等对CPU耗费少（协议传输层直接在卡里硬件完成）的链路类型，另外IO直接从节点下来到卷，不用转手。此时的IO流程是：节点上使用一种特殊的客户端（并非传统NFS/CIFS客户端），任何对文件的操作都通过Eth交换机向FS节点查询，比如一开始的ls，后续的open/read/write等，FS会将对应文件的信息（权限、属性、对应的卷块地址等）返回给节点，节点获取这些信息，便直接从卷上读写数据，所有的元数据请求包括锁等，全部经由Eth网与FS节点交互。这便是存储里的超市模式。

专业术语，店销模式称为带内模式或者共路模式，超市模式则为带外模式或者旁路控制模式或者随路模式。而图2中所示的方式，则就是所谓带外NAS系统。或者有人起了个更忽悠人的名字：“共享文件系统”/“共享式文件系统”，或者SanFS，也就是多主机通过SAN网络共享访问同一个卷，而又能保证文件底层数据一致性。上述的这种共享文件系统无非包含两个安装组件，元数据节点安装Master管理软件包，IO节点安装客户端软件包，经过一番设置，系统运行，所有IO节点均看到同样的目录，目录里有同样的同一份数据，因为它们都是从元数据节点请求文件目录列表以及数据的，看到的当然是一样的了。如图所示，NFS/CIFS客户端是不支持这种方式的，需要开发新的客户端，这个客户端在与FS节点通信时依然可以使用类似NFS的协议，但是需要增加一部分NFS协议中未包含的内容，就是将文件对应的块信息也传递给客户端，需要做一下开发，其他的都可以沿用NFS协议，此外，这个特殊客户端在IO路径后端还必须增加一个可直接调用块IO接口的模块，NFS客户端是没有实现这个的。

【主线3】对称式协作与非对称式协作

咱们再说回来，除了使用带内NAS或者带外NAS方式之外，还有另一种办法解决多节点共享处理同一份数据，而且相比NAS显得更加高大上和学院派。如图1上半部分所示，既然大伙各管各的又不沟通，那我让你们之间沟通一下不就可以一致了么？没错，在各自的FS之上，架设一个模块，这个模块专门负责沟通，每个人做的改变，均同步推送给所有人，当然，要改变某个数据之前，必须先加锁占坑，否则别人也有可能同时在试图改变这个数据。加锁的方式和模式有很多种，这个瓜哥会在后续文章中介绍。很早期，Win平台有个名为Sanergy的产品，其角色就是构架在NTFS之上的一个沟通同步、加锁、文件位置管理和映射模块，但是很难用，性能也很差，这个产品后来被IBM收购以后就没下文了，其原因是该产品与NTFS松耦合，对NTFS没有任何改动，只是在上面做了一些映射定向，开销非常大，是一个初期在广电领域非线编系统对于多机共享卷的强烈需求下出现的产品。再比如Ibrix（HP x9000 NAS的底层支撑集群文件系统）则是架构在EXT3 FS之上的集群管理模块，其对EXT3文件系统也没有修改。

这种模式的集群文件系统，称为“对称式集群文件系统”，意即集群内所有节点的角色都是均等对称的，对称式协作，大家共同维护同一份时刻一致的文件系统元数据，互锁频繁，通信量大，因为一个节点做了某种变更，一定要同时告诉集群内所有其他节点。相比之下，上文中所述的那种超市模式的带外NAS文件系统，则属于“非对称式集群文件系统”，有一个集中的独裁节点，非对称式协作，或者说没有“协作”了，只有“独裁”。

显而易见，对称式协作集群有个天生的劣势，就是看上去好看，人们都喜欢对称，但是用起来就不那么舒坦了，两个原因，第一个是其扩展性差，节点数量不能太多，否则通信量达到瓶颈，比如32个节点的话，每个节点可能同时在与其他31个节点通信，此时系统连接总数近似为32x32，如果一千个节点，则连接总数为999x999，节点性能奇差。其次，安全性方面，对称式协作，多个节点间耦合性非常紧，一旦某个节点出现问题，比如卡壳，那么向其加锁就会迟迟得不到应答，影响整个集群的性能，一人出事全家遭殃，再就是一旦某个节点发飙把文件系统元数据破坏了，也一样是全家遭殃，重则整个系统宕机FS再也挂不起来，轻则丢数据或不一致。所以，也只有少数几家技术功底深厚的追求完美的公司做出了类似产品，典型代表就是Veritas的CFS，类似的产品还有Ibrix。还有一些对称式协作集群产品，其内部并非是纯粹的对称式协作，而是按照某种规则划分了细粒度的owner，比如目录A的owner是节点A，目录B的owner是节点B，所有的IO均需要转发给owner然后由owner负责写盘，这样不需要加锁，降低通信量；或者将锁的管理分隔开，比如目录A的锁管理节点职责赋给节点A，这样大家访问目录A就都向A节点加锁，而不用所有人都发出锁请求，GPFS对称式协作FS就是这种做法。但是这些加了某种妥协的架构也就不那么纯粹了，但的确比较实际。这些不怎么纯粹的协作管理，可以被归为“Single Path Image”，也就是其协作方式是按照路径划分各个子管理节点的，甚至每个节点可能都掌管一个独立的文件系统，然后由协作层将其按照路径虚拟成一个总路径，Windows系统之前内置有个DFS就是这么干的；而纯粹的对称协作，可以被归为“Single Filesystem Image”，意即整个集群只有一个单一文件系统，所有人都可以管理任何元数据，完全纯对称。当然，SPI和SFI这两个估计逼格高甚，可能不少人已经难以理解了，所以冬瓜哥也就不再继续费手指头打字了。

即便如此，对称式协作集群的节点数量也不能增加到太多。而非对称式集群，由于耦合度很低，只是多对1耦合（每个IO节点对元数据节点之间耦合），通信量大为降低，目前最大的非对称式协作集群FS可达单集群13K台，基于HDFS。

说到这里，冬瓜哥要做个总结了。

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解
图3

如图3和图4所示，冬瓜哥把集群文件系统架构分割为三层，最底层为数据访问层或者说存储层，在这一层，上述的架构都使用了共享式架构，也就是多节点共享访问同一个或者同多个卷。再往上一层，冬瓜哥称之为协作管理层，这一层有对称式协作和非对称式协作两种方式，分别对应了多种产品，上文中也介绍了。最顶层，就是数据访问层，其实这一层可有可无，如果没有，那么需要把应用程序直接装在IO节点上，应程序直接对路径比如/clusterfs/cluster.txt进行代码级调用即可比如read()。

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解
图4

而如果将某个节点上的这个路径，使用NFS/CIFS server端export出去，再找一台server用NFS/CIFS客户端mount上来读写的话，那么这个集群系统就成了一台集群NAS了，从任何一个节点上都可以mount，这样就增加了并发度，增加了性能，当然，前提是底层的卷提供者未达到瓶颈。把应用和IO节点装在同一台server上，有些低逼格的说法叫做“HCI”，所谓超融合系统。冬瓜哥之前是一名纯粹的产品经理，也善于包装忽悠，有兴趣者可以看本公众号（大话存储）之前文章：《可视化存储智能—思路、技术和展现》。

往事不可追如冷风吹。好了，大家可以看到一个集群文件系统的三层框架架构，其中在协作管理层，有两种架构，第一种是对称式协作，第二种是非对称式协作。好了，其实上面这句话就是前文啰嗦一大堆的精髓所在。而我们现有的多数教材，是反过来说，它先特么给你总结和抽象，把你搞晕，然后可有可无懒懒散散的举几个不明不白的例子。冬瓜哥对此深恶痛绝，去特么的！耽误了多少莘莘学子的宝贵人生！这也是冬瓜哥急切想进入教师体制的原因，因为看到别人说不清楚某个东西，瓜哥心里捉急啊。

【支线】RAC、SMP和AMP

咋样？做完刚才那个主线任务，是不是有种荡气回肠的感觉呢？休息一下，来做个支线吧。Oracle RAC属于对称式协作+共享存储型集群。而早期的CPU和RAM之间的关系，也是对称式协作+共享存储型集群，如果把CPU看做节点，RAM看做存储的话，多CPU通过FSB共享总线通过北桥上的DDR控制器访问下挂的集中的RAM。多个线程可以随意在多CPU上任意调度，哪个CPU/核心执行都可以，这不是对称是什么？而且针对缓存的更新会有一致性广播探寻发出，这不是协作是什么？多CPU看到同样的RAM地址空间，同样的数据，这不是共享存储是什么？这种CPU和RAM之间的关系又被称为SMP，对称对处理器。与对称式协作面临的尴尬相同，系统广播量太大，耦合太紧，所以后来有了一种新的体系结构成为AMP，非对称对处理器。典型的比如Cell B.E处理器，被用于PS3游戏机中，其中特定的内核运行OS，这个OS向其他协处理内核派发线程/任务，运行OS的内核与这些协处理核之间是松耦合关系，虽然也共享访问集中的内存，但是这块内存主要用于数据存储，而不是代码存储，这种处理器在逻辑架构上可以扩充到非常多的核心。具体冬瓜哥不再多描述，后续看机会可能会在其他文章中详细介绍Cell B.E处理器。

但是好景不长。十年前，共享存储型的SMP处理器体系结构，被全面替换为NUMA架构。起因是因为集中放布的内存产生了瓶颈，CPU速度越来越快，数量越来越多，而内存控制器数量太少，且随着CPU节点数量增加滞后，访问路径变得太长，所以，每个CPU自己带DDR控制器，直接挂几根内存条，多个CPU在互联到一起，形成一个分布式的RAM体系，平时尽量让每个CPU访问自己的RAM，当然必要时也可以直接访问别人的RAM。在这里冬瓜哥不想深入介绍NUMA体系结构，同样的事情其实也发生在存储系统架构里。

中间插入一个问卷调查，投票完请继续阅读余下部分。冬瓜哥的逼格你觉是否需要再提高？

【主线4】分布式存储集群——不得已而为之

钱、性能 for 互联网企业；可靠性、钱、性能for传统企业。人们无非就是受这几个主要因素的驱动。互联网企业动辄几千个节点的集群，让这几千个节点共享卷，是不现实的，首先不可能用FC这种高成本方案，几千端口的FC交换机网络，互联网就算有钱也不会买些这个回来。就用以太网！那只能用iSCSI来共享卷，可以，但是性能奇差。其次，互联网不会花钱买个SAN回来给几千台机器用，一个是没钱（是假的），第二个是没有哪个SAN产品可以承载互联网几千个节点的IO压力的，虽然这些厂商号称最大支持64K台主机，我估计它们自己都没有实测过，只是内存数据结构做成可容纳64K条而已。

那怎么解决几千个节点的集群性能问题？首先一定要用非对称式协作方式，是的，互联网里从来没有人用过对称式集群，因为扩展性太差。针对存储瓶颈问题，则不得不由共享式，转为分布式。所谓分布式，也就是每个节点各自挂各自的存储，每个节点只能直接访问自己挂的磁盘卷，而不能直接访问他人的磁盘，这与NUMA访问内存是有本质不同的，NUMA里任意CPU可以直接在不告诉其他人的前提下直接访问其他人的RAM。为什么分布式就可以提升IO性能？这其实是基于一个前提：每个节点尽量只访问自己所挂接硬盘里的数据，避免访问别人的，一旦发生跨节点数据访问，就意味着走前端以太网络，就意味着低性能。NUMA就是这么干的，OS在为进程分配物理地址时，尽量分配在该进程所运行在的那个CPU本地的RAM地址上。

互联网里的Hadoop集群使用的Mapreduce就可以保证每个节点上的任务尽量只访问自己硬盘里的数据，因为这种大数据处理场景非常特殊，所以能从应用层做到这种优化。而如果你把一个Oracle RAC部署在一个分布式集群里，RAC是基于共享存储模式设计的，它并不知道哪个数据在本地哪个在远端，所以难以避免跨节点流量，所以效率会很低。但是我们的Server SAN同志虽然使用了分布式存储架构，但是却成功的使用高性能前端网络比如万兆甚至IB以及高性能的后端存储介质比如PCIE闪存卡规避了超级低的相对效率，而把绝对性能提上去了，其实考察其对SSD性能的发挥比例，恐怕连50%都不到。

值得一提的是，在分布式集群中，虽然数据不是集中存放的，但是每个节点都可以看到并且可以访问所有数据内容，如果数据不存在自己这，那么就通过前端网络发送请求到数据所存储在的那个节点把数据读过来，写也是一样，写到对应的远端数据节点。入图5所示便是一个分布式+对称式集群。

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解
图5

分布式存储架构得到广泛应用的原因一个是其扩展性，另一个是其成本，不需要SAN了，普通服务器挂十几个盘，就可以是一个节点，几千上万个节点就可以组成分布式集群。纵观市场上，大部分产品都使用非对称式+分布式架构，成本低，开发简单，扩展性强。具体产品就不一一列举了，大家自行都能说出几个来。

图6所示则是一个分布式+非对称式集群。

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解
图6

分布式系统一个最重要的地方是一定要实现数据冗余，不但要防止盘损坏导致数据丢失，还要防止单个节点宕机导致的数据不可访问。Raid是空间最划算的冗余方式，单节点内可以用raid来防止盘损坏导致的数据不可用，但是节点整个损坏，单机Raid就搞不定了，就得用跨节点之间做Raid，这样会耗费大量网络流量，Erasure Code（EC）就是传统Raid的升级版，可以用N份校验来防止N个节点同时损坏导致的数据丢失，但是也需要耗费大量带宽。所以常规的实现方式是直接使用Raid1的方式将每份数据在其他节点上镜像一份或者两份存放，Raid1对网络带宽的耗费比Raid5或者EC要小得多。

哎呦，写到这，冬瓜哥都有点刹不住了，这篇幅太长了，现在的人都浮躁，看几段就不愿意看了，没关系，浮躁之人就让他浮躁吧，冬瓜哥一定要把想说的说完，而且说清楚，这才是冬瓜哥，冬瓜哥一直都是这样，这样的冬瓜哥才是冬瓜哥。看完冬瓜哥文章的，自然也会受益。看不完的，不进则退。

【支线】各种集群NAS

对于一个集群NAS来讲，其可以使用分布式+对称式（Isilon就是这么做的，GPFS有两个版本，其分布式版本也是这种架构），也可以使用分布式+非对称式（互联网开源领域所有集群FS），也可以使用共享式+对称式（VeritasCFS，Ibrix），也可以采用共享式+非对称式（BWFS）。但是集群NAS一般都泛指一个独立的商用系统，而商用系统一般都是面向传统企业的，扩展性要求不是很高，而对“高雅”的架构却情有独钟，所以这些传统集群NAS厂商一般要么使用对称式要么使用共享式这些“高雅”的架构。

【支线】YeeFS架构简析

讲了这么多，冬瓜哥认为需要结合实际的产品来把这些概念和架构匹配起来，效果最佳。YeeFS由达沃时代（DaoWoo）公司出品，是一个典型的分布式非对称式集群文件系统+集群SAN（或者说Server SAN）。想到这里，你此时应该在脑海里想到“哦，非对称式，那在协作管理层一定要有元数据节点了。哦，分布式，那在存储层一定是每个节点各管各的磁盘或者卷了”，“那么前端访问层呢？”，哎呦，不错，你终于学会思考了，而且思路框架已经有点逼格了嘿。YeeFS在前端访问层支持NFS、CIFS以及Linux下的并行访问客户端，NFS和CIFS可以从任意节点Mount，对于ServerSAN访问方式，支持iSCSI连接方式。行了，我已经了解这款产品了！得了吧你，就这三板斧，逼格还早呢。

上面只是使用了我们所建立的框架思维来套用到一款产品上，从大架构方面来了解一款产品，类似大框架的产品还有很多，如果它们全都一个模子，那就不会有今天的ServerSAN产品大爆炸时期的存在了。考察一款ServerSAN产品，从用户角度看主要看这几样：性能、扩展性、可用性、可靠性、可维护性、功能、成本。从技术角度除了看大框架之外，还得关心这几个东西：是否支持POSIX以及其他接口，数据分块的分布策略、是否支持缓存以及分布式全局缓存，对小文件的优化，是否同时支持FS和块，数据副本机制，副本是否可写可读可缓存。

YeeFS支持标准POSIX及S3/VM对象接口。Posix接口很完善也很复杂，不适合新兴应用，比如你上传一张照片，你是绝对不会在线把这个照片中的某段字节更改掉的，POSIX支持seek到某个基地址，然后写入某段字节，而这种需求对于网盘这种新应用完全是累赘，所以催生了更加简单的对象接口，给我一个比如hash key，我给你一份完整数据，要么全拿走要么删除，要改没问题，下载到本地改完了上传一份新的，原来的删除。对分块的布局方面，YeeFS底层是基于分块（又被很多人称为object，对象）的，将一堆分块串起来形成一个块设备，便是集群SAN，将一对obj串起来形成文件，这就是集群NAS，这些对象块在全局磁盘上平均化分布，以提升IO并发度。在实际案例中YeeFS曾经支持到3亿的小文件存储同时还可以保证优良的性能，业界对小文件存储的优化基本都是大包然后做第二层搜索结构，相当于文件系统中的文件系统，以此来降低搜索时延。数据可用性方面，默认2个副本，可调。YeeFS支持读写缓存，但是不支持全局的分布式共享缓存，后者实现起来非常复杂，也只有由传统存储演变过来的高大上型ServerSAN比如VMax这种，通过IB来互联，高速度高成本，才敢这么玩，即便如此，其也只敢使用基于hash的避免查表搜索的缓存分配方式，而二三线厂商恐怕玩不起这个。YeeFS节点向元数据节点加锁某个obj之后便可以在本地维护读写缓存。YeeFS的副本也是可读写的，并且在保持并发度的前提下还保持完全同步的强一致性。整个集群可在线添加和删除节点而不影响业务。

在对闪存的利用方面，YeeFS采用三个维度来加速，第一个是采用传统的冷热分层，第二个维度，采用只读SSD Cache来满足那些更加实时的热点数据的性能提升，第三个维度采用非易失NVRAM来作为写缓存，并将随机的IO合并成连续的大块IO写入下层，极大的优化了性能。此外，YeeFS在元数据访问加速方面，采用了元数据切分并行无锁设计，多线程并行搜索，提升速度；元数据一致性方面，采用主备日志、分组提交方式，既保证性能又保证一致性。

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解
其他功能方面，支持去重和压缩，支持在客户端缓存文件布局信息，避免频繁与元数据节点交互信息。节点宕机之后的数据重构采用的是Raid2.0的方式，将数据重构到所有磁盘的空闲空间，提升并发度，降低重构时间。元数据节点支持扩展为多元数据节点协作并行处理元数据请求，以保证数千节点的超大规模集群的性能。

YeeFS 客户端的一些主要配置:元数据缓存超时时间设置，每个客户端有缓存元数据的能力，超时时间从0开始往上不等; 数据缓存大小设置，包括写缓存和读缓存的大小设置; 并发连接数设置，可以控制一个客户端在IO上往其它存储节点上的最大连接数目控制; 其它的一些配置命令，例如导出目录设置（这个客户端只能导出文件系统中的某个目录），客户端权限控制(这个客户端上是允许读写操作还是只读操作)，IP控制等。 YeeFS的IO节点上一些配置比如数据校验是否打开，日志大小，IO线程，IO线程与磁盘之间的关系等。元数据节点上主要配置是一些整体系统配置，文件或者目录的副本数配置，存储池的配置，负载均衡、数据重构等一些整体系统的配置。

YeeFS这个产品映入瓜哥眼帘的一个原因是其支持的比较完善，包括POSIX接口、既是集群SAN又是集群NAS。第二个原因，则是其提到的“应用感知”优化，这与瓜哥一直在提的“应用定义”不谋而合，详见之前文章《可视化存储智能解决方案》。其可以在系统底层针对不同应用不同场景进行IO层面的QoS调节。另外，现在的所谓“软件定义”存储系统，过于强调硬件无关性，忽视硬件特性。而YeeFS比较注重硬件的特性，如Flash、RDMA、NUMA、NVRAM等的优化和利用，针对不同硬件的不同特点，定义不同的场景。

YeeFS还有两个兄弟，YeeSAN和WooFS。YeeSAN是YeeFS的简化版，只提供分布式块存储服务，强调比YeeFS块服务更的高IOPS和低时延。而YeeFS可以同时提供文件和块服务。WooFS是专门针对跨数据中心实现的广域分布式的产品，通过统一的名字空间实现多个数据中心间的数据共享，任何一个数据中心的应用可以通过标准Posix接口直接访问存储在其他数据中心的数据，这里就不过多介绍了。

好，到此为止，你应该能更加深入的了解一款产品了，后续碰到任何产品，大家都可以用这种思路去切入、审视、分析和判断，这样可以防止被忽悠。

【主线5】串行访问/并行访问

对于一个分布式架构的集群NAS（不管是对称式还是非对称式），某个应用主机从某个节点mount了某个路径，访问其中数据，如果访问的数据恰好不存储在本机而是远端节点，那么该节点先从源端节点把数据拿到本地，再发送给请求数据的主机。为何不能让应用主机预先就知道数据放在哪，然后自己找对应的节点拿数据？这样可以节省一次IO转发过程。是的，你能想到的，系统设计者也想到了。但是传统的NFS/CIFS客户端是无法做到这一点的，必须使用集群文件系统厂商开发的特殊客户端，其先从元数据节点要到文件布局信息，然后直接到集群中的IO节点读写数据，这样的话，应用主机就可以同时从多个IO节点读写数据，而不再像之前那样从哪个节点mount的就只能从这个节点读写数据，这就是所谓的并行访问模式，指的是应用主机访问这个集群时候，是串行从一个节点读写数据，还是可以并行从多个节点同时读写数据。几乎所有的互联网开源集群文件系统都支持并行访问。此外，也可以看到，超市模式再一次在应用主机和集群之间得到了使用。

【主线任务大结局】终极大总结

1. 集群文件系统在数据访问层或者说数据存储层可分为共享存储型和分布存储型，或者说共享式和分布式，分别称为共享FS和分布式FS。

2. 集群文件系统在协作管理层可分为对称式集群和非对称式集群；

3. 集群文件系统在协作管理层针对元数据的管理粒度还可以分为Single Filesystem Image和Single Path Image；

4. 分布式集群文件系统在前端访问层可以分为串行访问和并行访问，后者又称为并行FS。

5. 不管什么架构，这些FS统称为“集群文件系统”。多个层次上的多种架构两两组合之后，便产生了让人头晕眼花的各种集群文件系统。

不仅是集群文件系统，集群块系统也逃不出上面的框架，相比于“集群块系统”逼格稍微高那么一点点的名词，就是“Server SAN”，一个分布式块存储系统，再包装包装，把应用装它上面，就是所谓HCI了，说实话冬瓜哥一开始都不知道HCI是个啥，还是被人邀请加入了一个HCI的群才知道竟然还有人搞出了这个词，哎，世界之大，逼格混杂！

咋样，经历了主线、支线任务和华丽简单的结局之后，是不是逼格大涨？打个饱嗝，是不是该抖个手发个红包了？后续瓜哥打算写个高端存储系统架构深度分析高逼格版本，绝不浮于表面，绝对底层爆料，撕破一切神秘面纱，让你看完了都觉得有点鄙视高端存储了，至于具体释放多高逼格的大招出来，就看大家的红包了，来，手都抖起来！

长按图片发微信红包：

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解

支付宝扫码发红包：

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解

本文转载请注明出自“大话存储”公众号。长按识别二维码关注“大话存储”获取业界最高逼格的存储知识。大话存储，只出精品！

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解

强赠冬瓜哥真容：

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解

(请注意，冬瓜哥不是西瓜哥，这是两个人，很多人给混淆了，冬瓜哥很早就叫冬瓜哥了)

你可能感兴趣的:(系统架构)

鼎盛合|如何做一个智能测脂懒啊体脂秤方案？鼎盛合设计开发单片机 mcu
随着健康管理意识的提升，智能体脂秤逐渐成为家庭健康监测的核心设备。本文基于DSH38M93主控芯片与CS1237高精度ADC芯片，提出一种创新性的智能测脂蓝牙电子秤设计方案，重点阐述其技术实现原理与系统架构设计。一、技术原理与核心器件选型称重测量原理采用高精度应变片式传感器构建惠斯通电桥，通过CS1237芯片进行24位Δ-Σ模数转换。当用户站立时，四角传感器产生0-20mV差分信号，经128倍PG
企业级RAG系统架构设计与实现指南（Java技术栈）在未来等你大模型应用开发 AI 技术编程 Java Spring
企业级RAG系统架构设计与实现指南（Java技术栈）开篇：RAG系统的基本概念与企业应用价值在当今快速发展的AI技术背景下，检索增强生成（Retrieval-AugmentedGeneration,RAG）已成为构建智能问答、知识库管理、个性化推荐等应用的核心技术之一。RAG系统通过结合信息检索与自然语言生成（NLG），能够有效提升模型对特定领域数据的适应能力，避免传统大模型在训练数据不足或数据更
2025年上半年软考系统架构设计师--案例分析试题与答案不对法计算机软考机考系统架构
必选题一:大模型训练系统某公司开发一个在线大模型训练平台，支持Python代码编写、模型训练和部署,用户通过python编写模型代码,将代码交给系统进行模型代码的解析,最终由系统匹配相应的计算机资源进行输出，用户不需要关心底层硬件平台。a.系统发生错误时，不影响正常运行时发送一个消息给系统管理员(可靠性。ps:可靠性中包括了健壮性:指的是保护应用程序不受错误使用和错误输入的影响，在发生意外错误事件
【软件系统架构】系列四：数字信号处理器（DSP）
目录一、什么是DSP？二、DSP的核心架构特点1.基本结构2.工作流程：3.关键特性：三、DSP与MCU/MPU/NPU的对比四、DSP与通用处理器的对比五、常用DSP算法类型六、常见DSP芯片平台七、开发工具链与语言支持八、典型应用场景举例通信领域：音频处理：图像与视频处理：工业控制：军事与航空航天：九、选型关键因素十、技术趋势总结一、什么是DSP？DSP（DigitalSignalProces
【Rust + Actix Web】现代后端开发：从零构建高并发 Web 应用 LCG元前端 rust 前端开发语言
目录项目概述环境准备项目创建与依赖配置系统架构设计核心代码实现1.数据库模型(`src/models.rs`)2.应用状态管理(`src/state.rs`)3.核心业务逻辑(`src/handlers.rs`)4.主应用入口(`src/main.rs`)高并发优化策略1.异步处理模型2.连接池配置优化3.缓存策略设计性能测试结果部署方案Docker部署配置(`Dockerfile`)Kubern
Club_IntelliMatch_Development_Guide Joseit python python pygame django flask
ClubIntelliMatch系统-全栈开发流程文档概述ClubIntelliMatch系统是一个现代化的社团活动智能匹配平台，采用前后端分离架构。系统基于PythonFlask构建RESTfulAPI后端，Vue.js3+Vite构建现代化前端，MySQL作为持久化数据存储。本文档深入分析了整个开发流程的技术架构、设计原则和实现细节。系统架构流程图后端API架构前端组件架构app.pyFlas
驾驭代码之道：JS/TS SOLID面向对象设计的五大黄金法则领码科技低代码技能篇 javascript 开发语言 SOLID原则 TypeScript 面向对象代码设计 AI辅助开发
摘要在现代JavaScript和TypeScript开发中，代码质量与可维护性至关重要。SOLID原则作为面向对象设计的经典法则，为构建稳健、灵活的系统架构提供了科学指导。本文不仅系统阐释单一职责、开闭、里氏替换、接口隔离和依赖倒置五大原则的核心精髓，还结合当今流行的AI智能辅助、微前端、低代码开发等新技术与新思维，深入剖析它们在实际JS/TS项目中的应用场景和最佳实践。通俗易懂的理论讲解、丰富的
测试第六讲-开发&测试阶段划分为你奋斗！软件测试测试用例经验分享笔记
一、软件开发的阶段划分1、需求分析阶段有需求分析人员完成，产出物：《需求规格说明书》2、概要设计阶段3、详细设计阶段一般由系统架构师（分析师）完成，产出物：《概要设计说明书》、《详细设计说明书》4、编码阶段由开发人员完成产出物：程序面试题：哪个阶段引入的bug最多？哪个阶段最少？需求分析阶段引入的bug最多，其次是设计阶段，最少的是编码阶段。结论：1）测试不能只测试程序，文档也必须要测2）测试工作
系统架构设计的全方位视角：深入解析4+1视图模型及其应用实践架构进化论系统架构设计师系统架构架构
在当今复杂多变的软件开发环境中，如何全面把握系统架构，满足不同利益相关者的需求，是每位架构师面临的重大挑战。“4+1”视图模型作为一种经典的架构描述框架，为解决这一难题提供了系统化的方法论。本文将深入剖析这一模型的理论基础、核心组成、实践应用以及与其他架构方法的对比，通过生活化案例解析和实际应用场景展示，帮助读者掌握如何运用多重视角构建健壮、可扩展的软件系统架构。无论您是初入架构领域的新手，还是经
企业架构设计中的CBAM方法深度解析：成本效益驱动的架构决策艺术架构进化论系统架构设计师架构微服务云原生后端
目录CBAM方法概述与核心价值CBAM核心流程与实施步骤前期准备与场景确定成本效益建模与分析风险调整与决策制定实施技巧与挑战克服CBAM实战案例与应用场景案例一：电商平台促销系统架构选型案例二：制造业ERP系统云迁移决策案例三：金融机构实时风控系统重构跨案例经验总结CBAM与其他架构评估方法的集成应用CBAM与ATAM的协同机制分层评估框架构建行业定制化集成模式敏捷环境中的轻量级CBAM组织能力建
基于YOLOv5的监控摄像头遮挡检测系统：从数据集到UI界面的完整实现芯作者 D2:YOLO YOLO 神经网络
实时守护监控设备安全，智能识别遮挡攻击的AI解决方案一、问题背景与系统价值在安防监控领域，摄像头遮挡是常见的恶意攻击手段——统计显示35%的安防失效源于摄像头被遮挡。传统方案依赖人工巡查，效率低下且响应延迟。本文将带你构建完整的AI遮挡检测系统，核心创新点：双模检测机制：YOLOv5目标检测+背景建模异常分析轻量化部署：模型量化压缩至1.8MB动态学习：运行时自动更新异常样本库二、系统架构设计[视
《深入理解Android 卷I pdf》资源介绍郭清然
《深入理解Android卷Ipdf》资源介绍【下载地址】深入理解Android卷Ipdf资源介绍《深入理解Android卷I》是一本深度剖析Android系统源代码的专业书籍，全面解读Framework层、Native层和Application层的核心机制。本书以情景分析的方式，深入探讨Android系统的启动流程、进程管理、内存管理、文件系统及网络安全等关键模块，帮助开发者透彻理解系统架构与原理
深入理解Android卷Ipdf资源介绍：全面解析Android系统架构与核心原理
深入理解Android卷Ipdf资源介绍：全面解析Android系统架构与核心原理【下载地址】深入理解Android卷Ipdf资源介绍《深入理解Android卷I》是一本深度剖析Android系统源代码的专业书籍，全面解读Framework层、Native层和Application层的核心机制。本书以情景分析的方式，深入探讨Android系统的启动流程、进程管理、内存管理、文件系统及网络安全等关键
Android 跨进程通信(IPC)深度技术总结 JT-Blink Android android
1.概述Android系统基于Linux内核，采用多进程架构设计。每个Android应用默认运行在独立的进程中，拥有独立的虚拟机实例和内存空间。进程间的内存隔离机制保证了系统的稳定性和安全性，但同时也带来了进程间通信的挑战。1.1为什么需要跨进程通信系统架构需求：Android系统服务（如ActivityManagerService、WindowManagerService）运行在system_s
机器学习模型监控警报系统设计：Prometheus+Evidently 实战教程大熊计算机机器学习 prometheus 人工智能
1.系统架构设计：从数据采集到智能告警（1）监控系统核心组件交互图预测请求监控指标告警规则通知渠道预测结果质量报告时序数据模型服务PrometheusExporterPrometheusServerAlertmanager邮件/Slack/WebhookEvidently服务可视化仪表盘图解：系统采用双引擎架构，Prometheus负责基础监控指标采集与告警触发，Evidently执行深度模型分析
鸿蒙线程池全揭秘：让你的应用快、稳、省资源 harmonyos
摘要在现代应用开发中，多线程已经成为提升程序性能、优化用户体验的关键手段。尤其是在HarmonyOS（鸿蒙系统）这种强调分布式、并发处理的系统架构中，合理使用多线程不仅可以让程序运行更高效，还能帮助我们处理复杂的后台任务，比如文件下载、数据库操作、网络请求等。引言鸿蒙系统作为面向多设备融合的新一代操作系统，其支持的多线程模型与传统Android十分类似。很多Java的线程操作方法在鸿蒙中依然适用。
鸿蒙线程池全揭秘：让你的应用快、稳、省资源前端世界 harmonyos harmonyos 华为
摘要在现代应用开发中，多线程已经成为提升程序性能、优化用户体验的关键手段。尤其是在HarmonyOS（鸿蒙系统）这种强调分布式、并发处理的系统架构中，合理使用多线程不仅可以让程序运行更高效，还能帮助我们处理复杂的后台任务，比如文件下载、数据库操作、网络请求等。引言鸿蒙系统作为面向多设备融合的新一代操作系统，其支持的多线程模型与传统Android十分类似。很多Java的线程操作方法在鸿蒙中依然适用。
《去哪儿网Redis高并发实战：从问题定位到架构升级》猕员桃 redis 架构数据库
去哪儿网Redis高并发实战：从问题定位到架构升级在互联网行业竞争日益激烈的当下，高并发场景下的系统性能优化一直是技术团队面临的重要挑战。对于去哪儿网这类在线旅游平台来说，节假日期间的流量高峰更是对系统架构的严峻考验。本文将深入剖析去哪儿网在五一假期期间，针对Redis高并发问题的实战解决方案，从问题定位、优化策略到架构升级，全方位展现整个优化过程。一、案例背景：五一假期流量峰值挑战1.1业务场景
stm32毕设基于单片机的太阳追光系统(源码+硬件+论文) m0_984093 单片机
文章目录0前言1课题介绍光线追踪的原理系统架构2硬件设计3核心软件设计4实现效果5最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是毕业设计基于单片机的太阳追光系统(源码+硬件+论文)学长这里
电子信息毕设基于单片机的太阳追光系统(源码+硬件+论文) 爱你单片机单片机 stm32 毕业设计
文章目录0前言1课题介绍光线追踪的原理系统架构2硬件设计3核心软件设计4实现效果5最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是毕业设计基于单片机的太阳追光系统(源码+硬件+论文)学长这里
毕设开源基于单片机的太阳追光系统(源码+硬件+论文) Mdc_stdio 单片机 stm32 毕业设计
文章目录0前言1课题介绍光线追踪的原理系统架构2硬件设计3核心软件设计4实现效果5最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是毕业设计基于单片机的太阳追光系统(源码+硬件+论文)学长这里
【软考高级系统架构论文】论企业集成平台的理解与应用 _Richard_ 2025年软考系统架构师系统架构
论文真题请围绕“企业集成平台的理解与应用”论题，依次从以下三个方面进行论述。概要叙述你参与管理和开发的、采用企业集成平台进行企业信息集成的软件项目以及你在其中所承担的主要工作。请给出至少4种企业集成平台应具有的基本功能，并对这4种功能的内涵进行简要阐述。具体阐述你参与管理和开发的项目是如何使用企业集成平台进行企业信息集成的，并围绕上述4种功能，详细论述在集成过程中遇到了哪些实际问题，是如何解决的。
c++常见英文单词（自用）叫我六胖子 c++英文 c++
c++常见英文单词application应用程式应用、应用程序applicationframework应用程式框架、应用框架应用程序框架architecture架构、系统架构体系结构argument引数（传给函式的值）。叁见parameter叁数、实质叁数、实叁、自变量array阵列数组arrowoperatorarrow（箭头）运算子箭头操作符assembly装配件assemblylanguag
高并发系统架构设计茫茫人海一粒沙系统架构 java
在互联网系统中，“高并发”从来不是稀罕事：双十一秒杀、12306抢票、新人注册峰值、热点直播点赞……，如果你的系统没有良好的架构设计，很容易出现：接口超时、数据错乱、系统宕机。本文从六个核心维度出发，系统性讲解如何构建一套“抗得住流量洪峰”的企业级高并发架构。一、系统拆分——降低系统耦合度，提高弹性伸缩能力核心思想将单体系统按业务域/模块/职责划分为多个服务；采用微服务架构（如SpringClou
64、Delphi系统架构与线程模型详解 g8f9d0s1a2 深入解析Delphi 6开发者指南 Delphi 系统架构线程模型
Delphi系统架构与线程模型详解1系统架构概述Delphi作为一款强大的集成开发环境（IDE），其系统架构设计不仅体现了高效性，还融合了灵活性和可扩展性。理解Delphi的系统架构是掌握其核心功能和开发技巧的关键。本文将详细介绍Delphi的系统架构及其各组成部分的交互方式，帮助开发者更好地利用这款工具。1.1Delphi系统架构的基本组成部分Delphi的系统架构主要包括以下几个关键部分：编译
论基于架构的软件设计方法及应用(ABSD) laomocoder 架构
摘要2020年6月,我司自主研发了在线多媒体设计行业的业务中台系统。系统以支撑各前台业务满足文件采购入库、运营一键分发、用户在线设计、文件存储等需求提供可重复使用能力，形成一次建设多次使用。系统以用户在线上传/编辑素材与模板完成设计工作为主要核心，按领域分为内容供应、内容管理、内容分发、用户管理、商业化、文件管理等模块,支持B/C端系统快速接入,在项目中我担任系统架构师角色，主要负责内容为架构设计
数据与ChatBI
ChatBI的核心是让用户用自然语言（如“帮我看看这周的销售额走势”）直接获取数据分析结果，无需懂SQL或技术细节。整个过程就像AI“听懂”你的话、理解需求、生成查询、验证执行、并可视化展示结果。首先，ChatBI的系统架构图展示了整个流程的关键步骤。它从用户输入开始，经过多个AI模块处理，最终输出交互式报表。现在来一步步解析ChatBI的工作流程。1.语音/文字输入——解放双手的起点这是什么？一
End-To-End 之于推荐-kuaishou OneRec 笔记 ASKED_2019 RecSys 笔记
核心思想OneRec提出了一种统一的生成式推荐系统架构，打破了传统“召回-粗排-精排”级联式推荐流程，使用单一生成模型同时完成召回与排序任务。该系统由快手团队研发，并成功部署于短视频主场景。OnlineA/BTest表现：模型总观看时长平均观看时长OneRec-1B+IPA+1.68%+6.56%一Input处理Userpositiveactionsequence，将短视频的多模态表征，通过量化的
【架构篇】微前端架构设计与qiankun实战全息架构师 Java 前沿探索：引领技术新风尚架构前端
【架构篇】微前端架构设计与qiankun实战阅前必看：本文是《前端开发完全指南》系列的第十七篇，包含15个核心代码示例、8张系统架构图解、2个企业级落地案例。通过qiankun+ModuleFederation实现前端应用自由组合，支撑百万级PV应用！目录微前端核心价值技术方案全景对比qiankun架构设计主子应用通信方案样式隔离方案沙箱机制解析资源加载优化权限体系集成性能监控方案中台系统实战一、
软件架构 vs 系统架构 vs 解决方案架构 vs 企业架构——你真的懂它们的区别吗？数字时代的探索者数字化转型系统架构软件架构解决方案架构企业架构
软件架构、系统架构、解决方案架构、企业架构……听起来都带"架构"，但根本不是一个东西啊！（就像"茶"可以是珍珠奶茶、水果茶、乌龙茶——虽然都叫茶，但差别大了去了！）为了澄清这些概念，本文将梳理这些概念的演变历程、发展现状，并阐明它们之间的异同。软件架构：代码的整体规划前世与今生软件架构是最早得到广泛认可的一种架构形式，起源于软件工程发展的早期阶段。最初，软件架构关注的是如何结构化地编写代码，以提高
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring