heiyeshuwu

[转]Unix下针对邮件,搜索,网络硬盘等海量存储的分布式文件系统项目（关于GFS、MogileFS分布式文件系统邮件列表）

Unix下针对邮件,搜索,网络硬盘等海量存储的分布式文件系统项目

：Google是当前最有影响的Web搜索引擎，它利用一万多台廉价PC机构造了一个高性能、超大存储容量、稳定、实用的巨型Linux集群。
http://bbs.chinaunix.net/forum/viewtopic.php?t=390949&show_type=old

其分布式分布式文件系统的实现方法，用低成本实现了高可用、高性能集群的方法是并行机设计、开发的一个成功典范,这种严格追求性价比的设计方法值得借鉴。

请大家参与到这一工作中来:)

发件人: Eric Anderson
收件人: FreeBSD Clustering List
主题: FreeBSD Clustering wishlist - Was: Introduction & RE: Clustering with Freebsd
日期: Wed, 11 May 2005 22:45:55 -0500 (星期四，11:45 CST)
邮件程序: Mozilla/5.0 (X11; U; FreeBSD i386; en-US; rv:1.7.7) Gecko/20050504

Ok - Im changing the subject here in an attempt to gather information.

Heres my wishlist:

FreeBSD have a native clustered filesystem. This is different than
shared media (we already can do that over fiber channel, ggated, soon
iscsi and AOE). This would allow multiple servers to access the same
data read/write - highly important for load balancing applications like
web servers, mail servers, and NFS servers.

Online growable filesystem. I know I can growfs a filesystem now, but
doing online while data is being used is *insanely* useful. Reiserfs
and Polyserves FS (a clustered filesystem, not open-source) do this well.

FreeBSDs UFS2 made to do journaling. Theres already someone working
on this.

I believe the above mean that we need a distributed lock manager too, so
might as well add that to my wishlist.

Single filesystem limits set very high - 16TB would be a good minimum.

Vinum/geom (?) made to allow added a couple more disks - be it a real
scsi device, or another vinum device - to existing vinums, so I can
extend my vinum stripe, raid, concat, etc to a larger volume size,
without worrying about which disk is where. I want to stripe mirrors of
raids, and raid striped mirrors of stripes. I know it sounds crazy, but
I really *do* have uses for all this. :)

We currently pay lots of money every year (enough to pay an engineers
salary) for support and maintenance with Polyserve. They make a good
product (we need it for the clustered filesystem and NFS distributed
lock manager stuff) - Id much rather see that go to FreeBSD.

Eric :em10: :em10: :em10: :em10: :em16:

yftty 回复于：2005-05-13 14:46:32

在 2005-05-11三的 22:45 -0500，Eric Anderson写道：
> Ok - Im changing the subject here in an attempt to gather information.
>
> Heres my wishlist:
>
> FreeBSD have a native clustered filesystem. This is different than
> shared media (we already can do that over fiber channel, ggated, soon

Yes, the clustered filesystem will not run on SAN, since that will give
a high cost.

> iscsi and AOE). This would allow multiple servers to access the same
> data read/write - highly important for load balancing applications like
> web servers, mail servers, and NFS servers.

http://www.netapp.com/tech_library/3022.html <-- this article give some
info about the small file operations among the web, mail, IM, netdisk,
blog, etc. service. and thats our DFS targets at ;)

>
> Online growable filesystem. I know I can growfs a filesystem now, but
> doing online while data is being used is *insanely* useful. Reiserfs
> and Polyserves FS (a clustered filesystem, not open-source) do this well.

Yes, we also support that with our insanely mechanism.

And you know in the current clustered fs, as GoogleFS, Lustre, etc.
which can be built on online growfs. Thats also our way to do it.

>
> FreeBSDs UFS2 made to do journaling. Theres already someone working
> on this.

Good news.

>
> I believe the above mean that we need a distributed lock manager too, so
> might as well add that to my wishlist.

By the specific application & services, we can easily remove the
distributed lock manager easily with upper layer way. You can read the
GoogleFS paper to get some further info.

>
> Single filesystem limits set very high - 16TB would be a good minimum.

The limits can be removed.

>
> Vinum/geom (?) made to allow added a couple more disks - be it a real
> scsi device, or another vinum device - to existing vinums, so I can
> extend my vinum stripe, raid, concat, etc to a larger volume size,
> without worrying about which disk is where. I want to stripe mirrors of
> raids, and raid striped mirrors of stripes. I know it sounds crazy, but
> I really *do* have uses for all this. :)

Yes, thats Lustres way, and we also add a logical disk layer to
support it.

>
> We currently pay lots of money every year (enough to pay an engineers
> salary) for support and maintenance with Polyserve. They make a good

Would you like to persuade your company to sponse the developing ;)

>
> product (we need it for the clustered filesystem and NFS distributed
> lock manager stuff) - Id much rather see that go to FreeBSD.

At last, any help & donate & contribute among the requirements & tech.
domains are great appreciated !

>
> Eric
>
>
>
--
yf-263
Unix-driver.org

chifeng 回复于：2005-05-13 15:00:52

yftty愿意为BSD做贡献啦。。。哈哈。
而且还有钱拿。。。。

riverfor 回复于：2005-05-13 15:05:58

我也想写fs!

thzjy 回复于：2005-05-13 15:19:51

largeness project

dtest 回复于：2005-05-13 16:33:32

though i can not understand it completely, i think its a good idea.:)

kofwang 回复于：2005-05-14 11:22:43

need to learn more advanced tech for understanding this artical

yftty 回复于：2005-05-15 21:54:46

在 2005-05-11三的 22:45 -0500，Eric Anderson写道：
> Ok - Im changing the subject here in an attempt to gather information.
>
> Heres my wishlist:

As for your wishlists, how about the MogileFS of
http://www.danga.com/mogilefs/

And what do you think about our GoogleFS like && MogileFS features
Clustre FS ?

Any comments are quite welcomed :)

yftty 回复于：2005-05-16 13:11:12

看样子大家对英文不是很感冒,给点我们头人的中文的乐呵乐呵

我一直在构想一个基于类SMPP协议的公开协议的分布式网络存储系统。大家可以看到google发布过一个google
fs的白皮书。实质上就是一个将fs的操作变为网络协议的操作的做法。最近手头上在帮助一个朋友完成了一个相关系统的设计的考虑。不知各位是否有兴趣一起来完成这样的一个项目，并且将它一直维护下去，也许将来它不止是一个python的实现，还会有c、java的实现。但是我相信python的实现会是最好的，就像现在的bt一样。
这样的分布式网络存储的用处会非常的多，如现在大家常在使用的大容量网络硬盘、gmail这样的大容量邮件系统、NNTP这样的大容量信息交互系统、Blog这样的大容量信息存储系统。
它的特点在于存储的内容多样化、存储的数据不能集中化、存储的数据会以用户/组/系统等为中心进行存储。
相关内容大家可以看看google fs。如果找不到我可以提供相关的pdf白皮书。
另：项目会开源（GPL或BSD）、项目会有实质的用所来证明我们的想法的正确性（我来解决测试环境的问题）。
----HD

wheel 回复于：2005-05-16 13:47:49

为何要基于类SMPP协议，不要基于bt

yftty 回复于：2005-05-16 13:53:24

[quote:af0423eec1=wheel]为何要基于类SMPP协议，不要基于bt[/quote:af0423eec1]

具体的网络抽象层(NAL)正在选型,我上个季度用过CURL作了个DEMO.

后面可能会用类似 PVFS2 的网络层架构

文件访问支持 TFTP, FTP, HTTP, NFS, etc.

另: 现在看来还是用类似Lustre的Portals那样的东西吧:(

dtest 回复于：2005-05-16 13:53:38

ok, i can take part in this project, how to start it? If python be used to develop, i think most of us must learn it at first.

yftty 回复于：2005-05-16 23:10:45

some good talk on Spotlight on Tiger (Mac OS X)

http://www.kernelthread.com/software/fslogger/

这也是我们的设计所追求的目标:

表现层 (基于搜索的目录, 用户文件)

检索/搜索层 (搜索引擎)

存储层 (分布式文件系统)

sttty 回复于：2005-05-17 00:15:15

好想法。支持。可惜我能力不够。不然我一定报名。

狂顶

ly_1979425 回复于：2005-05-17 09:18:18

如果使用光盘作为近线存储介质，会更有效的发挥成本优势。
如果把现在的光盘库文件系统，如果ISO9660，UDF，JOLIET等光盘文件系统格式，以一种统一的网络文件系统的格式显现给用户，会极大的提高光盘在网络中的使用。如果光盘库这种设备。
这种大家存储很大的数据，但成本很便宜。光盘的成本远低于硬盘的成本。
我可以在这个方面与yftty合作。

xuediao 回复于：2005-05-17 09:28:56

看了一下，基本了解了大概的事情。不过楼主能不能描述一下DFS将来的应用场景，和基于SMPP协议的考虑，这点我不是怎么明白。

However, my pleasure to join in this! :D

yftty 回复于：2005-05-17 10:45:22

[quote:18810a6f1e=xuediao]看了一下，基本了解了大概的事情。不过楼主能不能描述一下DFS将来的应用场景，和基于SMPP协议的考虑，这点我不是怎么明白。

However, my pleasure to join in this! :D[/quote:18810a6f1e]

不好意思, 请看英文部分;) 现有的集群文件系统就我所了解到的好像没有基于SMPP的,我也从没看过SMPP协议的东西.

应用场景就是那种海量存储. 如WEB, MAIL, VOD/IPTV, 广电, 图书馆等. 比较熟悉的系统应用如：Google的LINUX机群系统，Yahoo的BSD Server机群系统。

yftty 回复于：2005-05-17 10:49:49

[quote:0336c3ab45=ly_1979425]如果使用光盘作为近线存储介质，会更有效的发挥成本优势。
如果把现在的光盘库文件系统，如果ISO9660，UDF，JOLIET等光盘文件系统格式，以一种统一的网络文件系统的格式显现给用户，会极大的提高光盘在网络中的使用..........[/quote:0336c3ab45]

是的,本设计有这方面的考虑,如你前面所言. 将每个光盘文件系统的MetaData信息统一存储在MDS部分,完成Namespace解析功能, 使得到达光盘的指令仅为Seek和Read/Write Stripe操作, 会大大提高它的易用性.

同时光盘会大大降底使用成本如场地费用, 电费.

zhuwas 回复于：2005-05-17 13:10:57

i can do it in my spare time , support , support !!!

yftty 回复于：2005-05-17 13:23:24

或者你可以通过这种流程分析:)

Ext3/UFS/ReiserFS ;

NFS ;

GlobalFS ;

OpenAFS (Arla), Coda, Inter-mezzo, Lustre, PVFS2, GoogleFS.

因为我们的组内成员在扩大, 我一直在考虑如何使它像路边的大白菜一样普通; 而不是令人觉得突然在面前立起一个望不到头的高楼.

javawinter 回复于：2005-05-17 16:20:00

友情支持 :D

zl_vim 回复于：2005-05-17 17:02:36

是个什么dd？
怎么参与啊？

潇湘夜雨回复于：2005-05-17 18:17:27

支持一把。。。在IT职业生涯里也发一个吧

nemoliu 回复于：2005-05-17 23:00:19

hehe,伴随着google的成功fs显得更加诱人了，如果有实力也很像参与

javawinter 回复于：2005-05-18 02:55:46

有实力的都来加入吧:)

citybugzzzz 回复于：2005-05-18 08:45:05

UpUp!
继续关注中。。。虽然项目很忙，但很乐于参与！

hdcola 回复于：2005-05-18 09:04:40

很久没回来看了。我来告诉大家为什么当初会考虑smpp类的协议来做消息存储的分布式文件系统的一种协议。
1.smpp是全异步的协议，理论上可以非常多，但通常的应用中它通过十六到三十二个窗口来并发处理，从而达到在服务器端没有及时处理完工作的情况下在一个连接中处理下一个指令。这可以大量的减少服务器端的并发连接数量。
2.消息类存储写后都不会有大量的改。这样在save时可以考虑使用存储转发机制，在服务器端难以响应或出问题时解决消息的问题。
这只是一个建议。多一个想法而已。
^_^

yftty 回复于：2005-05-18 10:11:29

[quote:1c0f55756a=hdcola]很久没回来看了。我来告诉大家为什么当初会考虑smpp类的协议来做消息存储的分布式文件系统的一种协议。
1.smpp是全异步的协议，理论上可以非常多，但通常的应用中它通过十六到三十二个窗口来并发处理，从而达到在服..........[/quote:1c0f55756a]

欢迎大家多提意见和建议 >_> 我们都会在选型中作对应的评估和测试 :)

具体的工作会分为

client, data server, metadata server, namespace, datapath, log, recovery, networking (or on wire protocol), migration/replication, utilities, etc. 几部分. 欢迎大家就感兴趣的部分参与到工作中来.

或者可以分几个主题分别讨论相关的技术领域. 算是我们作分布式协作的尝试;)

欢迎大家也就开源协作模式作讨论

mozilla121 回复于：2005-05-18 15:15:28

頂一下

nizvoo 回复于：2005-05-18 15:58:58

i wanna do some part!

yftty 回复于：2005-05-18 16:13:51

[quote:abdc530327=nizvoo]i wanna do some part![/quote:abdc530327]

If you said the great golden saying I wanna do some part!, please recite your tech. background or interests domain so as I can give more info to let you get into the work smoothly.

Speak another way, do you consider as I say : Just do it ! make sense ;)

uplooking 回复于：2005-05-18 16:47:21

yftty 大侠的东西要顶，再说这个东西学会了会有很好的发展呀

yftty 回复于：2005-05-18 16:55:37

http://tech.sina.com.cn/it/2005-05-08/0920600573.shtml

新华网北京5月7日电 (记者李斌) 中国青年软件振兴计划工作委员会等单位日前进行的一项4400多人的“中国软件人才生存状况”调查表明，中国软件人才不仅“后继乏人”，而且由于培训缺乏、教育模式等原因“后继乏力”。

软件业知识更新速度快，然而调查发现，60%的国内软件企业没有对员工提供必要的职业规划，表明国内软件企业在员工培训方面不够重视。

调查表明，虽然大部分软件从业人员都希望自己可以通过培训提高自身能力，可是社会环境却很难提供这样的机会：一方面是供职的企业不支持，另一方面是社会上能够及时提供新技术培训的机构少之又少。

77%的软件从业人员的工作时间在8个小时以上，处于中间层次的程序员们没有时间去接受新的技术、新的理念，没有时间去提高自身能力。大多数软件专业本科毕业生月工资水平在2000元左右，年薪能够达到10万元的软件人才估计不足全部软件从业人员的5%。调查发现，教育体制的落后导致了软件专业毕业生缺乏实际编程能力，无法适应企业的实际需要。而软件企业自身又不愿提供相应的培训，这样一来编程人员的数量几乎是处在一种“净减”状态。

同时，中国缺少专门的软件开发管理人才培训机构，只有自身具备良好管理天赋的软件工程师或者程序员幸运地成为软件开发管理人员，出现了“软件人才就业难”和“软件企业招不到合适员工”的怪现象。

-------------

希望Uplooking.com能为这个行业培养出更多的系统级开发人才 :)

nizvoo 回复于：2005-05-18 17:24:42

3 years c /windows/opengl/dx

yftty 回复于：2005-05-18 17:38:33

[quote:4397799f7e=nizvoo]3 years c /windows/opengl/dx[/quote:4397799f7e]

本季度属于孕酿阶段,这个季度末我会向公司汇报或探讨可能的运作形式;请大家也就这方面提供意见和建议.关于像一个这样的项目的生存和发展.

使这个成为一个成功的行业级软件,并取得强大的生命力.

同时从这个贴子开始作起,去探索一个东东如何去保持其持续的生命力;)

年青,美丽, 永远!

yftty 回复于：2005-05-18 17:39:26

http://lists.danga.com/pipermail/mogilefs/2004-December/000018.html

On Dec 20, 2004, at 11:50, Brad Fitzpatrick wrote:

Excellent! I did a project implementing exactly
same idea two years ago for a project related
to storage of mail messages for GSM carrier and
can appreciate the beauty of the solution! It is
great to have such product in open source.

uplooking 回复于：2005-05-18 17:47:59

这个东西国内做的人多吗？

yftty 回复于：2005-05-18 18:29:21

不多,但想想刚开始或现在华为作电信设备的时候也没多少人,所以他每年需要培养那么多;)

人们总喜欢称商业规则为 Game Rule, Game 也可以说是个赌博, 所以对公司在说,在一定程度上他是在赌大众心理. 赌对了的就活的舒服一点, 你觉得行业的趋势和大众的心理在哪里呢?

这样说对你有吸引力么;)

http://www.blogchina.com/new/display/72595.html

遗憾人物”的最大缺陷就是资源利用和行业整合能力的欠缺，以及企业管理能力的平庸。

sttty 回复于：2005-05-18 23:55:59

将此项目支持到底。有机会，好好学学。

说到uplooking 课程。前几天去听公开课。感觉不错，课程很实用。我发现听课的人水平都不低。
当时感觉很惭愧。 :oops:

yftty 回复于：2005-05-19 09:36:25

[quote:7d30a9145e=sttty]将此项目支持到底。有机会，好好学学。

说到uplooking 课程。前几天去听公开课。感觉不错，课程很实用。我发现听课的人水平都不低。
当时感觉很惭愧。 :oops:[/quote:7d30a9145e]

对于一个社团来说, 它存在的价值在于:
首先它能帮助大家成长,
其次它能大家带来更多的机会.

请发布宣传性的东东如上以此为出发点;) 呵呵

nizvoo 回复于：2005-05-19 09:46:41

ok, i know it. I need learn more FS knowledge. keep touch.my mail : nizvooATgmail.com.

deltali 回复于：2005-05-19 10:11:26

whats the role of locks in a distributed filesystem？

thanks!

yftty 回复于：2005-05-19 11:03:55

[quote:042aeff932=deltali]whats the role of locks in a distributed filesystem？

thanks![/quote:042aeff932]

The locks in a distributed filesystem is managed by Distributed Lock Manager (DLM),

A distributed filesystem need to addressing the problem of delivering aggregate performance to a large number of clients.

DLM is the basis of scalable clusters. In a DLM based cluster all nodes can write to all shared resources and co-ordinate their action using the DLM.

This sort of technology is mainly intended for CPU and/or ram intensive processing, not for disc intensive operations nor for reliblity.

Digital > Compaq > HP... HP own the Digital DLM technology, available in Tru64 Unix (was Digital Unix and OpenVMS 8.)

Compaq/HP licensed the DLM technology to Oracle who have base their cluster/grid software on the DLM

Sun Solaris also has a DLM based cluster technology.

Now Sun and HP are fighting blog wars...
http://blogs.zdnet.com/index.php?p=661&tag=nl.e539
http://www.chillingeffects.org/responses/notice.cgi?NoticeID=1460

Where I see DLM being good is for rendering and scientific calculation. These processes could really benifit from having a central data store but will not put a huge load on the DLM hardware..

Some more deeply knowledge:

http://kerneltrap.org/mailarchive/1/message/56956/thread

http://kerneltrap.org/mailarchive/1/message/66678/thread

http://lwn.net/Articles/135686/

Clusters and distributed lock management
The creation of tightly-connected clusters requires a great deal of supporting infrastructure. One of the necessary pieces is a lock manager - a system which can arbitrate access to resources which are shared across the cluster. The lock manager provides functions similar to those found in the locking calls on a single-user system - it can give a process read-only or write access to parts of files. The lock management task is complicated by the cluster environment, though; a lock manager must operate correctly regardless of network latencies, cope with the addition and removal of nodes, recover from the failure of nodes which hold locks, etc. It is a non-trivial problem, and Linux does not currently have a working, distributed lock manager in the mainline kernel.

David Teigland (of Red Hat) recently posted a set of distributed lock manager patches (called dlm), with a request for inclusion into the mainline. This code, which was originally developed at Sistina, is said to be influenced primarily by the venerable VMS lock manager. An initial look at the code confirms this statement: callbacks are called ASTs (asynchronous system traps, in VMS-speak), and the core locking call is an eleven-parameter monster:

int dlm_lock(dlm_lockspace_t *lockspace,
int mode,
struct dlm_lksb *lksb,
uint32_t flags,
void *name,
unsigned int namelen,
uint32_t parent_lkid,
void (*lockast) (void *astarg),
void *astarg,
void (*bast) (void *astarg, int mode),
struct dlm_range *range);

Most of the discussion has not been concerned with the technical issues, however. There are some disagreements over issues like how nodes should be identified, but most of the developers who are interested in this area seem to think that this implementation is at least a reasonable starting point. The harder issue is figuring out just how a general infrastructure for cluster support can be created for the Linux kernel. At least two other projects have their own distributed lock managers and are likely to want to be a part of this discussion; an Oracle developer recently described the posting of dlm as a preemptive strike. Lock management is a function needed by most tightly-coupled clustering and clustered filesystem projects; wouldnt it be nice if they could all use the same implementation?

The fact is that the clustering community still needs to work these issues out; Andrew Morton doesnt want to have to make these decisions for them:

Not only do I not know whether this stuff should be merged: I dont even know how to find that out. Unless Im prepared to become a full-on cluster/dlm person, which isnt looking likely.

The usual fallback is to identify all the stakeholders and get them to say yes Andrew, this code is cool and we can use it, but I dont think the clustering teams have sufficent act-togetherness to be able to do that.

Clustering will be discussed at the kernel summit in July. A month prior to that, there will also be a clustering workshop held in Germany. In the hopes that these two events will help bring some clarity to this issue, Andrew has said that he will hold off on any decisions for now.

wolfg 回复于：2005-05-19 14:36:08

关注

ufoor 回复于：2005-05-19 23:38:16

看的有些晕了,还得多学
相关的东西还是先看中文的比较好些,效率高些.如果中文的没有再看英文的

Zer4tul 回复于：2005-05-20 03:08:11

好像是HD想出的主意吧？不错啊……可惜我水平不够……就在一边加油好了……过两天仔细看看Google FS的文档。

yftty 回复于：2005-05-20 08:15:56

[quote:89ea8253f6=ufoor]看的有些晕了,还得多学
相关的东西还是先看中文的比较好些,效率高些.如果中文的没有再看英文的[/quote:89ea8253f6]

看中文的有利于迅速建立相关的概念, 但几个概念建立起来之后, 就不要看中文的了, 否则会越看越糊涂.

yftty 回复于：2005-05-20 08:19:46

[quote:f7a8ff7b78=Zer4tul]好像是HD想出的主意吧？不错啊……可惜我水平不够……就在一边加油好了……过两天仔细看看Google FS的文档。[/quote:f7a8ff7b78]

hehe, HD can be considerred the Godfather of the Project !

Also great project need great man. Do you want to let me know and merge your brilliant ideas as what to do or how to do.

Lets inspiring each to other ;-) !

akadoc 回复于：2005-05-20 13:17:40

up，up，up。关注中。。。

yftty 回复于：2005-05-20 17:03:08

[quote:8e1053c4e6=akadoc]up，up，up。关注中。。。[/quote:8e1053c4e6]

您想关注那一点或哪一部分呢,是组织还是技术呢,还是技术的哪一部分呢:)

请看与我们类似的MogileFS提供的Features.

http://www.danga.com/mogilefs/

MogileFS is our open source distributed filesystem. Its properties and features include:

* Application level -- no special kernel modules required.
* No single point of failure -- all three components of a MogileFS setup (storage nodes, trackers, and the trackers database(s)) can be run on multiple machines, so theres no single point of failure. (you can run trackers on the same machines as storage nodes, too, so you dont need 4 machines...) A minimum of 2 machines is recommended.
* Automatic file replication -- files, based on their class, are automatically replicated between enough different storage nodes as to satisfy the minimum replica count as requested by their class. For instance, for a photo hosting site you can make original JPEGs have a minimum replica count of 3, but thumbnails and scaled versions only have a replica count of 1 or 2. If you lose the only copy of a thumbnail, the application can just rebuild it. In this way, MogileFS (without RAID) can save money on disks that would otherwise be storing multiple copies of data unnecessarily.
* Better than RAID -- in a non-SAN RAID setup, the disks are redundant, but the host isnt. If you lose the entire machine, the files are inaccessible. MogileFS replicates the files between devices which are on different hosts, so files are always available.
* Transport Neutral -- MogileFS clients can communicate with MogileFS storage nodes (after talking to a tracker) via either NFS or HTTP, but we strongly recommend HTTP.
* Flat Namespace -- Files are identified by named keys in a flat, global namespace. You can create as many namespaces as youd like, so multiple applications with potentially conflicting keys can run on the same MogileFS installation.
* Shared-Nothing -- MogileFS doesnt depend on a pricey SAN with shared disks. Every machine maintains its own local disks.
* No RAID required -- Local disks on MogileFS storage nodes can be in a RAID, or not. Its cheaper not to, as RAID doesnt buy you any safety that MogileFS doesnt already provide.
* Local filesystem agnostic -- Local disks on MogileFS storage nodes can be formatted with your filesystem of choice (ext3, ReiserFS, etc..). MogileFS does its own internal directory hashing so it doesnt hit filesystem limits such as max files per directory or max directories per directory. Use what youre comfortable with.

MogileFS is not:

* POSIX Compliant -- you dont run regular Unix applications or databases against MogileFS. Its meant for archiving write-once files and doing only sequential reads. (though you can modify a file by way of overwriting it with a new version) Notes:
o Yes, this means your application has to specifically use a MogileFS client library to store and retrieve files. The steps in general are 1) talk to a tracker about what you want to put or get, 2) read/write to the NFS path for that storage node (the tracker will tell you where) or do an HTTP GET/PUT to the storage node, if youre running with an HTTP transport instead of NFS (which is highly recommended)
o Weve briefly tinkered with using FUSE, which lets Linux filesystems be implemented in userspace, to provide a Linux filesystem interface to MogileFS, but we havent worked on it much.
* Completely portable ... yet -- we have some Linux-isms in our code, at least in the HTTP transport code. Our plan is to scrap that and make it portable, though.

scrazy77 回复于：2005-05-20 20:50:59

[quote:01064cbd68=yftty]

您想关注那一点或哪一部分呢,是组织还是技术呢,还是技术的哪一部分呢:)

请看与我们类似的MogileFS提供的Features.

http://www.danga.com/mogilefs/

MogileFS is our open source distributed filesystem..........[/quote:01064cbd68]
MogileFS 可視為簡單版的google gfs ?作，
概念上是很接近的，
只是其最小單位是以 file為主，而google gfs最小單位是一個Chunk (64MB)
但目前使用MogileFS 要用application client?韆ccess，
使用上的方便性還是不如像RedHat GFS這?的 Distribute share storage，
或Netapp Filer...
當然MogileFS可能是最便宜的solution
目前在我內部的cluster已經在進行測試，
使用php的client，應用於多server access的blog & album system，
如要?作為POSIX filesystem，使用FUSE應該是可以很快作出?恚?
danga他們好像也有此計?

Eric Chang

yftty 回复于：2005-05-21 00:30:32

> MogileFS 可視為簡單版的google gfs ?作，
> 概念上是很接近的，

是的,都属于非对称式集群文件系统的用户空间实现的一个子集

同时它们可以被看作是文件管理库函数,而不是个文件系统.

> 只是其最小單位是以 file為主，而google gfs最小單位是一個Chunk (64MB)

MogileFS 以 File 为最小管理单位, 所以只需要处理文件名字空间,无需处理磁盘块空间.

GoogleFS 将原来的磁盘块操作提升为基于文件的 Chunk (64MB) 操作,以使存储管理有个合适的管理最小细度,降底用于管理方面的开销.

> 但目前使用MogileFS 要用application client?韆ccess，
> 使用上的方便性還是不如像RedHat GFS這?的 Distribute share storage，

GFS 属于基于SAN的对称式的分布式文件系统

> 或Netapp Filer...

Netapp Filer 属于优化的NFS Server

> 當然MogileFS可能是最便宜的solution
> 目前在我內部的cluster已經在進行測試，

Good job !

> 使用php的client，應用於多server access的blog & album system，
> 如要?作為POSIX filesystem，使用FUSE應該是可以很快作出?恚?

这个应该是说的开发流程;) 我们刚开始也是这个思路,但由此带来的工作量大大增加,所以就不在FUSE里面作试验了.

> danga他們好像也有此計?

> Eric Chang

我菜我怕谁回复于：2005-05-21 09:09:00

嗨,unix本身偶还没有搞懂，还是潜水吧！！

yftty 回复于：2005-05-21 10:36:30

[quote:1f79b891a3=我菜我怕谁]嗨,unix本身偶还没有搞懂，还是潜水吧！！[/quote:1f79b891a3]

HOHO,这个在一定程度上和Unix没关系;) 我也很很不是很明白Unix,呵呵;

IT业作为由美国主导,硅谷精英发起的消费型经济,向以眼花缭乱的概念为噱头赢利,从而令大众的购买力大大超支. 同时,他们不但构造了技术壁垒,市场壁垒,还有这种心理上的壁垒. :em03: 莫要被它吓倒喔.

大项目都是纸老虎,要从战略上鄙视它,这样才能从战术上操纵它 :em02:

再大的项目每个人所参与的都是一小部分,但我是否因为这一小小的一部分,可以说我在参与了这个领域,或这个社会的进步了呢 ;) ;漫长的历程仅仅是因为目标的不明确:)

附: 王国维所言的作事情的三种境界 --

1. 昨夜西风调碧树,独上高楼,望尽天涯路!

2. 衣带渐宽终不悔,为伊消的人憔悴.

3. 众里寻它千百度,蓦然回首,那人却在,灯火阑珊处. (是你么 :em18: )

kofwang 回复于：2005-05-21 10:45:58

有道理，不过你算是找对了方向。对于一般人来说：
1、昨夜烧酒空寒心，欲上高楼，无觅天涯路
2、体力透支终不支，钱包依旧若空池
3、杀场拼争三百年，卸甲归田，却发现，无家可归 :em16:

sttty 回复于：2005-05-21 10:47:34

好一个
1. 昨夜西风调碧树,独上高楼,望尽天涯路!

2. 衣带渐宽终不悔,为伊消的人憔悴.

3. 众里寻它千百度,蓦然回首,那人却在,灯火阑珊处

一句话惊醒梦中人呀

kofwang 回复于：2005-05-21 10:53:52

“以眼花缭乱的概念为噱头赢利”
如今正是概念经济大行其道的时候。对于中国人来说，“家庭影院”，“自驾游”，“三个代表”，吸引了多少眼球阿

yftty 回复于：2005-05-21 10:58:34

[quote:834d16ab05=kofwang]有道理，不过你算是找对了方向。对于一般人来说：
1、昨夜烧酒空寒心，欲上高楼，无觅天涯路
2、体力透支终不支，钱包依旧若空池
3、杀场拼争三百年，卸甲归田，却发现，无家可归 :em16:[/quote:834d16ab05]

在牢房里望出去,一人看到了泥土,一人看到了星星 :wink:

人更多的是在看曲折后的坦途;所以这也是悲剧如<梁祝>更容易流传于世一样

在病态的执着后面你是否有这样的感受,早上总是被惊醒,但又不知道在担心或该担心什么?

akadoc 回复于：2005-05-21 14:23:17

[quote:153f9ab03f=yftty]

对于一个社团来说, 它存在的价值在于:
首先它能帮助大家成长,
其次它能大家带来更多的机会.

请发布宣传性的东东如上以此为出发点;) 呵呵[/quote:153f9ab03f]

Hoping to see a team as U say，in this project！

chifeng 回复于：2005-05-21 22:37:24

不知道像我这样的菜鸟能否帮上忙?
做点具体的事情.....:)

tclwp 回复于：2005-05-22 17:25:14

如果整和进新的开拓性技术，前途光明

yftty 回复于：2005-05-22 20:56:29

[quote:1817ff4e36=akadoc]

Hoping to see a team as U say，in this project！[/quote:1817ff4e36]

团队已经建立起来了。目前有两位成员，第三位会在七月份到位；）都有分布式文件系统的成功产品经验 :idea:

当然希望有更多的人参与到我们的工作中来 :em02: 和我们一起探索这方面的技术和相关的管理※工程经验。 :em02:

yftty 回复于：2005-05-22 20:59:56

[quote:b86bd17476=chifeng]不知道像我这样的菜鸟能否帮上忙?
做点具体的事情.....:)[/quote:b86bd17476]

呵呵，人因为工作而有相应的水平，而不是有了那个水平才去做那个事情。成长应该是一个人毕生的追求，所以我们总是在用已知的去探索未知的；）

我们一直在努力！ :em02:

sttty 回复于：2005-05-22 22:45:32

成功的人都是这样一步步走出来的。希望我在几年后，也延续这条路走下去。

yftty 回复于：2005-05-22 23:46:03

[quote:fe07ef93f7=tclwp]如果整和进新的开拓性技术，前途光明[/quote:fe07ef93f7]

像一个这样的或类似的项目,研发(新技术)的风险是相对来说比较小的,更大的是在工程方面.呵呵,通过作这件事情,我也渐渐明白了Google.com的两个创始人为什么一个负责技术,一个负责工程(当然我的理解可能有偏差).

在这样一个系统里，任何一个单独部分拿出来，都是比较简单的东西,并且从其它许多地方都能看到它的影子。但所有的东西整合到一起的时候，或我们通常说的形成一个系统的时候，技术的复杂性就上来了。特别是商业关键业务系统，其复杂性就更加明显。比如：一个大型的并发系统存在着非常多的Corner Cases, 优化的部分非常多从而难于把握具体的原因。而性能往往就是这个工程追求的唯一目标 :em03: 大家多支持多探讨 :)

whoto 回复于：2005-05-23 10:29:19

我不懂Google fs，我对yfttyFS（姑且这么叫）理解是：
在一个虚拟的yfttyFS根文件系统下，提供提供对多种存储设备、多种文件系统、多种操作系统提供的存储空间、多种协议、包括yfttyFS本身的连接（挂接）能力，形成一个统一的存储系统，提供存储服务。
望高手多指教。

yfttyFS/--yfttyFS/X1
|
--yfttyFS/X2
|
--yfttyFS/X...
|
-/Xdev/--HD
| |--SCSI
| |--CD
| |--DVD
| |--etc.
|
-/Xfs/--UFS
| |--UFS2
| |--Ext2
| |--NTFS
| |--ISO9660
| |--etc.
|
-/Xsys/--BSD(s)
| |--Linux(s)
| |--Windows(s)
| |--UNIX(s)
| |--etc.
|
-/Xprotocol/--TFTP
| |--FTP
| |--HTTP
| |--NFS
| |--etc.
|
--/etc.
|

WEB --|
MAIL --|
VOD/IPTV --|---base on--yfttyFS
Library --|
etc. --|

yftty 回复于：2005-05-23 11:28:33

hehe, I never think about and dare not to name it xxxFS as you said. As most ideas are stole from various resources, and there are members in our team much more intelligent than I. Here I disclose it just to want more insight into our project, as to benifit to the project and guys who contribute.

Yes, seems you really know what we want to do ;) Yes, the storage is a pool, and is always on-demand ! As the air around you.

And the tricky for my nickname:
Here I can see your masterpiece saying is cause now yf is before a tty ;)

Solaris12 回复于：2005-05-25 18:43:30

[quote:03acc5f034=yftty]

团队已经建立起来了。目前有两位成员，第三位会在七月份到位；）都有分布式文件系统的成功产品经验 :idea:

当然希望有更多的人参与到我们的工作中来 :em02: 和我们一起探索这方面的技术和相关的管理※工..........[/quote:03acc5f034]

怎么和你联系，对这个项目很感兴趣，
可以在技术和工程管理方面多多交流。

yftty 回复于：2005-05-27 00:24:38

[quote:066eb2232d=Solaris12]

怎么和你联系，对这个项目很感兴趣，
可以在技术和工程管理方面多多交流。[/quote:066eb2232d]

工程管理方面我们准备使用 PSP/TSPi and XP , 欢迎大家就这方面探讨 :em02:

另: 书都买了,还没来得及看 :em06:

javawinter 回复于：2005-05-27 01:15:51

Solaris12 回复于：2005-05-27 13:03:10

[quote:28316166f7=yftty]

工程管理方面我们准备使用 PSP/TSPi and XP , 欢迎大家就这方面探讨 :em02:[/quote:28316166f7]

恕本人无知，PSP/TSPi是什么？

XP是指极限编程吗？
根据我的理解，XP比较适合开发人员少，以客户需求为导向的项目。FS的产品不必要套用XP。

当然，在软件开发中确实有很多best practice，我们可以根据自己的实际情况作出相应的调整，找到效率和流程的平衡点：

1. 关于SCM：

要做好一个产品，必须制定关于SCM的一系列政策和标准，主要在一下几方面：

版本控制管理
变化跟踪管理

2.关于process

需要制定代码集成的一些标准。

开发：概念性文档-->开发-->code review->代码集成
测试：测试计划-->测试开发-->测试->测试报告

对于比较小和资源有限的开发团队，SCM和process不宜搞得复杂，尽量减少开发文档，强化配置管理和code review
测试方面，最好能找到开源的测试工具，但这就要求，FS的编程接口不能是专有的，应尽量符合某种标准

yftty 回复于：2005-05-27 13:48:07

(13:43:29) j-fox: 不管用什么管理模式，作好计划（各种计划，特别是风险应对计划）和状态监控是最主要的，先先开始拿一个小任务去尝试找到适用的方法

(13:45:45) j-fox: 先准备好开发文档
(13:46:04) yftty -- A dream makes a team, and the team builds the dream !: 好,我先把你的贴上

xuediao 回复于：2005-05-27 14:10:04

[quote:4a2325b636=Solaris12]
XP比较适合开发人员少，以客户需求为导向的项目。[/quote:4a2325b636]
如同Solaris12所说，XP是一个强调快速灵活，而PSP和TSPi是CMMi的一个延伸，强调计划和过程控制。

虽然说这是一个大型的工程项目，又以分布式开发为主，但同时实施这两个方法难度很大啊。

在这两个方法中取得平衡点，说不定即将开创一个新式的软件工程学，呵呵 :D

xuediao 回复于：2005-05-27 14:16:26

[quote:0f936c6c7e=yftty](13:43:29) j-fox: 不管用什么管理模式，作好计划（各种计划，特别是风险应对计划）和状态监控是最主要的，先先开始拿一个小任务去尝试找到适用的方法

(13:45:45) j-fox: 先准备好开发文档
(13:46:04) yftty -- ..........[/quote:0f936c6c7e]
我比较赞同j-fox的观点，开发状态监控和风险应对是最重要的，如果单纯公司内部开发可能实施TSP要容易得多，对于国内的分布式开发，这算是一个尝试和学习的过程吧。

mozilla121 回复于：2005-05-27 14:29:27

嚴格使用這套流程在執行上會比較難. 只有一個非常認同這種流程的團對才有可能執行下去.

yftty 回复于：2005-05-27 14:51:16

[quote:9f96c85f21=xuediao]
如同Solaris12所说，XP是一个强调快速灵活，而PSP和TSPi是CMMi的一个延伸，强调计划和过程控制。

虽然说这是一个大型的工程项目，又以分布式开发为主，但同时实施这两个方法难度很大啊。

在这两个方法中取得?..........[/quote:9f96c85f21]

是啊,西学为用,中学为体;)

现在仅是模仿一点点了,对这件事情本身的理解也在不断深化中; 用了XP的增量模式, 和TSP的监控和评估. 我现在也是边学边卖, 可能给整的有点不伦不类了吧, 但愿那可以被成为是创新;)

现在在把目前的用户空间的实现往FreeBSD的Kernel里面挪, 真是感激六祖惠能所创的禅宗里的顿悟.

yftty 回复于：2005-05-27 14:54:38

[quote:c51d41c4cb=mozilla121]嚴格使用這套流程在執行上會比較難. 只有一個非常認同這種流程的團對才有可能執行下去.[/quote:c51d41c4cb]

自知,自胜;知足,强行. -- <<道德经>>

xuediao 回复于：2005-05-27 14:54:46

呵呵，这也是中庸之道，抑或是新式的洋务运动吧

小平哥说得好，管他黑猫白猫，能逮老鼠就是好猫！

Solaris12 回复于：2005-05-28 21:03:45

[quote:6b9d40f3e2=xuediao]
如同Solaris12所说，XP是一个强调快速灵活，而PSP和TSPi是CMMi的一个延伸，强调计划和过程控制。

虽然说这是一个大型的工程项目，又以分布式开发为主，但同时实施这两个方法难度很大啊。

在这两个方法中取得?.........[/quote:6b9d40f3e2]

其实CMM这类东西非常适合外包公司做的。
我所在的开发团队，即不是XP，也不是CMM，但是却非常有效。
而且，你会在里面找到其他软件工程方法的影子，
所以，任何流程部重要，最重要的是和你拥有的资源匹配，
在我看来，很多国内软件公司最大的问题主要是以下几点：

1. SCM(软件配置管理)方面

没有称职的release engineer.
无法做到真正的版本管理
没有变化跟踪管理系统，无法捕捉系统的每一个变化
没有daily build，没有automatic 的 sanity test
和system test.

更重要的是，很多公司建立项目之初，就没有统一的
SCM的政策，比如code integreate criteria

2. 开发流程方面

没有民主权威机构来控制市场和软件体系结构的需求及功能改变
没有code review
没有automatic的regression test对应每一个daily build

不过任何软件工程和方法都是要占用额外资源的，
关键是每一个软件公司都能认识并且投入。

其实仔细看很多知名的开源项目的开发模式，
以上这些东西都能很好的满足，比如说：
你可以随时拿到它的daily build或者snapshot,
看到该build是否通过测试。还有bugtraq系统，
记录到了每一次的改动，包括bugfix,和新功能

yftty 回复于：2005-06-01 12:37:15

To Solaris12,

现在也是按照你所说的思路去一步步实施的,但还没有建立起来.

1.SCM, 现在仅仅是简单的Commit Rules (参照的是Lustre的流程).也是为了和现有的资源相匹配.

2. 开发流程, 现在仅有设计Rivew.其它的需要人员去建立.

另: 现在突然觉得有点丢掉了那曾经熟悉的东西.

james.liu 回复于：2005-06-01 13:42:18

看完这个帖子，第一印象不是这个项目或者牵涉的技术，而是yftty这个家伙
很能侃。

我不懂，但是我想看看，，，我该通过何种方式来旁观这个项目呢？

yftty 回复于：2005-06-01 14:05:20

[quote:9d7fb121e5=james.liu]看完这个帖子，第一印象不是这个项目或者牵涉的技术，而是yftty这个家伙
很能侃。

我不懂，但是我想看看，，，我该通过何种方式来旁观这个项目呢？[/quote:9d7fb121e5]

技术方面有明确的问题我还是回答的,比如前面关于分布式锁的(distributed lock, as dlm).

如何旁观或参与,这也是这个发贴的意图. 对于国内和国外的系统和内核开发来说,就我的感觉也没有太好的入手方式. Kernel-mentors mailing list 算是个这方面的尝试,并且显示了初步的效果.

当然我很抱歉我说的话令您或者其他人产生误解或其它意思. 但我相信每个人都希望给自己和他人以成长的机会.

同时我感觉一个人的做事方式和他的个人性格有很大的关系.没想清楚的事情,在风险可以承担的情况下,我会先把它丢出去再根据情况作随机. 就如踢足球,无法进攻的时候先把球传给对方前锋.

风暴一族回复于：2005-06-03 09:26:48

不错的说~

yftty 回复于：2005-06-07 09:41:22

here is the current sanity testing & results

[yf@yftty xxxfs]$ tests/xxxfs_sanity -v
000010:000001:1118108292.377965:4560:(socket.c:63:xxxfs_net_connect()) Process entered
config finished, ready to do the sanity testing !
xxxFS file creation testing succeeded !
xxxFS file read testing succeeded !
xxxFS file deletion testing succeeded !
xxxFS Sanity testing pid (4560) succeeded 1 !
[yf@yftty xxxfs]$

yftty 回复于：2005-06-07 11:38:57

项目到现在已快要过两个季度,经过这些时间的实践和思考

我的浅见是这个项目从流程来说上面的发贴所谈的已经比较完善了
从分工和组织来说,大家看下面的是否合适?

__________ __________
| 理论指导 | <-> | 开发指导 |
---------- ----------
| / |
| / |
------ ------ --------
| 研发 | <-> | 开发 | <-> | 测试 |
------ ------ --------

另:

这样还是有问题, 晕.

yftty 回复于：2005-06-08 09:30:30

Dan Stromberg wrote:
> The lecturer at the recent NG storage talk at Usenix in Anaheim,
> indicated that it was best to avoid active/active and get
> active/passive instead.
>
> Does anyone:
>
> 1) Know what these things mean?

In the clustering world, active/active means 2 or more servers are
active at a time, either operating on separate data (and thus acting as
passive failover partners to each other), or operating on the same data
(which requires the use of a cluster filesystem or other similar
mechanism to allow coherent simultaneous access to the data).

> 2) Know why active/passive might be preferred over active/active?

Well, if youre talking about active/passive vs. active/active with a
cluster filesystem or such, the active/passive is tons easier to
implement and get right. Plus, depending on your application, the added
complexity of a cluster filesystem might not actually buy you much more
than you could get with, say, NFS or Samba (CIFS).

--
Paul

yftty 回复于：2005-06-08 11:00:35

http://tech.blogchina.com/53/2005-06-07/372338.html

想了解Google的企业文化，需要从Google创立时的一个插曲开始：当谢尔盖·布林（Sergey Brin）和拉里·佩奇（Larry Page）想将自己的网络梦想付诸实际，最大的障碍是，他们并没有足够的资金来购买价格昂贵的设备。于是两人花费数百美元购买了一些个人电脑来代替那些数百万美元的服务器。

在实际应用中，这些普通电脑的故障率自然要高于专业服务器。他们需要确保任何一台普通电脑发生故障时都不会影响到用户正常得出搜索结果，于是Google 决定自己开发软件工具来解决这些问题。比如Google文件系统。这种文件系统不仅能够高效处理大型数据，还能够随时应付突然发生的存储故障。配合 Google的三重备份体制，这些个人电脑组成的系统就可以完成那些服务器的工作。

而这种遇到任何问题都全力解决之的理念，极大的影响了后来Google的文化。至今，Google依旧保持着网络公司的风貌。拥有2700名员工的公司总部里有900人是技术人员，而且在这里没有几间办公室。在施密特衣柜般的小办公室楼下，布林和佩奇共用一间办公室。而那里就像一间大学宿舍，里面摆着冰球装备、滑板和遥控飞机模型、懒人椅等等。

...

没有人质疑Google拥有魔幻般的技术和创新，但没有一家伟大的公司仅仅依靠出色的技术而成为世界级的公司。伟大的公司需要伟大的管理来帮助公司更上层楼。谁是Google的灵魂？当然是布林、佩奇再加上施密特组成的三人组。但谈到管理层面，49岁的施密特的确起到了至关重要的作用。

49岁的施密特曾经是Sun公司的CTO以及Novell公司的CEO，他至今仍清晰记得刚到这家公司时董事会对他的交待：“别把公司弄糟了，艾利克。公司的起点非常非常好，可别进行太大的改革。”他完全理解投资者的担心，他们不想这家创造力十足的公司变得僵化死板。

1999年施密特刚到这家公司的时候这里根本谈不上有什么管理，但他也不想照搬传统大公司那一套管理方法，他希望根据实际情况形成Google自己的管理模式。大多数情况下施密特和2位创始人一起行动，作出决策。通常情况下是施密特主持管理层会议，而2位创始人主持员工会议。当遇到重大问题需要解决的时候，Google3人组就会根据少数服从多数的基本规则作出决定。并且许多决定他们是当着员工的面得出结果的。公司管理层刻意保持企业文化中率直、自由的工程师文化，他们认为这是他们抗衡Yahoo和微软这样大规模公司的有力武器。

哈佛商学院教授大卫·友菲（David Yoffie）却并不看好这种管理模式：“如果很多人同时作决定，那等于没有决定任何事情。在Google每天会同时作出成千上万的计划，需要有一个人作出最终决断。”

施密特表示实际上他所扮演的角色更倾向于COO。他以雅虎和eBay举例来说，在这些公司里都是创始人来制定远景战略，尽管他们并不拥有首席执行官的头衔。但施密特的支持者认为，这名CEO的个人风格掩盖了他在公司中的实际地位。而曾经担任CEO的佩奇如今担任产品总裁。前董事长布林则担任技术总裁。而施密特则在过去的4年中为Google搭建了完善的架构。

布林和佩奇的管理哲学完全源于他们当初所在的斯坦福大学计算机科学实验室。Google的经理很少要求那些工程师去完成什么项目，取而代之的则是公司会宣布一个100项优先完成项目列表，工程师们根据自己的喜好参加不同的流动工作组，以周或者月为时间单位完成工作。

liuzhentaosoft 回复于：2005-06-10 23:49:57

openMosix：
5.1 What Is openMosix?
Basically, the openMosix software includes both a set of kernel patches and support tools. The patches extend the kernel to provide support for moving processes among machines in the cluster. Typically, process migration is totally transparent to the user. However, by using the tools provided with openMosix, as well as third-party tools, you can control the migration of processes among machines.

Lets look at how openMosix might be used to speed up a set of computationally expensive tasks. Suppose, for example, you have a dozen files to compress using a CPU-intensive program on a machine that isnt part of an openMosix cluster. You could compress each file one at a time, waiting for one to finish before starting the next. Or you could run all the compressions simultaneously by starting each compression in a separate window or by running each compression in the background (ending each command line with an &). Of course, either way will take about the same amount of time and will load down your computer while the programs are running.

However, if your computer is part of an openMosix cluster, heres what will happen: First, you will start all of the processes running on your computer. With an openMosix cluster, after a few seconds, processes will start to migrate from your heavily loaded computer to other idle or less loaded computers in the clusters. (As explained later, because some jobs may finish quickly, it can be counterproductive to migrate too quickly.) If you have a dozen idle machines in the cluster, each compression should run on a different machine. Your machine will have only one compression running on it (along with a little added overhead) so you still may be able to use it. And the dozen compressions will take only a little longer than it would normally take to do a single compression.

If you dont have a dozen computers, or some of your computers are slower than others, or some are otherwise loaded, openMosix will move the jobs around as best it can to balance the load. Once the cluster is set up, this is all done transparently by the system. Normally, you just start your jobs. openMosix does the rest. On the other hand, if you want to control the migration of jobs from one computer to the next, openMosix supplies you with the tools to do just that.

OSCAR：

Setting up a cluster can involve the installation and configuration of a lot of software as well as reconfiguration of the system and previously installed software. OSCAR (Open Source Cluster Application Resources) is a software package that is designed to simplify cluster installation. A collection of open source cluster software, OSCAR includes everything that you are likely to need for a dedicated, high-performance cluster. OSCAR takes you completely through the installation of your cluster. If you download, install, and run OSCAR, you will have a completely functioning cluster when you are done.

The design goals for OSCAR include using the best-of-class software, eliminating the downloading, installation, and configuration of individual components, and moving toward the standardization of clusters. OSCAR, it is said, reduces the need for expertise in setting up a cluster. In practice, it might be more fitting to say that OSCAR delays the need for expertise and allows you to create a fully functional cluster before mastering all the skills you will eventually need. In the long run, you will want to master those packages in OSCAR that you come to rely on. OSCAR makes it very easy to experiment with packages and dramatically lowers the barrier to getting started.

OSCAR was created and is maintained by the Open Cluster Group (http://www.openclustergroup.org), an informal group dedicated to simplifying the installation and use of clusters and broadening their use. Over the years, a number of organizations and companies have supported the Open Cluster Group, including Dell, IBM, Intel, NCSA, and ORNL, to mention only a few.

Because OSCAR is an extensive collection of software, it is beyond the scope of this book to cover every package in detail. Most of the software in OSCAR is available as standalone versions, and many of the key packages included by OSCAR are described in later chapters in this book. Consequently, this chapter focuses on setting up OSCAR and on software unique to OSCAR. By the time you have finished this chapter, you should be able to judge whether OSCAR is appropriate for your needs and know how to get started.

Rocks：
NPACI Rocks is a collection of open source software for building a high-performance cluster. The primary design goal for Rocks is to make cluster installation as easy as possible. Unquestionably, they have gone a long way toward meeting this goal. To accomplish this, the default installation

你可能感兴趣的:(网络,unix,Google,Solaris,存储,FreeBSD)

Charles中文版抓包工具：优化API调试与提升网络性能的利器
随着软件开发不断复杂化，特别是Web和移动应用的增加，开发者在进行API调试和网络优化时需要依赖高效且精准的工具。Charles作为一款知名的网络调试工具，帮助开发者捕获和分析HTTP/HTTPS流量、优化API性能并提升开发效率。通过强大的功能，Charles不仅能解锁API调试的精细化需求，还能帮助开发者模拟网络环境，优化应用性能，提升整体开发效率。本文将详细探讨如何通过Charles中文版抓
数据结构大项目 2301_147258369 数据结构
项目：基于链表的通信录管理意义：对于一个通信录来说，要管理联系人的信息，包括编号，姓名，性别，电话。开发其系统主要为了帮助用户提高通讯录有管理效率，节约资源，提高信息的精确度模块：一级菜单内容1>注册模块:完成用户信息的注册用于登录管理系统，将注册信息存入结构体数组2>登录模块：使用输入的登录账号和密码与结构体数组存储信息对比3>退出系统二级菜单内容:1>创建模块create：创建链表完成对通信录
破译AI黑箱：如何用20行Python理解ChatGPT？ Ven% 简单入门pytorch 人工智能 python chatgpt
文章目录一、核心概念：大模型本质二、代码逐行解析（以线性回归为例）三、关键概念详解四、与大模型的本质联系五、大模型训练核心思想六、如何扩展成真实大模型七、总结：AI训练的本质一、核心概念：大模型本质大模型=复杂数学函数+数据驱动训练现实任务（如图像识别、语言翻译）过于复杂，人类无法直接编写数学函数解决。解决方案：构建参数化的数学模型（如神经网络）用大量数据训练，自动寻找最优参数得到能解决特定任务的
HarmonyOS应用开发：掌握HTTP网络访问与封装技巧
引言在HarmonyOS（鸿蒙操作系统）应用开发中，网络访问是一个至关重要的环节。HTTP协议作为网络通信的基石，对于实现应用的数据交换和服务请求起着核心作用。本文将详细探讨在HarmonyOS应用开发中如何进行HTTP网络访问，包括基本的HTTP请求和响应处理，以及如何对这些操作进行封装，以提高代码的可重用性和可维护性。HarmonyOS中的HTTP网络访问使用HttpURLConnection
SQL函数和存储过程的区别 _深巷的猫 sql
本质上没区别。只是函数有如：只能返回一个变量的限制。而存储过程可以返回多个。而函数是可以嵌入在sql中使用的,可以在select中调用，而存储过程不行。执行的本质都一样。函数限制比较多，比如不能用临时表，只能用表变量.还有一些函数都不可用等等.而存储过程的限制相对就比较少1.一般来说，存储过程实现的功能要复杂一点，而函数的实现的功能针对性比较强。2.对于存储过程来说可以返回参数，而函数只能返回值或
粗略地看一下 glTF 2.0 的所有标准属性（顺便说一下，还有 .glb 的结构）在下胡三汉 3d
编码在glTF中，场景和各种对象的定义一般用JSON来描述，而顶点数据等所谓的“缓冲区”部分则以二进制形式存储。对于这些内容的最终编码方式，有多种选择。.gltf（JSON）+.bin（二进制缓冲区）（+图像文件）如何分离JSON和二进制部分。二进制部分可以分为多个部分。纹理可以位于单独的图像文件中，也可以位于二进制缓冲区中。二进制部分也可以合并为.gltf（JSON）您可以使用DataURI方案
数据仓库实时计算_如果您的云数据仓库没有分开存储和计算，为什么您会浪费金钱... weixin_26631359 python java 大数据算法 leetcode
数据仓库实时计算Notsolongago,establishinganenterprisedatawarehouseinvolvedaprojectthatwouldtakemonthsorevenyears.Thesedays,withcloudcomputing,youcaneasilyregisterforaSaaSorPaaSofferingprovidedbyoneofthecloudv
linux下的分布式Minio部署实践
Linux下的分布式Minio部署实践分布式Minio部署可以将多块硬盘（位于相同机器或者不同机器）组成一个对象存储服务，避免单机环境下硬盘容量不足、单点故障等问题。1.简介在当前的云计算和大数据时代，IT系统通常的设计理念都是无中心和分布式。Minio分布式模式可以帮助搭建一个高可靠、高可用、弹性扩展的对象存储服务。分布式部署，minio拓扑为Multi-NodeMulti-Drive(MNMD
为何YashanDB数据库是现代企业数字化转型的选择数据库
在企业数字化转型的过程中，选择合适的数据库技术是一个重大决策。当前常见的问题是，如何在海量数据环境下实现高效的数据存储与访问、如何保证数据安全性以及如何快速响应业务变更需求？这些问题直接影响企业的运营效率和决策能力，因此选择一款优秀的数据库是企业转型成功的关键。本文将探讨YashanDB数据库的技术优势及其为何成为现代企业数字化转型的不二选择。体系架构的灵活性与可扩展性YashanDB数据库支持多
云上配送革命：亚矩云手机如何重塑Uber Eats的全球外卖生态云云321 智能手机重构 web3 android 矩阵
当UberEats在东京涩谷的暴雨中因配送延迟被用户差评，当巴西圣保罗的贫民窟因网络信号差导致订单流失，当欧洲司机因高昂的燃油成本抗议平台抽成——全球外卖行业的增长瓶颈，正卡在“物理世界”与“数字世界”的断层带上。而亚矩云手机以“云端算力+AI调度+边缘网络”的技术组合，正在为UberEats构建一张覆盖6000多个城市的“云端配送神经网络”，重新定义外卖行业的效率、成本与用户体验边界。一、动态定
【实时Linux实战系列】实时以太网与 TSN 基础
在实时系统中，网络通信的实时性和可靠性是确保系统正常运行的关键。实时以太网和时间敏感网络（TSN）技术为实时数据传输提供了强大的支持。TSN通过一系列协议和机制，确保数据能够在预定的时间内可靠传输，满足工业自动化、汽车网络和音视频传输等领域对实时性的严格要求。本文将介绍实时以太网与TSN的基础知识，包括PREEMPT_RT下的配置流程，以及如何实现精准报文收发。核心概念实时网络通信需求实时网络通信
Java——JWT详细讲解
引言在当代Web应用与API开发里，用户认证和授权无疑是极为关键的环节。JSONWebToken（JWT）作为一种轻量级的身份验证机制，凭借其简洁性、可扩展性以及跨域支持等显著优势，在众多前后端分离项目中得到了广泛应用。本文将全面深入地探讨JWT的原理、工作流程，并且结合Java代码示例，展示如何在一个简单的登录系统中运用JWT进行认证。一、JWT概述1.什么是JWTJWT是一种用于在网络应用间安
组件化基本原理，怎么实现消息传递
组件化的核心在于解耦与通信，其基本原理和消息传递实现方案如下：一、组件化核心架构消息传递消息传递依赖依赖路由控制业务模块A通信中枢业务模块B基础组件服务发现二、组件化基本原理1.垂直拆分App用户模块订单模块支付模块商品模块公共库网络库存储库工具库2.分层架构层级组件类型示例依赖关系应用层App壳工程MainApp依赖业务层业务层垂直业务组件UserModule/OrderModule依赖基础层基
《推客小程序定制开发核心技术全解析！！！》 vx:hedian166 小程序
一、系统架构设计原则1.1模块化设计理念推客小程序应采用松耦合架构，核心模块包括：用户关系模块：处理分销员上下级关系订单追踪模块：记录推广路径与订单关联佣金计算模块：实时/定时计算各层级佣金数据统计模块：多维度的业绩分析展示1.2技术选型建议二、核心功能实现细节2.1分销关系存储方案闭包表实现方案CREATETABLE`distributor_closure`(`ancestor`bigintNO
微信小店分销系统深度解析：功能、架构与开发实践！ vx:hedian166 微信架构小程序
一、微信小店分销系统概述微信小店分销系统是基于微信生态构建的一套完整电商解决方案，它允许商家在微信内快速搭建自己的分销网络。与传统的电商平台不同，微信分销系统充分利用了微信的社交属性，通过多级分销模式实现商品的快速传播和销售。核心特点：社交裂变属性：利用微信好友关系链实现商品传播轻量化运营：无需复杂配置即可快速上线闭环交易：从浏览到支付全流程在微信内完成数据分析：提供完整的用户行为和交易数据追踪二
2025 年使用 Python 和 Go 解决 Cloudflare 问题 ForRunner123 python golang 开发语言
作为一名从事网络自动化和爬取工作的开发者，我亲眼目睹了日益复杂的安全性措施带来的挑战。其中一项挑战是Cloudflare的TurnstileCAPTCHA系统，目前该系统已在全球2600多万个网站上使用。这种先进的解决方案重新定义了我们对机器人检测的处理方式，它具有出色的能力，可以过滤掉80%的恶意流量，同时允许真实用户无需繁琐的谜题即可浏览网站。在2025年，我发现掌握使用Python和Go等编
Git代理灵活切换及自动化脚本工具新人新人新 git 自动化运维
Git代理配置完全指南：全局与项目级别的灵活切换在使用Git进行代码管理时，网络代理的配置往往是开发者需要面对的问题。特别是在需要访问GitHub等国外代码托管平台时，合理的代理配置能够显著提升工作效率。本文将为您详细介绍Git代理的配置方法，包括全局配置、项目级别配置，以及便捷的脚本工具。全局代理配置全局代理配置会影响您系统中所有的Git项目。这种配置方式适合大部分时间都需要使用代理的场景。设置
APP上架篇一：上架资质要求李小白杂货铺斜杠人生 App上架 App发布 App分发资质要求费用详情
文章目录系列文章AppleStore商店上架App官方文档资质要求费用详情GooglePlay商店上架App官方文档资质要求费用详情华为应用商店上架App官方文档资质要求费用详情小米应用商店上架App官方文档资质要求费用详情OPPO应用商店上架App官方文档资质要求费用详情vivo应用商店上架App官方文档资质要求费用详情应用宝上架App官方文档资质要求费用详情百度手机助手上架App官方文档资质要
ffmpeg 视频编码流程及主要API melonbo FFMPEG ffmpeg 音视频
一、编码流程初始化组件配置编码器参数打开编码器处理输入帧编码循环写入输出数据收尾释放资源二、核心步骤与API详解1.初始化与参数配置注册组件（旧版本需手动注册，新版本自动处理）avformat_network_init();//网络相关初始化（可选）查找编码器AVCodec*codec=avcodec_find_encoder(AV_CODEC_ID_H264);//支持H.264/HEVC等创建
【SNN脉冲神经网络2】AdEx神经网络软件仿真 XvnNing SNN脉冲神经网络神经网络人工智能深度学习
本文使用AdEx神经元搭建一个完整的神经网络来进行生物神经脉冲现象的仿真。主要的目的是为了验证数学原理，因此只调用的numpy函数包。对应的代码例程如下：1.导入所需的Python函数库importnumpyasnpimportmatplotlib.pyplotaspltimportreimportos2.定义均值函数以及一些常用函数defbin_data(data):try:returnnp.m
Qwen3 Embedding 结构-加载-训练看透模型设计哲学
看透一个顶级AI句向量模型的设计秘密，从文件结构到加载原理，再到其背后的训练哲学。1Qwen3-Embedding模型结构拆解说明：目录包含了运行一个基于Transformer的句向量模型所需的所有组件文件类别核心文件作用核心模型model.safetensors,config.jsonmodel.safetensors存储了模型所有训练好的权重分词器tokenizer.json,vocab.js
Linux——K8S的pod的调度 Xinan_____ K8S Linux kubernetes linux 容器
DeploymentStatefulSetDaemonsetreplicaSetReplicacontroller//从K8S的近期版本中将逐渐移除rcJobcronjobK8s网络：平台中的POD如何通信：CNI容器网络插件Coredns的组件负责提供平台中的名称解析平台中的应用如何被客户端访问Service//将部署的应用暴露给一个统一的入口ClusterIP//平台内部IP地址NodePor
TryHackMe-进攻性渗透测试-02_Alfred
Alfred在这个房间里，我们将学习如何利用广泛使用的自动化服务器上的常见错误配置（Jenkins-此工具用于创建持续集成/持续开发管道，允许开发人员在更改代码后自动部署其代码）。之后，我们将使用一种有趣的权限提升方法来获得完整的系统访问权限。由于这是一个Windows应用程序，我们将使用Nishinang来获得初始访问权限。存储库包含一组有用的脚本，用于初始访问、枚举和权限提升。在本例中，我们将
jenkins集成sonarqube(使用token进行远程调用) 被一米六支配的恐惧 jenkins 运维
先决条件sonarqube-version10.0.0jenkins-version2.486k8s-version1.23.14OS-versioncentos7.9jenkins上部署sonarqube插件sonarqubescanner部署sonarqube创建存储--前面有创建storageclass的文档.k8s-StoargClass的使用-基于nfs_avolumethatconta
使用 Docker Swarm 部署高可用集群指南思静鱼虚拟化技术docker和k8s docker 容器运维
DockerSwarm是Docker原生的集群管理工具，可以轻松地将多个Docker主机组成一个集群，实现服务的高可用性和负载均衡。以下是详细的部署步骤：一、环境准备1.服务器要求至少3台Linux服务器（建议CentOS/Ubuntu）每台服务器已安装DockerEngine（版本19.03+）服务器之间网络互通开放的端口：2377（集群管理）、7946（节点通信）、4789（覆盖网络）2.设置
Docker 网络模式
Docker的网络模式有以下几种，每种模式对应不同的通信能力、隔离性和使用场景。这是你构建服务之间通信（比如Tomcat↔Kafka↔Redis）时必须理解的基础。一览表：Docker网络模式对比模式是否隔离是否可用容器名通信是否共享宿主机端口使用场景举例bridge（默认）✅是✅支持❌否单机部署，容器通信host❌否❌不支持✅是高性能服务，绑定宿主机网络container:❌否✅共享网络命名空间
为什么选择YashanDB作为您的数据存储解决方案？数据库
在现代数据库管理中，如何在保持快速查询响应并确保数据一致性的基础上，有效管理海量数据，成为许多企业面临的挑战。优化查询性能、加速数据处理流程、确保高可用性和数据安全是数据库技术的关键需求。YashanDB作为一种新兴的数据库解决方案，以其灵活的架构和强大的性能优化能力，逐渐被视为满足这一需求的理想选择。领先的体系架构YashanDB的体系架构灵活且高效，支持单机部署、共享集群部署以及分布式集群部署
为什么YashanDB数据库是数据驱动企业的选择？数据库
在数据驱动的企业环境中，数据库作为信息管理的核心组件，其性能和特性直接影响企业的数据处理效率和应用响应速度。因此，选择合适的数据库技术，对于实现高效的数据存储与处理至关重要。特别是如何优化查询速度、确保数据的一致性和高可用性，是企业决策的重要考量。本文将详细分析YashanDB数据库的技术特点及其优势，帮助企业理解选择YashanDB的原因。YashanDB的体系架构与部署形态YashanDB支持
企业如何使用YashanDB实现数据资产最大化？数据库
在当今数字化时代，企业面临着海量数据的管理与利用挑战，如何优化数据查询速度以提升业务响应效率成为关键问题。查询速度直接影响数据驱动决策的时效性和准确性，进而关系到企业竞争力的提升。本文将基于先进数据库技术，探讨企业如何利用YashanDB的核心架构、存储引擎与优化机制，最大化数据资产的价值。YashanDB的部署架构与灵活应用YashanDB支持三种部署形态：单机部署、分布式集群部署及共享集群部署
学习java基础：java开发常用技术 molihuaya 学习java java开发技术
基础部分1.线程和进程的区别线程三个基本状态：就绪、执行、阻塞线程五个基本操作：创建、就绪、运行、阻塞、终止进程四种形式：主从式、会话式、消息或邮箱机制、共享存储区方式进程是具有一定功能的程序关于某次数据集合上的一次运行活动，是系统进行资源分配和调度的一个独立单位。一个进程包含多个线程。线程是进程的一个实体，是CPU调度和分配的基本单元。2.JSP四大域对象和九大内置对象四大域对象：PageCon
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源