djsl6071

什么是web2.0

转自：http://baike.baidu.com/view/733.html?wtp=tt

2001年秋天互联网公司（dot-com)泡沫的破灭标志着互联网的一个转折点。许多人断定互联网被过分炒作，事实上网络泡沫和相继而来的股市大衰退看起来像是所有技术革命的共同特征。股市大衰退通常标志着蒸蒸日上的技术已经开始占领中央舞台。假冒者被驱逐，而真正成功的故事展示了它们的力量，同时人们开始理解了是什么将一个故事同另外一个区分开来。

　　“Web 2.0”的概念开始于一个会议中，展开于O'Reilly公司和MediaLive国际公司之间的头脑风暴部分。所谓互联网先驱和O'Reilly公司副总裁的戴尔·多尔蒂(Dale Dougherty)注意到，同所谓的“崩溃”迥然不同，互联网比其他任何时候都更重要，令人激动的新应用程序和网站正在以令人惊讶的规律性涌现出来。更重要的是，那些幸免于当初网络泡沫的公司，看起来有一些共同之处。那么会不会是互联网公司那场泡沫的破灭标志了互联网的一种转折，以至于呼吁“Web 2.0”的行动有了意义？我们都认同这种观点，Web 2.0会议由此诞生。

　　在那个会议之后的一年半的时间里，“Web 2.0”一词已经深入人心，从Google上可以搜索到950万以上的链接。但是，至今关于Web 2.0的含义仍存在极大的分歧，一些人将Web 2.0贬低为毫无疑义的一个行销炒作口号，而其他一些人则将之理解为一种新的传统理念。

　　在我们当初的头脑风暴中，我们已经用一些例子，公式化地表达了我们对Web 2.0的理解：

　　Web 1.0 Web 2.0

　　DoubleClick Google AdSense

　　Ofoto Flickr

　　Akamai BitTorrent

　　mp3.com Napster

　　大英百科全书在线（Britannica Online）维基百科全书（Wikipedia）

　　个人网站博客(blogging)

　　evite upcoming.org和EVDB

　　域名投机搜索引擎优化

　　页面浏览数每次点击成本

　　屏幕抓取（screen scraping）网络服务（web services）

　　发布参与

　　内容管理系统维基

　　目录（分类) 标签（“分众分类”，folksonomy）

　　粘性聚合

　　这个列表还会不断继续下去。但是到底是什么，使得我们认定一个应用程序或一种方式为作所谓“Web 1.0”，而把另外一个叫做“Web 2.0”呢？（这个问题尤为紧迫，因为Web 2.0的观念已经传播的如此广泛，以至于很多公司正在将这个词加到他们的行销炒作中，但却没有真正理解其含义。同时这个问题也尤为困难，因为许多嗜好口号的创业公司显然不是Web 2.0，而一些我们认为是Web 2.0的应用程序，例如Napster和BitTorrent，甚至不是真正适当的网络程序！）

　　然而，抛开纷繁芜杂的Web 2.0现象，进而将其放到科技发展与社会变革的大视野下来看，Web 2.0可以说是信息技术发展引发网络革命所带来的面向未来、以人为本的创新2.0模式在互联网领域的典型体现，是由专业人员织网到所有用户参与织网的创新民主化进程的生动注释。

Web 2.0七大原则

　　我们首先来探讨一些原则，这些原则是通过Web 1.0的一些成功案例，以及一些最为有趣的新型应用程序来体现的。

　　1. 互联网作为平台

　　正如许多重要的理念一样，Web 2.0没有一个明确的界限，而是一个重力核心。不妨将Web 2.0视作一组原则和实践，由此来把距离核心或远或近的网站组成为一个类似太阳系的网络系统，这些网站或多或少地体现着Web 2.0的原则。

　　图1为Web 2.0的“模拟图”，该图是在名为“O'Reilly的朋友”（Friend Of O’reilly, FOO）的会议的一个研讨会上产生的。这个图基本上仍处于演化阶段，但已经描绘出了从Web 2.0核心理念中衍生出的许多概念。

　　例如，在2004年10月的第一次Web 2.0的会议上，约翰·巴特利（John Battelle）和我在我们各自的开场白中列举了一组初步的原则。

　　这些原则中的第一条就是“互联网作为平台”。这也曾是Web 1.0的宠儿网景公司（Netscape)的战斗口号，而网景在同微软的大战中陨落了。此外，我们早先的Web 1.0的楷模中的两个，DoubleClick和Akamai公司，皆是将网络当作平台的先驱。人们往往不认为这是一种网络服务，但事实上，广告服务是第一个被广泛应用的网络服务，同时也是第一个被广泛应用的混合处理（mashup），如果用另一个近来流行的词来说的话。每个旗帜广告（banner ad)都是用来在两个网站之前无缝合作，向位于另外一台计算机上的读者传递一个整合好的页面。

　　Akamai也将网络看作平台，并且在一个更深入的层次上，来搭建一个透明的缓存和内容分发网络，以便降低宽带的拥塞程度。

　　虽然如此，这些先驱提供了有益的对比，因为后来者遇到同样问题的时候，可以将先驱们的解决方案进一步延伸，从而对新平台本质的理解也更为深刻了。DoubleClick和Akamai都是Web 2.0的先驱，同时我们也可以看到，可以通过引入更多Web 2.0的设计模式，来实现更多的应用。

　　让我们对这三个案例中的每一个都作一番深究，来探讨其间的一些本质性的差别。

　　Netscape 对 Google

　　如果Netscape可以称为Web 1.0的旗手，那么Google几乎可以肯定是Web 2.0的旗手，只要看看他们的首次公开上市（IPO)是如何地揭示了各自的时代就清楚了。所以我们就从这两个公司和其定位的差别入手。

　　Netscape以传统的软件摹本来勾勒其所谓“互联网作为平台”：他们的旗舰产品是互联网浏览器，一个桌面应用程序。同时，他们的战略是利用他们在浏览器市场的统治地位，来为其昂贵的服务器产品建立起市场。从理论上讲，在浏览器中控制显示内容和程序的标准，赋予了Netscape一种市场支配力，如同微软公司在个人计算机市场上所享受的一样。很像当初“自行的马车”（horseless carriage）将汽车描绘为一种熟知事物的延伸，Netscape曾推销一种网络桌面（webtop）来替代传统的桌面（desktop），并且计划借助信息更新，以及由购买了Netscape服务器的信息提供者来推送的各种小程序，来开发推广这种网络桌面。

　　最终，浏览器和网络服务器都变成了“日用品”，同时价值链条也向上移动到了在互联网平台上传递的服务。

　　作为对比，Google则以天生的网络应用程序的角色问世，它从不出售或者打包其程序，而是以服务的方式来传递。客户们直接或间接地为其所使用的服务向Google付费。原有软件工业缺陷荡然无存。没有了定期的软件发布，只需要持续的改善。没有了许可证或销售，只需要使用。没有了为了让用户在其设备上运行软件而不得不进行的平台迁移，只需要搭建宏大的、由众多个人计算机组成的、可伸缩的网络，其上运行开源操作系统，及其及自行研制的应用程序和工具，而公司之外的任何人则永远无法接触到这些东西。

　　在其底层，Google需要一种Netscape从未需要过的能力：数据库管理。Google远远不只是一个软件工具的集合，它是一个专业化的数据库。没有这些数据，那些工具将毫无用武之地；没有这些软件，数据也将无可控制。软件许可证制度和对应用程序接口（API）的控制——上一个时代的法宝——已经毫不相关了，因为Google的软件只需要执行而从不需要分发，也因为如果不具备收集和管理数据的能力，软件本身就没有什么用处了。事实上，软件的价值是同它所协助管理的数据的规模和活性成正比的。

　　Google的服务不是一个简单的服务器，虽然其服务是通过大规模的互联网服务器集合来传递的；其服务也不是一个浏览器，虽然这种服务是被用户在浏览器中体验到的。Google的旗舰产品——搜索服务，甚至不托管它让用户来搜寻的内容。很像一个电话通话过程，不仅发生在通话的两端，而且发生在中间的网络上。作为用户和其在线体验的一个中介，Google作用于浏览器、搜索引擎和最终的内容服务器之间的空间中。

　　虽然Netscape和Google都可以被描述为软件公司，但显然Netscape可以归到Lotus，Microsoft，Oracle，SAP，以及其他发源于上个世纪八十年代软件革命的那些公司所组成的软件世界。而Google的同伴们，则是像eBay，Amazon，Napster，及至DoubleClick和Akamai这样的互联网公司。

　　DoubleClick对Overture和AdSense

　　同Google类似，DoubleClick是一个名副其实的互联网时代的孩子。它把软件作为一种服务，在数据管理方面具有核心竞争力，并且正如上文所述，它是一个早在连网络服务的名字还不曾有的时候，就已然开始其服务的先驱。然而，DoubleClick最终还是被其商业模式局限住了。它所贯彻的是九十年代的互联网观念。这种观念围绕着出版，而不是参与；围绕着广告客户，而不是消费者，来进行操纵；围绕着规模，认为互联网会被如MediaMetrix等网络广告评测公司尺度下的所谓顶级网站所统治。

　　结果是，DoubleClick得意地在其网站上引用道：“超过2000种的成功应用”。而相对比的是，Yahoo!公司的搜索市场（从前的Overture）和Google的AdSense产品，已经在为几十万的广告客户服务。

　　Overture和Google的成功源自于对克里斯·安德森（Chris Anderson）提到的所谓“长尾”的领悟，即众多小网站集体的力量提供了互联网的大多数内容。DoubleClick的产品要求一种签订正式的销售合同，并将其市场局限于很少的几千个大型网站。Overture和Google则领会到如何将广告放置到几乎所有网页上。更进一步地，它们回避了发行商和广告代理们所喜爱的广告形式，例如旗帜广告和弹出式广告，而采用了干扰最小的、上下文敏感的、对用户友好的文字广告形式。

　　Web 2.0的经验是：有效利用消费者的自助服务和算法上的数据管理，以便能够将触角延伸至整个互联网，延伸至各个边缘而不仅仅是中心，延伸至长尾而不仅仅是头部。

　　毫不奇怪，其他Web 2.0的成功故事也显示着同样的轨迹。eBay扮演着一个自动的中间媒介的角色，使个体之间发生的几个美元的偶然性的交易成为可能。Napster（虽然已经出于法律原因而关闭）将其网络建立在一个集中的歌曲数据库之上，但是它让每一个下载者都成为一台服务器，从而使其网络逐渐扩大。

　　Akamai 对 BitTorrent

　　同DoubleClick类似，Akamai的业务重点面向网络的头部，而不是尾部；面向中心，而不是边缘。虽然它服务于那些处于网络边缘的个体的利益，为他们访问位于互联网中心的高需求的网站铺平了道路，但它的收入仍然来自从那些位于中心的网站。

　　BitTorrent，像P2P风潮中的其他倡导者一样，采用了一种激进的方式来达到互联网去中心化（internet decentralization）的目的。每个客户端同时也是一个服务器；文件被分割成许多片段，从而可以由网络上的多个地方提供，透明地利用了网络的下载者来为其他下载者提供带宽和数据。事实上，文件越流行下载得越快，因为有更多的用户在为这个文件提供带宽和各个片段。

　　BitTorrent由此显示出Web 2.0的一个关键原则：用户越多，服务越好。一边是Akamai必须增加服务器来改善服务，另一边是BitTorrent用户将各自的资源贡献给大家。可以说，有一种隐性的“参与体系”内置在合作准则中。在这种参与体系中，服务主要扮演着一个智能代理的作用，将网络上的各个边缘连接起来，同时充分利用了用户自身的力量。

　　2. 利用集体智慧

　　在诞生于Web 1.0时代并且存活了下来，而且要继续领导Web 2.0时代的那些巨人的成功故事的背后，有一个核心原则，就是他们借助了网络的力量来利用集体智慧：

　　--超级链接是互联网的基础。当用户添加新的内容和新的网站的时候，将被限定在一种特定的网络结构中，这种网络结构是由其他用户发现内容并建立链接的。如同大脑中的神经突触，随着彼此的联系通过复制和强化变得越来越强，而作为所有网络用户的所有活动的直接结果，互联的网络将有机地成长。

　　--Yahoo!是第首例伟大的成功故事，诞生于一个分类目录，或者说是链接目录，一个对数万甚至数百万网络用户的最精彩作品的汇总。虽然后来Yahoo!进入了创建五花八门的内容的业务，但其作为一个门户来收集网络用户们集体作品的角色，依然是其价值核心。

　　--Google在搜索方面的突破在于PageRank技术，该技术令其迅速成为搜索市场上毫无争议的领导者。PageRank是一种利用了网络的链接结构，而不是仅仅是使用文档的属性，来实现更好的搜索效果的方法。

　　--eBay的产品是其全部用户的集体活动，就向网络自身一样，eBay随着用户的活动而有机地成长，而且该公司的角色是作为一个特定环境的促成者，而用户的行动就发生在这种环境之中。更重要的是，eBay的竞争优势几乎都来自于关键性的大量的买家和卖家双方，而这正是这一点使得后面许多竞争者的产品的吸引力显著减低。

　　--Amazon销售同Barnesandnoble.com等竞争者相同的产品，同时这些公司从卖方获得的是同样的产品描述、封面图片和目录。所不同的是，Amazon已然缔造出了一门关于激发用户参与的科学。Amazon拥有比其竞争者高出一个数量级以上的用户评价，以及更多的邀请来让用户以五花八门的方式，在近乎所有的页面上进行参与，而更为重要的是，他们利用用户的活动来产生更好的搜索结果。Barnesandnoble.com的搜索结果很可能指向该公司自己的产品，或者是赞助商的结果，而Amazon则始终以所谓“最流行的”打头，这是一种实时计算，不仅基于销售，而且基于其他一些被Amazon内部人士称为围绕着产品“流动”（flow）的因素。由于拥有高出对手一个数量级的用户参与，Amazon销售额超出竞争对手也就不足为奇了。

　　现在，具备了这种洞察力，并且可能会将之延伸开来的那些创新型的公司，正在互联网上留下他们的印迹。

　　维基百科全书（Wikipedia）是一种在线百科全书，其实现基于一种看似不可能的观念。该观念认为一个条目可以被任何互联网用户所添加，同时可以被其他任何人编辑。无疑，这是对信任的一种极端的实验，将埃里克·雷蒙德（Eric Raymond）的格言（源自开放源码软件的背景之下）：“有足够的眼球，所有的程序缺陷都是肤浅的”（with enough eyeballs, all bugs are shallow）运用到了内容的创建之中。维基百科全书已然高居世界网站百强之列，并且许多人认为它不久就将位列十强。这在内容创建方面是一种深远的变革。

　　像del.icio.us（美味书签）和Flickr这样的网站，其公司已经在近期获得了广泛的关注，并且已经在一种被人们成为“分众分类”（folksonomy，有别于传统分类法）的概念上成为先行者。“分众分类”是一种使用用户自由选择的关键词对网站进行协作分类的方式，而这些关键词一般称为标签（tags)。标签化运用了像大脑本身所使用的那种多重的、重叠的关联，而不是死板的分类。举一个经典的例子，在Flickr网站上，一幅小狗照片可能被加上“小狗”和“可爱”这样的标签，从而允许系统依照用户行为所产生的自然的方式来进行检索。

　　协作式垃圾信息过滤产品，例如Cloudmark，就聚集了电子邮件用户们对于“一封邮件是或者不是垃圾邮件”的众多相互独立的决策，从而胜过了依赖于分析邮件本身的那些系统。

　　伟大的互联网成功者并不主动地到处推销其产品，这几乎成为公理。他们采用“病毒式营销”（viral marketing）的方式，也就是说，一些推介会直接从一个用户传播到另外一个用户。如何一个网站或产品依赖广告来进行宣传，你几乎可以断定它不是Web 2.0。

　　即便许多互联网基础设施本身，包括在大多数网络服务器中用到的Linux，Apache，MySQL，以及Perl，PHP或Python代码，也都依靠开放源码的对等生产（peer-production）的方式。其中包含了一种集体的、网络赋予的智慧。在SourceForge.net网站上列有至少10万种开放源码软件项目。任何人都可以添加一个项目，任何人都可以下载并使用项目代码。

　　同时，由于作为用户使用的结果，新的项目从边缘迁移到中心。一个对软件的有机的接受过程几乎完全依靠病毒式营销。同时，作为用户应用的结果，新的项目从边缘迁移到中心，这是一种几乎完全依靠病毒式营销的，有机的软件采用过程，。

　　经验是：源于用户贡献的网络效应，是在Web 2.0时代中统治市场的关键。

　　平台总是打败应用程序

　　在过去每次同对手的竞争中，微软都成功地打用了平台这张牌，打败了即便是最占主导地位的应用程序。Windows平台让微软以Excel取代了Lotus 1-2-3，以Word取代了WordPerfect,，以Internet Explorer取代了Netscape浏览器。

　　不过这次，冲突不是在平台和应用程序之间，而是在两种平台之间。每个平台皆有一种截然不同的商业模式：一方面，一个独立软件商具有广泛的用户基础并且将应用程序接口和操作系统紧密集成，从而对程序设计模式予以控制；另一方面，是一个没有所有者的系统，由一组协议、开放标准和对合作的共识来连结到一起。

　　Windows系统代表了由软件程序接口来进行专有控制的高峰。Netscape曾尝试用微软当初对付其对手所使用的手段，来同微软进行争夺，但是失败了。然而拥有互联网开放标准的Apache却已经繁荣了起来。此番上演的战局，已经不再是实力悬殊的平台对决孤立的软件了，而是变成了平台对决平台。问题在于，哪个平台，或者更深远地来说哪个体系，以及哪个商业模式，最能适应未来的机遇。

　　Windows对于早期的PC时代的问题是一种卓越的解决方案。它统一了程序开发者的竞技场，解决了很多困扰这个领域的问题。但这种由单一供方控制的一刀切的方法，已经不再是适宜的解决方案，而成为了一种问题。面向交流的系统需要协同性，互联网作为一个平台当然也是如此。除非供方可以控制每一例交互的两个终端，这种通过软件的程序接口来锁定用户的可能性微乎其微。

　　任何企图通过控制平台来推销应用程序的Web 2.0提供商，从定义上讲，已经丧失了这个平台的优越性。

　　这并不是说锁定和竞争优势的机会不复存在了，而是说我们相信这种机会不是通过控制软件程序接口和协议来取得的。新的游戏规则正在浮现。那些能够理解这些新的游戏规则，而不是企图回到PC软件时代旧有规则的公司，才有可能在Web 2.0时代获得成功。

　　博客和大众智慧

　　Web 2.0时代一项最受追捧的特性就是博客的兴起。个人主页从互联网早期就已经存在了，而个人日记和每日发表观点的专栏就更渊源久远了，那么到底有什么让人大惊小怪的呢？

　　归根底地，博客只是一种日记形式个人网页。但正如里奇·斯格仁塔（Rich Skrenta）指出的，博客的按时间顺序来排列的结构“看起来像是一个微不足道的变化，但却推动着一个迥然不同的分发、广告和价值链。”

　　其中一大变化就是一项称为RSS的技术。RSS是自早期计算机高手们认识到CGI（公共网关接口）可用来创建以数据库为基础的网站以来，在互联网根本结构方面最重要的进步。RSS使人们不仅仅链接到一个网页，而且可以订阅这个网页，从而每当该页面产生了变化时都会得到通知。斯格仁塔将之称为“增量的互联网”（incremental web）。其他人则称之为“鲜活的互联网”（live web）。

　　当然，现在所谓“动态网站”（即具有动态产生的内容的、由数据库驱动的网站）取代了十年前的静态网站。而动态网站的活力不仅在于网页，而且在链接方面。一个指向网络博客的链接实际上是指向一个不断更新的网页，包括指向其中任何一篇文章的“固定链接”（permalinks），以及每一次更新的通知。因此，一个RSS是比书签或者指向一个单独网页的链接要强大得多。

　　RSS同时也意味着网页浏览器不再只是限于浏览网页的工具。尽管诸如Bloglines之类的RSS聚合器（RSS aggregators）是基于网络的，但其他的则是桌面程序，此外还有一些则可以用在便携设备上来接受定期更新的内容。

　　RSS现在不仅用于推送新的博客文章的通知，还可以用于其他各种各样的数据更新，包括股票报价、天气情况、以及图片。这类应用实际上是对RSS本源的一种回归：RSS诞生于1997年，是如下两种技术的汇合：一种是戴夫·温纳（Dave Winer）的“真正简单的聚合”（Really Simple Syndication）技术，用于通知博客的更新情况；另一种是Netscape公司提供的“丰富站点摘要”（Rich Site Summary）技术，该技术允许用户用定期更新的数据流来定制Netscape主页。后来Netscape公司失去了兴趣，这种技术便由温纳的一个博客先驱公司Userland承接下来。不过，在现在的应用程序实现中，我可以看出两者共同的作用。

　　但是，RSS只是令博客区别于同普通网页的一部分原因。汤姆·科特斯（Tom Coates）这样评论固定链接的重要性：

　　“现在它可能看上去像是一项普普通通的功能，但它却有效地将博客从一个易于发布（ease-of-publishing）的现象，进一步转变为互相交叉的社区的一种对话式的参与。这是首次使得对其他人的网站上的很特定的帖子表态和谈论变得如此地容易。讨论出现了，聊天也出现。同时，其结果是出现了友谊或者友谊更加坚定了。固定链接是第一次也是最为成功的一次在博客之间搭建桥梁的尝试。”

　　在许多方面，RSS同固定链接的结合，为HTPP（互联网协议）增添了NNTP（新闻组的网络新闻协议）的许多特性。所谓“博客圈”（blogosphere），可以将其视作一种同互联网早期的、以对话方式来灌水的新闻组和公告牌相比来说，新型的对等（peer-to-peer）意义上的等价现象。人们不仅可以相互订阅网站并方便地链接到一个页面上的特定评论，而且通过一种称为引用通告（trackbacks）的机制，可以得知其他任何人链接到了他们的页面，并且可以用相互链接或者添加评论的方式来做出回应。

　　有趣的是，这种双向链接（two-way links）曾是象Xanadu之类的早期超文本系统的目标。超文本纯粹论者已然将引用通告颂扬为向双向链接迈进了一步。但需要注意的是，引用通告不是一个真正的双向链接，确切地讲是一种（潜在地）实现了双向链接效果的对称式单向链接。其间的区别看起来可能很细微，但实际上却是巨大的。诸如Friendster, Orkut和LinkedIn那样的社交网络系统（social networking systems），需要接受方做出确认以便建立某种连接，从而缺少像互联网架构本身那样的可伸缩性。正如照片共享服务Flickr网站的创始人之一卡特里纳·费克（Caterina Fake）所指出的，注意力仅在碰巧时才礼尚往来。（Flickr因此允许用户设置观察列表，即任何用户都可以通过RSS来订阅其他所有用户的照片流。注意的对象将会被通知，但并不一定要认可这种连接。）

　　如果Web 2.0的一个本质是利用集体智慧，来将互联网调试为一种所谓的全球的大脑，那么博客圈就是前脑中喋喋不休的呓语，那种我们整个头脑中都能听到的声音。这可能并不反映出大脑的往往是无意识的深层结构，但却是一种有意识的思考的等价物。作为一种有意识的思考和注意力的反映，博客圈已经开始具有强有力的影响。

　　首先，因为搜索引擎使用链接结构来辅助预测有用的页面，作为最多产和最及时的链接者，博客们在修整搜索引擎结果方面充当着一种不成比例的角色。其次，因为博客社区是如此多地自相引用，关注其他博客的博客们开阔了他们的视野和能力。此外，评论家们所批判的“回音室”（echo chamber）也是一种放大器。

　　如果只是一种放大器，那么撰写博客将会变得无趣。但是像维基百科全书一样，博客将集体智慧用作一种过滤器。被詹姆士·苏瑞奥维奇（James Suriowecki）称为“大众智慧”（the wisdom of crowds）的规律起了作用，并且就像PageRank技术所产生的结果胜过分析任何单一文档一样，博客圈的集体关注会筛选出有价值的东西。

　　虽然主流媒体可能将个别的博客视为竞争者，但真正使其紧张的将是同作为一个整体的博客圈的竞争。这不仅是网站之间的竞争，而且是一种商业模式之间的竞争。Web 2.0的世界也正是丹·吉尔默（Dan Gillmor）的所谓“个人媒体”（We，the media)的世界。在这个世界中，是所谓“原本的听众”，而不是密实里的少数几个人，来决定着什么是重要的。

　　3. 数据是下一个Intel Inside

　　现在每一个重要的互联网应用程序都由一个专门的数据库驱动：Google的网络爬虫, Yahoo!的目录（和网络爬虫），Amazon的产品数据库，eBay的产品数据库和销售商，MapQuest的地图数据库，Napster的分布式歌曲库。正如哈尔·瓦里安（Hal Varian）在去年的私人对话中谈到的，“SQL是新的HTML”。数据库管理是Web 2.0公司的核心竞争力，其重要性使得我们有时候称这些程序为“讯件”（infoware）而不仅仅是软件。

　　该事实也引出了一个关键问题：谁拥有数据？

　　在互联网时代，我们可能已经见到了这样一些案例，其中对数据库的掌控导致了对市场的支配和巨大的经济回报。当初由美国政府的法令授权给Network Solutions公司（后被Verisign公司收购）的对域名注册的垄断，曾经是互联网上的第一个摇钱树。虽然我们在争论通过控制软件的API来形成商业优势在互联网时代会变得困难得多，但是对关键数据资源的控制则不同，特别是当要创建这些数据资源非常昂贵，或者经由网络效应容易增加回报的时候。

　　注意一下由MapQuest, maps.yahoo.com，maps.msn.com，或者maps.google.com等网站提供的每张地图下面的版权声明，你会发现这样一行字“地图版权NavTeq，TeleAtlas”，或者如果使用的是新的卫星图像服务，则会看到“图像版权Digital Globe”的字样。这些公司对其数据库进行了大量的投资。（仅NavTeq一家，就公布投资7.5亿美元用于创建其街道地址和路线数据库。Digital Globe则投资5亿美元来启动其自有卫星，来对政府提供的图像进行改进。）NavTeq竟然已做了很多模仿Intel的耳熟能详的Intel Inside标识的事：例如带有导航系统的汽车就带有“NavTeq Onboard”的印记。数据是许多此类程序事实上的Intel Inside，是一些系统的唯一的信息源组件，这些系统的软件体系多数是开放源码的，也有商业化的。

　　当前竞争火热的网络地图（web mapping）领域显示着，对拥有软件核心数据的重要性的疏忽大意，将最终削弱其竞争地位。MapQuest在1995年率先进入地图领域，随后是Yahoo!，再后来是Microsoft，而最近Google也决定挺进这一市场，他们可以轻松地通过对同一数据的授权来提供一个具有竞争力的程序。

　　然而，作为对比的是Amazon.com的竞争地位。像Barnesandnoble.com这样的竞争者一样，其原始数据库来自于ISBN注册商.R. Bowker。但是同MapQuest不同，Amazon大力增强其数据，增加出版商提供的数据，例如封面图片，目录，索引，和样张材料。更重要的是，他们利用了其用户来评注数据，以至于十年之后，是Amazon而不是Bowker，成为图书文献信息的主要来源，一个学者、图书管理员和消费者的参考书目来源。Amazon还引入了其专有的标识符，即ASIN，该标识符在ISBN存在时与之对应，而当产品不带有ISBN时，就创建出一个等价的命名空间。Amazon从而有效地“吸收和拓展了”其数据提供商。

　　设想如果MapQuest也已做了同样的事情，利用他们的用户来评注地图和路线，添加新的价值层面。那么对仅仅通过授权使用基础数据来进入这一市场的其他竞争者，将造成远远大得多的困难。

　　近期Google地图的引入，为应用程序销售商和其数据提供商之间的竞争，提供了一个活生生的实验室。Google的轻量型编程模型已经引发了不计其数的增值服务的出现，这些服务以数据混合的方式，将Google的地图同其他可以通过互联网访问的数据源相结合。保罗·拉特马赫（Paul Rademacher）的housingmaps.com是这种混合的一个上佳范例，其网站将Google的地图同Craigslist的公寓出租，以及住宅购买数据相结合，来创建一种交互式的房屋搜索工具。

　　目前，这些混合大多是由程序高手们实现的创新性的实验产品。但是企业行动将紧随其后。并且，人们已经可以从至少一类开发者中发现这一点。Google已经将数据源提供者的角色从Navteq那里夺走，并且将自己定位为一个令人喜爱的中介者。在以后几年里，我们将会看到数据提供商和程序销售商之间的斗争，因为两大阵营都认识到了，特定的数据类别在作为搭建Web 2.0程序的积木时是多么的重要。

　　这场竞赛已经涉及到拥有特定类别的核心数据：位置、身份、公共事件日历、产品标识和命名空间等。在许多情况下，在那些创建数据需要巨额成本的地方，也可能存在一种如同Intel Inside方式一样凭借单一数据源来所有作为的机遇。其他情况下，胜者将是那些通过用户聚合来达到临界规模，并且将聚合的数据融入系统服务中的公司。

　　比如，在身份标识领域，PayPal，Amazon的一键式，以及拥有数百万用户的交流系统，都有可能成为创建整个网络范围的身份标识数据库的正当竞争者。（关于此，Google最近使用手机号码作为Gmail账号标识的尝试，可能就是朝借鉴和拓展电话系统所迈出的一步。）同时，像Sxip这样的创业公司，正在探索联合身份标识的可能性，以寻求一种“分布一键式”，从而提供一个无缝的Web 2.0标识子系统。在日历领域，EVDB则是通过维基式参与体系来搭建世界上最大的共享日历的一种尝试。虽然评判者尚在观望着任何一个特定创业公司或方式的成功是否，但很显然，这些领域的标准和解决方案，有效地将某些数据转变为“互联网操作系统”（internet operating system）的可靠的子系统，并将促成下一代的应用程序。

　　关于数据，必须注意一个进一步的方面，那就是用户关心其隐私和对自己的数据的权限。在许多早期的网络程序中，版权只被松散地执行。例如，Amazon宣称对任何提交到其网站的评论的所有权，但却缺少强制性，人们可以将同样的评论转贴到其他任何地方。然而，随着很多公司开始认识到，对数据的掌控有可能成为他们首要的竞争优势来源，我们将会看到在此类控制方面强度更大的尝试。

　　正如专有软件的增长而导致自由软件运动一样，在下一个10年中我们会看到专有数据库的增长将导致自由数据运动。在像维基百科全书这样的开放数据项目、创作共用（Creative Commons）、以及像Greasemonkey（让用户决定如何在其计算机上显示数据）这样的软件项目中，我们可以看到这种对抗势头的前兆。

　　参与的体系

　　一些系统被设计为鼓励参与。在丹·布莱克林（Dan Bricklin）的论文“共用的丰饶”（The Cornucopia of the Commons）中，他指出有三种创建大型数据库的方式。第一种，已经由Yahoo!来体现了，就是付费给人们来实现。第二种，由开放源码社区的经验启发而来，就是让志愿者来完成同样的任务。开放目录项目（Open Directory Project），一个Yahoo的开放源码竞争者，就是该方式的产物。但是Napster体现了第三种方式。因为Napster将其默认设置为自动为任何已经下载的音乐服务，任何用户都自动地帮助建立共享数据库的价值。同样的方式已经被其他所有P2P文件共享服务所采用。Web 2.0时代的一个关键经验在于：用户增加价值。但是只有很小一部分用户会有意来为你的程序增加价值，而不怕麻烦。因而，Web 2.0公司均进行了这样的默认设置，即作为程序通常使用方式的副产品，来聚合用户数据并创造价值。正如上面所指出的，他们在搭建那种用户越多则效果越好的系统。

　　米切尔·卡普尔（Mitch Kapor）曾经指出“体系是策略”。参与是Napster的本质，其根本体系的一部分。

　　同更经常被引用的所谓“吸引志愿精神”的原因相比，这种体系结构上的洞察力可能更能抓住对开放源码软件成功的本质。互联网、万维网（World Wide Web）、以及像Linux、Apache和Perl这样的开放源码软件项目的体系结构，均是这样一种设计，使得作为一种自动产生的副产品，谋求其自身利益的用户们创建着集体的价值。这些项目中的任何一个都有一个很小的核心、一种设计良好的扩展机制、和一种让任何人来添加任何合乎规定的组件的方式，不断增长着被Perl语言的创始人拉里·沃尔（Larry Wall）称为“洋葱头”（the onion）的外部层面。换句话说，这些技术通过他们本来的设计方式，体现着网络的效应。

　　4. 软件发布周期的终结

　　如上文在对Google和Netscape的比较中谈到的，互联网时代软件的代表性特征就是它应该被作为服务来交付。这种事实导致这类公司的商业模式上很多根本性的变化。

　　1. 运营必须成为一种核心竞争力。Google或者Yahoo!在产品开发方面的专门技术，必须同日常运营方面的专门技术相匹配。从软件作为制造品到软件作为服务的变化是如此地根本，以至于软件将不再能完成任务，除非每日加以维护。Google必须持续抓取互联网并更新其索引，持续滤掉链接垃圾和其他影响其结果的东西，持续并且动态地响应数千万异步的用户查询，并同步地将这些查询同上下文相关的广告相匹配。

　　所以，Google的系统管理、网络、和负载均衡技术，可能比其搜索算法更被严加看管，也就不足为奇了。Google在自动化这些步骤上的成功是其同竞争者相比更有成本优势的一个关键方面。

　　同样也不足为奇的是，像Perl、Python、PHP、和当前的Ruby这样的脚本语言在Web 2.0公司中扮演着重要角色。Sun公司的第一个网管哈桑·施罗德（Hassan Schroeder）曾对Perl有一个著名的形容：“互联网的管道胶带”（the duct tape of the internet）。事实上，动态语言（常常被称为脚本语言，并被软件制品时代的软件工程师所贬低），是系统和网络管理员，以及创建可经常更新的动态系统的程序开发者们所喜爱的工具。

　　2. 用户必须被作为共同开发者来对待，这是从对开放源码开发实践的一种反思中得出的（即便所涉及的软件不太可能以开放源码授权方式来发行）。开放源码的格言“早发布并常发布”（release early and release often）事实上已经演变成一种更为极端的定位“永远的测试版”（the perpetual beta）。其中产品在开放状态下开发，新的功能以每月、每周、甚至每天的速度被加入进来。Gmail、Google Maps、Flickr、del.icio.us，和其他类似的服务，可能会在某个阶段打着测试版的标识多年。

　　故此，实时地监测用户行为，来考察哪些新特性被使用了，以及如何被使用的，将成为另外一种必须的核心竞争力。一位工作于一个主要在线服务网络商的开发者评论道：“我们每天在网站的某些部分提供两到三个新的特性，而且如果用户不采用它们，我们就将其撤掉。如果用户喜欢它们，我们就将其推广到整个网站。”

　　Flickr的总开发师卡尔·亨德森（Cal Henderson），近来透露了他们是如何在短至每半个小时就部署一个新版本的。显而易见，这是同传统方式有天壤之别的开发模式。虽然不是所有的网络程序都以像Flickr这样的极端方式来开发，但几乎所有网络程序都有一个同任何PC或者客户-服务器时代截然不同的开发周期。正因如此，ZDnet杂志才论断Microsoft不会打败Google：“Microsoft的商业模式依赖于每个人在每两到三年都升级他们的计算环境。Google的模式则依靠任何人每天在其计算环境中自行探索新东西。”

　　虽然Microsoft已经体现了从竞争中学习并最终做得最好的强大能力，但是毫无疑问这一次的竞争要求Microsoft（可以扩展到任何现存的软件公司）来成为一种在深入层面上显著有别的公司。天生的Web 2.0公司在享受自然而然的优势，因为它们不需要去摆脱陈旧的模式（及其相应的商业模式和营收来源）。

　　5. 轻量型编程模型

　　一旦网络服务的观念深入人心，大型公司将以复杂的网络服务堆栈来加入到纷争之中。这种网络服务堆栈被设计用来为分布式程序建立更可靠性的编程环境。

　　但是，就像互联网成功正是因为它推翻了许多超文本理论一样，RSS以完美的设计来取代简单的实用主义，已经因其简单性而成为大概是应用最广泛的网络服务，而那些复杂的企业网络服务尚未能实现广泛的应用。

　　类似地，Amazon.com的网络服务有两种形式：一种坚持SOAP(Simple Object Access Protocol，简单对象访问协议）网络服务堆栈的形式主义；另一种则简单地在HTTP协议之外提供XML数据，这在轻量型方式中有时被称为REST（Representational State Transfer，代表性状态传输）。虽然商业价值更高的B2B连接（例如那些在Amazon和一些像ToysRUs这样的零售伙伴之间的连接）使用SOAP堆栈，但是根据Amazon的报道，95%的使用来自于轻量型REST服务。

　　同样的对简易性的要求，可以从其他“朴实的”网络服务中见到。Google近来的Google地图的推出就是一个例子。Google地图的简单AJAX（Javascript和XML的结合）接口迅速被程序高手们破译，被随即进一步将其数据混合到新的服务之中。

　　地图相关网络服务已经存在了一段时间，例如像ESRI那样的GIS（地理信息系统），以及从MapQuest和Microsoft的MapPoint。但是Google地图以其简洁性而让世界兴奋起来。虽然从前销售商所支持的网络服务都要求各方之间的正式约定，但Google地图的实现方式使数据可以被捕获，于是程序高手们很快就发现了创造性地重用这些数据的方法。

　　这里有几条重要的经验：

　　1. 支持允许松散结合系统的轻量型的编程模型。由企业开发的网络服务堆栈的复杂设计是用来促成紧密结合的。虽然这在许多情况下是必须是，但是许多最重要的应用程序可以事实上保持松散结合，甚至是脆弱的结合。Web 2.0的理念同传统的IT的理念迥然不同。

　　2. 考虑聚合（syndication）而不是协调（coordination）。简单的网络服务，例如RSS和基于REST的网络服务，是用来向外聚合数据，但并不控制其达到连接的另外一端时发生的事情。这种想法是互联网本身的基础，一种对所谓端到端原则的反映。

　　3. 可编程性和可混合性设计。像最初的互联网一样，RSS和AJAX这样的系统，都有此共同点：重用的障碍非常低。许多有用的软件事实上是开放源码的，而即便它不是，也没有许多东西来保护其知识产权。互联网浏览器的“查看源文件”选项，使得许多用户可以复制其他任何用户的网页；RSS被设计得使用户能够在需要的时候查看所需要的内容，而不是按照信息提供者的要求；最成功的网络服务，是那些最容易采纳未被服务创建者想到的新的方向。同更普遍的“保留所有权利”（all rights reserved）相比，随着创作共用约定而普及的“保留部分权利”（Some Rights Reserved）一词成为一个有益的指路牌。

　　装配中的创新

　　轻量型商业模型是对轻量型编程和轻量型结合的一种自然产物。Web 2.0的理念善于重用。一种像housingmaps.com这样的新服务，是通过将两个现存服务抓取到一起来简单地创建起来的。Housingmaps.com还没有商业模式（目前为止），但对于许多小规模的服务，Google的AdSense（或Amazon的associates fees计划，或者两者都是）为同类服务提供了营收模式。

　　这些案例为Web 2.0的另外一个关键原则提供了启发，我们将之称为“装配中的创新”。当商品组件充裕时，你可以通过以新颖的或者有效的方式来装配这些组件来创建价值。很像PC革命为硬件商品装配提供了许多创新的机会，其中像Dell这样的公司创造了这种装配的科学，并从而打败了那些商业模式上要求产品开发方面的创新的公司，我们相信Web 2.0为各个公司提供了，通过在利用和整合由其他人提供的服务方面逐渐完善，来赢得竞争的机会。

　　6. 软件超越单一设备

你可能感兴趣的:(应用服务器,Web,互联网,Google,网络应用)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
第四天旅游线路预览——从换乘中心到喀纳斯湖陟彼高冈yu 基于Google earth studio 的旅游规划和预览旅游
第四天：从贾登峪到喀纳斯风景区入口，晚上住宿贾登峪；换乘中心有4路车，喀纳斯①号车，去喀纳斯湖，路程时长约5分钟；将上面的的行程安排进行动态展示，具体步骤见”Googleearthstudio进行动态轨迹显示制作过程“、“Googleearthstudio入门教程”和“Googleearthstudio进阶教程“相关内容，得到行程如下所示：Day4-2-480p
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
webpack图片等资源的处理 dmengmeng
需要的loaderfile-loader（让我们可以引入这些资源文件）url-loader（其实是file-loader的二次封装）img-loader（处理图片所需要的）在没有使用任何处理图片的loader之前，比如说css中用到了背景图片，那么最后打包会报错的，因为他没办法处理图片。其实你只想能够使用图片的话。只加一个file-loader就可以，打开网页能准确看到图片。{test:/\.(p
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
「豆包Marscode体验官」 | 云端 IDE 启动 & Rust 体验张风捷特烈 ide rust 开发语言后端
theme:cyanosis我正在参加「豆包MarsCode初体验」征文活动MarsCode可以看作一个运行在服务端的远程VSCode开发环境。对于我这种想要学习体验某些语言，但不想在电脑里装环境的人来说非常友好。本文就来介绍一下在MarsCode里，我的体验rust开发体验。一、MarsCode是什么它的本质是:提供代码助手和云端IDE服务的web网站，可通过下面的链接访问https://www
新私域是什么平台靠谱吗氧惠佣金真的高
新私域指的是借助与互联网电商，随着平台内商家入驻量、用户量相辅相成的全国化平台。是否靠谱取决于平台是否合规。新私域指的是借助与互联网电商，在传统会员体系外新增的锁定用户跨平台、跨界收益，一种随着平台内商家入驻量、用户量相辅相成的全国化平台。关于新私域平台是否靠谱，这个需要看平台的底层逻辑是否合理、合法、合规以及平台的未来的发展方向氧惠APP抖音购物、看电影、点外卖、打车用氧惠APP！佣金更高、更优
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
Python神器！WEB自动化测试集成工具 DrissionPage 亚丁号 python 开发语言
一、前言用requests做数据采集面对要登录的网站时，要分析数据包、JS源码，构造复杂的请求，往往还要应付验证码、JS混淆、签名参数等反爬手段，门槛较高。若数据是由JS计算生成的，还须重现计算过程，体验不好，开发效率不高。使用浏览器，可以很大程度上绕过这些坑，但浏览器运行效率不高。因此，这个库设计初衷，是将它们合而为一，能够在不同须要时切换相应模式，并提供一种人性化的使用方法，提高开发和运行效率
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
Spring MVC 全面指南：从入门到精通的详细解析一杯梅子酱技术栈学习 spring mvc java
引言：SpringMVC，作为Spring框架的一个重要模块，为构建Web应用提供了强大的功能和灵活性。无论是初学者还是有一定经验的开发者，掌握SpringMVC都将显著提升你的Web开发技能。本文旨在为初学者提供一个全面且易于理解的学习路径，通过详细的知识点分析和实际案例，帮助你快速上手SpringMVC，让学习过程既深刻又高效。一、SpringMVC简介1.1什么是SpringMVC？Spri
Spring Boot中实现跨域请求 BABA8891 spring boot 后端 java
在SpringBoot中实现跨域请求（CORS，Cross-OriginResourceSharing）可以通过多种方式，以下是几种常见的方法：1.使用@CrossOrigin注解在SpringBoot中，你可以在控制器或者具体的请求处理方法上使用@CrossOrigin注解来允许跨域请求。在控制器上应用：importorg.springframework.web.bind.annotation.
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
计算机网络八股总结 Petrichorzncu 八股总结计算机网络笔记
这里写目录标题网络模型划分（五层和七层）及每一层的功能五层网络模型七层网络模型（OSI模型）==三次握手和四次挥手具体过程及原因==三次握手四次挥手TCP/IP协议组成==UDP协议与TCP/IP协议的区别==Http协议相关知识网络地址，子网掩码等相关计算网络模型划分（五层和七层）及每一层的功能五层网络模型应用层：负责处理网络应用程序，如电子邮件、文件传输和网页浏览。主要协议包括HTTP、FTP
最简单将静态网页挂载到服务器上(不用nginx) 全能全知者服务器 nginx 运维前端 html 笔记
最简单将静态网页挂载到服务器上(不用nginx)如果随便弄个静态网页挂在服务器都要用nignx就太麻烦了，所以直接使用Apache来搭建一些简单前端静态网页会相对方便很多检查Web服务器服务状态：sudosystemctlstatushttpd#ApacheWeb服务器如果发现没有安装web服务器：安装Apache：sudoyuminstallhttpd启动Apache：sudosystemctl
2020年学习什么知识比较好？互联网行业依然是发展较佳编程仔
2019年余额已不足，不少职场人心里也在盘点这一年的工作得失，琢磨新一年的奋斗策略，是继续冲刺还是换个跑道？今年跳槽更难吗？image互联网行业一直以相对较丰厚的薪酬和广阔的发展前景吸引着各界人才。但最近，互联网行业寒冬、互联网企业裁员等话题再次引起热议。正在从前些年的高速发展期转向发展调整期的互联网行业真的步入了“寒冬”？该行业依旧具有吸引力吗？什么职位又最热门呢？image互联网行业仍保持较高
思考成长丁昆朋
这篇文章是加紧赶出来“应付”日更，一方面不想要再晚睡了；另一方面不想失去日更达人的称号，只能坐下来匆忙写下一点文字。既然标题是成长，先来总结一下这段时间的收获：1、整理箱子站着可以看电脑，坐着反而是一种享受，减少了坐着腰酸背痛的现象；2、使用讯飞输入法大大增加自己的输出量；3、Anaconda+“pythontutor.com"+Google算是简单入门python；4、英语的阅读文章能力、听力提
效率神器来了：AI工具手把手教你快速提升工作效能 kkai人工智能人工智能学习媒体 ai chatgpt
随着科技的进步，AI工具已经成为提升工作效率的关键手段。本文将介绍一些实用的AI工具和方法，帮助你自动化繁琐的重复性任务、优化数据管理、促进团队协作与沟通，并提升决策质量。背景：OOPAI-免费问答学习交流-GPT自动化重复性任务Zapier：Zapier可以自动化多个应用程序之间的工作流程。例如，它能自动将Gmail中的附件保存至GoogleDrive，或在你发布新文章时，自动分享至社交媒体平台
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n