明道云创始人任向晖

云计算简史（完整版）

文/明道云创始人任向晖

围绕云计算相关的技术领域、技术名词和技术产品令人眼花缭乱。在云计算发端之初，应用开发环境还比较简单，当时还有所谓的全栈工程师存在，意味着如果不考虑开发周期，一个人就能搞定整个应用软件。今天，这个称谓已经名不符实。很少再有一个人，甚至一个企业能够全面掌握和云计算有关的所有技术栈。他们可能会应用旁人完成的一些成果，结合自有的一些专有经验，来形成在某个细分市场有竞争力的产品，或者为客户交付期望的产出。

即使作为纯粹的应用者，要想全面了解和云计算有关的技术，做到合理架构，恰当选型，顺利完成集成开发和部署的全过程，也都比过去难得多，需要的技术人才也比过去昂贵。坦率来说，在当下的人才竞争度下，一般行业的企业，即使拥有信息部门，也都不太可能独立驾驭这样复杂的开发设施，他们将不得不广泛依赖云计算平台提供的服务。这给软件行业的解决方案商带来了新的市场机会。谁能够为数字化转型企业提供友好的应用开发和部署环境，谁就能够获得和保有客户。

这篇长文主要面向大中型企业的技术和非技术管理者。我通过描绘云计算技术和市场领域的发展过程，介绍关键技术和市场里程碑，包括不同技术域下的核心开源项目，让企业能够对云计算发展历史和相关技术域有一个通盘的了解。有了通盘的认知，你会更容易看透本企业应该怎样利用云计算，未来可能的市场机会和挑战在哪里？

本文受到Tom Siebel 2019年出版的Digital Transformation一书的启发，但我尽量结合了中国市场的实际情况通俗地来讲述。

云计算市场的形成和结构

我们今天能够享受经济和便捷的云计算服务，主要来自两大动力，一是计算资源的虚拟化技术，二则是规模经济效应。前者发端于2000年后VMWare推出的Hypervisor虚拟化软件，它不再依赖一个母体操作系统，就允许用户将硬件和网络资源划分成多个单元，从而实现计算资源的池化、共享和按需调度。

2006年，Amazon推出了S3对象存储服务和SQS简单队列服务，开创了公共云计算服务的先河。在此后，微软，IBM，谷歌，中国的阿里，腾讯和华为等都陆续加入了公共云服务的市场，提供的服务也从基础计算资源扩展到数据库、人工智能、物联网等多个技术领域。目前，这个行业已经成长为年收入2500亿美元的巨大市场。

在这十多年的发展过程中，当然出现了很多的公司，产品和服务，但是概括起来这些事物的涌现基本沿着两条明显的路线在进行：

趋势一：从基础设施，到应用，再到应用相关的平台服务。

基础云（Infrastructure as a Service)

最早的云计算服务就是最基础的云主机（Virtual Machine)，服务商把裸金属装上Hypervisor，把计算和网络资源分块后就可以卖了。随后，基础服务被拆分为主机、存储、网络、数据库和安全等几个重要的基础云产品，允许用户灵活组合，并实现了弹性计费（目前国外基础云厂商大多都提供按分钟或按秒的计费精度，存储则可以按月计费，比如AWS的S3服务每GB数据的标准存储月费在0.0125美元，而深度归档存储的每GB月费可以低至每GB0.001美元）。

我们一般把主机，存储，网络，数据库和安全相关的计算服务统称为基础云服务。在这些服务之上，开发者需要完成所有的技术栈搭建，构建自己的数据架构，开发编码，部署运维，最终才能实现云端应用。而初代的云计算客户大多数都是互联网公司。他们并非云服务的最终消费者，而是生产者。

应用即服务（Software as a Service）

和Amazon Web Services几乎同时起步的另外一家公司Dropbox是一家面向个人和团队提供文件存储和共享服务的创业公司。赶上了AWS起步的时候，Dropbox就直接使用了AWS现成的S3对象存储服务，这让一家团队人数很小的初创公司有机会能够聚焦在应用开发和营销上，让Dropbox通过短短的几年时间发展成市场份额第一的文件共享应用。和Dropbox类似的大票SaaS企业大多也都是在随后的十年内陆续出现，他们千篇一律都使用了云计算平台的服务，而不再自建基础设施。这当中也包括一个超级大用户“奈飞“（Netflix），他们的下行流量占到整个互联网下行流量的15%之多，也是AWS的客户。

我们创办的明道协作应用诞生在2011年，也正好赶上了中国云计算平台开始的年份，所以我们也避免了很多基础设施的建设工作。广义来说，最早的云服务在基础云公司之前就出现了。1999年创办的Salesforce，就是一个典型的SaaS公司，只不过当年没有这样的行业术语。2016年，据说Salesforce也已经成为了AWS的客户。因为SaaS服务形式的存在，使得云计算能够间接提供服务给大量的中小企业和非互联网行业企业。今天，几乎所有的企业都或多或少应用一些SaaS服务。

云计算市场发展的第一波主要由互联网企业用户带动。他们具备比较完整的开发和自助运维能力，而且也有日益增长的用量，属于基础云服务最理想的客户群体。直到今天，阿里云和腾讯云的主要客户群体依然是泛互联网行业。

SaaS企业是云计算基础服务的重要推动者，虽然这个门类和2C的网络服务相比，贡献的经济价值要小得多，但是他们深谙企业市场的需求，推动了云计算平台的应用开发环境日益成熟。这就是趋势的下一步：平台即服务。

（开发）平台即服务（Platform as a Service）

所谓平台即服务，特指开发平台。应用开发工作从本地迁移到云端，自然需要在云计算环境中提供对应的更优解决方案。所以过去传统的中间件市场陆续发生变迁，逐一转换为在云计算平台上的某项服务。比较常见的开发平台服务包括：

通讯：提供音视频通信、消息推送、短信、邮件等服务

地理信息：提供地图、定位、导航相关的服务

应用开发框架：提供应用开发环境和运行时环境

媒体服务：提供图片和音视频等媒体文件的编码、加工和存储服务

机器学习框架：提供面向AI应用开发者的机器学习数据标注和模型训练平台

小到发送一条验证码短信也是一项PaaS服务。

作为PaaS服务，主要是为开发者服务的，所以除了功能性服务以外，PaaS厂商也要提供开发友好性相关的周边能力，比如弹性扩展的能力，调试和控制权限的能力等。参与的开发者越多，一项PaaS服务就能够有更多的改进机会和摊低的平均成本。

PaaS服务是不是一定由独立的PaaS厂商来提供呢？不一定。实际上，主流的PaaS服务大多被IaaS公司所覆盖了。如果你打开阿里云的产品列表，在数百个产品中，你会发现基础云服务只是其中一个门类，其他十几个门类都是和开发环境有关的服务。这意味着，一家创业公司想要独立成为一家成功的PaaS厂商，需要相当聚焦地执行，而且产品有明显的技术领先度。一旦做到这一点，也不用担心和基础云公司的竞争，因为我后面会讲到云计算市场的技术发展，其中已经有众多的技术趋势保障了独立性PaaS公司建立跨云服务的独特优势。

以上说的是云计算服务过去十五年发展中的一条脉络，从基础云到应用的共生，再到日益丰富的开发平台即服务。云计算覆盖的用户越来越多，依赖的是这三个层次的服务互为补充。

趋势二：从公共云、私有云到混合云，再到多云

第二条脉络有关云计算服务的部署模式（Deployment Model）。当云计算概念被提出时，它显然指的就是公共云服务，客户不需要保有任何基础设施，直接像水电煤一样使用云计算资源就可以。但是商业的现实和技术企业的理想之间总是存在沟壑。云计算到底是技术还是服务，在很长一段时间内是缺乏共识的。

在云计算服务开启之前，很多大型企业和组织都有自己的服务器。2010年，全球服务器市场就有500亿美元的规模，这些服务器大多数都卖给了企业和政府。企业拥有了这些基础设施，难道再花钱买公共云服务吗？既然云计算技术这么好，为什么我自己来实现呢？政府、金融、医药等行业客户更加不可能在公共云计算服务诞生的初期就义无反顾地采纳，他们有各种各样所谓的合规要求。

私有云（Private Cloud）

果不其然，有需求就有供给。2010年Rackspace和NASA公开了一个叫做OpenStack的开源项目组。它包含了一系列用于构筑云计算服务的开源软件。这意味着，所有拥有硬件基础设施的用户都可以用很低的成本来实现和AWS类似的技术架构。Rackspace是一家IDC公司，它这么做的动力显然是很强的。它认为只要帮助客户解决虚拟化问题，自己的主机托管生意一样可以兴旺发达。

虽然软件是开源免费的，但是要实施Open Stack依然需要云计算相关的专业知识。因此，从2010年开始，出现了很多基于OpenStack帮助企业建立私有云的服务商。在国内，公共云服务商甚至都提供过这类服务。十年过去了，这股由OpenStack带起的私有云风潮基本告一段落。除了极少数大型用户在经济上能够承受自己维护独立的云计算平台，绝大多数用户根本无法得到经济上合理的回报。虚拟化只是云计算服务的一个技术前提，但并非所有的价值。私有云方案永远无法利用到资源弹性利用（可大可小）和真正的规模经济效应，除非用户根本不关切经济理性。

在中国市场，重点行业可能至今依然无法使用商业云服务，但是电信运营商和一些国家级的科技企业也在公共云服务商的帮助下建立了各种行业云。比如移动云，联通云和电信天翼云都是这样形成的，他们为金融、政府、交通、教育等重点行业提供公共云服务。

故事到这里，似乎公共云已经大获全胜。但是，商业现实又回来了。在越来越同质化的云计算服务市场，客户难道完全没有议价能力吗？客户的需求如果不能得到满足，总有供应商会愿意创新。于是混合云（Hybrid Cloud）出场了。

混合云（Hybrid Cloud）

其实混合云并不是什么独特的云计算技术，它实质上是一组通讯服务。只要堆上足够好的网络设备和奢侈的专线连接，世界上任何地点的计算设备都可以组成高速专网。即便客户预算有限，只要对安全性和连通性的要求没有那么高，也可以自助搭建经济的VPN网络。围绕通过商业网络连接组建混合云的技术被称之为“SD-WAN”（软件定义广域网）。有了网络连接，就可以把客户自有的计算设施和公共云计算设施连接在一起，称之为“混合云”。

混合云对客户的好处是明显的。首先，每个企业都可能有云计算基础用量，但也可能有短期的激增需求。有了混合云，客户就可以围绕自己的基础用量采购自有IT资产，自己运营私有云，而短期波动的增量则可以通过公共云服务满足，等需求高峰过去，就可以去掉这部分的开支。企业也可以将运维难度比较低的基础云服务保留在自己的设施内，而同时使用公共云提供的复杂计算服务，比如机器学习平台等。Dropbox是一个大规模的SaaS应用，它在2016年做了很大的架构调整，大部分的服务不再使用AWS的公共云，一举节省了7000万美元的年度云计算开销。

混合云策略现在已经得到了厂商和客户的双重支持，它终结了公共云和私有云非黑即白的争议，让整个IT产业更加务实。这其中也诞生了很多的商业机会。微软，亚马逊，IBM，Google等领先的云计算厂商都推出了自己的混合云解决方案。因为混合云方案主流化，云计算厂商的竞争开始从基础云资源的成本向应用开发生态环境迁移。因为在混合云架构下，客户面临如何规划流畅的数据连接，如何快速交付云原生应用的新挑战。所以，云计算的终极竞争不是硬件的竞争，也不是软件的竞争，而是应用开发和部署（AD&D）环境的竞争。

多云（Multi-Cloud）

多云概念是云计算市场最近几年出现的概念。它把所有的云计算平台，客户的私有云设施全部视作一般基础设施。所有的应用在所有的云上都能一致并可靠地运行。多云解决方案不仅是基础设施提供者需要协调的，更重要的是应用开发和部署要面向多云运行目标。

2013年，Y Combinator孵化企业Docker Inc开源了Docker项目。它成为应用跨云部署的重要前提。Docker允许用户将复杂的应用、数据和依赖的环境，包括操作系统本身打包到一个“容器”中，通过标准的Docker引擎，在任何计算环境中都可以一致地运行。有了这项技术，把一个应用系统从阿里云转移到腾讯云就和传输一个文件一样简单，云和云之间已经没有边界。为什么Windows和mac OS的应用永远不兼容，而云计算厂商却眼睁睁地看着这些事情发生呢？很简单，因为整个云计算技术生态都建立在开源软件上，亚马逊再大，它也只是一个服务提供者，收的是租金。而客户方，则越来越看重自主可控性，他们不希望被单一的云计算公司锁定，毕竟自己的客户和交易数据都运行在云计算上，它是所有企业的命脉了。

2015年，Google开源了Kubernates项目，让多云解决方案更胜一筹。K8S能够对容器的创建、扩展等进行自动编排。这意味着无论应用有多么复杂，它都能够在多云环境中进行统一运维。比如自家的某种类型存储用完了，就可以临时购买一些亚马逊的存储。数据过时了，就定期自动地转移到低价格的冷存服务中。

有了多云技术框架和服务，同时意味着云计算平台必须提供广泛支持。阿里云当然希望多卖一些云主机服务，但是如果因为技术框架落后，客户就会流失。所以，全世界的云计算平台目前都义无反顾地支持了多云策略，希望在这个过程中继续以专业服务商的地位存在。

多云策略对应用开发者的影响也很大。首先开发者必须从第一天就按照云计算环境来规划，支持多云部署，自动伸缩，采用微服务架构以实现容器部署。其次，应用开发者也能够从这样的架构中受益。因为它使得客户获得私有软件也像应用SaaS一样简单，唯独不同的是应用和数据运行在客户控制的计算环境中，但是软件本身都是基于单一代码库的（Single Code Base）。我们明道云原来是一个SaaS形态应用，客户只需要在mingdao.com上注册即可使用，现在，通过容器技术，我们的客户也可以在自己的云计算环境中安装和升级。这些都有赖于多云技术架构。

前面我们提到了云计算公司的竞争将向应用开发和部署环境迁移。那么它具体指的是什么呢？它有关于围绕云计算相关的四个技术领域。Tom Siebel把他们概括为云计算本身、大数据、人工智能和物联网。

接下来，我们会逐一介绍这十五年来，伴随云计算发展起来的数字化技术领域。正是因为云计算服务的普及，才催化了这些新兴的技术领域，反过来，这些技术领域的发展也让现代云服务更加完善，当然也更加复杂。正是这些复杂性，让企业数字化转型工作变得阻力重重。相较于更早前的基础信息化工作，企业届要认知和掌握的技术范畴要比宽广得多。因此，我们介绍云计算的发展简史，就必须要把关联技术域的发展也一并介绍。

云计算相关的技术领域

大数据（Big Data）

在大数据概念出现之前，数据存储、处理和分析的技术早已存在。随着存储成本的下降和云计算提供的弹性计算能力增强，越来越多的数据场景已经不能被传统的数据库技术所处理。这些新场景可以被概括为高数据量（Volume），高频度（Velocity）和多数据类型（Variety）三个特点。比如在电子商务、金融和物联网领域，系统往往在很短的时间内会产生大量的数据。这些数据甚至在存储的过程中就会产生瓶颈，更不用说实时性很强的计算和分析。所以，从搜索引擎时代开始，大数据相关的技术就开始孕育。

MapReduce和Hadoop

搜索引擎的霸主Google成立于1998年，几年以后，Google的搜索服务所承载的数据量已经是一个天文数字，而且还在以光速增加。传统的数据处理技术完全依赖硬件算力的铺陈，这会让Google在未来的发展中不堪重负。2004年，Google在内部推出了GFS分布式文件系统和分布式计算框架MapReduce。前者解决了单一硬件资源的限制，后者通过一系列数学原理，将多类型的数据进行切片并分散存储在特定的分区中，这个设计能够让未来的计算和分析大幅提效。MapReduce的技术原理是大数据技术发展的最重要基础。

很快，开源软件领域开始响应这项技术方案，Lucene项目创始人Doug Cutting在2006年正式独立出Hadoop开源项目，在其中包括了分布式文件系统，在集群资源上的调度工具，以及最核心的大数据并行处理开发框架。有了Hadoop以后，那些面对海量数据分析难题行业从此有了更好的解决方案。只是在2006年前后，主要的应用行业还是互联网行业本身。Yahoo，

中国的百度等都很快应用了Hadoop来解决海量数据的存储和检索问题。

Hive，Spark和流式计算

在随后的几年中，Hadoop相关的大数据处理技术继续得到增强。Facebook开源的Hive分析工具用更高层和抽象的语言来描述算法和数据处理流程，能够用SQL语句进行大数据分析，这大大降低了使用者门槛，也提升了大数据技术的应用效率。不要小看这项改进，它让全世界大多数现有的数据分析人员可以轻易掌握大数据技术。

2009年，加州大学伯克利分校的AMP实验室开发了Spark开源集群计算框架，通过完善API和库，提供更完善的能力和通用性。而且Spark的特色是能够将数据存储在内存中，所以数据处理和查询效率要比利用硬盘存储的MapReduce框架快百倍。目前，Spark已经加入Apache Software Foundation，成为Apache开源项目中的明星项目，被大数据技术领域作为最重要的工具框架。

至此为止的技术栈基本解决了针对海量数据批量进行处理和分析的需求。比如零售业企业如果需要研究顾客和交易数据，从而对顾客群进行特征细分，这些技术就足够了。但是，数字化技术的发展总是会刺激出更高级的需求。比如，在线上零售中，商品和顾客的行为数据是永续不断在发生的，我们希望在数据发生的时刻就立即进行计算，及时地给顾客推送一张个性化的优惠券，而不是定时进行某种批量计算，这时候就需要大数据技术的一个分支—流式计算。

流式计算的常用框架包括Storm和Spark Stream和Flink，他们在零售和电子商务行业中的交易分析、金融风控、物联网中的态势监控、车联网中的自动驾驶等领域都被广泛应用。2019年，阿里巴巴用1亿美元收购了Flink，是因为我们用的淘宝天猫中的搜索、商品推荐，包括双11的实时监控大屏数据都是由Flink来驱动的。Flink用几乎无延迟的速度截获双十一最后一秒钟结束后的GMV数值，可见它在实时处理数据方面的性能。

NoSQL数据库

与大数据技术同步发展的还包括NoSQL（非关系型）数据库市场。在上个世纪，大多数商业数据库都是关系数据库，通过SQL语言进行数据处理和查询。当大数据技术发展起来后，技术专家们发现数据库完全可以用不同的形态来存储数据，这样可以大幅减少数据分析过程中的预处理工作量。所以，从2009前后开始，各种NoSQL数据库开始进入市场。

下图是维基百科上针对NoSQL数据库类型的分类方法：

类型	主要产品
键值缓存	Apache Ignite, Couchbase, Coherence, eXtreme Scale, Hazelcast, Infinispan, Memcached, Redis, Velocity
键值存储	ArangoDB, Aerospike, Couchbase, Redis
键值存储 (最终一致)	Oracle NoSQL Database, Dynamo, Riak, Voldemort
键值存储 (序列化)	FoundationDB, InfinityDB, LMDB, MemcacheDB
元组存储	Apache River, GigaSpaces
对象数据库	Objectivity/DB, Perst, ZopeDB
文档数据库	ArangoDB, BaseX, Clusterpoint, Couchbase, CouchDB, DocumentDB, eXist-db, IBM Domino, MarkLogic, MongoDB, Qizx, RethinkDB, Elasticsearch
宽表存储	Amazon DynamoDB, Bigtable, Cassandra, Scylla, HBase, Hypertable
多模数据库	ArangoDB, Cosmos DB, OrientDB, MarkLogic

读者可以忽略其中的细节技术语言，只需要了解不同类型的NoSQL数据库会有利于特定场景的应用开发。比如文档数据库采用JSON格式存储，可以随心所欲定义不同的数据结构，而且横向扩展性很强（数据规模增大后可以保证查询效率）。我们明道云的工作表就是利用了文档数据库MongoDB作为存储方案。

NoSQL数据库普遍支持分布式文件系统，所以都具备很强横向扩展性。和关系数据库相比，NoSQL数据库大多不具备事务一致性，但是这个牺牲交换得到数据处理的效率，因而作为大数据技术相关的常见存储方案。

云计算平台上的大数据服务

以上我们介绍了大数据技术发展依赖的各个重要技术栈。很显然，和传统的应用开发相比，大数据技术相对更加复杂。它不仅涉及复杂的编程框架，还需要一个专业的运维体系。这使得大部分普通企业用户很难自己来搭建大数据开发环境。所以云计算平台在基础云服务之外，也开始结合云计算资源提供大数据服务。阿里云上的MaxCompute是一个全托管的大数据SaaS服务，用户甚至无需管理主机基础设施，直接按照大数据计算任务量付费。顺便说一下，这种直接将计算服务提供给开发者的模式被称为“无服务器”（Serverless）计算，它的目的是为了简化开发工作中的运维任务，让开发者聚焦在应用开发上。不仅仅是大数据领域，在AI，物联网等其他技术领域，无服务器服务模式正在日益成为主流。E-MapReduce则是一整套大数据相关的PaaS服务，用户可以选择利用现成的服务在自己控制的云主机上完成部署，客户主要支付的是基础云的资源费用。和阿里云类似，亚马逊AWS等其他云计算平台也提供丰富的大数据相关平台服务。

应用领域

我们前面提到大数据技术起源于搜索引擎应用。在随后的十多年中，它的主要应用场景依然还是在互联网领域。最常见的应用包括计算广告（依据用户和内容数据动态决定广告投放策略和定价），内容检索和推荐（百度、头条），商品推荐和营销活动优化（淘宝、拼多多）。不要小看这几个场景，它们几乎和互联网用户上网过程中的每一分秒都有关系，所以创造了巨大的经济价值。

数据的价值当然不仅仅局限于互联网行业，几乎每个产业都有机会在大数据技术的帮助下发掘出数据的价值，或者改善运营效率，或者发现出新的业务机会。金融行业是较早的受益者。银行贷款业务中的风险控制、零售和结算业务中的欺诈发现、保险业务中的精算和保单个性化定价、证券行业中的期货定价和股价预测等都实实在在在创造出财富。

大数据在研究和开发领域也在大显身手。在生物医药领域，大数据技术在帮助缩短药物研发的周期和提高成功率；合成化学行业也在利用大数据和机器学习技术来加快发现新材料。有人甚至认为数据科学将成为实验、推演和仿真以外的一种新的科学研究方法，成为“第四范式”。

大数据在城市交通、社会治理、能源传输、网络安全、航空航天等领域也都已经有了现实的应用。但在这些资本投入密集的领域之外，大数据在一般行业和企业中的应用依然道路曲折。这不是因为大数据技术不够完善，而是诸多行业尚未能够明确抽象出大数据应用的价值以及可付诸实施的方法论。正如前面提到的，云计算和大数据对于普通中小企业来说依然是一个模糊的技术工具，一般企业也很难雇佣大数据专家，而专业服务企业目前还没有找到利用自己的技术专长提供普遍服务的有效机会。通用领域中的大数据应用还停留在理念阶段。所以，在过去几年出现的大数据技术公司大多都还在服务金融、公安、交通、能源等大客户集中的行业。

突破的关键点可能在两个方面，一是大数据技术栈本身十分复杂，当下的工具还依赖专门训练的计算机专家，产业还没有抽象出一个通用领域的应用模型，也无法提供一个类似SaaS这样友好的应用界面。这值得数据技术领域和企业应用领域中的跨界专家来探索。二是企业数字化建设还刚刚开始，很多企业缺失稳定和可靠的数据采集和记录的过程。如果没有数据流，自然就不会有大数据应用。因此大数据技术被广泛应用可能还需要五到十年的时间。

人工智能（Artificial Intelligence）

人工智能的概念和基本原理起源早至1950年代。早期的人工智能研究集中在加州大学伯克利分校，麻省理工，斯坦福和南加州大学等计算机实验室中。今天已经商业化的神经网络算法就来自于半个世纪多前麻省理工大学的明斯基教授发表的《感知元》论文，但是计算机算力在当时实在是太弱了，以至于任何计算理论上的假设都很难付诸于现实。因此，在长达五十年的时间内，人工智能技术都停留在理论研究和一部分不成功的实践上。

虽然人工智能领域经历了漫长的冬天，但它所提出的机器向人类学习，并最终在特定领域能够做得比人类更好的假设却是千真万确的。

千禧年后的AI复苏

2000年以后，有几大动因推动了人工智能概念的复兴。首先，因为摩尔定律的存在，计算机的运算速度和单位存储成本均用指数速率发展到一个新的阶段。云计算和大数据技术也允许计算机用很快的速度处理TB甚至PB级的数据。其次，网络服务的兴起在诸多领域生产出丰富的数据，Google，Netflix和Amazon的业务就像数据机器一样，每分每秒都能产生海量的用户行为数据。

第三，在人工智能的数学方法研究中，AT&T贝尔实验室的三位科学家（Tin Kam Ho, Corinna Cortes, 和 Vladimir Vapnik）在机器学习领域取得了突出的进展。机器学习技术可以将复杂和不确定的非线性问题通过线性的数学公式来解决。在解决不同的问题的过程中，机器学习理论方法和实践被明确验证。最早的一批互联网企业，包括Google，Facebook，Linkedin等在这个过程中既提供了海量数据，也从研究过程中获得了巨大的成果。尤其是Google，它是机器学习及其分支深度学习领域最重要的信奉者和推动者。2010年，Google成立了Google大脑，一个专注人工智能研究的内部组织，后来又收购了英国企业DeepMind。后者在2016年3月击败了人类围棋冠军李世石。

下图是Tom Siebel在Digitlal Transofrmation一书中对AI技术进化史的一张插图，显示了从1950年代开始到现在的主要技术迭代历史。

机器学习（Machine Learning）

机器学习是推动AI复苏的最重要动力。它的兴起标志着人工智能很长时间弯路的终结。要想让机器比人做得更好，并不是依靠人来教机器规则，而是让机器从历史数据中学习。比如最常见的机器学习场景——物体识别，要想让机器从各种照片中找出“猫”，只要让机器学习各种各样猫的照片对象。机器学习算法会将训练用的猫图像背后的向量特征总结为一个预测模型，让这个模型预测任何一张新图片中包含猫的概率。同样的道理，语音识别、语言翻译、人脸识别等都是使用的类似的原理。喂养算法的数据量越大，通常预测的准确率就越高。

机器学习应用可以分为有监督学习和无监督学习。前者需要人工参与训练数据的标识，后者则通过数学方法自动聚类出存在相似性的对象。在缺少训练数据的情况，无监督机器学习就会起到更大的作用。

机器学习的一个分支被称为深度神经网络（DNN），它的设计已经高度参照了人类大脑神经元的连接结构。在深度神经网络中，数据被输送到输入层，结果则从输出层产生，在输入层到输出层之间存在多个隐藏层，每一层会对输入数据的各个特征进行推断，最终能够得到更为准确的预测结果。打败李世石的AlphaGo就是一个基于深度神经网络的算法。但是，DNN对于用户来说依然是一个黑盒子。设计者并不需要也不会知道神经网络中的每一层到底在判断什么具体特征，以及它是如何分解特征的。它背后都是高度抽象的数学方法。不管它有多么玄妙，深度神经网络的确厉害，它不仅具备高超的自学习能力，而且还简化了传统机器学习中大量复杂和耗时的特性工程（Feature Engineering，通过行业专有知识来调优机器学习算法的过程）。

TensorFlow

2015年，Google开源了内部的TensorFlow框架，开始将人工智能计算框架作为一项云计算服务向外界提供。在核心开源库之后，TensorFlow还陆续推出了Javascript版本，满足在浏览器和Node.js上开发和训练机器学习模型，以及在移动设备和IoT设备上部署的Lite版本。另外，TensorFlow Extended是一个端到端的机器学习生产平台，它连带提供了编程环境和数据处理工具。

当然，TensorFlow并不是唯一的机器学习框架，Caffe，Torch，Keras等都是。它们无一例外都是开源的。在云计算的前沿领域，软件开源是一个普遍的策略。为什么如此复杂和高级的软件都会义无反顾地选择开源呢？一方面因为框架性产品本身并不直接包含商业价值，价值需要开发者进行二次创造，另一方面，在云计算服务的商业模式大前提下，通过API来提供封装好的人工智能服务是一个非常容易实现的商业手段。这些开源产品的运营者没有必要对框架进行收费。

人工智能服务

事实上，即便你不使用这些机器学习框架，也能直接使用人工智能服务。国内外云计算平台都已经在通过API提供各色各样的人工智能服务。这些服务已经完全封装成应用开发接口，开发者完全不需要了解和处理复杂的机器学习过程，只要把自己当作用户就可以了。

但是这些服务都非常具体和专向，并不存在任何通用的AI接口，每个接口只能为用户解决一类具体问题。以下是阿里云AI类目下的服务分布。你可以看出这些服务都和用户的某一个具体需求有关。比如语音识别可以让移动开发者开发出让用户直接通过语音来控制功能的应用。人脸识别可以识别出影像中的人脸对象和实现身份对比验证。

提供一次此类服务要收多少钱呢？在云计算平台上，这类AI应用开发接口大多按照次数或者每秒次数级别（QPS）进行收费。比如识别一张身份证上的信息大约要收取1-5分钱，听起来不少吧？

实际上，从事人工智能技术的企业并不仅仅是云计算平台提供商。比如中国市场中，Face++，科大讯飞、商汤科技、寒武纪、优必选等都分别在计算机视觉、语音、机器人等领域有专长。但是它们的专向定位让这些企业很难提供普遍的开发者服务。因为开发者往往希望在一个云计算平台上获得一揽子服务，而且用户的基础云资源也是从云计算平台购买的。作为开发者来说，拥有一个统一和完善的应用开发环境是非常重要的。

所以，在人工智能的商业化中，还有不少企业利用自己的专向技术优势来解决更加细分的问题。比如科大讯飞主要通过自己在语音和自然语言处理方面的技术积累为教育和司法等行业提供解决方案，中国法院的庭审文字记录现在很多都是通过自动化的语音转录而实现的。商汤科技和旷视科技则主要在智慧城市和安防领域提供软硬件一体化方案。还有一组创业企业专注于解决高价值的自动驾驶问题，并从中派生出更细分的AI芯片设计和制造企业。

技术栈和人才

AI相关的技术栈是前面介绍的大数据技术的一个扩展。也就是说，没有离得开数据获取和处理的人工智能项目。要把如此众多的开发框架和微服务组合在一起，对于非云计算专业企业来说是非常困难的。除了技术栈的复杂性以外，开发者还需要搞定大规模训练数据的获取和处理过程，这个成本在短时间内一定会成为牵制企业投入的因素。

成本还是相对容易克服的问题，因为只要问题足够值钱，有长期主义价值观的企业总是愿意投入。但是更致命的问题在于AI相关人才的激烈竞争。能够从事AI应用开发的团队需要包含大数据相关的数据库专家，深谙数学建模的算法专家，以及熟练掌握C++或Python等编程语言的高级程序员，同时还离不开有技术素养的业务专家参与。而在当下阶段，云计算巨头企业和专业企业像吸铁石一样吸引走了绝大多数专长人才，让普通企业根本无从获取。

考虑到AI技术的复杂性和专业度，它极可能像云计算服务一样，大多数企业都只会成为用户级别的角色，这就给专业开发者留下了创新的空间，看谁能够进行足够合理的抽象，组合出更加易用，面向通用业务场景的AI服务。

物联网（Internet of Things）

消费产品引爆的物联网普及

云计算服务的普及不仅为用户提供了弹性伸缩的经济性，还提供了一个泛在的可连接性。任何计算设备只要连上互联网，就彼此通过TCP/IP协议能够相互访问。这个互联价值在物联网技术发展之前还仅仅限于传统计算设备，也就是服务器和个人计算终端。在个人、家庭和企业世界，还有大量非传统计算设备并没有联入这个数字化世界。

汽车、家电、个人穿戴设备、工厂的制造设备现在都已经有接入互联网的条件，市场上流通的这些互联智能产品也越来越多。当连接的设备丰富到一定程度的时候，各种智能化场景才能真正实现。IHS Markit预测到2025年，全球联网设备总数量将达到750亿个。万物互联，正是物联网技术所追求的愿景。

具有数字化连接能力的非常规计算设备在上个世纪90年代就已经出现，比如可以无线连接的摄像头。真正具备中长距离连接能力的设备首先出现在零售和工业制造领域，包括西门子，通用电气等企业开发的工业设备互联协议（M2M）。在当时，这些设备已经可以通过低速的无线局域网使用IP协议连接到工厂的控制中心。这样的网络被成为工业以太网。但当时商业互联网并没有开始发展起来，所以M2M的出现只能算作是物联网技术的局部发展。

物联网开始成型还是通过消费产品市场来推动的。2000年代初期，LG率先推出了可以接入互联网的家电产品，一台联网冰箱售价高达20000美元，这显然无法真正带动市场。在随后几年中，像Garmin GPS和Fitbit智能手环这样的消费电子产品开始获得更大的产销量，从而带动相关的低功耗芯片行业发展。到了2011-12年，消费电子领域出现了更多的明星级产品，这其中包括后来被Google收购的家用传感器Nest，Philip推出的Hue智能灯泡等。在中国市场，以小米为代表的智能手机厂商开始扩展到物联网产品领域，推出了一系列围绕个人和家庭的智能设备和家庭网关产品。苹果也于2015年正式进入可穿戴产品市场，推出了Apple Watch，后来还推出了智能音箱HomePod。Google和国内的互联网巨头企业也都加入了这场通过新型个人数字设备争夺用户和数据的竞争。目前，全球可穿戴产品市场已经多年保持了40%以上的年度增长率。

个人和家庭智能设备的量产促进了和物联网相关的协议发展和元器件成本的降低。在这期间，蓝牙5.0，WiFi-6，IPv6，NFC和RFID等关键传输和通信协议得到进一步发展，让设备能耗和连接速率都进一步提升。在同一时间，云计算基础服务和大数据处理技术也起到了关键作用。物联网设备往往在短时间内会产生大量数据，如果没有前文提到的大数据技术栈，传统的数据库工具是无法承载的，同时云计算也是设备数据汇聚的海洋，今天几乎所有的物联网技术平台都架构在云计算平台上，他们是典型的互生行业。

物联网的技术栈

物联网相关的技术栈非常综合。它横跨软硬件，既包含感知探测相关的硬件技术，也包含网络传输和应用构筑的软件技术。直至今天，物联网相关的技术栈都没有完全稳定下来，甚至很可能长期保持多元的特征。但是概括起来，整个技术栈还是有一些层次特征。

行业一般把物联网相关的技术架构分解为四层，分别定义为和物理环境相关的设备感测层、和数据传输和通信有关的网络层，IoT相关的平台管理层，以及最终实现用户价值的业务应用层。无论是针对消费市场还是企业市场的物联网系统都会有这四个层次。

设备感测层是由各种类型的传感器和可交互访问的硬件模块及其嵌入式软件而组成的。例如温度湿度传感器、摄像头、电源开关和插座和网关等。感测层设备不仅是单向获取数据，还可能从外界接受指令改变硬件状态（比如智能锁）。行业内一般把这个层次称为“边缘”（Edge）。

设备感测层的技术栈主要由软硬件协同开发的嵌入式系统构成。我们用的智能手机本质上也是一个嵌入式系统，只是它的嵌入度非常完整，甚至不亚于一台标准计算设备。嵌入式系统开发经历了早期的单片机和嵌入式操作系统/CPU阶段，目前最前沿的是SoC（片上系统），把一个专用系统的所有嵌入式软件完全整合在一个集成电路上。今天的智能手机、智能电视等都是由若干个SoC整合而成的。在嵌入式系统中，固化在硬件上的软件程序甚至依然可以得到更新，而且这种更新目前大多都可以通过连接互联网实现，这种升级被称之为OTA （Over-the-air）更新。

另外，设备感测层还需要解决设备的访问协议问题。物联网系统目前已经广泛支持IPv6协议。IPv6能够提供全球的IP地址总量高达2的128次方，这是一个天文数字，可以确保任何物联网设备都能够拥有独立的IP地址，从而实现在全球的唯一寻址。当全球物联网设备达到千亿，甚至万亿数量级的时候，IPv6功不可没。

网络传输层要解决的是感测设备和计算设备之间，以及最终与平台管理层之间的数据传输问题。根据连接性质不同，又可以分为短距、中距和长距类型，以及有线和无线类型。在这些连接协议中，蓝牙、NFC、Wi-Fi、无线射频（RFID）、4G和5G等是比较常用的。这些传输协议在设备侧一般都是直接设计在板上系统上的，通过IP协议提供可访问地址。开发者需要根据连接的距离、速率、功耗和成本等要求做出合理的选择。

IoT平台层是物联网系统中至关重要的部分，它的出现也标志着基于云计算平台的物联网系统诞生。一个IoT平台的核心作用是管理成千上万的物联网设备，包括他们的状态，数据上报接收，建立对它们的控制，对设备进行运维分组，并能够实现从云端往边缘侧的更新推送（OTA）。同时，物联网平台也要借用上文提到的大数据技术栈，对设备上报数据进行处理，并用各种数据库完成存储，这其中比较重要的数据库类型就是时序数据库。

更完整的IoT平台还包括围绕设备数据建立自动化工作流的能力，数据分析工具以及为更上层的应用开发提供数据开发接口的设计。

目前，主流云计算平台都专门为客户提供了物联网技术平台，结合基础云和大数据相关服务获取增值业务收入。阿里云，AWS，Azure和Google Cloud都有专门的解决方案，国内外也有专门的物联网平台技术公司将自己的解决方案架构在基础云上或者提供跨云服务。

Oracle，Salesforce和微软Azure等企业软件厂商的物联网平台不仅提供了上述基础服务，还结合了自己的企业应用套装优势，提供一站式的物联网应用开发平台。它们更适合企业物联网系统建设。

最上一层的应用层是整个物联网技术架构中最不标准化的部分。应用层最终要将连接的设备和数据用于具体的商业场景。比如共享充电宝就是一个物联网系统，它的应用层包含面向C端的租用和支付系统，面向商户的设备状态报告，收益结算系统，以及面向运营部门的设备运维管理系统。换到另外一个物联网场景，应用层的构成可能完全不一样。

边缘计算和AIoT

物联网技术架构的基本思路是分层分工，感测层主要取得数据和建立对物理硬件的控制，数据通过网络层和计算平台连接，计算则在云端完成。但是随着物联网应用场景的丰富，设备规模的扩大，以及芯片技术的发展，边缘计算概念开始得到认可。所谓边缘计算，就是利用设备端和邻近网关的计算能力处理和存储数据，减少和云端的数据传输，从而实现更快速的应用响应。除了速度的提升，边缘计算还能够大幅减少云计算和数据传输成本。比如针对一个大型的视频监控网络，如果摄像头将所有的视频流数据都传输到云端，云端算力要求和成本将会非常高。而如果在摄像头设备内部实现必要的视觉计算（比如识别异常），整个物联网系统的效率将大大提高。再例如广泛应用的人脸认证和识别系统，如果不能依赖本地的设备计算能力，十亿用户的高频度使用将会让云平台不堪重负。

上面两个例子显示了边缘计算往往和人工智能应用相关，设备侧往往完成的是模式识别类的人工智能算法，因此往往需要专门芯片的助力。Nvidia公司推出的Jetson系列模块就是专门为边缘计算场景而服务的。这些芯片模块被安装在机器人、自动驾驶汽车等边缘设备上，所以这组技术产品也被称为“自主机器”。因为物联网和这些人工智能应用的结合，因此，这套技术方案也常被称为AIoT。

应用领域

如果把2012年前后作为基于云计算的物联网平台技术发展开端的年份，仅仅八年左右的时间，物联网应用领域已经发展得非常广泛。只是我们身在其中，享受它带来的便利，并不一定能够感知它的存在。这个高速发展过程很大程度上受益于基础云计算服务和大数据技术栈的同步发展。

在消费应用领域，个人穿戴设备已经从手表、手环发展到耳环戒指这样的杂项。在智能家居领域，我们可见的家电、门锁、照片、开关、音箱等都已经是互联网设备。在个人和家庭领域，物联网技术竞争已经不再重要，竞争的焦点已经迁移到内容生态和用户网络效应。在这些领域，苹果、谷歌和国内的华为、小米等已经牢牢占据了领先地位。小米生态链重点指的就是依托米家体系的一群消费电子产品企业。

在工业、农业、交通运输、能源和社会管理领域，物联网的应用场景更为广泛。我们的街道上已经密布了各种摄像头，这些摄像头通过专门网络构筑了天眼系统；我们头顶上的电力传输网络和用电单位终端也已经完成了智能电网改造；矿场和工地上也都布满了各种安全监控设备。这些都是最近十年来重大的IT投资。预计未来十年这样的建设和更新依然不会结束。

云计算的未来

本文主要是对云计算过去十五年的一个回顾。技术领域的发展速度是如此之快，以至于我们很难预测未来的十五年会发生什么。在本文的最后，我仅仅对当下已经呈现的云计算市场趋势做一些简单的概括，它们甚至已经在发生，但我们不知道这些技术趋势的发展具体会颠覆哪些巨头，会催生出哪些明星。

存储和计算的成本将进一步下降，但消耗会同步增长。考虑到全球范围内的计算服务还有大量没有转移到云计算环境中，未来十年基础云服务的算力还会大量增加，服务单价会持续下降。

前沿技术将持续融合到云计算平台，包括量子计算、AR/VR、区块链等。尤其是那些依赖海量数据计算能力和弹性计算资源的应用，云计算是成就它们更快成长速度的轨道。

云计算的核心竞争将聚焦在应用开发环境的优越性上。谁能够提供廉价、完善和前沿的开发技术栈环境，谁就能够获得更多的开发者用户。当开发者用户选择了云服务商后，他们其实就为终端用户做出了选择。
多云、或称混合云环境成为长期的企业应用策略，云计算用户将综合使用边缘、各个云计算服务商和自有IT设施。
云计算开发技术栈会越来越复杂，这会让应用开发领域的分工更加明确。面向终端用户的应用开发将变得更加简洁，应用生成的方式会越来越多元，无需编码，依靠普通业务用户建立应用程序的服务商会越来越多。

本文作者是明道云创始人，明道云是一个零代码应用平台厂商，通过可视化方式帮助企业用户建立中后台企业应用，具备快速搭建，灵活调整，数据贯通和简单易学的特点。

你可能感兴趣的:(人工智能,scipy,makefile,crm,lighttpd)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
Makefile问答之 04 优化异常与警告设置捕鲸叉 Linux使用 Linux系统编程 Makefile linux
Makefile怎样指定优化选项，包括编译和链接优化，常用的选项有哪些？在Makefile中，你可以通过设置编译器和链接器的选项来指定优化选项。优化选项可以分为编译优化和链接优化，以下是如何在Makefile中指定这些选项，以及一些常用的选项。示例Makefile#编译器CC=gcc#编译选项CFLAGS=-Wall-O2#链接选项LDFLAGS=-O2#需要链接的库LDLIBS=#目标文件TAR
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
如何运用SCRM系统做好客户管理？腾迹 big data 产品运营大数据
随着互联网的更新迭代发展，大部分的企业都是有在应用SCRM系统来进行客户关系管理，丰富、完善用户标签，从而更加了解消费者所需要的产品和服务。SCRM的全称是SocialCustomerRelationshipManagement，是社会化客户关系管理的简称，主打的是以客户互动为中心，增加参与体验、互动了解，创造双向价值的工具。SCRM更加以消费者为中心，并且重点关注充分发挥每个消费者的社交价值，实
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
企微scrm系统如何打造本地私域电商平台 ZHENKESCRM 企业微信
随着网络的发展，很多的品牌商家都已经明白了私域的重要性，也已经纷纷入局私域。企微scrm系统如何打造本地私域电商平台已经成为越来越多企业关注的问题。而很多客户的微信里也已经添加了N多品牌的企微号，同一品类，客户同时接收着不同商家的信息，也进入了不同商家的私域池里，客户和商家已经形成了1对N的局面。面对这样的现状，对商家来说，已经进入了私域博弈的阶段，大家面临着私域存量客户之间的竞争。不仅仅是如何引
SCRM产品助力电商行业发展 Ajdbjdbf 内容运营用户运营产品运营
基于企业微信的营销与服务平台，聚焦“引流获客”、“营销转化”、“运营管理”三大场景，帮助企业解决获客难、运营效率低、客户资产流失等问题，帮助企业利用好企业微信实现增长。在电商行业，有以下几大痛点:主流平台流量越来越贵，获取新客户的成本不断攀升；原有的触达客户方式逐渐失效，高效的触达客户工具没有启用；营销活动每天都在进行，但效果并不理想；客户画像不清晰，推荐产品转化差。如今电子商务已经进入新零售电商
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {