Go中国

饿了么混合云架构探索

本文根据饿了么 CTO 张雪峰在 2017年 ECUG 十周年盛会上演讲的整理

压力还是蛮大的，因为技术会议越来越多，商业味越来越重。但是不写公司名字或者介绍一下业务的特点，其实很难去讲。像我们这种每天"送盒饭"的，有什么技术含量？大家抛开公司名字，看这个行业，业务特点比较重的，或者偏线下的，很多时候所谓的架构或者演进大部分时候都是被逼出来的，也没有太多的前瞻。技术什么时候还债、变革或者跟上一些潮流趋势，我们是根据业务来判断的，分三个阶段：第一是冒烟；第二是小火；第三是大火。我们能够做到的是尽可能在冒烟阶段做一些技术的变革。如果出小火的时候再做技术的改革，那就有点晚了。到大火的话，相当于被逼的没有办法了。我原来也是想纯粹搞技术，写一点好玩的东西。后来进到一个专注具体业务的公司，发现先要活下来。不同的公司会有一些差别，我对美团也略有了解，我们在技术上还是略微有一些差别，尽管是在同一个行业。

我今天的演讲分为四个部分：

挑战（challenge）。有些技术是普适的，通用的，比如我们一直在用的TiDB，再比如office一类的软件，但我们的并不是将解决方案（solution）卖给谁。有一些欧洲和美国的朋友找到我，说我们在那边copy一套是不是就能work，这是不现实的。我们现在值钱的不是代码，而是一批对业务了解的人，能把业务跑起来。所以我们与通用技术的差异是比较大的。

架构（architecture）。architecture里有一张图是家家都有的，大同小异。但为什么我们到今天折腾成这样一张图，而不是在三年前？因为这里面有很多现实的困难。

拓扑和数据（topology & data）。这里会有带说明的拓扑以及一些数据。数据其实有很多辛酸在里面，也出很过很多宕机，线上业务最怕的就是宕机。
正在做的以及未来计划（doing & planning）。这里是有点精神追求的，我们现在处于冒烟的阶段。

Challenge 1

图1 下单量随时间的变化

大家看一下，这就是行业的特色，绿色不要管，是一些异常。这是下单量，其实前端流量更大，两者有一个转化。电商在国内有这样的曲线，应该只有外卖这个行业，我们二家（饿了么和美团）都差不多。业务上要“削峰填谷”是很难的，我们做那么多年的努力才培养出来这样的习惯。但是技术上要想办法。看到这张图大家会不会想，你们这家公司不搞云计算，机器浪费超级严重。我告诉大家，就是非常严重，但是没有办法，我现在做的容量规划就是基于波峰来做。我们也想给公司节省成本，IT 部门投入蛮大，公司也不会削减预算。我们现在很在意成本，因此在考虑怎么给公司减负。

Challenge 2

图2 challenge 2

今天主要讲云、后端的冲击、在“削峰填谷”上面我们要做什么事情以及为什么要做混合云。我作为程序员，最喜欢的就是简单，能用钱砸的就不要安排一堆人去做。但是现在混合云越来越复杂，还要做很多调度器之间的适配。比如 YARN 怎么跟 ZStack、Mesos 适配。我们是重度的 Mesos 用户，做了大量的二次开发，适配是非常麻烦的。高并发或者秒杀的冲击还好，最大的问题是成本：怎么提升单位运营的效率。公司拼到最后，活下来就是拼效率，不是拼谁钱多。一切围绕着效率来走，在这个出发点下我们做了一些架构的改造。我们原来做灾备，相对容易些，但后来灾备也做不下去了。这不光是一个排除法，之前踩的坑对你做下一个选项是有价值的。

Architecture 1

图3 architecture 1

5年前我们没有这张图，是人肉运维，那时才叫 DevOps（a software engineering culture and practice that aims at unifying software development (Dev) and software operation (Ops)）。为什么呢？因为我们的工程师就是 Ops，没有专门的 Ops 团队。三年前我进去发现很夸张，就一个专职 DBA（Database administration）和一个 Ops。后来发现不行，要招人，完全超出你的想象，招一堆人写业务逻辑。业务逻辑没有办法智能，也没有办法像刘奇他们招三个中国最顶尖的程序员就可以搞定。对业务逻辑是这样的，我们已经抽象了还是不行，业务逻辑 AI 解决不了。后来发现招人不行，做的乱七八糟的，系统也老挂，我也不是吐槽 Pyhton。我们最近也做了大计划，大概会省几亿的人民币，就是 Python 转 Go，因为大部分流量靠 Python 扛的，集群压力也是蛮大的。用 Go 的话（成本）大概除以5。但这个写 Python 的同学很牛，除了 DBA 没干基本上啥都干了。后来拆分出了乱七八糟这些东西，现在看起来蛮漂亮的，花了我们很长时间。

今天讲 IDC（Internet data center）+ Cloud，因为我们自己有 IDC，总不能报废吧？虽然机器三年折旧，但我们每年还会有一些增量补上去，而且我们还有一个很大的运维团队。Cloud 又复杂了。我们基本上把国内四大云都用遍了，腾讯云我们原来是第一大用户，百度云也是第一大用户，阿里云不是第一估计也是前三的，然后还有七牛云，总之四大云把我们都裹在里面。

Architecture 2

图4 architecture 2

最早我们想做灾备，但灾备有一个有个很大的麻烦，就是真到灾难的时候不敢切换。我们当时做的灾备不顺利，最大的开销不在部署而在测试，因为灾备是没有生产流量的，验证起来很困难。业务逻辑还好，比如多了个接口，少了个应用，从异步变为同步，但也很令人崩溃。这一堆的事情最后让我们暂停了项目，这个项目（灾备）是我发起的，也是我叫停的。这其实是个赌局，包括google、TiDB是不可能保证100%可靠的，总有一定的概率，无非是几个9。

我们的（多活架构）coding & deploy & 测试加起来就三个月，前期准备了9个月。好多团队异地多活很容易，三个月就可以搞定，其实不然。首先，异地多活不是一个技术活，要想清楚业务需不需要。我们是被业务逼得没办法，因为灾备没有搞好，现在觉得灾备也确实不好搞。所以在偏业务的公司搞技术是一件很麻烦的事情。

讲一下 global zone。我们有两种 transaction，一个是下单，一个是配送。大部分 transaction 都可以在一个机房完成，但还有一些东西是绕不过去的，需要用到 global zong。百度也做了多活，叫“同城多活”，严格意义上那不是多活，“同城”就类似于 global zone。要是仅仅安于北京和上海，其实BGP放哪里都无所谓，但如果要打两百个城市，在一些三四线城市，你根本没有办法。因为我们是 IDC 不是云，云你是无所谓在哪里的。我们的异地多活是被迫的，我很喜欢百度的“同城伪多活”。百度外卖用的百度云在广州有两个机房，延迟大概2ms。只有一个地方有 master ，流量是均分的。如果流量跟 master 的 DB 不在一起，就会通过专线同城穿一下，这就相当于我们的 global zone。

Architecture 3

图5 architecture 3

这是典型的南北线，但其实也不是南北的线，是根据流量切分的。

Architecture 4

图6 architecture 4

我们有4个调度器，非常的头疼。我们讲一下 ZStack，在 Docker 没推之前，基本都是在 ZStack 上，也就是虚拟机，物理机没有特别的调度。我们大概有20%的节点部署了 Docker，有多公司已经100% Docker，但我们现在做不到，有一些现实的困难。Docker 也有一点麻烦，有些集群是没法迁 Docker 的，比如 ElasticSearch 这种有状态的服务。我们现在也开始自研分布式存储系统，从 EMC 挖人来做，但还处于冒烟阶段。

再来说说大数据的 TP（Transaction Processing）和 AP（Analytical Processing）。我们的AP原来基本上都在 YARN 上面。大家可能会诧异，我们现在这样的一个情况，为什么不是 Kubernetse。也是被逼的，开始就没有打算用 Kubernetse，而是用Mesos。很多时候跟你的团队有关，团队在上面已经很长时间了，业务也比较稳定。Kubernetse 太复杂，上手也比较重。现在上 Kubernetse 也是被逼的，因为要用 Google 的东西，我们现在有一个机器学习平台，除了spark，spark也有机器学习。但还有一些同学，特别是用惯 python 的，用惯 tenserflow 的，我们现在都走 elearn（自研AI over Kubernetse）。大家会感觉很诧异，我们居然不是在TP上部署 Kubernetse。我们TP上现在主要是 Mesos 和 ZStack。

Cloud 更麻烦了，现在饿了么这边主要还是阿里云，百度外卖那边主要是百度云。百度云等会讲，也有很头疼的，前两天跟他们聊，也是很痛苦的。我们的团队坚持要用物理机的，原来在腾讯云上面的时候，我们就有自己有物理机，并且挪到了腾讯云的机房。但现在阿里云不能让我们把自己的机器给挪进去的。怎么办呢，其实在今年云栖上已经提到了，我们算是第一批用的。我们要坚持要用物理机，否则 IO 密集的任务根本跑不起来。RDS（Relational Database Service）我们也试过，但只是用在测试。我们所有的程序员和 QA（Quality Assurance）用的环境都是在阿里云上面，是用 RDS。当然还有重要的原因，那就是 RDS 太贵了。我们也会在Cloud上部署二次开发的 Mesos。

Topology & Data 1

图7 topology & data 1

大家可以看一下，黄框基本上都是机房，包括 IDC 和 Cloud。最麻烦的就是北京一个，上海一个。在我们上海新机房没有开之前，大数据的 AP 和 TP 是混合部署的，但这个混部其实是隔开的，并不是真正意义上在一个 node 混部。这边是阿里云华东和阿里云华北，腾讯云其实快下完了。另外还有一些专线，也就是两个支付（微信和支付宝）。原来两个支付是不走专线的，后来发现走公网很难忍受的，峰值的时候稍有抖动就受不了，一秒钟可能1万个订单就没了。在支付这个环节丢掉客人是最伤的，一开始APP打不开就认了，最后什么都走完了，最后支付不成功，就很麻烦。我们专线非常多，每条线都是一个环路。现在广州百度那边，百度云不是一个大的 IDC 架构，那边是完整的体系，到上海两个机房要做两条专线，每一条都是环路，也很很复杂。我们内部最头疼的不是 IDC，是各种专线，非常复杂。还有到我们的 office，还要有 POP 点。我也不想搞的那么复杂，把北京的 IDC 废弃不就结了，但是没这么简单。前提是要搞多活，不管是异地还是同城。

Topology & Data 1

图8 topology & data 2

我们现在北京上海两个团队加在一起大概25k个节点。Docker 率只有不到20%，我们的目标是50%~60%，因为有很多是做不了的，尤其是中间件，用 Docker 不划算。大数据这块当时狠了下心，把 TP 的应用全部“干掉”，但现在发现，虽然机房是以大数据为主了，但是AP和TP同城能不能合在一起，好不容易分开现在又要合在一起。现在大数据的机房压力也比较大了，我们业务的增加是 120TB，除了大数据还有我们自己的系统日志、trace 差不多 400TB。每天要处理 3PB，总的存量是 12PB，数据量特别大。

我们现在的系统不能让它出问题，也不能停。昨天也听刘奇讲到，尤其是通用软件的供应商，停一秒钟意味着什么？不管这个客户是秒杀类的还是常规类的业务，肯定受不了。我们还只是为自己的业务提供服务，损失要稍微小一些。但是做公共设施，比如七牛云、TiDB，一旦停顿，所有的用户都找你麻烦，所以我们相对来说压力还算小。我们业务没有办法，逼着我们每天350次发布，现在可能不止了，现在有很多新业务，每天发布好几次。我们大数据非常的烧钱，我们最贵的3个集群：MySQL、Hadoop+Spark 还有 Redis。Redis 还有很大的省钱空间。从经济/效率的角度来看，这个东西放在那儿很浪费。还有大数据的备份，大数据是我们的命脉。网站宕一天我们道歉一下就行了，第二天该来的用户还得来，但大数据一旦出问题，一是数据是隐私，二是数据丢掉或者错乱，会更加麻烦。我们每天做了很多的备份，但后来发现这些备份太冷了，到底划不划算，你不能去赌它，但是成本放那儿太痛苦了。混合云架构是被逼出来的，不是我想搞这些东西的。

Doing & Future（混合云架构）

图9 混合云架构

多活的难点主要在异地多活，同城伪多活是比较容易的，也就是 global zone 这种方式，但同城做真正的多活也跟异地差不多，主要是 latency 的问题，你要自己做 DRC（Data Replication Center），包括 MySQL 层面，Zookeeper 层面和 Reids 层面。我们跟 PingCAP 也合作蛮久了，我也问过东旭，你是不是可以异地机房跨 IDC。这还是一年前，东旭跟我说还没有考虑这个问题，因为没有这样的用户。昨天聊的时候说好像可以支持跨 IDC，而且是北京上海这种35ms的延迟跨度。我们用一个服务，就希望它是跨 IDC 的，主要就是 latency 和一致性，这两个问题很难协调。

还有 Cloud Native，是大势所趋，就像Go语言。冒烟时开始做，太超前了也不行，毕竟要先把业务做起来。但是到小火就比较危险了，我们也曾到小火的时候再去还债，还债还算容易，到小火的时候真的靠人肉上去砸就比较麻烦了。Cloud 肯定会考虑的，混合云虽然听上去很时尚，但是我们步调比较谨慎的。对运维团队也是个挑战，比如 RDS。我们内部数据库也千奇百怪，有 MySQL、MongoDB。你让习惯了敲命令行写脚本的运维变成程序员，我们内部反过来叫 OpsDev，这个难度要远超过 DevOps。我们希望公司所有人都是程序员，但是这个挑战蛮大的。

我们 Serverless 是在线上做了一个系统，但是比较简单。接下来可能会考虑短信推送，移动推送，因为这个只要搭个 Redis，开启就可以直接发送了。对我们来说，Serverless 对复杂业务是走不通的，除非我们全部用 Cloud infrastructure。

Auto scaling 是我们在计划做的，因为多活做了之后才能相对宽松一些，流量想切多少切多少。95%的 transaction 都在同一个 zone 里做完的。不做这件事情就没有办法做阿里云的拓展。阿里云现在可以做 auto scaling，但是成本很高。一般来说云的成本会比 IDC 要高一些，那是不是说做4小时的拉起再拉出（值应对峰值流量）是划算的？我们算了一笔账，发现不一定是这样。如果削峰填谷做的比较有成效的话，就会冲淡 auto scaling 节省的成本。我们和新浪微博不一样，它是不可预知突发事件的，所以只能做 on demand（按需）。虽然我们有很大的波谷差异，但是可以预知的。前两天团队给我一个“炸弹”：我们现在机器利用率很低，我们不是上 Docker 嘛，我们做一件事情——超卖。什么叫超卖？我们原来是一核对一核，现在一核当两核，后来发现还不错，用 Docker 的人感觉没有什么变化。我们继续超卖，一核当三核用，我们按峰值来算的，发现平时的峰值利用率也不是那么高。

Doing & Future（混部尝试）

图10 混部尝试

不管我们要不要做 auto scaling，不管我们业务上要不要削峰填谷，都要做混部。混部百度走的早一些，他们前几年做了一个系统，目的不是要混部，但是要产生一个好的副作用来实现这样的东西。回到业务本身，混部其实很难的，我跟他们聊的时候，说搜索这种业务是可以采用类似于网格计算的，每个格子自己算，然后汇聚。他们有大量的 swap（数据交换），但你让 spark 来做这些东西，比如 machine learning 和 swap，即使是万兆网卡，也会突然把带宽占满。现在机器学习跟搜索或者爬虫可以分而治之的技术不一样，我们叫分布式，有大量的 swap。我们也在尝试，把能够在每一个节点单独计算，不需要大量 swap 的任务放上去。

混部是为了解决什么问题呢？我们业务的峰值非常高，到波谷的时候这些机器就闲置着，那是不是可以来跑一些 job。这个 job 不是指 TP。TP 也有一些 job，但都耗不了多少 CPU。这是不划算的，不能纯粹玩技术，为了玩而玩，我们要解决的是大量的场景。我们能想到的是 Hadoop、Spark，尤其是现在 machine learning 压力比较大。但是聊下来比较难，第一不能异地，第二同城也很难。还有很头疼的挑战：我们大数据团队用的机型是定制的，他们已经习惯了这种机型模板。我们 TP 的模板非常多，已经从上百种压缩到十几种，但还是量很大的，有 API 的，有业务逻辑的，有 Redis 的。如何把大数据或者 machine learning 的任务适配到到杂七杂八的机型是个问题。

我们这个行业经常有促销活动。活动的时候即使有云，也还是要花钱的。所以活动期间可以把大数据任务冻结，释放机器资源用于大促。大部分任务拖延三四个小时都是可以接收的。两边互相的部，首先解决资源隔离的问题，还有调度器。YARN 是很难调度TP的，Mesos 或者 Kubernetse 调度 AP 也是有麻烦的。

我们在研究的问题是 YARN、Mesos 和 ZStack 怎么适配，现在没有搞定。混部的问题早就存在，但是财务上面给我的压力没有到冒烟，所以放最后一页讲。如果饿了么哪天提供了饿了么云，大家不要惊讶，我们不会去做公有云，但是曾经考虑介于 PaaS（Platform-as-a-Service）和 SaaS（Software-as-a-Service）之间的物流云。我们现在有很多的配送并不来自于饿了么，也帮双11配送。现在也有叫闪送，可以在很短的时间送到，一个人送一个件，但是收费比较高。我看到闪送的人直接骑摩托车送的，一般是电动车。很多时候业务发展起来了，正好也帮我们解决了这样的一些问题。

Q&A

提问一：刚才我听到有一个迁移Docker的打算，我不知道出发点诉求是什么？刚才说成本比较高，这个成本是指人力成本还是时间成本？

张雪峰：是说利用率。我们这种业务如果说要扩容，虽然有冷备的机器在，但还是比较慢，Docker现在很快。我们这种业务扩容很正常的，压测不可能压到所有的细节，我们分公共和业务研发团队，公共团队主持这个工作，但是业务不可能了解那么细。业务保证大盘不出问题，现在公司业务小问题尽量小，以前可能就是一个新浪微博，现在就是小问题，机器匀出来做一些其他的问题。成本为什么比较高是吗？不是人力成本，是我们的机器比较差，你先活下来，一开始用钱，其实创业很多时候先用钱换时间，你上公有云，为什么呢？因为钱可能贵一些，但是时间换回来了，我们早年也是这样，钱换时间，因为这个时间过了就倒闭了，倒闭还谈什么。

提问二：刚才听到，您对一些有状态的服务迁到 Docker 里面有一些担心，但是我看到现在 Docker 容器，其实存储的时候有一些插件，不把服务器切到容器上面，细节上面还有什么问题？

张雪峰：不是因为插件，是因为存储，如果我们自己可以搞定，一旦有状态的话存储就搞不定。原来最土的一种办法，我们用所谓的企业存储方案，后来发现不行，量太大，图片还容易解决，我们内部的图片小文件还可以，但不是块存储，我们现在也是用钱换能力，我们有单机的，来做这个还可以的，一旦进入容器里面挑战比较大。不是不能玩，说直白一点，不能让这一块有任何的波动。

提问三：我之前在IBM做过存储和虚拟化适配。你研究的块存储这一块给数据库这样定吗？

张雪峰：对，它不是对象存储，我们的对象最主要就是图片。以前没有踩过的坑里面能够看懂，排障能力，虽然我们不敢用。我只是请某一个EMC的同学帮我们支持这个工作，我不是用EMC，因为互联网公司很少去买软件，我们会买一些我们搞不定的东西。

提问：没有考虑过直接买EMC？

张雪峰：不会。我们这种一秒出来，我给你5分钟先看懂故障在哪儿，如果我们是一个平缓的业务无所谓，大部分都是高峰期出的问题，80%的故障出在高峰期，不是说EMC的产品不是好产品，是我们hold不住。

Kimi Chat 1.5 与 2.0 架构升级对比 charles666666 人工智能 transformer 深度学习产品经理 chatgpt
1.5版的MoE架构优化KimiChat1.5采用了优化后的MoE架构，其核心在于“专家网络动态路由”。这一机制类似于快递系统智能选择最优路径，能够根据输入数据的特性动态分配计算资源。这种优化显著提升了模型的计算效率，同时降低了硬件资源的浪费。在实际应用中，这意味着开发者可以在相同的硬件配置下处理更复杂的任务，或者在有限的资源下实现更高的性能。2.0的混合专家系统创新点与1.5版相比，KimiCh
C++设计秘籍：为什么所有参数都需类型转换时，非成员函数才是王道？讳疾忌医丶 c++前端开发语言
当所有参数都需要类型转换时，为什么要选择非成员函数？在C++的世界里，有一个看似简单却蕴含深意的设计原则：当所有参数（包括被this指针所指的那个隐式参数）皆须进行类型转换时，请为此采用非成员函数实现。这个原则背后隐藏着C++类型系统的精妙设计，也揭示了成员函数与非成员函数在处理隐式类型转换时的本质差异。想象一下，你正在设计一个数学计算库，需要支持整数与有理数的混合运算。如果你天真地将所有操作都实
redis管道 -redis pipeline -redis pipelining shuair redis redis bootstrap 数据库
redis管道文档redis单机安装redis常用的五种数据类型redis数据类型-位图bitmapredis数据类型-基数统计HyperLogLogredis数据类型-地理空间GEOredis数据类型-流Streamredis数据类型-位域bitfieldredis持久化-RDBredis持久化-AOFredis持久化-RDB+AOF混合模式redis事务官方文档官网操作命令指南页面：https
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
探索WPF界面的神器：Snoop 伍霜盼Ellen
探索WPF界面的神器：Snoop项目地址:https://gitcode.com/gh_mirrors/sno/snoopwpfSnoop是一款由PeteBlois发起，并由BastianSchmidt维护的开源WPF应用监视工具。它提供了一种无需调试器就能浏览和操作任何运行中WPF应用程序视觉、逻辑和自动化树的强大功能。无论是修改属性值、查看触发器还是在属性变化时设置断点，Snoop都能轻松应对
基于STM32金属探测器设计
摘要随着便携式金属探测器在安防，考古及工业检测等领域需求的增加，现有探测器的体积大，能耗高，操作复杂的缺点亟需解决。本文针对便携式金属探测器的设计进行探索，在硬件上使用了STM32F103C8T6单片机模块，WL02涡流传感器模块，ADS1115模数转换模块，蜂鸣器模块等设计出本系统的电路，在软件上设计出主程序，信号采集及报警子程序等，对系统进行基础功能，灵敏度，抗干扰和耐久性测试，测试结果表明探
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
AI技术正在深刻重塑A/B测试优化的流程、效率和价值，推动其从传统的“手动实验”向“智能优化引擎”跃迁。 zzywxc787 人工智能
AI技术正在深刻重塑A/B测试优化的流程、效率和价值，推动其从传统的“手动实验”向“智能优化引擎”跃迁。以下是具体变革方向及实际影响：1.实验设计智能化：告别“猜猜看”传统痛点：依赖经验选择测试变量（如按钮颜色、文案），忽略潜在高价值组合。AI解决方案：多臂老虎机算法（MAB）：动态分配流量至表现最优的变体（如：80%流量给当前最优，20%探索新选项），减少流量浪费高达70%（Netflix案例）
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink DataStream API详解（一） bxlj_jcj Flink flink 大数据
一、引言Flink的DataStreamAPI，在流处理领域大显身手的核心武器。在很多实时数据处理场景中，如电商平台实时分析用户购物行为以实现精准推荐，金融领域实时监控交易数据以防范风险，DataStreamAPI都发挥着关键作用，能够对源源不断的数据流进行高效处理和分析。接下来，就让我们一起深入探索FlinkDataStreamAPI。二、DataStream编程基础搭建在开始使用FlinkDa
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch混合搜索深度解析（下）：执行机制与完整流程 GeminiJM ES学习笔记 elasticsearch jenkins 大数据
引言在上篇中，我们发现了KNN结果通过SubSearch机制被保留的关键事实。本篇将继续深入分析混合搜索的执行机制，揭示完整的处理流程，并解答之前的所有疑惑。深入源码分析1.SubSearch的执行机制1.1KnnScoreDocQueryBuilder的实现KNN结果被转换为KnnScoreDocQueryBuilder，这个类负责在查询阶段重新执行KNN搜索：//server/src/main
2025年UDP洪水攻击防护实战全解析：从T级流量清洗到AI智能防御上海云盾商务经理杨杨 udp 人工智能网络协议
一、2025年UDP洪水攻击的新特征AI驱动的自适应攻击攻击者利用生成式AI动态调整UDP报文特征（如载荷内容、发送频率），攻击流量与正常业务流量差异率低至0.5%，传统指纹过滤规则失效。反射放大攻击升级黑客通过劫持物联网设备（如摄像头、传感器）构建僵尸网络，利用DNS/NTP协议漏洞发起反射攻击，1Gbps请求可放大至50-500倍流量，峰值突破8Tbps。混合协议打击70%的UDP攻击伴随TC
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
操作系统线程模型用户级线程内核级线程混合线程多对一模型一对一模型多对多模型 littleAirport~ hqyanyan 操作系统线程
根据操作系统内核是否对线程可感知，可以把线程分为内核线程和用户线程。名称描述用户级线程由应用程序所支持的线程实现,内核意识不到用户级线程的实现内核级线程内核级线程又称为内核支持的线程在只有用户级线程的系统内，CPU调度还是以进程为单位，处于运行状态的进程中的多个线程，由用户程序控制线程的轮换运行；在有内核支持线程的系统内，CPU调度则以线程为单位，由操作系统的线程调度程序负责线程的调度。对于多用户
LLaMA-Omni 深度解析：打开通往无缝人机语音交互的大门 kakaZhui 前沿多模态大模型：论文与实战 llama 交互 LLM TTS 语音识别语音合成人工智能
一、引言：语音交互大模型今天我们来看语音交互大模型LLaMA-Omni，它由中国科学院计算技术研究所的研究者们推出，是一个基于强大的Llama-3.1-8B-Instruct构建的语音语言模型。LLaMA-Omni不仅实现了低至226ms的惊人交互延迟，还能同时生成高质量的文本与语音回复，真正意义上让大语言模型（LLM）具备了“听说”的能力。这篇博客将带你由浅入深，全方位地探索LLaMA-Omni
低成本作弊神器？使用ESP32将通义千问AI接入学生计算器
前因：IT之家9月24日消息，YouTube频道ChromaLock于9天前发布视频，介绍了名为TI-32的改造电路板，加装在德州仪器TI-84Plus图形计算器上，可以接入ChatGPT。IT之家查询公开资料，在PSAT、SAT和ACT大学入学考试、IB和AP考试中，标准化组织已经批准考生使用TI-84Plus图形计算器。ChromaLock探索了该计算器的连接端口，设计了名为TI-32的改造电
BindView失效问题
原因：java和kotlin混合开发时黄油刀BindView失效解决：implementation'com.jakewharton:butterknife:10.2.3'annotationProcessor'com.jakewharton:butterknife-compiler:10.2.3'替换成如下：重点是kaptimplementation'com.jakewharton:butterk
华为 Mate 80 影像配置揭秘：硬软双升 RUZHUA 华为
7月7日，知名数码博主爆料了华为Mate80系列的影像配置，引发广泛关注。从曝光信息来看，Mate80系列在影像方面延续华为的技术探索，通过硬件升级与算法优化，力图为用户带来更出色的拍摄体验。爆料显示，Mate80系列主摄将采用5000万像素的1/1.28英寸超大底传感器，支持物理可变光圈与定制模组。这一配置虽未达到“超大杯”的极致堆料，但在影像硬件上的创新依旧可圈可点。其主摄传感器型号为SC59
探索Python领域pip的强大功能 Python编程之道 Python人工智能与大数据 Python编程之道 python pip 网络 ai
探索Python领域pip的强大功能关键词：Python包管理、pip工具、依赖管理、虚拟环境、PyPI、wheel包、开发工作流摘要：本文深入探讨Python生态系统中pip工具的核心功能和应用场景。我们将从基础概念出发，逐步分析pip的架构原理、依赖解析算法，并通过实际案例展示其在项目开发中的高级用法。文章还将介绍pip与虚拟环境的协同工作方式，以及如何利用pip优化Python开发工作流。最
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
爬虫技术：从基础到高级，探索数据抓取的奥秘
一、基础爬虫：揭开数据抓取的神秘面纱对于初学者来说，基础爬虫是入门的起点。基础爬虫的目标通常是静态网页，这些网页的内容在加载时就已经确定，不需要与服务器进行交互。通过简单的HTTP请求和HTML解析，就可以获取到网页中的数据。在基础爬虫中，最核心的技术是HTML解析。HTML是网页的结构语言，它定义了网页的布局和内容。爬虫程序需要通过解析HTML，找到其中的文本、图片、链接等元素。常用的HTML解
【Nginx学习】7步轻松编译安装Nginx，你真的准备好了吗？墨瑾轩一起学学Nginx【一】nginx 学习运维
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣7步轻松编译安装Nginx，你真的准备好了吗？嘿，小伙伴们！今天我们要聊的是如何从源码编译安装Nginx。这不仅是一个技术活，更是一次对耐心和细心的考验。但别担心，跟着我一步步来，你会发现这其实并不难。让我们一起开始这段有趣的旅程吧！1.选择Nginx版本首先
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
Maven 构建性能优化深度剖析：原理、策略与实践越重天 Java Maven实战 maven 性能优化 java
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
【数据分析】多数据集网络分析：探索健康与退休研究中的变量关系生信学习者1 数据分析 (2025版)数据分析 r语言数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理函数网络分析画图保存图片总结系统信息介绍在医学和社会科学研究中，理解多个变量之间的复杂关系对于揭示潜在的病理生理机制和社会行为模式至关重要。本文介绍了一种基于R语言的网络分析方法，用于探索HRS（健康与退休研究）及其类似研究（CHARLS、ELSA、MHAS、SHARE）中的变
第35周—————糖尿病预测模型优化探索
目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision,torch#设置硬件设备，如果有GPU则使用，没有则使用cpudevice=
【Python-办公自动化】批量修改文件夹内所有WORD文档格式花花 Show Python Python-办公自动化 python word 开发语言
欢迎来到"花花ShowPython"，一名热爱编程和分享知识的技术博主。在这里，我将与您一同探索Python的奥秘，分享编程技巧、项目实践和学习心得。无论您是编程新手还是资深开发者，都能在这里找到有价值的信息和灵感。自我介绍：我热衷于将复杂的技术概念以简单易懂的方式呈现给大家，让每个人都能享受到编程的乐趣。我相信，通过不断的学习和实践，我们都能够成为更好的开发者。关注提示：如果您喜欢我的内容，别忘
OpenCV探索之旅：多尺度视觉与形状的灵魂--图像金字塔与轮廓分析
在我们学会用Canny算法勾勒处世界的轮廓之后，一个更深层次的问题摆在了面前：这些由像素组成的线条，如何才能被赋予“生命”，成为我们能够理解和分析的“形状”？如果一个物体在图像中时大时小，我们又该如何稳定地识别它？欢迎来到本次的探索之旅。我们将建造两种强大的“金字塔”，赋予我们跨越尺度的“鹰之眼”；然后，我们将不仅仅是找到轮廓，更要深入其内部，测量它的面积、周长，找到它的重心，甚至量化它的“形状”
探索 Golang 与 Docker 集成的无限可能 Golang编程笔记 golang docker 开发语言 ai
探索Golang与Docker集成的无限可能关键词：Golang、Docker、容器化、微服务、云原生、镜像优化、CI/CD摘要：本文将带你走进Golang与Docker集成的奇妙世界。我们会从“为什么需要这对组合”讲起，用生活故事类比核心概念，拆解Go静态编译与Docker容器化的“天作之合”，通过实战案例演示如何用Docker高效打包Go应用，并探讨它们在云原生时代的无限可能。无论你是Go开发
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

饿了么混合云架构探索

你可能感兴趣的:(饿了么混合云架构探索)