DataStax

吴太银：华为消费者云服务Cassandra使用场景与最佳实践

大家好，我是华为消费者云的吴太银。

我今天分享的主要是华为消费者云服务使用Cassandra的应用场景和最佳实践。我这个可能跟其他嘉宾分享的不太一样，因为前几个嘉宾讲的实际上对Cassandra原生的代码有一定的修改，而我们当前使用的是纯粹的、原生的Cassandra，我们没有做任何的修改。所以这个分享可以给一些想大量使用原生的Cassandra的朋友有比较好的借鉴意义。

我今天会大概从这三个方面来给大家介绍一下：第一个就是我们用Cassandra的一些使用历程，经验和教训，以及我们当前的规模；第二个就是我们现网遇到的典型问题，我之前跟组织者交流，因为我们当前的规模比较大，他主要是想看我们在用到典型的ToC场景下，在用到大规模，大数据量的情况下，在现网有哪些典型的问题，这个对大家应该有一定的启示作用（哪些是Cassandra的雷区，是不能碰的，如果你把这些避免掉，就不会出大问题）；第三个就是我们使用Cassandra总结出来的最佳实践，因为我们现在所有的终端业务，基本上都会用到Cassandra，我们的业务场景非常的复杂，必须有些设计上的，包括表结构的设计上的约束，不能随便用，因为随便用它一定会有问题。这个在前面的各位演讲嘉宾也经常提到：我们要顺着它来用。

我们现在先看一下为什么选Cassandra。大家可能都比较清楚了，我就简单的说一下：一个是去中心化的部署，不但简单，而且扩展性很好，可以轻松应对业务发展带来的数据容量和性能上的要求；第三个是它天然支持多DC的部署，我们当前是一主一备，再加容灾，三个数据中心，它天然的支持（这种部署），内部自动同步；第四个是它的监控指标和监控接口非常完善，通过nodetool和JMX可以非常容易监控到Cassandra原生的各个指标，这个在我们后面的幻灯片里会看到，这一块是非常重要的，在现网，特别是你在集群规模变大了之后，你需要快速恢复一些故障的时候，没有这些东西，你是做不到的；第五个是它的这个开源社区确实很活跃，包括稳定的版本演进，可以让我们不停的选择它。

这个（幻灯片）是我们的使用历程，给大家看一下。我们实际上是从2010年开始就使用了。Cassandra是差不多2008年开始在Apache孵化，我们差不多是跟孵化同时的时间开始接触，一开始是0.7版本。Cassandra在我们这边用大概分两个阶段：前一个阶段，可能是一个相对来说比较失败的一个经历，因为这个阶段我们还是主要用于ToB的场景。当时我们的华为手机还没完全（流行）起来。这个场景在这个阶段我们面对都是电信级的应用。

在这个时间段，其实NoSQL还没有完全流行起来。我们找的应用都是电信级的应用。但是电信级的应用大家都习惯用SQL的方式去做，第一个当时KV的方式大家也不太习惯，第二个当时Cassandra的接口不像现在这么好。当时是纯的Thrift接口，现在支持CQL，还有很多CQL的驱动。所以说当时是我们找业务，所以我们要按照它的使用方式，提供了一堆的定制化的东西，比如说我们在Thrfit的基础上，定制了一个类JDBC的接口，让它像SQL一样用Cassandra。这一块当时我们也是深入的修改，我们写了一整套SQL解析的模块（DDL，DML全部都重写了，然后转换成原生的mutation对象）。序列化和反序列化我们全部都改了。包括我们做得比较前沿的东西（因为当时0.7的版本还没有堆外内存），因为它的GC比较严重，我们把memtable, index summary, bloom filter, row cache, key cache这些常驻内存的一大部分全部都放到了堆外。

另外，我们还做了存储过程、二级索引、触发器等。其实当时我们就是对标的关系型数据库去做。但是实际上我们大家也知道本来Cassandra原生的是列数据库，我们强制按照行的方式来改造，实际上有很大的问题。再加上电信级的业务场景，这个对可靠性和数据的准确性的要求是非常高的。所以说我们当时虽然做到了SQL的形状，但是实际上没有SQL的实质。这个只是在小范围使用，也没有完全用起来。这个基本上算是一个失败的尝试。

然后这个过程对我们有什么好处呢？这个让我们深入的看到了一些Cassandra架构，以及它的处理方式，还有它的源码。因为在后续的发展过程中，Cassandra的代码虽然重写了好多版（不停的重构），但是它的整个框架，整个处理流程是没有变化的。这些知识对我们后面这个阶段是有很好的指导意义的。虽然我们把Cassandra应用在电信场景没有很成功，但是后来华为的手机慢慢流行起来了。2014年开始，终端开始起来了。

之后，我们面临互联网ToC的场景，其实是非常适合Cassandra的，我们就慢慢的找到了Cassandra存在的一些价值，并且不停的在往下走。这一阶段我们就没有修改任何源码了，完全用原生的。因为根据我们第一阶段的教训，改了源码之后，基本上就成为了孤版，很难向前演进。然后在终端情况下，我们不停的找，它最佳的使用场景。第二个因为ToC终端用户对实时性和可靠性要求都非常高，所以我们基于Cassandra的天生的多DC方式，实现故障切换。

这里仔细讲一下：我们当前的业务一般是1+1+1，一主一备一容灾，每个DC都是3副本。正常的情况下我们只会向一个DC写，如果出现故障，我们通过这个我们重写的驱动，把它切到另一个DC去，保证任何DC里的两个节点出现故障，对终端业务的请求来说是无损的，客户端会自动切换数据中心。另外，Cassandra原来是有OpsCenter来进行管理的，但是因为我们公司的安全规范，没有用它。我们现在是构建了一套华为自己的集群部署管理，包括监控系统。第三，我们不断跟进社区的新版本。第四，Cassandra在华为的使用场景非常多。可以这样说，凡是华为终端，包括手机，包括穿戴式，包括IoT的所有华为终端应用的背后，你看得见看不见的背后，都有我们Cassandra的身影。比如举个简单的例子，运动健康，大家跑步的时候，就是这些数据都基本上存在我们Cassandra里去。华为手机上的应用，只要你看得到的，基本上后面都有Cassandra的身影。所以Cassandra伴随了我们消费者云，伴随了我们华为终端，六年的快速发展。

然后我们可以看一下我们当前的规模。我们当前的规模还是比较庞大的，基本上我们这里存的全是用户数据。Cassandra我们全球的节点大概有三万多台，我们的数据规模大概有20PB。我们的集群数量可能有500多。我们最大的集群的节点数有600多节点。我们现在全网每秒有一千万每秒的访问吞吐量。我们的平均延迟是4毫秒。我们当前最大的一张表，单表达到三千亿条记录。像我们这个量，在原生的没有改动Cassandra源码的情况，能够达到这个规模，也是比较值得让人骄傲的一件事情。这些数据从另一个角度证明，Cassandra原生的稳定性，使得它足以在ToC的这种线上场景，可以有很好的一个应用。

我们下面再看一下，虽然我们规模有这么大，但是不代表Cassandra是万能的，也不代表Cassandra它什么问题都能解决。我们要避开这些问题。

我们当前面临的挑战，首先是华为终端，包括中国区和海外不停的业务发展带来的庞大数据量造成的稳定性的问题。现在华为终端卖得非常好，而且用的人是越来越多，这个对我们数据库的压力很大，也带来数据一致性的问题。当前我们有些数据是没有上云的。我们自建了机房，自建机房一块块的盘，是不稳定的，会遇到一些坏盘的问题，坏盘会带来一致性，包括僵尸的问题。第三个是基础设施的问题，比如JDK的问题，网络的问题，磁盘的问题，我们都全部遇到过。第四个是故障的快速定位、定界，以及恢复。因为我们现在面临的都是OLTP的场景，全是ToC的。ToC的场景，基本上就是华为终端用户的场景。我举个例子：假如你用到的华为手表，故障的时间一长，你的业务终端用户就不能用，人家是很着急的。所以说我们现在对于业务的体验，包括故障的恢复的要求也非常高。我们必须在半个小时之内把所有的故障必须恢复，你可以定位不出来问题，但是你必须把它恢复掉。

我这里有一个分类，把我们现网里遇到的典型问题列了一下。我们现网遇到的问题比这多得多，可能是这个的好几倍，但是我总结了一下这些典型的问题，希望对大家，或者是即将使用原生Cassandra来构建自己的核心业务的朋友做一个提醒，你一定要注意这些方面的问题。这里都是我们在业务发展过程中遇到的典型问题。我后面会针对每一个问题，包括它的现象，包括从监控里面的反应，包括堆栈，都会介绍一下，结合我们的业务场景，给大家讲讲。

大家可以看一下，这里是我们的监控系统，我把一些IP抹掉了，这是我们的业务成功率，这是我们现网节点的CPU、IO等系统指标。大家可以看到案例的描述：有一次，现网扩容，但是扩着扩着就发现，到一定程度的时候，所有节点的CPU和IO都全部非常高，这个对我们的业务影响大家可以在右边的图里看到，本来成功率百分之百，忽然一下降了这么多。对应的时间点内CPU、IO全部都飙升。为什么，这个就是集群规模过大造成的影响。我们可以先看一下为什么会这样。

根本原因是：第一是我们的集群非常大，几百个节点，第二个是我们的Token数有256个，这样算起来，我们最多可以有十几万个Token范围。新节点加入集群过程中，Token信息需要更新。同时，Cassandra读写流程里面，也需要获取Token信息用于路由。两个流程使用读写锁获取一个对象。当集群规模达到一定的程度时，Token数量过大，会导致Token信息更新缓慢，如果此时刚好业务高峰，请求会因为拿不到锁而阻塞，从而导致业务请求大量超时失败。这里我们给出的解决方案是，控制单集群规模，主要是虚拟Token数量，尽量不要超过十万。集群过大的时候，需要考虑拆分，不要让一个集群无限膨胀。我们现在ToC的集群为了稳定性，我们的集群节点数不超过两百。超过两百个节点我们建议业务去拆分。

第二个是，单节点数据量过大的时候，会有什么问题。我们当时每个节点数据量达到了5TB，集群变得非常不稳定。表现在单节点数据量大时，bloomfilter、index summary等需要的常驻内存量会很大，导致频繁full GC甚至OOM；另外，我们默认使用的压实算法是Leveled Compaction Strategy，如果使用LCS而且数据量过大，磁盘空间可能不够，因为L0经常需要使用STCS来做压实操作。解决的方法是避免单节点数据量超过1.5TB，另外在扩容过程中临时增大磁盘空间或者设置disable_tscs_in_l0=true。注意，这个参数只能在紧急时候使用，扩容完成后，务必记得恢复成默认值。

第三个问题是节点压实操作（Compaction）堆积严重。大量的压实堆积说明压实跟不上，会产生大量小文件，影响读性能。后面这两张图里可以明显看到在LCS的小文件太多的时候，读延迟大大增高。我们找出的解决办法，一个是调整compaction的速度，一个是调整两个系统参数：sstable_preemptive_open_interval_in_mb，以及-Dcassandra.never_purge_tombstones。通过jstack查看线程的调用栈可以判断需要调整那个参数。另外注意，never_purge_tombstones也仅限紧急情况下使用，压实的堆积消除以后必须恢复原有的默认配置。

第四个问题是大Key的问题。前面的几位嘉宾也提到单个partition太大的时候对性能和稳定性的影响。这个在Cassandra日志里会出现告警信息。解决的办法是在业务里改变表结构和使用方法。比如一个文件删除记录表，对于个人文件来说，某个文件下面的删除记录不会很大，但是对于公共文件，比如华为手机上的锁屏图片，就会出现大Key问题，解决的办法就是在业务里增加判断，如果是热门文件，在删除次数达到某个阈值后就不再新增删除记录。再比如，如果记录一个热门电影的预约用户，使用电影的resourceID作为分区键，预约用户的UserID作为聚类键，当预约的用户数达到千万甚至上亿级别，就一定会出现大Key问题。解决办法就是使用额外的hash串将resourceID继续离散，避免单个resourceID下的分区太大。

第五个问题是热点Key问题。表现在短时间内对同一个Key频繁操作，会导致该节点的CPU和Load过高，影响其他的请求，导致业务成功率下降。这个从右边监控系统的截图可以看到，部分节点的CPU和负载都非常高。应急处理的方法，一般是通过toppartitions找到访问量最大的partition key，在业务侧加黑名单屏蔽这种热Key。最终的解决方案是利用缓存来减小热Key对数据库的冲击。

第六个是墓碑问题，这个我就不花太多时间说了。这方面一定要避免的就是短期内如果有频繁的删除并且还有频繁的读操作的话，可能Cassandra并不适合这种场景。另外，作为应急方案，可以临时减少gc_grace_seconds，以加速墓碑的物理清理回收时间。

第七个是坏盘导致的僵尸数据，这个大家可以直接看一下图示和源码，因为我的时间有限。我们的解决方案是如果你用的是自建的IDC机房，出现坏盘了，必须在gc_grace_seconds的周期内完成数据修复，或者直接replace掉出了坏盘的节点；当然，如果你的业务有条件上云的话，这种坏盘发生的可能性要低很多。

第八个是基础设施方面的网络丢包问题。我们现网当时出现的症状是突然时延大幅度增加，Cassandra驱动侧出现大量的慢日志信息。排查了集群的资源利用和线程池都没发现问题，但是我们用getendpoints把慢查询日志涉及的分区键对应的副本节点打出来，发现都涉及到一个*.*.23.20的节点。后来果然发现这个节点的网卡出现了丢包的故障。修复了丢包故障后，业务时延恢复正常。

第九个是集群节点规格不一致导致的节点负载不均。这个其实涉及Cassandra的一个优化，但是优化用得不好，也会带来问题。因为Cassandra的Gossip交换的信息里，会包含每个副本节点的负载，负载越小，收到的请求就越多。如果你的节点的物理配置不均，会导致请求集中在高配的几个节点上。这个对自建IDC的影响比较大。在云上，大家的节点配置比较一致，会较少遇到这个问题。

第十个是操作系统的网络调参。我们这里只列举了一个。网络参数不合理的症状是数据迁移不会出错，但是会卡死。在集群扩容时，200GB的数据不是卡死，就是长达一两天。在公有云上我们发现把net.ipv4.tcp_sack (Selective ACK) 开启，之后我们200GB的数据迁移20分钟就完成了。这个参数能够减小报文重传的概率，在网络拥塞或者乱序的情况下会有很好的效果。

最后一个是JDK的STW (Stop The World)的问题。这个问题我们到现在都还没有复现，我们是通过把业务切到备用的DC，然后重启故障DC的所有节点解决的。我们是怎么发现这个问题呢，当时业务的平均时延增高到3秒，但是系统CPU、IO、负载都正常，我们也排查了集群节点系统的各个核心参数，均没有发现问题，但是注意到Hint大量出现，这说明数据在写入过程中，出现了大量的业务节点被短暂识别为宕机状态，引起Hint被记录下来。通过查看Jstack和GC日志，发现线程卡顿和STW经常长达10秒。

最后，我们再来看看我们总结出来的Cassandra最佳实践。我这里总结了几点。

首先，需要管控业务使用场景，加强业务表结构的评审。不管你是用云上的，还是用自建IDC的，这个对大家都是有一定的借鉴意义的。我们现在整个业务大概有几百个利用Cassandra数据库。我们这个组现在负责在业务上线之前，对业务场景和表结构进行评审。我们基于这样一些方面的规范（我们也叫“军规”）：主键设计合不合理，Schema约束，数据老化机制，单条数据频繁更新/删除，单条记录过大，大面积数据删除引发墓碑问题，集群规模。我们现在为什么会做到这么大的量，是因为我们管控了使用的场景，让它必须按照我们要求的来做。

然后，是构建完善的Cassandra集群监控系统。我们有很多方面的监控：第一个是主机级别的监控，包括CPU/IO/磁盘/内存；第二个是读写请求的监控，这个是从业务的角度来看请求量是多少；第三个是Cassandra内部核心线程监控，这个是Cassandra内部的一些显微镜级别的监控手段,必须可视化出来，否则的话现网几万台机器，出了问题的话，你是没有任何办法可以快速恢复的；第四个是集群规模的监控，包括节点数和集群统计量，告警，自动化部署相关的指标。

另一个最佳实践，就是使用Cassandra，一定要多看源码，多熟练掌握nodetool各种命令和使用场景。Nodetool命令其实非常好用，这个只是列了一些我们用得最多的，包括cleanup, compactionstats, getendpoints, netstats, rebuild, repair, toppartitions, tpstats, cfstats，我不在这里一一说明，大家可以看这个表。如果你在大规模应用中，需要快速的恢复，这些命令对于故障排查和恢复会非常有帮助。

实现相机权限二次申请鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本示例基于程序访问控制管理实现二次向用户申请相机访问权限授权。实现相机权限二次申请源码链接效果预览使用说明点击“RequestPermission”按钮，出现弹窗向用户申请相机访问权限授权，点击“不允许”，再次点击“RequestPermission”按钮，出现半屏弹窗二次向用户申请授权。实现思路点击“RequestPermission”按钮时，通过request
1章5节：大模型术语解读与从生成到推理的演进 DAT｜R科学与人工智能人工智能
在人工智能的浩瀚宇宙中，大模型正以前所未有的速度演进，推动着科技变革的新浪潮。从多模态到通用模型，再到行业模型，人工智能的边界不断拓展，为各行各业带来了全新的机遇与挑战。本篇文章将深入剖析大模型相关的核心术语，探讨其内涵、应用及发展趋势，并回顾大模型从生成到推理的演进历程，解析全球科技巨头与国内前沿企业在这一领域的竞争与创新。让我们一同探索大模型的演进脉络，把握智能时代的发展脉搏。一、剖析大模型相
深度学习项目--基于DenseNet网络的“乳腺癌图像识别”，准确率90%+，pytorch复现羊小猪~~ 深度学习网络 pytorch 人工智能 python 机器学习分类
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊前言如果说最经典的神经网络，ResNet肯定是一个，从ResNet发布后，很多人做了修改，denseNet网络无疑是最成功的一个，它采用密集型连接，将通道数连接在一起；本文是基于上一篇复现DenseNet121模型，做一个乳腺癌图像识别，效果还行，准确率0.9+;CNN经典网络之“DenseNet”简介，源码研究与复现(pytorch)：
如何合理拆分微服务微服务
**在微服务架构中，要想做到合理拆分，需要重点关注：服务边界划分、业务耦合度控制、数据隔离策略、服务自治能力、团队组织协调。它们共同决定了微服务架构的灵活度与可维护性，其中，服务边界划分是最基础且最关键的一步。它要求我们从业务领域出发，将高度聚合、密切相关的功能抽离成单独服务，避免粗放的“大而全”式切分。在实际落地时，应当以业务语义、数据交互频率等为出发点，力求服务粒度既不会过细导致管理成本飙升，
代练系统源码小程序如何助力游戏代练行业数字化转型？ mysqlvue.jsphp
在电子竞技日益成为全球性娱乐和文化现象的今天，游戏代练服务作为连接高水平玩家与普通玩家的桥梁，其市场需求迅速增长。为满足这一需求，多客代练系统应运而生，它不仅简化了代练服务的匹配流程，还通过智能化管理提升了服务质量和用户体验。本文将深入探讨多客代练系统的核心优势、用户价值以及它如何塑造游戏竞技行业的未来。源码获取地址！！！！请点击！！！！前端框架主要负责用户界面的展示和交互。多客代练系统采用：un
如何进行OceanBase 运维工具的部署和表性能优化 oceanbase
随着OceanBase数据库应用的日益深入，数据量不断攀升，单个表中存储数百万乃至数千万条数据的情况变得愈发普遍。因此，部署专门的运维工具、实施针对性的表性能优化策略，以及加强指标监测工作，都变得更为重要。以下为基于我们的使用场景，所采取的一些部署和优化措施分享。一、OCP部署升级1．OCP升级（1）4.2.1BP1升级到4.2.2，本来以为毫无波澜但是下载完毕一键包并完成前期准备工作启动后发现无
C# WPF 基础知识学习(一) 埃菲尔铁塔_CV算法 c#wpf 学习人工智能图像处理计算机视觉
一、WPF简介WindowsPresentationFoundation（WPF）是微软推出的一款用于构建用户界面的框架，它为开发Windows桌面应用程序提供了统一的编程模型、语言和框架。WPF将用户界面的设计与业务逻辑分离开来，采用了XAML（可扩展应用程序标记语言）来描述界面元素，使得界面设计更加直观和灵活。与传统的WindowsForms相比，WPF在图形渲染、动画效果、数据绑定等方面具有
密码学：网络安全的基石与未来安全
在数字化时代，网络安全已成为全球关注的焦点。无论是个人隐私的保护，还是国家关键基础设施的安全，都离不开密码学这一核心技术。密码学不仅是信息安全的基石，更是现代社会中数据保密性、完整性和可用性的守护者。本文将从密码学的基本原理出发，结合最新技术发展，探讨其在网络安全中的核心作用。一、密码学的基本原理密码学的核心目标是通过数学方法保护信息的机密性、完整性和真实性。它主要分为两大领域：对称加密和非对称加
C++ 模板初阶总结矛取矛求 c++开发语言
1.泛型编程目标：编写与类型无关的通用代码，提高代码复用性。问题：传统函数重载需为每种类型编写重复代码，维护成本高。解决方案：使用模板（Template），通过编译器自动生成特定类型的代码。2.函数模板定义：templatevoidSwap(T&left,T&right){ Ttemp=left; left=right; right=temp;}typename或class声明模板类型参数。
Git 钩子自动化部署完全指南：掌握 post-receive 触发机制与生产实践窝窝和牛牛 git 自动化
文章目录Git钩子自动化部署完全指南：掌握post-receive触发机制与生产实践一、核心机制剖析1.1触发三要素1.2触发时序图二、配置全流程详解2.1目录结构规范2.2权限控制矩阵2.3标准脚本模板三、高阶调试技巧3.1手动触发测试3.2智能日志追踪四、生产级部署方案4.1多环境分流策略4.2安全回滚机制五、故障应急手册5.1常见问题速查5.2监控指标配置六、性能优化建议Git钩子自动化部署
Bilibili直播信息流：连接方法与数据解析直播弹幕哔哩哔哩
如今，市面上已经有不少开源项目可以用于连接B站直播WebSocket获取信息流。但在实际使用中，常常发现它们并不能完全满足个性化需求。为了更好地适配自己的业务场景，我决定自己动手实现一套连接方案。因此，我整理了整个实现过程的一些关键步骤和注意事项，希望能够对有相似需求的朋友们有所帮助PHP可以直接通过composer安装相关库来直接链接B站直播间并对数据进行解密，点击前往GitHub也有现成的B站
网络安全：数字时代的永恒命题安全
网络安全已成为数字时代最严峻的挑战之一。从个人隐私泄露到国家级网络攻击，网络安全威胁呈现出日益复杂和严峻的态势。2021年，全球网络犯罪造成的损失超过6万亿美元，这一数字预计将在2025年突破10万亿美元。网络安全不再仅仅是技术问题，而是关乎国家安全、经济发展和社会稳定的重大战略问题。一、网络安全威胁的演变与升级网络安全威胁的演变史就是一部攻防对抗的技术发展史。早期的网络攻击以病毒、蠕虫为主，攻击
云原生周刊：基于 KubeSphere LuBan 架构打造DeepSeek 插件云计算
开源项目推荐KubeAIKubeAI是一个K8s上的AI推理操作器，旨在简化在生产环境中部署和管理大型语言模型（LLM）、向量嵌入和语音处理等机器学习模型。它提供与OpenAI兼容的API，支持在CPU和GPU上运行，并具备按需自动扩缩容的能力。KubeAI无需依赖Istio、Knative等其他系统，能够在几乎任何K8s集群中开箱即用。此外，它内置了模型代理，优化了键值缓存利用率，从而显著提升系
2025年2月中国数据库排行榜：OceanBase迎来开门红，金仓、GBASE排名节节高
2025年2月，中国数据库流行度排行榜正式发布。在春节之际，DeepSeek凭借突破性的技术成功出圈，而在此前，各大数据库厂商便已开始探索AI与数据库的深度融合，并陆续推出了相关产品和功能。相信在这股技术革新的浪潮下，将涌现越来越多的新产品和解决方案。接下来，我们将逐一盘点各大数据库的最新动态，探索未来的潜力与挑战。一、金仓、GBASE排名再攀升，TDSQL升第九与上月相比，榜单前十的位次出现了细
Mysql高频八股——SQL语句的执行过程钢板兽高频八股 mysql sql 数据库面试后端
大家好，我是钢板兽！今天这篇文章本来想把SQL语句的执行过程和事务与undolog、redolog的联系放在一起写的。SQL语句的执行过程中会涉及到undolog、redolog，而undolog、redolog更深入的原理也是面试中经常会问到的，所以把它们放在一起再合适不过了，但是写着写着发现内容太多，于是拆成了两篇。这篇文章会带你理解SQL语句的执行过程，在探究SQL语句的执行过程前，我们要先
python webdriver-manager 实现selenium 免下载安装webdriver 小马MT python selenium 爬虫
pythonwebdriver-manager实现selenium免下载安装webdriverselenium在自动化测试中，通常需要使用浏览器驱动来与浏览器进行交互。然而，手动下载、安装、以及管理这些驱动非常麻烦，尤其是当驱动版本频繁更新时。为此，webdriver-manager库提供了一个极简的方案，自动帮我们下载、更新和管理驱动，使Selenium代码更简洁优雅。webdriver-man
该如何升级Tableau server呢？
在现代数据分析的世界中，Tableau作为一个强大的企业级数据可视化工具，受到众多公司喜爱。但是由于Tableau退出中国市场，如果仍在使用Tableau的企业，一定要做好TableauServer升级。随着技术的不断更新，升级TableauServer变得越来越重要，以确保您能够利用最新的功能和安全性。在这篇文章中，我们将详细探讨如何进行TableauServer升级，步骤、注意事项以及最佳实践
【MySQL基础-3】SQL语言详解：定义、分类、注意事项与注释 AllenBright #MySQL mysql sql
SQL（StructuredQueryLanguage，结构化查询语言）是用于管理和操作关系型数据库的标准编程语言。无论是查询数据、插入新记录、更新数据还是删除数据，SQL都是与数据库交互的核心工具。本文将深入探讨SQL语言的定义、分类、注意事项以及注释的使用，帮助你全面掌握这一强大的数据库操作语言。1.什么是SQL语言？SQL是一种专门用于管理关系型数据库的编程语言。它允许用户执行以下操作：查询
ROS机器人边缘计算：EdgeComputing与ROS AI天才研究院计算 AI大模型应用入门实战与进阶大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA 计算 AI大模型应用
1.背景介绍1.1机器人操作系统（ROS）机器人操作系统（RobotOperatingSystem，简称ROS）是一个用于机器人软件开发的灵活框架。它提供了一系列工具、库和约定，使得创建复杂且健壮的机器人应用变得更加容易。ROS的核心是一个消息传递系统，它允许不同的软件模块（称为节点）之间进行通信。这种模块化设计使得开发人员可以更容易地重用和共享代码，从而加速了机器人软件的开发过程。1.2边缘计算
从零到一：Transformer模型的原理与实战之旅樽酒ﻬق AI transformer 深度学习人工智能
目录从零到一：Transformer模型的原理与实战之旅1.Transformer原理简介1.1什么是Transformer？1.2自注意力机制的核心1.3Transformer的结构2.实战：构建Transformer模型2.1任务目标2.2环境准备2.3数据准备2.4模型构建2.5模型训练3.推理实战：完整示例与输出结果3.1完整推理代码3.2代码解析4.原理与代码的结合4.1自注意力机制的实
深入探究 Ryu REST API 漫谈网络网络技术进阶通途网络
Ryu4.34RESTAPI详细接口说明与示例Ryu4.34的RESTAPI提供了对SDN网络的核心管理功能，涵盖交换机、流表、端口、拓扑和QoS等操作。以下是详细的接口分类、功能说明及Python示例代码。1.交换机管理1.1获取所有交换机DPID端点:GET/stats/switches功能:返回当前连接到控制器的所有交换机的DPID（数据路径标识符）列表。示例:importrequestsR
最近较火的RunnerGo 与Jmeter优劣势分析
最近有一款较火的测试产品RunnerGo，它是一个基于go语言研发的开源测试平台。在这里我想从性能测试方面、结构方面以及功能方面对比两款产品。性能方面：Runner基于go语言研发，相对于jmeter来说更轻量级。所以性能测试方面RunnerGo应该是优于jmeter的这里我做了个压测对比，真实对比一下：一条使用查看新闻的场景：六个接口，使用并发模式，20的并发，执行10分钟。相同的配置下进行压测
python web开发pyramid库安装与使用范哥来了 python
为了在Python中使用Pyramid进行Web开发，你需要先安装Pyramid库。接着我会指导你如何安装它，并给出一个简单的示例来展示如何创建一个基本的Pyramid应用。安装Pyramid确保你的环境中已经安装了pip工具，然后可以通过以下命令安装Pyramid：pipinstallpyramid如果你想要开始一个新的Pyramid项目，推荐同时安装pyramid_starter模板，这可以帮
Unity AI 技术浅析（三）：智能代理（Agents）爱研究的小牛 AIGC—虚拟现实 AIGC—游戏制作 unity 人工智能游戏引擎 AIGC
UnityAI的智能代理（Agents）技术是实现游戏和虚拟现实应用中非玩家角色（NPC）、敌人、盟友等智能行为的核心。通过智能代理，开发者可以为虚拟角色赋予感知、决策和行动的能力，使其能够与环境和其他角色进行复杂的交互。一、智能代理的基本原理智能代理是能够在特定环境中感知、决策和行动的计算实体。在Unity中，智能代理通常用于模拟游戏中的NPC、敌人、盟友等角色。其基本原理包括以下几个方面：1.
Selenium WebDriver Manager 安装与配置完全指南 m0_74824025 selenium python 测试工具
SeleniumWebDriverManager安装与配置完全指南webdrivermanagerWebDriverManager是一个用于自动化管理Web驱动程序的Java库，可以用于自动化下载，配置和管理Web驱动程序，支持多种Web驱动程序，如ChromeDriver，FirefoxDriver，SafariDriver等，可以用于自动化测试和Web应用程序开发。[这里是图片001]项目地址
tksheet：强大的Python Tkinter表格组件江连日Silver
tksheet：强大的PythonTkinter表格组件tksheetPython3.6+tkintertablewidgetfordisplayingtabulardata项目地址:https://gitcode.com/gh_mirrors/tk/tksheet项目基础介绍与编程语言tksheet是一个基于Python的Tkinter库开发的高性能表格控件，专为展示和编辑大量的tabular数
LL(1)文法与左递归 Vitalia #形式语言与自动机 LL(1)文法左递归编译原理
没有超群的记忆力和过目不忘的能力，担心自己忘了，就写下来好啦。考虑如下文法，S->SA|AA->a如何说明该文法是LL(1)的？我们首先要明确，LL(1)是文法的一种性质，它描述的是这样一种文法，Predictiveparsers,thatis,recursive-descentparsersneedingnobacktracking,canbeconstructedforaclassofgram
CAP 公理解析：分布式系统中的一致性、可用性与分区容错性 Vitalia 系统设计分布式系统 CAP
文章目录1.CAP公理的核心概念1.1一致性（Consistency）1.2可用性（Availability）1.3分区容错性（PartitionTolerance）2.CAP公理的三种选择2.1CA（一致性+可用性）2.2CP（一致性+分区容错性）2.3AP（可用性+分区容错性）3.CAP公理的实际应用3.1CP系统（一致性+分区容错性）示例1：ZooKeeper示例2：etcd3.2AP系统（
为什么程序员需要学习数字电路 Vitalia 理论基础程序人生学习开发语言数字电路
在编程的世界里，我们通常关注的是算法、数据结构、框架和设计模式等软件层面的知识。然而，数字电路作为计算机硬件的核心基础，对程序员来说同样重要。掌握数字电路不仅能帮助我们更好地理解计算机的底层原理，还能在实际开发中解决一些棘手的问题。本文将通过理论和实例，探讨程序员学习数字电路的必要性。1.数字电路与计算机的关系计算机的核心是中央处理器（CPU），而CPU的本质是由大量的数字电路组成的。数字电路通过
用户数据报协议（User Datagram Protocol，UDP） Dream Algorithm 网络
用户数据报协议（UserDatagramProtocol，UDP）是一种简单的、无连接的传输层协议，位于TCP/IP协议栈中，与TCP（传输控制协议）并列。UDP提供了一种低开销、低延迟的数据传输方式，适用于对实时性要求较高、但对可靠性要求相对较低的应用场景。UDP的主要特点无连接：UDP不需要在通信前建立连接（如TCP的三次握手），直接发送数据包。发送方和接收方之间没有固定的连接状态。不可靠传输
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

吴太银：华为消费者云服务Cassandra使用场景与最佳实践

你可能感兴趣的:(吴太银：华为消费者云服务Cassandra使用场景与最佳实践)