腾讯技术工程

Clickhouse 在腾讯的应用实践

原文链接： https://www.zhihu.com/question/47604963/answer/867549349

今天给大家介绍 Clickhouse 在腾讯的应用实践，主要分为两部分内容：

Clickhouse 的部署和管理
Clickhouse 在腾讯业务线的应用实践

Clickhouse 的部署和管理

Clickhouse 它自身是一个非常强大的数据处理的引擎，因为它非常专注数据处理的计算效率这一块，因此它周边的一些管理插件，其实还是比较弱的。

大家在做大数据的平台，以及在做一些平台产品的时候，其实管理和监控都是蛮重要的一部分。不然你的平台出了问题，业务提出挑战，说为什么查不出来，或者我的数据为什么慢？这时候平台如果没有一个合理的解释的话，平台必然是要背锅的。下面我们一起看一下 Clickhouse 在我们生产环境的部署情和监控管理。先给大家介绍一下我们的选型机器，因为 Clickhouse 它是一个服务于大数据场景的MPP数据库，那么它的应用场景是非常明确的，是一个“大数据”的快速查询场景。

这种情况下，其实它对于并发性要求不是特别的高，因为数据大，那么它对于磁盘的容量其实要求还反倒多一些，这样的话我们用一些廉价盘就是传统的这种sata盘来做这种的底层数据的存储。Clickhouse 虽然有这种主从同步，数据复制的机制，它的一个单机损坏的话，虽然你有备库可以做支撑查询，但是相对来说恢复的成本也是很高的。建议在单机之上使用raid5模式，也就是尽量在单机况下也能够保障它一些数据的安全性。

然后因为 Clickhouse 还有一个特性，就是它是一个share nothing的架构，就是说他不能避免一些情况下需要单机一些内存的排序的和处理一些大量的数据，这种情况下，它对于内存的要求其实也蛮高的，有的时候像内存如果不够它会出现oom，虽然他有一些可以扩展内存的方式使用磁盘去做一些额计算出来，但是相对来说性能会有影响。所以会选择内存稍微大一点的服务器。然回到网卡话，因为万兆网卡都是比较普及的了，千兆网卡在大数据应用的场景下是非常容易被打满的，容易影响到服务的稳定性，因此选择万兆网卡作为基础服务。

下面这是我们一个生产环境的部署方案：

首先笼统的说我们是一个读写分离的模式，数据写入我们使用这样一个外围的负载均衡机制来去写不同的分片，然后不同分配下都是双重备份的，这样的话就可以分散的去写数据。读的时候是用distribution表去读取数据，对 Clickhouse 有一定了解的话，就会疑惑，我们为什么不直接去写这个distribution表，这样不是峰更方便吗？这有有两点原因。

第一点就是专一

distribution表更多的工作应该是分发读取SQL和整合数据，是在读取的方面比较有优势，而非要利用它来做负载均衡进行数据写入，虽然可以，但是无意中增加的它的负担，再说外部独立部署一个负载均衡是一个非常简单的事情。把专有功能交给专有模块去做会更加合适，也更加稳定一些。

第二点就是在扩容方面比较平滑

因为 Clickhouse 比较粗犷，如果直接写distribution表的话，在扩容过程中难免会遇到一些问题，不够平滑。而这种方案可以按照以下步骤更加平滑的扩展服务：

安装新部署新的shard分片机器
批量修改当前集群的配置文件增加新的分片
新shard上创建表结构
名字服务添加节点

在这个过程中你在做前三步的时候，对在线服务基本上是没有任何影响的OK了，并且你新上的节点也是没有任何数据写入的，当你完成了所有的检查之后，在负载均衡器中增加你的新节点，就能够保障一个平滑扩容了。

下面是 Clickhouse 写入策略的一个小分析：

Clickhouse 不是事务型的那种数据库它无法支持很高的并发，它服务于大数据，它更加适合这“大批量，少批次”的写入，所谓的大批量少批次，就是说把数据一批一批地组合在一起，一次性的去写入更多的数据，在我们线上测试的数据中大家可以看到， 2万条一个批次和100万一个批次的差别，我们主要看两块，一是磁盘的等待，它们基本上都是50%左右。

一个服务器，磁盘50%等待的时候就已经说明他的IO已经到达瓶颈了，还算是一个可以忍受的瓶颈，但它们的差别在哪？当插入2万的时候40%的磁盘等待已经出现了insert失败的错误， 100万的时候磁盘等待时间是54%磁盘IO要比2万的时候高，但是没有任何插入失败，说明服务器的利用率更高了。因此可以验证， Clickhouse 更适合这种大批量，少批次的写入模式。

下面的例子比较类似，是在说每一条数据的大小情况，用10K 和 100 B对比，大家可以看到10K的数据相对来说更加适合 Clickhouse 的写入情况。这个场景能就反推过来，一个应用场景所有的数据库在处理join的时候其实都是有一些瓶颈的，但是 Clickhouse 的优势是列宽，他是一个列式存储，对列宽基本上没有什么限制，因此我们可以建立一个更宽的大宽表，吧join的操作变成表查询操作，我昨天和ivan聊了一下，目前 Clickhouse 的列宽大概可以支持到1万列左右，在1万个月以下的时候，其实没有什么问题，都是非常好的，因此建议大家更多使用宽表来替代join。

以上介绍了 Clickhouse 的部署模式和写入模式，下面介绍一个立体监控模型。

Clickhouse 立体监控模型

大家在做平台的时候，很多情况下就会有一个分界点，就是跟业务之间分得太开，业务做业务的数据指标监控，平台做平台的监控。但其实平台有时也需要关注业务的这种指标数据，你业务数据出现了问题，反推平台一定是也出现了问题的。所以这种情况下就是说做平台的兄弟一定也是要建立一些业务方面的监控。例如空值或者是断线这样的一些监控指标其实是非常重要的。

然后在服务层，就是 Clickhouse 。很多时候不管是 Clickhouse 也好还是一些其他服务，大家很容易忽略它的错误日志，偶尔几条错误服务不crash的情况下大家关注不多。这种情况其实无意中就给你的服务埋下了一个很大的隐患，所谓千里之提溃于蚁穴。

这种情况下，建议大家把log不断的记下来，当你的服务出现问题的时候完全可以去看出问题的时间点，你的错误log到底有多少？你的log内容到底是什么？这样可以提高你平台处问题时候的定位效率，也能提高你的平台的稳定性。

再往下的话是这样的，是一个业务请求指标，这样一个请求指标的监控平台上有的时候也会容易忽略的。比如业务忽然找到平台，说我的查询慢了，我的插入太慢了，为什么？这个时候就有了业务请求指标的话，你可以跟他今天，昨天，上一个小时数据数据去做对比，比如插入的数据是昨天十倍或者是三五倍，那平台如果慢了，就可以明确的说明原因，是业务增长导致的，需要进行优化或者进行扩容，这样对于业务它有一个平台使用的预期，对平台的信任感也会增加，而不会因为只是发现过载了，就去扩容，盲目的去找了一圈原因也不知道为什么过载了。

下面是扫描详情的这种监控，刚才说的前面的那几种监控，例如错误日志暴涨，负载高了，这种情况基本说明平台已经出问题了，更多的时候需要防患于未然。这就需要下面的扫描结果集监控和查询耗时的监控，属于亚健康性状态的监控，就说作为一个 Clickhouse 服务平台，要经常去关注一下，查询的扫描集和结果集，以及它的查询耗时，提前把查询耗时长，结果集大的询亚健康任务找出来进行优化，省得慢查询造成服务的堵塞把平台拖死影响到业务，特别是混合业务的支撑很容易因为， A业务把平台打垮了，B业务找过来说我的业务可用了，比起出现问题后大家手忙脚乱的解决问题，这种亚健康状态监控是非常重要。

经过上面举例，归纳起来就是这样一个立体监控模型，我们从应用层，服务层，物理层。这样三层去把 Clickhouse 的监控做得更细一点。物理层这一块我刚才没有去举任何的例子了，因为这块东西是大家都比较通用的，就是磁盘的IO，持续的负载，还有流量。刚才有朋友问， Clickhouse 在cpu上面的消耗。其实 Clickhouse 对CPU的性能压榨是很高的，它的CPU偶尔飙到百分之百是在集中计算数据，他不像是事务性并发数据库那样需要支持高并发，因此对于波浪形的CPU彪高的监控并没有太大意义。

更重要的是IO的瓶颈。这种立体监控模型，对敏感度来说的话，肯定是应用层次最低的，就是说应用层出问题了，一定是就是说从底到上物理层，就是说首先是服务器的IO或者负载高了，然后影响到 Clickhouse 的写入慢，或者是查询耗时长了，或者写入失败了，然后再体现在业务指标出问题了，监控敏感度是一层层降低的，但所谓的监控的紧急度的话，反而是反过来是一个从高到低的，我业务处就是应用业务出问题了，一定是要第一时间去响应去解决这个问题，已经影响到业务了，你的SLA 也就受到了挑战。相对于物理层和服务层的这种层级的监控，出现一些慢SQL，或者一些高负载的情况，我们是可以有时间提前去把这种亚健康的状态解决掉，更好的保障平台的稳定性。

Clockhouse在性能上面是非常优秀的，但是技术圈里面没有银弹，无论什么东西，都需要合理的使用方式才能发挥出它最大的价值，希望大家能够在我的分享中得到一些启发让自己的 Clickhouse 平台更加稳定，但是他同时就说是也需要大家有一个合理的使用方式和一个合理的管控方式，让这个平台更加稳定。

Clickhouse 在腾讯游戏业务线的应用实践

主要从四个方向进行介绍。

首先是我们游戏数据分析的业务背景，我们为什么要在我们腾讯游戏中做一些数据分析，然后是我们自研的数据分析引擎TGMars，对于其中的画像系统使用的的是 Clickhouse 。我们也有自己的分布式查询画像服务，至于为什么要进行替换，后面也将从第三点进行一些介绍，最后简单的介绍下我们平台对 Clickhouse 的使用。

给大家介绍一下，我们腾讯游戏数据分析的一个场景作图。然后从这张图上我们可以看出我们在底层的大数据基础平台上构建了一个pass应用平台，基于我们的pass能力构成了最上层的sass系统，游戏运营小伙伴可以在我们的系统上去实时的进行数据分析，任务配置，营销活动，从而提高我们的游戏服务质量。

我们首先看下最下层的大数据基础平台，其主要分为数据的采集和存储。如果大家都玩游戏的化可能会有一个明显的感觉，如果游戏有几毫秒的延迟，体验起来就会特别差，所以数据的采集也是我们投入较大的一块。关于存储，我们会将数据落地到数据仓库tdw，同时也有我们也有自己的实时传输管道，保证数据实时的消费落地展示。在我们基础的数据处理平台上我们形成了一个pass化的大数据服务平台，主要分为三个方向。

首先是我们的挖掘分推荐方向，通过对数据的处理训练达到精准的推荐，比较常见的是我们微信游戏中的游戏推荐。接着是我目前所在的idata产品中心，我们主要做游戏的实时数据的在线统计分析，比如我们的实时在线用户，实时游戏收入，实时的创角等，同时我们也提供用户的多维提取和画像分析等，在画像分析中，我们目前就是使用的 Clickhouse 。最后就是我DataMore的大数据应用服务，提供大数据的实时决策能力。

下面对我们的数据分析引擎做些简单的介绍，比对于业界传统的大数据分析引擎，我们可以明显的发现，我们提供更多更强大的能力。传统的大数据分析引擎通过spark或者hadoop对数据进行多维的聚合操作，形成了自己的报表分析结果。我们根据游戏数据的特点构建了自己的快速分析引擎，首先是对spark的定制修改，形成了TGSpark，它在游戏的多维聚合下推过程中具有更好的运行效率，然后我们对数据也进行了特点的处理，构建了自己的存储系统。在我们的底层引擎上我们构建了自研的报表服务，可以像tableau一样进行数据的托拉拽和数据展示。当然多维分析，多维提取和用户画像的功能也是比不可少的。

这里演示下我们的多维提取和透视分析，右上角的是我们的多维提取功能，用户通过指标选择他们想要提取的数据信息，比如最近流失的用户和用户等级大于10级的用户，指标之间也可以进行各种组合，然后在我们的引擎上对结果进行快速的提取，提取到相关信息后用户可以对它进行画像分析，透视分析等操作。

右下图是用户的透视分析，通过对指标的托拉拽，获取用户需要的结果。新的画像系统目前还在灰度阶段，目前只在游戏平台部进行小规模的使用。其实我们旧的画像系统多维下钻分析效率也蛮快的，对于亿级数据的10维以下的分析基本上是秒级分析出结果。

下面对我们的画像系统简单的介绍下，分析我们为什么要对其进行改造。我们画像系统的主要功能就是数据导入和数据的展示，因此整个画像系统的设计也是围绕这两个主要的功能进行的设计。系统主要分为三个方面，调度层，存储节点，执行节点。

首先进行数据的导入时，我们会在调度服务上选择出主节点，对数据进行切分然后均匀的存储在各存储节点上，同时也会对数据进行一些元信息的统计，方便数据展示时快速获取一些关键信息，存储节点中我们将数据进行列式存储，以及数据的分片处理和压缩等。在数据展示层，用户可以通过托拉拽形成sql，我们主调度层会对sql进行解析，解析完成后我们对sql进行优化，形成我们的DAG执行计划下发到各直接节点进行查询，我们查询时会通过jit将sql转换层字节码信息，加快查询效率。同时在执行层中我们有自己的位图缓存技术，在每次下钻查询过程中会进行动态位图索引匹配，加快查询效率，最终由主节点进行查询结果汇总输出。

我们的分布式查询服务引擎其实也是一个MPP架构模式，查询效率也很快为什么我们还要打算用 Clickhouse 进行替换？主要可能是因为下面几个原因，首先就是它的扩展性比较差，不支持数据的扩展和修改，如果用户在我们系统上提取一个用户包然后进行画像分析，假如是从去年9月10号到今年10月10号提到一些数据包，然后进行分析，过了几天他又想多分析几天的数据，比如从去年9月10号到10月20号，中间就是差10月10号到10月20号的数据，我们不支持的数据增加和修改，所以它只有重新提取，然后重新导入，所以说它的扩展性就是有些问题。

然后数据类型只是数字类型，因为我们为了加快它的查询效率，那时候只做数字类型，因为我们画像时只需要做一些统计类的信息，但是随着业务方需求的变化，单一的数字类型已经不能满足我们的需求了。同时当数据量达到了10亿级别以上，维度分析达到十几维，效率就会有所下降，查询效率就基本上到了分钟级别。

也是因为这些原因我们需要进行一些改造或者替换，后面发现对它改造的代价其实还是蛮大的，我们就去调研了一些主流的olap分析系统，最终我们被 Clickhouse 强大的功能所吸引，也就决定通过它进行替换。首先最重要一点应该可能就是它超高的查询效率，这里给了一个简单的多维下钻分析，在四亿的数据多维下钻分析中，在低纬度的分析中其实画像和 Clickhouse 都能在秒级内查询出结果，因为这里的对比图是单机运行的，所有比实际生产环境还是慢很多的，但是当维度增加时 Clickhouse 的强大之处就展示出来了。

同时 Clickhouse 还有其它一些非常优秀的能力，比如它的SQL能力，聚合函数能力，还有它的目前正在完善的机器学习能力等等。建议大家也可以搭建个环境去体验下，使用起来真的很好，必须吹一下。

然后下面介绍一下，通过一个实例介绍下我们是如何通过 Clickhouse 满足我们以前做起来比较麻烦的需求。比如说map类型的数据处理，我们接到业务方的数据格式是map类型，需要对其中的业务信息进行统计，这个map的key可以理解为游戏代号，value值可以理解为游戏的登录吧，在最开始的游戏登录统计分析中，我们时在tdw上进行计算，通过hive自带的sql对map进行切分然后进行汇总统计，数据量其实也就十几亿吧，但是整个结果计算下来竟然花费了十多分钟吧。

然后我们将数据进行处理导入到我们画像系统中，也就是将map转换成可扩展的列，每个key值对应单独的一列，对每一列进行统计计算，这样查询效率是变快了，几秒中就能查询出结果，但是游戏数据增多我们需求在对映射关系进行一些修改，所有使用起来也就没那么方便。但是我们使用 Clickhouse 后发现处理这样的需求真是不要太简单了，它支持嵌套的数据类型和数组类型，因此我们选择数据导入时将其转换成对应的数据格式进行导入，然后进行一个简单的sql就能查询出最终的结果。

下面这两个sql就是嵌套数据类型和数组类型的查询方式，sql统计非常简单，进行array join就能查询出每个key值sum的结果。通过查询结果我们也可以发现，它的效率也是非常高的，整个查询结果仅仅花费了0.3秒，这还是在我们集群比较小的情况下的结果。同时 Clickhouse 的其它一些函数也能满足我们的一些特殊需求，所有感觉非常棒。

后面说下我们目前对 Clickhouse 的使用。最下面的使我们不同类型的数据源，TDW数据源主要是hdfs出库文件，RDBMS数据源，我们自己的TGMars数据源，还有消息中间件数据源。目前消息中间件这快运用的比较少，因为我们做实时数据有自己的一套druid和storm，运行比较稳定，因此这块我们目前只做了些功能验证测试。接下来就是我们使用较多的tdw和tgmars数据源，我们通过自己的etl服务工具进行数据源的转换，因为 Clickhouse 其实适合大批量小批次的写所有我们通过etl工具进行控制，同时也会对数据进行监控，保证数据完整性。

其实 Clickhouse 也可以直接通过 MySql引擎实现一些小的功能，比如数据库处于不同实例中，我们可以通过 Clickhouse 进行跨实例的join 操作，这块我在测试使用时还是比较感兴趣的。数据导入到 Clickhouse 后，我们就将基于它做一些服务应用开发，比如我们的画像服务，BI系统，以及查询服务。当然我们也将打算通过它做一些增强分析相关的工作，目前第一步正在进行游戏指标的统计，接着可能会进行NLP处理，最终使用 Clickhouse 出结果。

最后就是我们近期的展望，后面会做一些增强分析的工资，就可能会用到更多的机器学习算法，刚刚从俄罗斯团队上的分享中也了解到目前他们也在这方面投入的更多力量，期望后续我们也能很好的使用上。然后就是执行计划的分析，其实这个也不算必须的，因为我们可以从query log中查看到对应的信息，但是用习惯explain后还是比较喜欢这种方式。最后就是集群管理方面，其实集群的搭建和管理还不是那么的方便，希望后续官网提供更好的方案供使用者使用。

以上是关于 Clickhouse 的分享。

文中 PPT 源文件可以点击下方知乎小程序或者 阅读原文 获取！

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
发票合并工具小朋的软件园前端 javascript java html 服务器
"发票合并工具"是一款专为高效整理票据设计的实用工具，支持将来自不同渠道的发票文件（如PDF文档、各类图片格式）快速整合为排版规范的PDF文件，尤其适用于财务报销场景下的批量票据处理需求。核心功能亮点多格式兼容：无缝导入PDF文件及常见图片格式（.png/.jpg/.jpeg/.bmp），适配多来源发票整合需求。智能布局配置：提供灵活的页面布局选项（每页2/3/4张发票），其中"2合1"模式针对报
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

Clickhouse 在腾讯的应用实践

Clickhouse 的部署和管理

Clickhouse 立体监控模型

Clickhouse 在腾讯游戏业务线的应用实践

你可能感兴趣的:(Clickhouse 在腾讯的应用实践)