romandion

支撑5亿用户、1.5亿活跃用户的Twitter最新架构详解及相关实现

http://www.csdn.net/article/2013-07-11/2816199-architecture-twitter-uses-to-deal-with-150m-active-users

Twitter如今在世界范围内已拥有1.5亿的活跃用户，为了给用户生成timeline（时间轴）需支撑30万QPS，其firehose每秒同样生成22MB数据。整个系统每天传输tweet 4亿条，并且只需要5分钟就可以让一条tweet从Lady Gaga手中呈现到她3100万粉丝的屏幕上。当下Twitter系统的规模及强大的吞吐量确实惹人艳羡，然而在出道之初Twitter也只是个奋斗在 RoR上的小站点而已，下面就一览Twitter如何完成从RoR到以服务为核心的系统架构蜕变。

Twitter系统的一些特性：

1. 当下的Twitter已不满足于Web App的现状。Twitter期望成为一组API，驱动世界范围内的移动客户端，成为世界级最大的实时事件链之一。

2. Twitter主导的是消费机制，而不是生产机制。每秒读取timeline的操作就会产生30万次的查询，而每秒的写入请求只有6000左右。

3. 离群值，拥有巨量粉丝的个体开始变得普遍，大量粉丝拥有者发送tweet时会因为大量的扩散而变得缓慢。Twitter试图将这个延时控制在5秒内，但是也并非一直生效，特别是名人们发送tweet以及相互转发变得越来越频繁后。这样就导致转发的内容可能比原始内容先一步到达共同粉丝的界面上，这样一来，就高价值用户来说，Twitter的主要精力必须从写操作转移到读操作上。

4. 使用Redis集群处理Home Timeline（首页时间轴，包含了众多关注者的tweet），最大条数为800。

5. 从你关注的人和你点击的链接，Twitter可以获知一系列关于你的信息。

6. 用户最关心的是tweet内容，然而大部分的基础设施却和这些内容不相关。

7. 对如此复杂堆栈进行性能追踪所需求的监视和调试系统往往非常复杂，同样旧决策的影响会不时的出现。

Twitter面临的挑战

1. 1.5亿的用户以及支撑timeline（home及Search）的30万QPS会让最初的具体实现（Naive materialization）变得缓慢。

2. 最初的具体实现由大量选择语句组成，遍及整个Twitter系统，曾今使用后被取缔。

3. 使用一个基于写的扩散方案。在接收到tweet时，系统将做大量的计算以发现tweet需要呈现的用户。这将造就更快、方便的读取，不要对读做任何的计算。由于所有的计算都被安排到写去执行，每秒大约可处理4000个写操作，比读操作要慢一些。

Twitter的团队合作

1. Platform Service团队承担起了Twitter核心基础设施的一切事务：

他们负责Timeline Service、Tweet Service、User Service、Social Graph Service这些驱动Twitter平台的所有组件。
内外客户端使用了大致相同的API
产品团队不需要担心任何规模相关
针对第三方API的注册应用过百万
做容量规划，打造可扩展后端系统架构，在网站超出预期增长时要不断的更换基础设施。

2. Twitter还拥有一个架构团队。负责Twitter的整体架构，维护技术负债列表。

Pull和Push模式

1. 任何时刻都有用户在Twitter上发布内容，Twitter的任务就是考虑如何将消息同步发出并呈现到粉丝。

2. 真正的挑战就是实时性约束，目标则是在5秒内将消息发送到粉丝：

交付意味着尽可能快的收集内容、投入互联网，并且在尽可能短的时间内返回。
交付要做的是发布到内存timeline集群、推送通知以及触发电子邮件，其中包括所有的iOS、黑莓、安卓通知以及SMS。
Twitter是最大的SMS制造者
Elections可以成为产生内容并且以最快速度扩散内容的最大动力

3. 两种类型的timeline：user timeline（用户时间轴，即指定用户tweet页）及home timeline

user timeline就是一个指定的用户发布的所有tweet
Home timeline是你所有关注用户user timeline的一个临时合并
业务规则。非你关注人@你时，将会被自动过滤，转发的tweet也可以被过滤。
在Twitter的规模做这些事情是非常有挑战性的

Pull模式

1. 指向timeline，比如Twitter.com及hone_line API。之所以将tweet发送给你，是因为你对其进行了请求。基于Pull的交付：你通过REST API的调用向Twitter请求这些数据。

2. 查询timeline，搜索API。对资料库进行查询，尽可能快的返回所有匹配指定查询的tweet。

Push模式

1. Twitter运行了一个巨型的实时事件系统，通过Firehose以每秒22M的速度推送tweet。

给Twitter打开一个socket，他们将会在150毫秒内完成所有公共tweet的推送。
任何时候给推送集群打开的socket都超过1百万个
使用类似搜索引擎的firehose客户端，所有公共的tweet都通过这些socket传输

2. 用户流连接。TweetDeck及Mac版的Twitter同样通过这种方式驱动。在登录的时候，Twitter会查看你的社交图，同样也只会推送关注人的消息，重建home timeline，而不是在持久的连接过程中获得同一个timeline。

3. 查询API，发布一个对tweet的持续查询时，每当有新的tweet发布，并且被认定匹配这个查询，系统会将这条tweet发送给相应的socket。

高等级基于Pull的timeline

Tweet由一个写入API生成，它将会通过负载均衡器及TFE（Twitter Front End）
这种做法很直接，所有的业务逻辑在tweet生成时就已经被执行。
随着tweet的扩散过程开始，新生成的tweet会被投入一个大规模的Redis集群中。每个tweet都会在3个不同的机器上做3个拷贝。因为在Twitter的规模，每天会有大把的机器出故障。
粉丝的查询基于Flock的社交图服务，Flock会维护粉丝及粉丝列表：

Flock会返回一个接收者的社交图，并且开始循环访问所有存储在Redis集群上的timeline
Redis集群拥有TB级以上的内存
每次投递4K左右的tweet
Redis使用原生的表结构
如果你有2万个粉丝，负责粉丝查询的守护进程将会确认2万个用户在Redis集群中的具体位置，然后它会横跨整个Redis集群将Tweet ID插入相应的列表中。所以当你有2万个粉丝时，每条tweet的写入都会造成2万个插入操作。
储存的信息包括新生成tweet的ID、tweet编写者ID以及一个4字节大小的状态信息（转发、评论或者是其它相关）。
Home timeline位于Redis集群中，每个有800条tweet。如果你向后翻太多页就没了，RAM是限制列表tweet数量的最大瓶颈。
为了控制延时，所有活跃用户都存储在内存中。
活跃用户的定义是在30天内有登陆过Twitter，当然这个规则可以根据缓存容量、实际使用等进行修改。
如果你不是活跃用户，tweet就不会被放入缓存。
只对home timeline进行存盘（持久化。PS：个人觉得这里应该是user timeline，如果是home timeline下文的重建方法显然不科学，欢迎大家讨论）
如果home timeline不在Redis集群中，则需要经历一个重建的过程：

对社交图服务进行查询，找出你关注的人。分别的访问磁盘获取每个人的数据，然后将他们送回Redis。
通过Gizzard使用MySQL处理磁盘存储，这将抽象出所有SQL事务并且提供了全局备份。

鉴于每条tweet都会做3个备份，如果其中某台机器发生故障，他们无需对这台机器上的所有timeline进行重建。
当tweet被转发时，将会存储一个指向原tweet的指针。

当做home timeline查询时，Timeline Service将被调用。Timeline Service确认home timeline究竟存在哪台机器上：

鉴于timeline备份在3个不同的机器上，所以需要运行3个不同的哈希环。
一旦找着其中一个，就会尽可能快的返回结果。
虽然这个过程会花费稍长的一点时间，但是读的处理仍然很快。从冷缓存到浏览器上呈现大约需要2秒，其中一个API的调用时间大约400毫秒。

鉴于timeline只包含了tweet的ID，所以还必须要做tweet内容的查询。确定了ID以后，Twitter将通过T-bird并行获取tweet的内容。
Gizmoduck是个用户服务，而Tweetypie则是个tweet对象服务，每个服务都拥有自己的独立缓存。用户缓存使用的是memcache集群，缓存了所有用户。Tweetypie处理的是上个月的内容，它将一半的tweet储存在它独立的memcache集群中，当然这个部分服务的是内部用户。
内容的过滤同样会省却一些读取时间，比如过滤掉法国的纳粹相关，这些内容的读取时间在呈现之前就被过滤了。

高等级的搜索

1. 所有的计算都通过读来解决，这让写更加简洁

2. 当有tweet生成时，Ingester会做相应的语法分析和索引，随后会将其传入Early Bird机器中。Early Bird属于Lucene的修改版本，同时索引都储存在内存中。

3. 在tweet扩散过程中，它可能会被储存在多个home timeline中，其个数由粉丝的数量决定。然而在Early Bird中，一个tweet只会被存入一个Early Bird机器中（不包括备份）。

4. Blender负责timeline的查询，横跨整个数据中心做集散操作。它对每个Early Bird做查询，以发现与查询条件匹配的内容。如果你搜索“New York Times”，Blender会查询数据中心的所有分片并返回结果，同时还会做分类、合并及重新排序等。排序的规则基于互动的数据，也就是转发、收藏及评论的数量等。

5. 互动的信息使用写的模式完成，这里会建立一个互动timeline。如果你收藏或者回复一个tweet，将会触发对互动timeline的修改；类似于home timeline，它同样由一系列的互动ID组成，比如收藏ID、评论ID等等。

6. 所有这些信息都被送到Blender。以读的方式进行重算、合并以及分类，返回的结果就是search timeline为你呈现的界面。

7. Discovery是个基于你相关信息的定制搜索，这些信息主要来自你关注的人、打开的链接，而重新排序的规则同样基于这些信息。

Search和Pull是相反的

1. 搜索和pull看起来非常相似，其实他们有着本质上的区别。

2. 在home timeline情况下：

写。一个写tweet的动作会触发一个O（n）规模的Redis集群写入操作，n的值取决于粉丝的数量，由此可见处理Lady Gaga及Barack Obama这样拥有数千万粉丝的名人将会很麻烦。Redis集群上的信息都会写入磁盘，Flock集群会将user timeline储存到磁盘上，但是通常情况下timeline在Redis集群的内存中都可以发现。
读。通过API或网络查找Redis是一个常数规模的操作。Twitter对home tiimeline的读操作做了高可用性优化，读操作只花费数十毫秒。这里也可以看出Twitter主导的是一个消费机制，而不是生产机制。每秒可处理30万个读操作，而写操作每秒处理6000个。

3. 搜索timeline情况：

写。Tweet生成，并且传输到Ingester，只会写入一个Early Bird机器。一个tweet处理的时间大约为5秒，其中包括了排队及寻找待写入的Early Bird 机器。
读。每个读请求都会触发一个O(n)规模的集群读操作。读大约需要100毫秒，搜索不涉及到存盘。所有的Lucene索引都保存在RAM中，所以聚散是非常有效率的，因为不涉及到磁盘。

4. Tweet的内容基本上与大多数的基础设施都是无关的。T-bird存储了所有tweet内容，大部分的tweet内容都是在内存中。如果没有的话，可以通过select查询将其拉回内存。与tweet内容相关的功能非常少，搜索就是其中一个，而Home timeline则完全不关心。

未来的工作

1. 如何将这条数据的管道打造的更快更有效

2. 在5秒内做到tweet的扩散，但是并不是时刻的奏效，特别是越来越多的高粉单位。

3. Twitter是非对称的关注，只有你关注人的tweet才会呈现给你。Twitter可以从这些单向关注中获取你更多的信息，有些单向关注同样还影射出一些社会契约。

4. 问题一般发生在大基数的图上：@ladygaga拥有3100万粉丝，@katyperry拥有2800万粉丝，@justinbieber拥有2800万粉丝，@barackobama拥有2300万粉丝。

5. 大批量粉丝的拥有者每发送一条tweet将造成数据中心大量的写入操作，而随着越来越多名人之间的交互，挑战变得更加的艰巨。

6. 这些需要扩散给大批量用户的tweet是Twitter最大的挑战，在关注这些名人的共同粉丝中，经常会出现回复tweet比原文更早一步送达的情况。他们在站点中引入竞态条件，比如最近关注Lady Gaga的粉丝可能会比老早之前关注的粉丝早5分钟看到tweet内容。比如说一个用户先收到了tweet，并进行回复，然而这时候Lady Gaga的原微博并没有扩散完毕，这样就会存在有些用户先看到回复的情况，为用户造成很大的困扰。Tweet通过ID进行排序，因为他们大多数是单调递增的，然而在如此粉丝规模下，这种做法并不奏效。

7. 寻找读和写途径的合并，不再做如此大规模的扩散；比如传播Taylor Swift新生成的tweet，取代在生成时进行扩散tweet ID，而是在读取时候就进行合并。通过平衡读写途径，节省百分之几十的资源。

解耦相关

1. 基于Twitter通过各种途径传播tweet，解耦可以让不同技术团队独立完成自己的工作。

2. 基于性能问题，系统也需要解耦。Twitter过去使用的一直是完全同步模式，而在两年前因为性能问题他们停用了这个模式。设备接收一个tweet需要145毫秒，接收完毕后就断开所有客户端连接，这么做同样也因为技术负债。写的路径由Ruby驱动，通过MRI实现，一个单线程服务器，每次Unicorn worker分配都会耗尽所有处理性能。每当有tweet流入，Ruby就会接收它，将它放到一个队列中然后断开链接。他们在每台服务器上只运行45-48个进程，这样的话每个机箱能同时处理的tweet数量也是这么多，所以他们必须尽可能快的断开连接。

3. 当下的tweet已经通过异步模式来处理，而这些讨论也都是建立在异步之上。

监视相关

1. 系统性能实时仪表盘

2. 使用VIZ系统监视每个集群，请求Timeline Service并从Scala集群获取数据的平均时间为5毫秒。

3. 基于Google Dapper系统的Zipkin，工程师可以通过Zipkin对请求的细节进行监视，比如获取请求所访问的服务及请求时间，这样就可以获知每个请求的性能细节。这样就可以通过每个阶段耗费的时间对系统进行调试，同样也可以从总体上看从请求到交付耗费的时间。花费了两年的时间，Twitter将活跃用户的timeline降到2毫秒。

部分统计数据：

如果你有100万个粉丝，每个tweet将耗费数秒的时间来传播
Tweet输入统计：每天4亿条；日平均统计5000每秒；日统计峰值7000每秒；大事件期间高于1.2万每秒。
Timeline交付统计：每天300亿次（更多数据见原文）

C C++ 为什么称为Native代码、虚拟机 TO_ZRG c++开发语言
CC++为什么称为Native代码，为什么要快1.直接编译为机器码无需中间层：C/C++代码通过编译器（如GCC、Clang）直接编译为CPU可执行的机器码（二进制指令），运行时无需虚拟机（如JVM）或解释器（如Python解释器）的介入。减少运行时开销：相比Java、C#等需要运行时环境（JIT编译）的语言，C/C++的执行路径更短，避免了中间层的性能损耗。2.底层硬件访问能力直接操作硬件：C/
leetcode hot100【LeetCode 146. LRU缓存】java实现 DataCrafter LeetCode Hot100 leetcode 缓存 java 链表
LeetCode146.LRU缓存题目描述设计和实现一个LRU(LeastRecentlyUsed)缓存机制。它应该支持以下操作：get(key)：如果缓存中存在key，则返回value，否则返回-1。put(key,value)：如果缓存已满，移除最久未使用的项，然后插入新的key-value对。如果key已存在，则更新其value。Java实现解法解法：使用哈希表和双向链表importjava
用C++代码利用std::filesystem库写入一个文件路径到数据库中新兴AI民工 C++编程实战大杂烩 c++数据库 filesystem 转移字符处理
使用C++代码写数据库不是什么麻烦事，但是和成熟的JAVA体系不一样，C++没有那么多成熟的数据库操作，比如mybatis等等。而且C++一般来说也不会用于写业务软件，不会用比较重的三方库。所以有时用C++代码来直接操作数据库，碰到的一个问题是：在一张数据库表中定义了一个字段：filePathvarchar2(100)需求是将一个形如：c:\test\test.log这样的文件名写入到该字段。本来
目前人工智能的发展，判断10年、20年后的人工智能发展的主要方向，或者带动的主要产业 meisongqing 人工智能
根据2025年的最新行业研究和技术演进趋势，结合历史发展轨迹，未来10-20年人工智能发展的主要方向及带动的产业将呈现以下六大核心趋势：一、算力革命与底层架构优化核心地位：算力将成为类似“新能源电池”的基础设施，支撑大模型迭代和实时交互。中国通过DeepSeek等技术创新（如MLA注意力机制、FP8混合精度训练）突破算力瓶颈，实现与美国顶尖模型性能对标，成本降低至558万美元/项目。技术突破：量子
C# WPF学习总结战族狼魂 WPF C#c#wpf 学习
经过一段时间的学习和实践，我对C#WPF（WindowsPresentationFoundation）有了更深入的理解。WPF作为一个强大的桌面应用程序开发框架，为开发者提供了丰富的UI控件、强大的数据绑定和灵活的布局系统。以下是我对C#WPF学习的一些总结：目录1.基础知识2.UI设计3.数据绑定4.动画和特效5.命令和路由事件6.自定义控件和扩展性7.性能优化和内存管理8.实战项目经验9.学习
809政府平台H5无插件播放1078URL 毛三仙视频播放 vue.js
809政府平台视频播放器接入指南背景政府平台播放JT/T1078-20166.2音视频流URL大都是通过Flex开发一个播放器完成，但Flash支持已经被大多数浏览器移除或阻止，需要一个新的方案来解决播放问题。我们开发了一个播放器，引用一个js即可简单实现H5无插件播放此URL，最少仅需3行代码。控件地址https://lib.cvtsp.com/video/CVNetVideoJs/1.3.0/
LeetCode Hot100 LRU缓存 m0_67582670 leetcode leetcode 缓存 c++
请你设计并实现一个满足LRU(最近最少使用)缓存约束的数据结构。实现LRUCache类：LRUCache(intcapacity)以正整数作为容量capacity初始化LRU缓存intget(intkey)如果关键字key存在于缓存中，则返回关键字的值，否则返回-1。voidput(intkey,intvalue)如果关键字key已经存在，则变更其数据值value；如果不存在，则向缓存中插入该组k
LeetCode 热题 HOT 100 第四十七天 146. LRU 缓存中等题用python3求解阿舒带你学编程面试学习路线阿里巴巴缓存 leetcode 链表面试 java-ee
题目地址请你设计并实现一个满足LRU(最近最少使用)缓存约束的数据结构。实现LRUCache类：LRUCache(intcapacity)以正整数作为容量capacity初始化LRU缓存intget(intkey)如果关键字key存在于缓存中，则返回关键字的值，否则返回-1。voidput(intkey,intvalue)如果关键字key已经存在，则变更其数据值value；如果不存在，则向缓存中插
Unity打包程序嵌入WinForm或者WPF(2) 问题 llhswwha Unity
嵌入方式两种，官方的-parentHandle和我的WinAPI嵌入。问题1.主程序卡死[-parentHandle]:主程序打开3D后，切换到其他程序，再切换回来，卡死。[WinAPI]:主程序打开3D后，过一段时间卡死。其实这里的打开的Unity程序也算是其他程序了。这个问题结果发现是主程序其他部分导致的。问题2.嵌入Unity的控件隐藏后，GPU使用率达到99%。所谓的Unity控件隐藏是指
win10快捷键冲突检测与解决方法 H.ZWei 开发工具的那些事快捷键检测快捷键冲突热键冲突
文章目录背景安装与使用背景相信很多人都遇到过，在使用一个快捷键时会经常与其他软件产生冲突，事与愿违；而且又很难找到是与哪个软件产生了冲突。有一款工具可以帮我们定位到目前的快捷键在哪个软件，这样就可以到对应的软件上把这个热键删除或者改成其他，避免热键冲突。安装与使用FindGlobalHotkey下载链接提取码：mxok下载解压即可使用如果需要检查某个快捷键被使用了，直接FindGlobalHotk
鸿蒙ZRouter动态路由框架—服务路由 H.ZWei HarmonyOS应用开发鸿蒙 Harmonyos Navigation router
前言源码：https://gitee.com/common-apps/ZRouterOH：https://ohpm.openharmony.cn/#/cn/detail/@hzw%2Fzrouter服务路由主要用于实现模块之间的通信，模块间是相互独立且不直接依赖于彼此。首先确保路由插件在1.0.9版本及以上一、添加配置1、在entry模块的build-profile.json5文件的buildOp
在Android Studio中通过CMake实现交叉编译生成动态so文件 H.ZWei Android NDK android studio android Android NDK CMake 动态so文件交叉编译
文章目录NDK工具链基本步骤CMake配置文件aux_source_directoryinclude_directorieslink_directoriesadd_librarytarget_link_libraries将CMake配置文件依赖到Gradle中交叉编译生成动态库参考NDK工具链最近项目上需要将微信语音silk文件格式进行编解码，在silk、PCM、AMR、MP3间进行格式转换，将s
在Vite创建项目中引入Sass弹出The legacy JS API is deprecated and will be removed in Dart Sass 2.0.0 宝子卡粉 javascript 前端 node.js
在Vite创建项目中引入Sass弹出ThelegacyJSAPIisdeprecatedandwillberemovedinDartSass2.0.0原因分析：其实通过报错提供的链接就可以知道，sass提供的某些jsapi即将在v2.0.0的新版本中废弃了，提醒你及时更新解决方案：在配置文件vite.config.js中配置//设置scss的api类型为modern-compilercss:{pr
【C++】命令空间不具名命名空间具名命名空间十年一梦实验室 c++开发语言
在C++中，命名空间（Namespace）是一种用于组织代码、避免命名冲突的机制。通过将代码封装在命名空间中，可以确保不同模块或库中的同名实体不会发生冲突。C++中的命名空间分为具名命名空间（NamedNamespace）和不具名命名空间（UnnamedNamespace）。1.具名命名空间（NamedNamespace）具名命名空间是显式命名的命名空间，用于将代码封装在一个特定的作用域内。1.1
Python爬虫-请求模块urllib3 andyyah晓波 python 爬虫开发语言
Python爬虫-请求模块urllib3urllib3是一个功能强大、条理清晰，用于HTTP客户端的第三方模块，许多Python的原生系统已经开始使用urllib3。urllib3提供了很多Python标准库里所没有的重要特性：线程安全。连接池。客户端SSL/TLS验证。使用multipart编码上传文件。Helpers用于重试请求并处理HTTP重定向。支持gzip和deflate编码。支持HTT
【c++】内联函数十年一梦实验室 c++
内联函数详解内联函数（InlineFunction）是C++中的一种重要特性，它通过将函数体的代码直接插入到调用点，从而减少传统函数调用的开销。本文将详细介绍内联函数的定义、用途、实现机制、注意事项以及适用场景，帮助你全面理解这一特性。1.内联函数的定义内联函数是一种特殊的函数，通过在函数定义前添加inline关键字，建议编译器在调用该函数时将其函数体直接嵌入到调用处，而不是执行传统的函数调用流程
Python爬虫-请求模块Urllib andyyah晓波 python 爬虫开发语言
Python爬虫-请求模块UrllibPython3中的Urllib模块中包含多个功能的子模块，具体内容如下：urllib.request：用于实现基本HTTP请求的模块。urllib.error：异常处理模块，如果在发送网络请求时出现了错误，可以捕获异常进行异常的有效处理。urllib.parse：用于解析URL的模块。urllib.robotparser：用于解析robots.txt文件，判断
python自制MBTI 16型人格测试1.0 LHTZ python 开发语言娱乐
什么是16型人格测试16型人格测试也叫MBTI（Myers-BriggsTypeIndicator）测试，它是一种基于心理学理论的人格测评工具。这个理论最初是由凯瑟琳・库克・布里格斯（KatharineCookBriggs）和她的女儿伊莎贝尔・布里格斯・迈尔斯（IsabelBriggsMyers）在20世纪40年代开发的。它的理论基础是瑞士心理学家卡尔・荣格（CarlJung）的心理类型理论。MB
一文读懂强化学习：从基础到应用 LHTZ 算法时序数据库大数据数据库架构动态规划
强化学习是什么强化学习是人工智能领域的一种学习方法，简单来说，就是让一个智能体（比如机器人、电脑程序）在一个环境里不断尝试各种行为。每次行为后，环境会给智能体一个奖励或者惩罚信号，智能体根据这个信号来调整自己的行为，目的是让自己在未来能获得更多奖励。就像训练小狗，小狗做对了动作（比如坐下），就给它零食（奖励），做错了就没有零食（惩罚），慢慢地小狗就知道怎么做能得到更多零食，也就是学会了最优行为。强
Python常用函数及常用库整理 Nicholson07 python
简单整理一下一些常用函数，方便自己查阅。目录文件操作文件夹/目录文件数据格式链表类特殊函数一些常用函数常用库tqdm进度条库tqdm模块参数说明常用函数使用方法yacs参数配置库简介使用方法logging日志库使用方法文件操作文件夹/目录importos1、os.path.exists(path)判断一个文件/目录是否存在，只要存在相匹配的文件或目录就返回True，因此当目录与文件同名时可能报错2
LLM大语言模型书籍：《大模型时代》开启人工智能狂潮！（附文档） Langchain 人工智能 prompt chatgpt ai大模型 LLM 大语言模型大模型时代
哈喽大家好！很久都没有更新大模型这块的书了，今天给大家说一下这本：《大模型时代》，本书对大模型时代的技术、应用和产业变化进行了深入的分析和阐述。近2年GPT风靡全球，然而真正的智慧“心脏”却是大型语言模型（LargeLanguageModel）！生成式大型模型正引领我们进入一个崭新的时代。《本书》深入探讨了大型模型时代的技术演进、应用场景和产业变革。生动地阐释了ChatGPT背后的工作原理，深入解
鸿蒙(HarmonyOS)应用开发实战——数据库版本升级案例 CTrup 移动开发鸿蒙开发 HarmonyOS harmonyos 数据库华为鸿蒙开发装饰器模式 ArkUI 前端
往期推文全新看点学鸿蒙开发的优劣势，你清楚吗？建议你了解一下！鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中…
C#WPF的相关知识点 Documentlv C#wpf c#开发语言 windows
学习C#WPF的路线了解C#编程基础熟悉WPF界面设计原理掌握WPF控件的使用学习数据绑定和MVVM架构深入理解WPF动画和转换效果学习WPF中的多媒体和图形绘制掌握WPF中的布局和控件模板学习WPF中的自定义控件和样式了解C#编程基础如果你想开始学习C#编程语言，这里是一些关键的基础知识，可以帮助你快速上手。C#是什么C#是一种通用的、面向对象的编程语言，由微软公司开发。它在.NET框架上运行，
郝斌C语言_分支；循环；数组；函数；运算符(笔记) sugario C c语言笔记
笔记目录前言一、选择_If1.求分数等级2.互换两个数字3.对任意三个数字进行排序4.看懂/掌握一个程序5.If常见问题二、选择_Switch三、循环_for1. 1+2+...+1002. 1~10的奇数之和3.For与If的嵌套使用_被3整除的数字之和4.For与If的嵌套使用_斐波拉契序列5.强制类型转换6. 1/1+1/2+...+1/1007.试数举例_18.浮点数存储9.多层For循环
如何在Python中安装itchat\n介绍\n在Python中安装itchat可以帮助你实现微信的自动化操作，比如发送消息、接收消息等。本文将帮助你学习如何在Python中安装itchat。拉保小跑博客竞赛 python 计算机网络 python 开发语言学习
如何在Python中安装itchat\n介绍\n在Python中安装itchat可以帮助你实现微信的自动化操作，比如发送消息、接收消息等。本文将帮助你学习如何在Python中安装itchat。\n\n整体流程\n下面是安装itchat的整体流程：\n\n2022-10-01\n2022-10-02\n2022-10-02\n2022-10-03\n2022-10-03\n2022-10-04\n2
c语言笔记函数入门我是大咖 c语言笔记 c语言笔记开发语言
目录函数的定义函数语法汇总函数的实参与形参函数实参与形参的区别函数的实参是传地址还是传值？c语言的函数就是用来实现某种功能的，如果说我们的程序代码都写在main函数中，这样会显得很难读懂，而且代码太长过于冗余，显得没有质量。所以我们可以把一些功能用分函数的方法实现功能独立分开，实现c程序的工整还有方便我们或者读者读懂。如果我们都把程序的代码全部写在主函数内，要是出现错误，我们要修改起来比较麻烦，要
Python中很常用的100个函数整理请为小H留灯 python中函数 python 开发语言
Python内置函数提供了强大的工具，涵盖数据处理、数学运算、迭代控制、类型转换等。本文总结了100个常用内置函数，并配备示例代码，提高编程效率。1.abs()取绝对值print(abs(-10)) #102.all()判断所有元素是否为真print(all([True,1,"hello"])) #Trueprint(all([True,0,"hello"])) #False3.any()判断任意
生产环境使用k3s避雷指南：避免数据丢失与不可恢复后端运维数据库
1.存储安全：避免数据丢失的核心1.1必须使用持久化存储问题：k3s默认使用临时存储（如emptyDir），容器重启后数据会丢失。解决方案：生产环境必须使用持久化存储卷（PVC），并绑定到可靠的存储后端（如云厂商的块存储、NFS、Longhorn等）。示例：在MySQL/Redis的Deployment中，替换emptyDir为持久化PVC：volumes:-name:mysql-datapers
WPF与其他技术的集成：与 WinForms、WCF 等协同工作 xcLeigh WPF 从入门到精通 wpf C#优化
WPF与其他技术的集成：与WinForms、WCF等协同工作一、前言二、WPF与WinForms集成2.1技术背景与特点2.2集成的必要性2.3集成方式与代码示例三、WPF与WCF集成3.1WCF技术概述3.2集成的应用场景3.3集成步骤与代码示例3.4集成中的安全与性能考虑四、总结结束语优质源码分享WPF与其他技术的集成：与WinForms、WCF等协同工作，在软件开发领域，很少有单一技术能够满
从代码民工到架构大师：为什么顶尖程序员的价值是普通人的100倍？苏师兄编程职场发展架构职场发展
大家好！我是苏师兄，一名工作多年的程序员，也是公众号【苏师兄编程】的主理人。凌晨三点的写字楼里，小张盯着屏幕上跳动的红色报错信息，这是他本月第三次被叫去处理线上故障。与之形成鲜明对比的是，隔壁工位的王工总能优雅地抿着咖啡，在系统监控大屏前用几行脚本化解危机。这两个场景每天都在互联网公司的各个部门上演——这就是普通程序员与顶尖技术人才之间的真实差距。一、被时代抛弃的"CRUD工种"在某电商公司的后台
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h