Go语言中的数据竞争模式详解

前言
Go在goroutine中通过引用来透明地捕获自由变量
切片会产生难以诊断的数据竞争
并发访问Go内置的、不安全的线程映射会导致频繁的数据竞争
Go开发人员常在pass-by-value时犯错并导致non-trivial的数据竞争
消息传递（通道）和共享内存的混合使用使代码变得复杂且易受数据竞争的影响
Add和Done方法的错误放置会导致数据竞争
并发运行测试会导致产品或测试代码中的数据竞争
小结

前言

本文主要基于在Uber的Go monorepo中发现的各种数据竞争模式，分析了其背后的原因与分类，希望能够帮助更多的Go开发人员，去关注并发代码的编写，考虑不同的语言的特性、以及避免由于自身编程习惯所引发的并发错误。

近年来，Uber已经开始采用Golang（简称Go）作为开发微服务的主要编程语言。目前，其Go monorepo（译者注：包含多个不同项目的单个仓库）包含了大约5,000万行代码，以及大约2,100个独特的Go服务。而且，它们都还在持续增长中。

为了实现并发，我们通常会使用go关键字，为函数调用添加前缀，以实现异步式的运行调用。在Go中，此类异步函数调用被称为goroutine。开发人员可以通过创建goroutine（例如，对其他服务的IO或RPC调用），来隐藏延迟。不同的goroutine可以通过消息传递，以及共享内存的方式，来传递数据。其中，共享内存恰好是Go中最常用的数据通信方式之一。

由于goroutineGo很容易被程序员创建和使用，因此它被认为属于“轻量级” 。同时，由Go编写的程序通常会比由其他语言编写的程序具有更强的并发性。例如，通过扫描数十万个运行在数据中心的微服务实例，我们发现Go微服务的并发性可达Java微服务的8倍。

当然，更高的并发性也意味着更多潜在的并发错误。我们常用数据竞争（data race）来描述当两个或多个goroutine访问相同的数据，而且至少有一个处于写入状态时，由于它们之间并没有排序，因此就会发生并发错误。总的来说，根据Go自身的相互作用等特点，数据竞争之类的隐蔽错误非常容易出现，因此我们应该尽量避免。

最近，我们使用动态数据竞争检测技术开发了一个系统，专门用来检测Uber的数据竞争。它在上线的六个月时间内，在我们的Go代码库中，检测到了大约2,000个数据竞争。其中已被开发人员着手修复了的数据竞争约有1,100个。下面，我将向您展示我们已发现的各种常见数据竞争模式。

Go在goroutine中通过引用来透明地捕获自由变量

Go中的嵌套函数（又名closure）通过引用的方式，透明地捕获所有自由的变量。程序员通常无需明确指定在closure语法中，需要捕获哪些自由变量。

这种方式是有别于Java和C++的。Java的lambda仅会根据数值去捕获，而且他们会有意识地避免并发缺陷。而C++则要求开发人员明确地指明是使用数值、还是引用的捕获方式。

当closure较大时，开发人员并不知道closure内使用的变量是否自由，可否通过引用来捕获。而由于引用的捕获、以及goroutine都是并发的，因此Go程序最终可能会因为没能显式地执行同步，而对自由变量进行无序的访问。我们可以通过如下三个示例来证明这一点：

示例1：由循环索引的变量捕获，而导致数据竞争

图1A中的代码显示了迭代Go的切片作业，并通过ProcessJob函数来处理每个元素的作业。

图1A：由循环索引的变量捕获，而导致数据竞争。

在此，开发人员会将厚重的ProcessJob包装在一个匿名的goroutine中。但是，循环索引变量的作业是通过goroutine内部被引用捕获的。当goroutine为首次循环迭代而启动，并访问作业的变量时，父goroutine中的for循环将在切片中更新相同的循环索引变量作业，并指向切片中的第二个元素，这就会导致数据竞争的出现。此类数据竞争可能发生在数值和引用类型上；切片、数组和映射上；以及循环体中的读和写的访问中。为此，Go推荐了一种编码习惯，来隐藏和私有化循环体中循环索引的变量。不过，开发人员并不总是能够遵循这一点。

示例2：由err变量的捕获，所导致的数据竞争

图1B：由err变量的捕获，所导致的数据竞争。

Go一直提倡函数有多个返回值。图1B展示了一种常见的通过返回实际值和错误对象，来指示是否存在错误的用法。可见，当且仅当错误值为nil（空）时，实际的返回值才会被认为是有意义的。因此，我们的通常做法是：将返回的错误对象，分配给名为err的变量，然后检查其是否为空（nilness）。不过，由于我们可以在函数体内调用多个返回错误的函数，因此程序每次都会对err变量进行多次赋值，然后进行是否为空的检查。当开发人员将这个习惯用法与goroutine混合使用时，错误变量就会在closure中被引用捕获。结果，程序对于goroutine中err的读写访问，与随后对封闭函数（或goroutine的多个实例）中相同的err变量的读写操作，就会同时运行。这便导致了数据竞争。

示例3：由已命名的返回变量捕获，所导致的数据竞争

图1C：由已命名的返回变量捕获，所导致的数据竞争。

Go引入了一种被称为已命名返回值的语法块。已命名的返回变量被视为在函数顶部定义的变量，其作用域超出了函数体。而没有参数的return语句，被称为“裸”命名返回值。由于closure的存在，如果将正常（非裸）的返回与已命名的返回相混合、或在具有命名返回的函数中使用延迟返回，那么就可能会引发数据竞争。

在上图1C中的NamedReturnCallee函数返回了一个整数，而且返回变量被命名为result。根据该语法，函数体的其余部分可以对结果进行直接读写，而无需额外声明。如果函数在第4行返回的是一个裸返回，而由于在第2行被赋值为result=10，那么第13行的调用者将看到其返回值为10。编译器则会安排将结果复制到retVal。同时，已命名的返回函数也可以使用如第9行所示的标准返回语法。该语法会让编译器复制return语句中的返回值20，以分配给已命名的返回变量结果。第6行创建了一个goroutine，它会捕获已命名的返回变量的结果。在设置该goroutine时，即使是并发专家也可能认为读取第7行的结果中是安全的，毕竟不存在对同一变量的写入，而且第9行的语句返回的20是一个常量，它似乎并没有触及到已命名的返回变量结果。不过，如前所述，代码在生成的过程中，会将return 20的语句转换为写入结果。此时，一旦我们突然对共享的结果变量进行并发读写，就会产生数据竞争的情况。

切片会产生难以诊断的数据竞争

切片（Slices）实际上是一些动态数组和引用类型。在其内部，切片包含了一个指向底层数组的指针、它的当前长度、以及底层数组可以扩展的最大容量。为了便于讨论，我们将这些变量统称为切片的元字段（meta field）。切片上的一种常见操作便是通过追加操作（append operation）来使其增长。当达到其容量限制时，代码会进行新的分配（例如，对当前的容量翻倍），并更新其对应的元字段。而当一个切片被goroutine并发访问时，Go会通过互斥锁（mutex），来保护对它的访问。

图2：即使使用锁，切片仍会出现数据竞争。

在图2中，开发人员往往以为已经对第6行的切片进行了锁定保护，便可防止数据竞争的出现。而实际上，当第14行将切片作为参数传递给没有锁保护的goroutine时，就会产生数据竞争。具体而言，goroutine的调用导致了切片中的元字段从调用处（第14行）被复制到被调用者（第11行）处。考虑到切片属于引用类型，我们认为在将其传递（复制）到被调用者时，会导致数据竞争的发生。不过，由于切片与指针类型不同，毕竟元字段是按照数值复制的，因此该数据竞争的发生概率非常低。

并发访问Go内置的、不安全的线程映射会导致频繁的数据竞争

哈希表(或称映射)是Go中的内置语言功能。不过，它对于线程是不安全的。如果多个goroutine同时访问同一张哈希表，而且其中至少有一个试图去修改哈希表（插入或删除某项）的话，就会产生数据竞争。开发人员往往认为他们可以同时访问哈希表中的不同项。而实际上，与数组或切片不同，映射（哈希表）是一种稀疏的数据结构，访问某一个元素就可能会导致访问另一个元素，如果在同一过程中发生了另一种插入或删除，那么它将会因为修改了稀疏的数据结构，而导致了数据竞争。

我们甚至观察到了更为复杂的、由并发映射访问产生的数据竞争。其原因是同一个哈希表被传递到了深度调用路径，而开发人员忘记了这些调用路径是通过异步goroutine去改变哈希表的事实。图3便显示了此类数据竞争的示例。

图3：由于并发映射访问导致的数据竞争。

虽然导致数据竞争的哈希表并非Go独有，但是以下原因会让Go更容易发生数据竞争：

由于映射是一种内置的语言结构，因此Go开发人员会比其他语言的开发者更频繁地使用映射。例如，在我们的Java存储库中，每MLoC（Millions of Lines Of Code，数百万行代码）里有4,389个映射结构；而在Go中，每MLoC里就有5,950个映射，足足高出了1.34倍。
不同于Java的get和put API，哈希表的访问语法类似数组访问语法，虽然易于使用，但是也会意外地与随机访问数据结构相混淆。在Go中，我们可以使用table[key]的语法，轻松查询那些不存在（non-existing）的映射元素。该语法能够简单地返回默认值，而不会产生任何错误。这种容错性对于开发者在使用Go的映射时是非常友好的。

Go开发人员常在pass-by-value时犯错并导致non-trivial的数据竞争

Go建议使用pass-by-value的语义，以简化逃逸分析，并为变量提供更好的栈上分配的机会，进而减少垃圾收集器的压力。

与所有对象皆为引用类型的Java不同，在Go中，对象可以是数值类型（如：结构），也可以是引用类型（如：接口）。由于没有了语法差异，这会导致诸如：sync.Mutex和sync.RWMutex等数值类型，在同步构造中被错误地使用。如果一个函数创建了一个互斥体结构，并通过数值传递（pass-by-value）给多个goroutine调用，那么这些goroutine在并发执行时，不同的互斥对象是不会在操作过程中共享内部状态的。这也就破坏了对于受保护的共享内存区域的互斥访问特性。请参见如下图4所示的代码。

图4A：

由by-reference或by-pointer的方法调用所引起的数据竞争

图4B：sync.Mutex的Lock/Unlock签名。

由于Go语法在指针和数值上调用方法是相同的，因此开发人员往往会忽视m.Lock()正在处理互斥锁的副本并非指针这一问题。调用者仍然可以在互斥的数值上调用这些API。而且编译器也会透明地安排传递数值的地址。相反，如果没有此类透明度，该错误就能够会被检测到，并认定为编译器类型不匹配的错误。

据此，当开发人员意外地实现了一个方法，其中的接收者是指向结构的指针，而不是结构的数值或副本时，那么就会发生与此相反的情况。也就是说，调用该方法的多个goroutine，最终会意外地共享结构相同的内部状态。而且，调用者也不会意识到数值类型在接收者处被透明地转换为了指针类型。显然，这都是开发人员所不愿发生的。

消息传递（通道）和共享内存的混合使用使代码变得复杂且易受数据竞争的影响

图5：将消息传递与共享内存混合时的数据竞争。

图5展示了开发人员使用一个专门为信号和等待准备的通道，通过Future来实现的示例。我们可以通过调用Start()方法来启动Future，并通过调用Future的Wait()方法，来阻止Future的完成。Start()方法会创建一个goroutine，以执行一个注册到Future的函数，并记录其返回值（如：response和err）。如第6行所示，goroutine通过在通道ch上发送一条消息，以向Wait()方法发出Future完成的信号。对称地，如第11行所示，Wait()方法块会从通道中获取相应的消息。

在Go中，上下文携带了跨越API边界和进程之间的截止日期、取消信号和其他请求范围的数值。这是在微服务中为任务设置时间线的常见模式。由此，Wait()阻止了被取消（第13行）的上下文、或已完成的Future（第11行）。此外，Wait()被包装在一个select语句（第10行）中，并处于阻止状态，直到至少有一个选择arm准备就绪。

如果上下文超时，则相应的案例将Future的err字段，在第14行上记录为ErrCancelled。此时，对于err的写入与第5行对Future的相同变量的写入操作，便形成了竞争。

Add和Done方法的错误放置会导致数据竞争

sync.WaitGroup结构是Go的组同步结构。与C++的barrier的barrier、以及latch的构造不同，WaitGroup中参与者的数量不是在构造时被确定的，而是动态更新的。在WaitGroup对象上，Go允许进行Add(int)、Done()和Wait()三种操作。其中，Add()会增加参与者的计数，而Wait()会处于阻止状态，直到Done()被调用为count的次数（通常每个参与者一次）。由于在Go中，组同步的使用程度比Java高出1.9倍，因此WaitGroup在Go中常被广泛地使用。

在下图6中，开发人员打算创建与切片itemId里的元素数量相同的goroutine，且并发处理它们。每个goroutine在不同索引的结果切片、以及在第12行对父功能块中，记录其成功或失败的状态，直到所有的goroutine已完成。接着，它会依次访问结果中的所有元素，以计算出被成功处理的数量。

图6A：

由于WaitGroup.Add()的错误放置，导致了数据竞争

为了使该代码能够正常工作，我们需要在第12行调用Wait()时，保证wg.Add(1)在调用wg.Wait()之前所执行的次数，也就是注册参与者的数量，必须等于itemIds的长度。这就意味着wg.Add(1)应该在每个goroutine之前被放置在第5行调用。但是，如果开发人员在第7行错误地将wg.Add(1)放置在了goroutine的主体中，它就无法保证在外部函数WaitGrpExample调用Wait()时，完整地执行。据此，在调用Wait()时，被注册到WaitGroup的itemId的长度就可能会变短。正是出于该原因，Wait()会被提前解除阻止。据此，WaitGrpExample函数则可以从切片结果中开始读取（即：第13行），而一些goroutine则开始并发写入同一个切片。

此外，我们还发现过早地在Waitgroup上调用wg.Done()，也会导致数据竞争。下图6B展示了wg.Done()与Go的defer语句交互的结果。当遇到多个defer语句时，代码会按照“后进先出”的顺序去执行。其中，第9行的wg.Wait()会在doCleanup()运行之前完成。即，父goroutine会在第10行去访问locationErr，而子goroutine可能仍然在延迟的doCleanup()函数内写入locationErr（为简洁起见，在此并未显示）。

图6B：由于WaitGroup.Done()的错误放置

延迟语句排序，并导致了数据竞争。

并发运行测试会导致产品或测试代码中的数据竞争

测试是Go的内置功能。在那些后缀为_test.go的文件里，任何前缀为Test的函数，都可以测试由Go构建的系统。如果测试代码调用了API--testing.T.Parallel()，那么它将与其他同类测试并发运行。我们发现此类并发测试有时会在测试代码中、有时也会在产品代码中产生大量的数据竞争。

此外，在单个以Test为前缀的函数中，Go开发人员经常会编写许多子测试，并通过由Go提供的套件包去执行它们。Go推荐开发人员通过表驱动的测试套件习语（table-driven test suite idiom）去编写和运行测试套件。据此，我们的开发人员在同一个测试中就编写了数十、甚至数百个可供系统并发运行的子测试。开发人员以为代码会执行串行测试，而忘记了在大型复杂测试套件中使用共享对象。此外，当产品级API在缺少线程安全（可能是因为没有需要）的情况下，被并发调用时，情况就会更加恶化。

小结

在上文中，我们分析了Go语言里的各种数据竞争模式，并对其背后的原因进行了分类。当然，不同的原因也可能会相互作用与影响。下表是对各种问题的汇总。

图7：数据竞争待分类。

上面讨论的主要是基于我们在Uber的Go monorepo中发现的各种数据竞争模式，难免有些挂一漏万。其实，代码的交错覆盖也可能产生数据竞争模式。希望上述提到的各种经验能够帮助更多的Go开发人员，去关注并发代码的编写，考虑不同的语言的特性、以及避免由于自身编程习惯所引发的并发错误。

到此这篇关于Go语言中的数据竞争模式详解的文章就介绍到这了,更多相关Go数据竞争模式内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

如何本地运行和开发 Langchain 项目 dgay_hua langchain python
在这篇指南中，我们将详细讲解如何在本地运行Langchain仓库，并提交您的第一个代码变更。如果您希望在开发容器中操作，可参考.devcontainer文件夹中的指南。技术背景介绍Langchain项目是一个高级框架，围绕构建“链”这种概念来组织代码。每个链的基本构件是微型逻辑单元，它们彼此结合，并可通过可编辑的配置文件进行管理。这个项目依托于Python生态，利用了Poetry作为其依赖管理工具
在Fedora上安装MySQL ZaxfSass mysql adb 数据库
MySQL是一种流行的开源关系型数据库管理系统，被广泛用于各种应用程序和网站。在Fedora操作系统上安装MySQL非常简单，本文将向您展示安装MySQL的步骤和相关源代码。步骤1：更新系统在安装MySQL之前，首先需要更新您的Fedora系统以确保您拥有最新的软件包和安全补丁。打开终端并执行以下命令：sudodnfupdate步骤2：安装MySQL服务器现在，我们可以使用DNF包管理器在Fedo
中国美容养生平台实现产业的转型 2401_84109346 大数据人工智能
中国美容养生平台可以创造多方面的价值，具体如下：经济贡献：美容养生行业对国民经济的贡献日益显著。随着市场规模和行业产值的不断提升，美容养生行业已成为推动经济增长的重要力量。例如，预计到2025年，中国生活美容服务行业的市场规模将达到8375亿元。技术创新与数字化转型：随着5G时代的到来，美容养生平台的运营方式不断创新，呈现出更强的竞争力。技术创新和数字化转型为美容养生行业带来了新的发展机遇，如新型
携程开源的分布式apollo技术，整合springboot集成实现动态刷新配置 2401_84584854 程序员 java 面试学习
最后这份文档从构建一个键值数据库的关键架构入手，不仅带你建立起全局观，还帮你迅速抓住核心主线。除此之外，还会具体讲解数据结构、线程模型、网络框架、持久化、主从同步和切片集群等，帮你搞懂底层原理。相信这对于所有层次的Redis使用者都是一份非常完美的教程了。整理不易，觉得有帮助的朋友可以帮忙点赞分享支持一下小编~你的支持，我的动力；祝各位前程似锦，offer不断！！！本文已被CODING开源项目：【
Python 基础：类诸葛思颖 python python 开发语言
目录一、类的概念二、定义类三、创建对象并进行访问四、修改属性的值方法一：句点表示法直接访问并修改方法二：通过方法进行修改五、继承继承父类属性和方法重写父类方法六、将实例用作属性七、导入类导入单个类从一个模块中导入多个类导入整个模块导入模块中的所有类八、一些代码编写规范遇到看不明白的地方，欢迎在评论中留言呐，一起讨论，一起进步！本文参考：《Python编程：从入门到实践（第2版）》一、类的概念类是是
TCP/IP原理详细解析一个儒雅随和的男子 tcp/ip 网络网络协议
前言TCP/IP是一种面向连接，可靠的传输，传输数据大小无限制的。通常情况下，系统与系统之间的http连接需要三次握手和四次挥手，这个执行过程会产生等待时间。这方面在日常开发时需要注意一下。TCP/IP是互联网的核心协议族，定义了数据如何在网络中进行传输、路由和接收。其设计遵循分层模型（四层或五层），各层独立工作，通过协议协同实现端到端通信。以下章节是其核心原理的逐层解析。一、TCP/IP分层模型
Python精进系列：Counter 函数进一步有进一步的欢喜 python 编程语言
目录一、Counter函数概述二、基本使用案例（一）列表元素计数（二）字符串字符计数（三）元组计数三、Counter对象的常用方法（一）most_common()方法（二）update()方法（三）subtract()方法（四）elements()方法四、Counter对象的数学运算（一）加法运算（二）减法运算（三）交集运算（四）并集运算五、实际应用场景（一）文本分析（二）数据分析（三）游戏开发应
数据库语句 lrydnh 数据库 android
环境变量path下的目录是系统目录。#include#include#pragmacomment(lib,"libmysql.lib")//链接libmysql.dll动态库的中间桥//MYSQL*conn;//数据库句柄。后面还有网络句柄（用来网络收发数据）boolconnect(){conn=mysql_init(NULL);if(conn==NULL){printf("Error%u:%s\
论文阅读-秦汉时期北方边疆组织的空间互动模式与直道的定位（中国） MilkLeong 论文阅读空间计算
论文英文题目：AspatialinteractionmodelofQin-HanDynastyorganisationonthenorthernfrontierandthelocationoftheZhidaohighway(China)发表于：journalofarchaeologicalscience，影响因子：3.030论文主要是使用空间互动模型来对秦汉时期的北方边疆直道进行定位和重建。分析
如何进行项目风险评估项目管理
进行项目风险评估的核心在于全面识别风险、定量评估、动态监控。其中，全面识别风险要求团队在项目启动前和实施过程中，从各个角度搜集和整理可能影响项目进度、成本、质量及目标达成的各种内外部风险；定量评估则依托数据与模型，将风险发生的概率与影响程度进行量化，从而为后续制定应对策略提供科学依据；动态监控强调在项目全过程中持续跟踪风险变化，并及时调整风险应对措施，确保项目始终处于可控状态。一、项目风险评估的基
指针高级06【数组指针】-黑马程序员C语言 c
数组指针的基本用法概念：指向数组的指针，叫做数组指针作用：方便操作数组中的各种数据#include"stdio.h"intmain(){intarr[]={10,20,30,40,50};intlen=sizeof(arr)/sizeof(int);//获取数组的指针//实际上获取数据的首地址int*p1=arr;int*p2=&arr[0];printf("%p\n",p1);printf("%
RK3568笔记五十六：yolov8_obb旋转框训练部署殷忆枫 RK3568学习笔记笔记 YOLO
若该文为原创文章，转载请注明原文出处。本文基于rknn_model_zoo和山水无移大佬的博客和代码训练模型并部署到正点原子的ATK-DLRK3568板子测试。https://github.com/ultralytics/ultralytics一、训练1、环境搭建使用的是AUTODL环境，yolov8-obb数据集不大，也可以使用cpu。2、创建虚拟环境#创建虚拟环境condacreate-nyo
记一次多线程导入问题排查过程程序辕日记 java MySql java spring boot
记一次多线程导入问题排查过程1.需求2.遇到问题3.排查解决问题1.需求大数据量的核对：现在有1000个excel文件，每个excel文件内有21个sheet页，现在要对这些数据进行核对，需要先将这些数据导入到库中，再进行核对。2.遇到问题库使用的是MySql，程序是Java，springcloud生态，在串行导入的时候，导入一次大概需要60分钟，现在对其进行改造，使用多线程导入，其思路为：创建线
【大数据】大数据处理-Lambda架构-Kappa架构 weixin_33884611 大数据系统架构
大数据处理-Lambda架构-Kappa架构elasticsearch-headElasticsearch-sqlclientNLPchina/elasticsearch-sql:UseSQLtoqueryElasticsearch360企业安全V5.6SP1,杨军01,您好!lamda架构_百度搜索Lambda架构vsKappa架构-数据源博客-CSDN博客数据系统架构——Lambdaarchi
对开源VLA sota π0的微调——如何基于各种开源数据集、以及你自己的私有数据集微调π0(含我司的微调实践) v_JULY_v 通用机械臂之路:π0等VLA sota模型开源VLA的sota模型微调π0 微调VLA模型基于私有数据集微调π0 基于开源数据集微调π0
前言25年2.4日，几个月前推出π0的公司PhysicalIntelligence(π)宣布正式开源π0及π0-FAST，如之前所介绍的，他们对用超过10,000小时的机器人数据进行了预训练该GitHub代码仓库「π0及π0-FAST的GitHub地址：github.com/Physical-Intelligence/openpi」包括4个方面：简言之，就是π0本身的代码和权重、特定平台上特定任务
Python 爬虫实战：从大众点评爬取餐厅评价，探寻美食打卡地西攻城狮北 python 爬虫美食实战案例
目录引言一、项目背景与需求分析1.1大众点评平台的特点1.2数据爬取目标二、技术选型与工具准备2.1技术选型2.2工具准备三、爬取餐厅信息3.1获取餐厅列表3.2获取餐厅详情四、数据存储五、数据处理与分析5.1数据清洗5.2数据分析六、可视化展示七、总结与展望引言大众点评作为国内知名的本地生活服务平台，提供了丰富的餐厅信息和用户评价。通过爬取大众点评上的餐厅评价数据，我们可以分析餐厅的受欢迎程度、
使用OpenAI API实现自然语言处理应用 shuoac 自然语言处理人工智能 python
使用OpenAIAPI实现自然语言处理应用技术背景介绍随着人工智能技术的不断发展，自然语言处理（NLP）在各种应用中的地位越来越重要。从自动文本生成、聊天机器人到智能搜索引擎，NLP技术的应用场景非常广泛。而OpenAI提供的API使得开发者可以轻松地将先进的NLP模型集成到他们的应用中。核心原理解析OpenAI的API基于强大的GPT（GenerativePre-trainedTransform
Python高级开发工程师巴啦啦小魔仙变身 python 开发语言
Python高级开发工程师通常会围绕技术能力、项目经验、问题解决能力等方面展开,以下为你详细介绍面试的常见内容、准备方式及注意事项:常见面试内容技术基础语言特性:深入理解Python的高级特性,如装饰器、元类、描述符等的原理和应用场景。例如,面试官可能会要求你现场编写一个装饰器来实现函数执行时间的统计。数据结构与算法:熟悉常见的数据结构(如列表、字典、集合、堆、栈、队列、链表、树、图等)和算法(如
Django-ORM-select_related 巴啦啦小魔仙变身 Python Django django 数据库 sqlite python
Django-ORM-select_related作用使用场景示例无select_related的查询有select_related的查询如何理解"只发起一次查询，包含所有相关作者信息"1.select_related的工作原理2.具体示例解析3.为什么只发起一次查询数据库中的books量巨大，使用`select_related`导致服务崩掉，如何解决程序层面优化1.优化select_relate
【计算机网络】常见tcp/udp对应的应用层协议，端口 {⌐■_■} 计算机网络 tcp/ip udp
TCP和UDP对应的常见应用层协议基于TCP的应用层协议协议全称用途默认端口HTTPHyperTextTransferProtocol超文本传输协议80HTTPSHTTPSecure加密的超文本传输协议443FTPFileTransferProtocol文件传输协议（20传输数据，21控制连接）20,21SMTPSimpleMailTransferProtocol发送邮件25POP3PostOff
【Rockchip系列】官方函数：wrapbuffer_handle jcfszxc Rockchip系列 linux Rockchip 开发语言 rknn-toolkit2 c++算法
wrapbuffer_handlewrapbuffer_handle函数用于将输入输出的图像参数转化为统一的rga_buffer_t结构,作为IM2D图形库用户API的输入参数。在执行相应的图像操作之前,需要先调用此函数来准备图像数据。函数原型IM_APIrga_buffer_twrapbuffer_handle(rga_buffer_handle_thandle,intwidth,intheig
使用Couchbase中的向量搜索进行智能查询 eahba python
技术背景介绍Couchbase是一种强大的分布式NoSQL数据库，广泛应用于云、移动、AI和边缘计算应用中。其向量搜索功能，作为全文搜索服务的一部分，支持在应用中进行高效的语义查询。这为开发者在实现AI驱动的应用时提供了极大的便利。核心原理解析Couchbase的向量搜索利用向量嵌入技术对文本进行处理，可以实现基于语义相似度的查询。这与传统的关键词匹配有根本的不同，更适合AI应用场景中模糊或语义相
LVITEM 列表视图控件（List Control）显示图标 form88 C++class
LVITEM列表视图控件（ListControl）列表视图控件是一种非常常用的控件，在需要以报表形式显示数据时，列表控件通常是最好的选择，许多专用的数据报表控件，也是在它的基础上派生而来。与树视图类似，列表控件可以由多个子项目组成，并且支持大图标、小图标、列表和报表4种方式显示信息，如图1所示。图1列表视图的4种显示方式列表视图包含一个项目列表，而其中每个项目由图标、项目名称和多个子项组成，每一个
如何利用PubMed作为信息检索器 — 结合LangChain实现高效文献查询 bhawfgrcbtwny langchain python
如何利用PubMed作为信息检索器—结合LangChain实现高效文献查询引言PubMed是由美国国家生物技术信息中心（NCBI）和国家医学图书馆（NLM）维护的一个涵盖超过3500万篇生物医学文献的数据库。对于研究人员和开发者而言，如何高效地从如此庞大的数据库中提取有用的信息是一项挑战。在本文中，我们将探讨如何使用LangChain库中的PubMedRetriever类，从PubMed查询并返回
DeepSeek该选蒸馏版还是满血版飞翔的FOX 人工智能
针对不同版本的DeepSeek，需要从多个维度综合分析：1.模型规模与基础能力671B模型在理论上具备更强的底层推理能力：更大参数量意味着更强的模式识别、逻辑推理和知识储备能力，尤其在跨领域、开放域任务中优势显著。70B模型若未经过充分行业适配，其原始能力上限低于671B。但在特定场景下，通过优化可能突破这一限制。2.行业数据适配的关键作用长期迭代的70B模型可通过以下方式缩小差距：领域微调：持续
使用Trubrics进行LLM用户分析和反馈管理 dgay_hua python
技术背景介绍在AI模型开发过程中，用户的输入数据和反馈信息对模型优化至关重要。Trubrics是一个强大的LLM用户分析平台，能够帮助开发者收集、分析和管理用户的提示和反馈。本文将介绍如何使用Trubrics平台，结合实际代码展示其安装、设置及应用。核心原理解析Trubrics主要通过对用户与模型的交互进行分析，来提供改进建议。其核心是利用API来监控用户发出的每一个提示和反馈，从而帮助开发者更好
使用 `UnstructuredURLLoader` 和 `SeleniumURLLoader` 从 URL 加载 HTML 文档 VYSAHF html 前端 python
随着网络数据的爆炸性增长，如何高效地从网页中获取结构化信息变得愈发重要。在这篇文章中，我们将探讨如何使用UnstructuredURLLoader和SeleniumURLLoader来处理和加载来自URL的HTML文档。这两种方法都有其特定的应用场景和优势。技术背景介绍对于需要大量从不同网页中获取信息的场景，选择合适的工具显得尤为关键。UnstructuredURLLoader提供了一种简单直接的
报表控件Stimulsoft报告中的数据矩阵条形码介绍小董讲MES 报表控件报表工具 Stimulsoft
本连载系列教程将介绍StimulsoftReport中创建二维条形码的文章，以及如何在Stimulsoft工具中创建的报告中使用它们。本系列的第一篇文章是关于DataMatrix条形码的，我们将在其中告诉您如何在报表中放置和自定义它。。从2022.1版本开始，我们将Aztec条形码添加到Stimulsoft报告工具和数据分析中。StimulsoftUltimate官方正版下载条形码历史记录随后的自
炸裂函数explode 阿强77 炸裂函数 sql
在ApacheHive中，"炸裂函数"通常指的是将复杂数据类型（如数组或映射）拆分成多行的函数。Hive提供了几个内置函数来实现这种操作，其中最常用的是explode函数。1.explode函数explode函数用于将数组或映射类型的列拆分成多行。每行包含数组或映射中的一个元素。示例1:炸裂数组假设有一个表my_table，其中有一列my_array是数组类型：SELECTexplode(my_a
RDD 行动算子阿强77 RDD Spark
在ApacheSpark中，RDD（弹性分布式数据集）是核心数据结构之一。行动算子会触发实际的计算并返回结果或执行某些操作。以下是Scala中常见的RDD行动算子：1.collect()将RDD中的所有数据收集到驱动程序中，并返回一个数组。注意：如果数据集很大，可能会导致内存不足。valdata:Array[T]=rdd.collect()2.count()返回RDD中元素的总数。valcount
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他