OneFlow深度学习框架

开源语言大模型的正确姿势

作者 | Nathan Lambert

OneFlow编译

翻译｜杨婷、宛子琳

如今，很多公司都被迫加快步伐，参与到开源语言大模型（LLM）的竞争之中。发布某种形式的开源语言大模型已成为机器学习公司实力的象征。最近，Mistral AI 完成资金筹集，发布了一款拥有 70 亿参数的强大语言模型。

尽管更多人参与到开源机器学习生态系统中是有益的，也被很多人视为一个重要的发展趋势，但现在我们需要转变视角，推动开源机器学习公司从发布开源模型转向寻求长期的商业战略和竞争优势。这些公司需要做到两点：第一，具备相比资金雄厚的公司的竞争力；第二，建立和维护有利于产品粘性的护城河。目前为止，开源 ML 公司还并未在这两个方面取得良好的成果。

本文着眼于第一点：如果维持现状，那么开源语言大模型公司能否缩小与谷歌或 OpenAI 等巨头之间的差距？

这个问题针对的是 Mistral 和 Stability 等公司（他们把全部资金都用于计算，而没有开发产品）和那些认为开源是语言大模型的最佳发展方向的人。

（本文作者Nathan Lambert是伯克利人工智能博士和 Huggingface 的机器学习科学家。本文由OneFlow编译发布，转载请联系授权。原文：https://www.interconnects.ai/p/are-open-llms-viable#footnote-anchor-1-13759732）

开源 LLM 的短期趋势：种子、泡沫与实验

为呼应 BitTorrent 上原始 LLaMa 模型的泄露，Mistral 通过推特上发布了自己的第一个模型，并附带一个种子链接（如下图）。这种模型发布方式十分有趣，符合时代潮流。

今明两年可能是开源 LLM 的黄金时期。Meta 以 LLaMa 为计算平台快速发展壮大，LLaMa 2 很实用，能够轻松进行各类有趣任务的微调，许多小规模开发者通过完善其生态系统进行支持，LLaMa 3/4 对标的是 GPT4 的能力。

因为 Meta 成功地将 LLaMa 打造成了一个计算平台，所以我们能将 LLaMa 2 托管在谷歌云平台 GCP和 AWS Bedrock 上。其分发流程为：Meta 发布模型 --> 开发者用模型进行实验 --> 开发者向管理层推荐应该在实验性产品中使用该模型 --> 业务决策者找到云服务供应商以托管该模型。Google 和 Amazon 可能同意与 Meta 签订收入共享协议来托管该模型。尽管 Meta 的许可证备受批评，但 LLaMa 2 的成功不可否认。

有多少模型能够像 Meta 的 LLaMa 获得同样的杠杆效应呢？成功与否似乎主要取决于模型的发布时间和地点。目前，LLaMa 2 是唯一一款最优秀的通用开源语言大模型。性能最佳的代码模型以及其他一些独特的模型也可能会被托管，但这个数量仍然远低于当前发布模型的供应商数量。

市场炒作的可持续性的关键在于，弄清楚有多少人因为公司高层鼓励人们使用 LLM 产品并进行实验而参与了 LLaMa 和开源 LLM 。对于技术发展而言，了解开源 LLM 在特定用例中的基础设施和限制至关重要，而产品还没有那么有用这一细节在资金充裕的情况下并不重要。这就是 LLM 市场出现泡沫的原因。

LLaMa 是验证 LLM 产品能否获得一些吸引力的跳板，这是一个极具价值的立足点，也正因如此，人们自然而然地会产生疑问：除了 Meta，是否还会有其他公司进入这一领域？

LLM 的中期发展趋势：共享、数据和竞争

许多有开源倾向的 LLM 提供商已经宣布了自己的意图，随着图景逐渐明朗，每隔几个月我们就会看到新的模型版本发布，判断谁是其中的佼佼者，问题是，采用“开源LLM即平台”策略的那些人，并没有真正贯彻他们在开源方面的开放性。

LLM 真正的开源在于开放数据和训练代码库。因此，我们需要采取行动鼓励人们开放这些资源。下面的这条推文以及我在 Mistral 发布之后进行的一些线下讨论，让我意识到，缺乏数据透明性可能很快成为关乎开源 LLM 生态系统存亡的重要问题。

注意：许多数据发布细节实际上可能受到对 OpenAI 和 Meta 诉讼的制约，其中记录了未经许可使用图书数据集的情况。如果在此问题上模型供应商经证明不存在问题，就无须担心。

开源技术的一个主要论断是，通过更多利益相关者的参与，能够让每个人都受益，实现更快的进步。这适用于安全性、可靠性和功能性。考虑到现代 LLM 的预训练通常可以简化为收集优质数据并高效地应用于模型，我们正在使用的各个开源模型的主要区别在于数据，如 LLaMa 以及 Adept、Mistral 和 Stability 等已发布的模型。

这一论断存在根本的资本约束。很多开源团队的规模可能是 OpenAI、Google 和 Meta 这样的大型团队规模的 1/20。每个团队都在用不同的方法追求相似的目标，拥有更多的人员确实能够完成更多事。开源的优势在于参与各方能够彼此分享最显著的细节，然后通过整合（尤其是通过无偿社区的调试和改进），开源阵营能够汇集 20 倍的人力资源，从而为每个开源组织节省时间，提高效率。虽然开源本身并不能给任一参与方带来巨大优势，但它为整个生态系统提供了机会。

开源组织应当明白，当前发布的模型实际上并不具备直接商业化的价值（1）。在未来几年将 LLM 逐渐融入现代经济的过程中，它们的主要作用是服务于人员招募和公共关系。尽管开源 LLM 正迅速拉近与 OpenAI 之间的差距，但考虑到模型 SOTA 的快速迭代和更新（三个月左右），开源模型优势和竞争力的持续时间非常有限，只能维持到下个模型出现之前。

尽管某些参与者可能认为，不公开自己的数据可以积累优势，但实际上他们正在逐渐失去竞争力。在开源领域内，他们相互竞争，而 OpenAI 可能会通过更快的发展迅速吞噬其市场份额。Mistral 和那些仅以开源为商业模式的参与者需要更加强调开放性，直到开发出自己的产品。否则，他们只会增强我们对 Meta 等公司深厚资源的依赖来弥补开源和闭源语言模型之间的差距。

Mistral 等公司以开源方式训练优质的语言大模型，然而这种方式在业务策略上意义不大，这可能仅仅只意味着，训练并发布了一个不错的LLM，但没有任何产品，也不是可行的商业策略。

如果从未计划推出产品，就意味着没有真正的商业模式，所以至少可以做件好事，把模型细节分享给大家。对于 Meta 等坐拥大量资金的公司而言，开源语言大模型并不会影响其生存底线，但对于规模较小的参与者来说，开源则可能导致其被收购或破产。

这是开源与闭源语言模型之间的漫长故事的序章。之前的错误埋下了悲剧的种子，预示着故事的结局：LLM 供应商的大规模整合。

如果我们认真思考这样一种未来：开源以其最初的原则蓬勃发展，那么我们需要对决定哪些数据能开源/不开源的决策者来施加更大压力。同时，关于引导社区发展，这些公司还应当做些什么呢？

回顾文章开头引用的推文，由于法律责任问题（目前作者和撰稿人正在关注），很少有组织能够加入该列表，不过其中包含的数据很值得探讨。

例如，Mistral 使用了部分 2023 年（2）的数据进行训练，这意味着，他们不仅仅下载了 The Pile 或常用的 Common Crawl 存档。Mistral 还应该公开其网络爬虫或使用过的数据处理脚本等资源。现在，是时候出现一个新的预训练数据发布表单了。此外，Stability 发布了一些关于他们最新的 30亿参数的 StableLM 的数据信息，这值得肯定，尽管业界传闻他们在业务方面遭遇了困境。

这种情况随着 RLHF 的出现而变得更加复杂。我不确定是否有人知道如何传达重新收集 RLHF 数据所需的必要限制条件。与预训练相比，与外部供应商进行的迭代训练和数据收集显著增加了复杂性。开源领域尚未完全复现 OpenAI 和 Google 从 RLHF 中所期望的行为，当 LLaMa 2 中的各种结果是唯一的产出时，这种差距尤为明显。

我预测开源 LLM 的未来有如下两种可能：

开源公司持续加大开源力度。开源社区通过群众智慧共同快速解决众多问题，而公司有充足时间开发产品从而解决商业命题。

开源 LLM 维持现状不变，导致进展逐渐落后。开源供应商就像在玩抢凳子游戏，除非他们能够找到其他收入来源并充分利用庞大的 GPU 机群，否则将逐个在约 18 个月内因资金耗尽而被收购。唯有那些拥有大规模产品用例的开源参与者能够继续生存，开源能够帮助他们深入了解自己的模型。

在 LLM 领域，当众人聚焦于开源与闭源之争时，现在更应进一步关注开放性与和透明度，而不仅仅将其作为公关关系的手段。

事实表明，对于那些先筹集资金训练开源模型，之后才思考其用例的组织，大多数理性的人对其发展前景越来越谨慎。LLM 当前的发展要义都在产品上，底层技术将持续进步，但只有其驱动新的产品才有价值。这正是我们目前所处的经济周期，对此也有前车之鉴。

如果我们不能及早深入思考这一问题，就会白白浪费巨额投资。

图片来自 Midjourney

开源LLM 的长期趋势：专有模型、规模化及挑战

资源共享的前景并不明朗，资本需求的规模定律（scaling law）预测对于开源公司来说也并不乐观。开源公司需要有能力筹集到这些资金，否则一切都是空谈。

改变这一局面的关键因素是：开源公司在其产品所聚焦的细分领域中形成绝对优势。之后可以发布模型，在其专业领域收集社区反馈，并加快迭代间的反馈循环。类似于 Adept 发布多模态模型，展示其从全部 YouTube 教程中学习的能力，这意味着 Mistral 必须找到一个产品解决方案（并非易事）。

正如我在关于 LLM 发展路径的文章中所提到的：

开源领域将会开发出在特定需求集上更具模式能力的 LLM，但其综合能力相对较差。这意味着，相比对标 GPT4 在各项指标上的强大能力，开源模型将选择 10-50% 的指标作为目标胜过 GPT4，在其他指标上将仍会落后。

直接的正面竞争并不是一种可行的短期或长期策略。我认为，大多数公司都已意识到了这一点，并迫切需要找到解决方案，但 Twitter 上的许多用户似乎还没有意识到这一点，他们会仅仅因为发布了一个模型就欢呼雀跃。事实上，其中还包含许多其他影响因素。

同时我预计，在未来的 5-10 年内，训练 SOTA 语言模型的成本将每年增加约 5 倍。到 2028 年，训练一个模型的花费可能会轻易超过百亿甚至千亿美元。我甚至没有在论述中充分考虑这一因素，但这进一步强调了一个事实：较小的公司需要专注于特定领域，以增加自身的竞争优势。

这是每个人都能为自己所感兴趣的任务获得一个更小、更本地化模型的方式。我们需要回归开源的两大原则：个性化与安全性。

开源模型领域还会有更多公司的加入。xAI 预计将开源模型，Mosaic 将发布强大的模型，Contextual 也可能会发布一些实用模型，还有一些在暗中运作的公司未被提及。除数据细节之外，接下来的问题是，随着模型能力的日益增强，行业动态将如何展开。我们已经看到整个行业的大趋势，即最强大的模型供应商变得越来越封闭。为促进开源生态系统的蓬勃发展，我们需要全面推动并积极营造正面势头，但目前还未看到这种情况。

注释：

（1） Meta 的情况有些微妙。对于 Meta 而言，在产品中利用专有模型可能比通过授权获得更多收益。

（2）我没找到包含最近模型回答问题截图的推文。

其他人都在看

为什么开源大模型终将胜出
英伟达的AI霸主地位会持久吗
大模型长上下文运行的关键问题
PyTorch创始人：开源成功的方法论
OpenAI首席科学家：直面AGI的可能性
语言模型的多模态能力、幻觉与研究经验
LLVM之父:我的AI基础设施软件构建理念

试用OneFlow: github.com/Oneflow-Inc/oneflow/

Teleport 开源堡垒机（推荐工具）小政同学运维堡垒机
1.什么是堡垒机？堡垒机，就是让我们能够更安全的远程连接和操作服务器的一种工具，将其部署到服务器中，然后将其他服务器的外部访问进行限制，所有的操作都在堡垒机中进行，堡垒机还拥有记录登录信息与操作监控等功能，对于运行一些指定的危险命令，会对其进行告警反馈，有人登录时，管理员可以查看其在服务器中进行的操作，采用视频的形式展示，真正做到了出现故障能够追责到某个人。2.Teleport开源堡垒机他是一个轻
Docker-compose容器编排
⼀、Docker-compose定义1.dockercompose是docker官⽅的开源项⽬，负责实现对docker容器集群的快速编排(容器，依赖，⽹络，挂载。。)2.compose是docker公司推出的⼀个⼯具软件，可以管理多个docker容器组成的应⽤3.需要定义⼀个YAML格式的配置⽂件docker-compose.yml，写好多个容器之间的调⽤关系4.使⽤compose的步骤、5.1.
Android 发展历程
个人学习笔记安卓（android）是基于Linux内核的开源操作系统。主要用于移动设备，如智能手机、平板电脑、电视等，由Google公司及开放手机联盟领导及开发。2005年8月由谷歌收购注资HTC制造第一部Android手机2011年第一季度，android在全球的市场份额超过了塞班，成为全球第一2013年的第四季度，android平台手机的全球市场份额已经达到78.1%。2019年，谷歌官方宣布
巧用云平台API实现开源模型免费调用的实战教程 herosunly AIGC 人工智能大模型 API 实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法工程师一职，获得CSDN博客之星第一名，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得多项AI顶级比赛的Top名次，其中包括阿里云、科大讯飞比赛第一名，CCF、开放原子比赛二等奖。在技术创新领域拥有多项授权发明。曾辅导多位非科班出身的同学成功进入算法行业就业
React + PDF.js 预览 PDF 文件：从基础实现到高级优化的完整指南 EndingCoder 前端开发 javascript react.js pdf 前端前端框架
关键点PDF.js：Mozilla开发的开源JavaScript库，用于在浏览器中渲染PDF文件。React集成：结合React组件化特性，实现高效、交互式的PDF预览功能。功能实现：支持PDF文件加载、页面导航、缩放、搜索、书签和注释。优化策略：包括性能优化（懒加载、缓存）、可访问性和手机端适配。常见问题：处理大文件加载、跨浏览器兼容性和内存管理。实践场景：通过一个文档管理应用，展示PDF.js
RTSP系列三：RTP协议介绍 BreakingY 网络音视频
我的音视频/流媒体开源项目(github)RTSP系列：RTSP系列一：RTSP协议介绍-CSDN博客RTSP系列二：RTSP协议鉴权-CSDN博客RTSP系列三：RTP协议介绍-CSDN博客RTSP系列四：RTSPServer/Client实战项目-CSDN博客目录一、基本概念二、RTP报文格式三、RTP封装视频3.1、RTP封装H2643.1.1、单一封包模式3.1.2、组合封包模式3.1.3
从零开始写一个RTSP服务器（五）RTP传输AAC
从零开始写一个RTSP服务器系列★我的开源项目-RtspServer从零开始写一个RTSP服务器（一）RTSP协议讲解从零开始写一个RTSP服务器（二）RTSP协议的实现从零开始写一个RTSP服务器（三）RTP传输H.264从零开始写一个RTSP服务器（四）一个传输H.264的RTSP服务器从零开始写一个RTSP服务器（五）RTP传输AAC从零开始写一个RTSP服务器（六）一个传输AAC的RTSP
dnSpy 使用教程
一、dnSpy简介dnSpy是一款功能强大的免费开源.NET反编译工具，支持对.NETFramework、.NETCore和Mono程序进行反编译、调试与修改，能将程序集反编译为C#或IL（中间语言）代码，帮助开发者或安全研究人员深入分析和理解.NET程序的内部逻辑。它为逆向工程工作提供了极大便利，使相关操作更易于理解和执行。与之类似的ILspy也是一款知名的开源.NET反编译软件，下面将对二者进
极客开发者如何打造下一个DeepSeek：从技术颠覆到生态构建的深度思考山顶望月川人工智能
DeepSeek的成功首先源于其技术范式的根本性突破...1.1架构创新的三大支柱DeepSeek的技术优势建立在三大创新基础之上...1.2极客开发者的技术启示对于有志打造下一个DeepSeek的极客开发者...二、生态战略：从封闭花园到开源雨林DeepSeek的第二个成功密码在于其开放生态战略...2.1开源生态的双重价值DeepSeek的开源策略创造了双重价值...2.2构建开发者生态的关键
为什么Linux系统安全没有病毒?原因是“它” 老男孩IT教育 linux 系统安全网络
提到Linux系统，我们都会想到安全、自由度高、开源等特点，在Linux中病毒是很少甚至没有的，那么为什么Linux系统下病毒这么少呢?下面看老男孩教育小编给大家详细说明下，以下是详细的内容：Linux账号限制对一个二进制的Linux病毒，要感染可执行文件，这些可执行文件对启动这个病毒的用户一定要是可写的。而实际情况通常并不是这样的。实际情况通常是，程序被root拥有，用户通过无特权的帐号运行。而
Flutter中Material的介绍 zhouzhengqian flutter flutter
Flutter是一个由Google开发的开源UI工具包，用于在移动、Web和桌面平台上构建高性能、美观的本地用户界面。Flutter使用Dart编程语言，具有热重载（HotReload）功能，可以快速方便地进行开发、测试和构建应用。MaterialDesign是由Google提出的一种设计语言，用于创建现代、直观、一致的用户界面。Flutter提供了一个名为material的包，它实现了Mater
Flutter介绍 PyCrawlFlutter Lab Flutter开发 flutter
什么是Flutter？Flutter是一个开源的UI软件工具包，由谷歌开发，用于从单一的代码库创建精美的、编译型的移动应用、Web和桌面应用程序。它使用Dart语言编写，特别注重性能和响应式设计。Flutter的优势和不足优势Flutter是一个完全免费且彻底开源的软件开发工具包，它加速了应用的开发过程。通过Flutter，开发者能够设计出卓越的用户界面（UI），同时显著减少代码编写量。它还允许开
UI自动化-Appium Oooon_the_way ui 自动化 appium
前言Appium是一款开源的跨平台移动应用UI自动化测试框架，支持Android、iOS和Windows平台的原生（Native）、混合（Hybrid）及移动Web应用。其核心设计基于WebDriver协议（即SeleniumWebDriver的W3C标准），通过客户端-服务器（C/S）架构（常见面试题）实现多语言支持和高扩展性。一、核心架构与工作原理C/S架构分层客户端（Client）：测试脚本
ClickHouse【理论篇】01：什么是ClickHouse
ClickHouse是一款开源的列式数据库管理系统（Column-OrientedDBMS），专为高性能实时数据分析（OLAP,OnlineAnalyticalProcessing）场景设计。它由俄罗斯搜索引擎公司Yandex开发（2016年开源），目前由独立基金会ClickHouse,Inc.维护，广泛应用于大数据分析、日志处理、用户行为洞察等领域。一、核心定位：OLAP场景的“性能标杆”传统关
推荐开源项目：Diodon —— 专为Unity桌面打造的顶级剪贴板管理器郦岚彬Steward
推荐开源项目：Diodon——专为Unity桌面打造的顶级剪贴板管理器diodonAimingtobethebestintegratedclipboardmanagerfortheUnitydesktop项目地址:https://gitcode.com/gh_mirrors/di/diodon在日常的计算机操作中，剪贴板是不可或缺的工具之一。Diodon，一个旨在成为Unity桌面环境下最佳集成剪
利用已有的 PostgreSQL 和 ZooKeeper 服务，启动dolphinscheduler-standalone-server3.1.9 镜像云游大数据平台 zookeeper docker postgresql 工作流任务调度
ApacheDolphinScheduler是一个分布式易扩展的可视化DAG工作流任务调度开源系统。适用于企业级场景，提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。ApacheDolphinScheduler旨在解决复杂的大数据任务依赖关系，并为应用程序提供数据和各种OPS编排中的关系。解决数据研发ETL依赖错综复杂，无法监控任务健康状态的问题。DolphinSchedule
OpenLayers 入门指南：序言凌往昔 OpenLayers 入门指南 WebGIS OpenLayers
本专栏旨在帮助零GIS基础的开发人员系统掌握OpenLayers这一强大的开源Web地图库，通过“理论+实战”结合的方式，逐步实现从创建地图到构建一个基础地图应用模版。无论你是前端开发者、GIS爱好者，都可以通过此专栏零基础开始用OpenLayers开发一个基础地图应用。如果你对OpenLayers已经有过了解和使用，且对API也掌握的比较熟了，不建议订阅此专栏！一、前端框架Vue3TypeScr
SQLiteC/C++接口详细介绍sqlite3_stmt类（二）界忆数据库 SQLite C与c++sqlite 数据库
返回目录：SQLite—免费开源数据库系列文章目录上一篇：SQLiteC/C++接口详细介绍sqlite3_stmt类简介下一篇：SQLiteC/C++接口详细介绍sqlite3_stmt类（三）sqlite3_reset()功能：重置一个准备好执行的SQL语句的状态，使其可以重复执行或进行新的绑定。在SQLite3准备执行一个SQL语句之前，需要进行一系列的准备工作，包括将SQL语句编译成字节码
SQLiteC/C++接口详细介绍sqlite3_stmt类（一）界忆数据库 SQLite C与c++sqlite 数据库
返回目录：SQLite—免费开源数据库系列文章目录上一篇：SQLiteC/C++接口详细介绍sqlite3_stmt类简介下一篇：SQLiteC/C++接口详细介绍sqlite3_stmt类（二）序言：本文开始了SQLite的第二个类的详细介绍了，有兴趣的朋友可以关注更新一下。1、sqlite3_prepare_v2()`sqlite3_prepare_v2`是SQLite库中的一个函数，用于将一
jQuery Mobile 事件
jQueryMobile事件概述jQueryMobile是一个基于jQuery的开源移动设备Web框架，它通过简单的代码和丰富的API，为开发者提供了创建适应各种移动设备的响应式Web应用的解决方案。jQueryMobile事件是其核心功能之一，本文将详细介绍jQueryMobile中常见的事件及其使用方法。常见事件1.点击事件（click）点击事件是jQueryMobile中最常用的交互事件之一
wireshark介绍和使用有趣的我网络安全 wireshark 测试工具网络
Wireshark介绍Wireshark是一款开源的网络协议分析工具（PacketSniffer），用于捕获和分析网络数据包。它支持多种协议解析，适用于网络调试、安全分析、网络教学等场景。官网：https://www.wireshark.org/特点：✔跨平台（Windows/macOS/Linux）✔支持2000+种协议解析✔图形化界面+命令行工具（tshark）✔可实时抓包或分析离线抓包文件（
19｜Whisper+ChatGPT：请AI代你听播客 _Rye_ AI大模型 whisper chatgpt
今天，我们的课程开始进入一个新的主题了，那就是语音识别。过去几周我们介绍的ChatGPT虽然很强大，但是只能接受文本的输入。而在现实生活中，很多时候我们并不方便停下来打字。很多内容比如像播客也没有文字版，所以这个时候，我们就需要一个能够将语音内容转换成文本的能力。作为目前AI界的领导者，OpenAI自然也不会放过这个需求。他们不仅发表了一个通用的语音识别模型Whisper，还把对应的代码开源了。在
VSCode 安装使用教程小奇JAVA面试安装使用教程 vscode ide 编辑器
一、VSCode简介VisualStudioCode（简称VSCode）是由微软推出的一款免费、开源、跨平台的代码编辑器。它支持多种语言、丰富的插件系统、强大的调试功能和Git集成，是当前最流行的开发工具之一。二、安装VSCode2.1下载地址官方网站：https://code.visualstudio.com/2.2Windows安装下载.exe安装程序；双击安装，建议勾选“添加到系统PATH”
docker-compose编排saleor obboda 运维 docker 容器运维
一、saleor简介Saleor是一个开源Headless电商系统Saleor，它被用于电子商务等场景。Saleor是现代堆栈上以客户为中心的电子商务。是一个无头的GraphQL商务平台，提供超快速、动态、个性化的购物体验。美观的在线商店，任何地方，任何设备。二、saleor的默认启动流程1、拉取存储库gitclonehttps://github.com/saleor/saleor-platfor
PostgreSQL连接池监控与优化：pg_stat_activity详解及连接阻塞排查指南
1.引言PostgreSQL是一款功能强大的开源关系型数据库，广泛应用于各类企业级应用。在高并发场景下，数据库连接池的管理和监控至关重要。如果连接池使用不当，可能会导致连接泄漏、阻塞甚至数据库崩溃。本文将详细介绍如何使用pg_stat_activity监控PostgreSQL连接状态，并针对连接卡住、阻塞等问题提供解决方案。2.使用pg_stat_activity监控连接状态pg_stat_act
ECharts 智慧医疗大屏制作实例详解
在大数据时代，数据可视化已成为信息传递和决策支持的重要手段。ECharts作为一款功能强大、易于上手的开源可视化库，凭借其丰富的图表类型、灵活的配置项和良好的跨平台兼容性，广泛应用于企业级数据大屏、BI报表、实时监控等场景。本教程以“智慧医疗大屏”为例，完整演示了从页面搭建、图表配置到动态交互与响应式适配的全过程。通过循序渐进的讲解，读者将掌握如何使用ECharts构建专业、美观、可交互的数据可视
React-Native痛点解析之开发环境搭建及扩展 cuoban Android ReactNative android开发 android
ReactNative简直太火了，国内大公司都在争先恐后的尝鲜，让人难以相信这是诞生刚刚一年的开源项目。正因为它的年轻，在使用它进行开发时难免会遇到这样那样的坑，因此，我们邀请了《ReactNative入门与实战》的作者之一，魅族高级研发经理魏晓军来为我们解析RN开发中的痛点。本文分享的是在环境搭建和扩展中会遇到的问题与解决方案。引言ReactNative的出现，为APP开发者们带来了冲动和激情，
Github 2025-07-04 Java开源项目日报 Top10 老孙正经胡说 github java 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-07-04统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Java项目10Java实现的算法集合：使用Gitpod.io进行编辑和贡献创建周期：2883天开发语言：Java协议类型：MITLicenseStar数量：57266个Fork数量：18692次关注人数：57266人贡献人数：431人OpenIss
【科研写作自动化工具】如何用AI技术组合（大模型+多Agent+自动化）打造一个“智能论文生产线”，把枯燥的写作流程变成自动化
n8n是一款开源的工作流自动化工具，类似于Zapier或Make（原Integromat），但更注重灵活性和开发者友好性。在课程文件中提到的n8n自动化流水线主要用于科研写作的自动化流程集成，以下是详细解释：n8n的核心功能可视化工作流设计：通过拖拽节点（Nodes）连接不同工具和服务，无需编写复杂代码即可搭建自动化流程。多平台集成：支持连接文献数据库（如PubMed、arXiv）、AI模型（如O
ubuntu 18.04系统的镜像源 weixin_45081353 ubunt 日常操作 ubuntu linux 运维
1国内可用的镜像源Ubuntu官方下载地址阿里云开源镜像站清华大学开源镜像站中国科技大学开源镜像站华为云开源镜像站2ubuntu18.04镜像说明Ubuntu18.04是一个广泛使用的Linux发行版，它有多个版本的镜像可供下载。在物理机上安装的镜像如带desktop字样的镜像，含桌面环境，适合办公如带server字样的镜像，无桌面环境，适合部署服务器在虚拟机中安装的镜像仅用于制作启动介质的镜像在
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

开源语言大模型的正确姿势

你可能感兴趣的:(开源)