giszz

【AI】马斯克说大模型要开源，我们缺的是源代码？（附一图看懂6大开源协议）

一、说说开源和闭源

1. GUN GPL协议

2. BSD（Berkeley Software Distribution，伯克利软件发布版）协议

3. Apache 许可证版本（Apache License Version）协议

4. MIT（Massachusetts Institute of Technology）协议

5. GUN LGPL（GPL V2）

6. Mozilla许可证

二、开源和闭源对大模型技术发展的影响

三、开源与闭源的商业模式比较

OPENAI的GPT-4

GOOGLE的PaLM 2 AI

META的LLaMA

说说开源和闭源的对比

四：处在大模型洪流中，向何处去？

近期，特斯拉CEO马斯克公开表示：OpenAI不该闭源，自家首款聊天机器人将开源。

说起这个事，我觉得和大模型和电动车，有异曲同工之妙。

马斯克的特斯拉电动车，开源后并没有造成电车的销量下降，而且随着生态的繁荣，电动车的配套设施越来越完善，各个国家的准入法规越来越宽松，特斯拉大行其道。

还记得那个宗毅吗，2014年特斯卡刚进中国，他就买了一辆。可是他要在北京和广州两地跑，没有充电桩呀！于是他喊出，从北京到广州都修上一路的充电桩！这在当时可是如同把喜马拉雅山打个隧道，一样轰动的事啊。于是，修充电桩，比他在芬尼克兹和裂变式创业上的成就，更被人熟知。

现在，充电桩的问题，已经不是问题了，这就是马斯克开源的心得。

如今，大模型和电动车一样，当然他要喊开源，希望更多企业来烘托这个生态。

开源当然是好事，但是，如同特斯拉开源，我们也无法去造车一样，大模型开源，普通人也无法去训练一个新的大模型，那都是大象跳舞的事，你以为，我们缺的是你的那点源代码吗？

当然，我还是赞同开源的，我坚定认为开源是人类文明的象征之一。

一、说说开源和闭源

开源并不是一丝不挂，闭源也不是拒人千里。

我想对于开源，CSDN的朋友们应该极其熟悉了吧，我借用一个图，将开源这事再说说。

这是乌克兰程序员 Paul Bagwell 画的，乌克兰是个好地方。

可以说是一图看懂开源协议，值得点赞收藏。

看到了吧，开源就要了解开源协议，不是说开源，你就可以直接C+V大法伺候了，或者套个壳子，去融资，当然，这么干的也有，还是著名投资人和大厂，下一章说。

世界上的开源协议有上百种，很少有人能彻底搞清它们之间的区别，其实，现在最流行的六种开源协议——GPL、BSD、MIT、Mozilla、Apache 和 LGPL，结合上面的图，把这6种搞明白，你就可以说自己懂开源协议了。

1. GUN GPL协议

只要软件中包含了遵循 GPL 协议的产品或代码，该软件就必须也遵循 GPL 许可协议，也就是必须开源免费，不能闭源收费，因此这个协议并不适合商用软件。

LINUX这样的软件，都是遵守GPL协议的。

特点	说明
复制自由	允许把软件复制到任何人的电脑中，并且不限制复制的数量。
传播自由	允许软件以各种形式进行传播。
收费传播	允许在各种媒介上出售该软件，但必须提前让买家知道这个软件是可以免费获得的；因此，一般来讲，开源软件都是通过为用户提供有偿服务的形式来盈利的。
修改自由	允许开发人员增加或删除软件的功能，但软件修改后必须依然基于GPL许可协议授权。

如上图，修改自由，但是你新增了代码，也要继续遵守原协议。

2. BSD（Berkeley Software Distribution，伯克利软件发布版）协议

BSD对商业是比较友好的，很多公司会选择BSD协议的开源软件，来进行修改和二次开发。

BSD 协议基本上允许用户“为所欲为”，用户可以使用、修改和重新发布遵循该许可的软件。

BSD协议的三个条件：

如果再发布的软件中包含源代码，则源代码必须继续遵循 BSD 许可协议。
如果再发布的软件中只有二进制程序，则需要在相关文档或版权文件中声明原始代码遵循了 BSD 协议。
不允许用原始软件的名字、作者名字或机构名称进行市场推广。

上图中，关于BSD协议的“你的名字”，指的是原作者的名字。

3. Apache 许可证版本（Apache License Version）协议

这个图标，大家都太熟悉了亲切了，这个组织太庞大了，太有POWER了。

Apache 和 BSD 类似。

Apache 协议在为开发人员提供版权及专利许可的同时，允许用户拥有修改代码及再发布的自由。

现在热门的 Hadoop、Apache HTTP Server、MongoDB，等项目都是基于该许可协议研发的，程序开发人员在开发遵循该协议的软件时，要严格遵守下面的四个条件：

该软件及其衍生品必须继续使用 Apache 许可协议。如上图所分类的情况。
如果修改了程序源代码，需要在文档中进行声明。
若软件是基于他人的源代码编写而成的，则需要保留原始代码的协议、商标、专利声明及其他原作者声明的内容信息。如上图，YES的说明。
如果再发布的软件中有声明文件，则需在此文件中标注 Apache 许可协议及其他许可协议。

可以说，由于有BSD和Apache协议的存在，很多大厂的产品体系，才可能会如此的丰富，继承和发展了这些开源产品。

4. MIT（Massachusetts Institute of Technology）协议

由上图可以看到，MIT的限制，比Apache的还少，可能是目前限制最少的开源许可协议。

只要程序的开发者在修改后的源代码中保留原作者的许可信息即可（这其实很友好，你甚至可以用这条来营销，这条实际是MIT和BSD的核心区别），因此普遍被商业软件所使用。

使用 MIT 协议的软件有 PuTTY等。

5. GUN LGPL（GPL V2）

该协议主要是为类库设计的开源协议。这就是上图左侧，一路NO下来的分支。

LGPL 允许商业软件通过类库引用（link）的方式使用 LGPL 类库，而不需要开源商业软件的代码。这使得采用 LGPL 协议的开源代码可以被商业软件作为类库引用并发布和销售。

6. Mozilla许可证

Mozilla许可证（Mozilla Public License，MPL）是一种自由软件许可证，它由Mozilla基金会制定。该许可证是一种类似于GNU通用公共许可证（GPL）和MIT许可证的许可证，允许用户修改和分发软件的源代码，同时还保护原作者的版权。MPL还允许将代码与其他许可证一起使用，包括GPL和Apache许可证。该许可证最初用于发布Mozilla浏览器的源代码，后来也被用于其他开源软件项目，如OpenOffice.org和MongoDB等。

有人说，开源协议不一定具备法律效力，这个问题比较复杂，软件重合度取证，有时和论文查重一样，有时需要“自由心证”。但是当涉及软件版权纠纷时，开源协议也是非常重要的证据之一。

二、开源和闭源对大模型技术发展的影响

大模型当然要开源，如果这个世界上只有一个OpenAI，那么他将很快消失。

开源对大模型技术的发展，起到了巨大的推波助澜的作用。如果没有开源，大模型的万花筒里，不会如此丰富多彩。

国内的大模型，包括大厂和开源，这里有我的一篇简单总结的文章。

群模乱舞，AI大模型盛开，国内大模型盘点-CSDN博客

这当然只是很少的一些，光是百度智能云集成的第三方开源大模型，就是数十个之多。

除了让人类的生活更美好，程序员肯定是首先想让自己的生活更美好。当然，在成就他人的过程中，成就自己，是更高的维度。

百度除了自研的ERNIE大模型外，还集成了很多开源模型，比如Meta著名的Llama，当然，这些开源模型，都有自己的限制，例如Llama就要求每个月的调用量，不能超过一定的数量。

从上图中，其实就回答了开源和闭源，对大模型技术发展的影响，就是你中有我，我中有你，共同打造一个生态，大家一起赚钱。如果这个世界上，只有一家独大，而且是在这么重要的涉及国力发展和社会安全的领域，那么这个拥有者，需要极大的保护能力，保护自己和自己的这个宝贝的安全呦。

当然，有了开源的模型，一定离不开“套壳”这个话题。

很多成功的商业软件，都是来自于开源。

李开复的知名大模型公司，发布的“零一万物”（Yi）大语言模型，就被开源社区暴出，疑似套壳Meta公司在今年开源的大模型LLaMA。

这个大厂新模型exactly就是LLaMA的架构，但是为了表示不一样，把代码里面的名字从LLaMA改成了他们的名字，然后换了几个变量名。

零一回应说：GPT 是一个业内公认的成熟架构，LLaMA 在 GPT 上做了总结。零一万物研发大模型的结构设计基于 GPT 成熟结构，借鉴了行业顶尖水平的公开成果，同时基于零一万物团队对模型和训练的理解做了大量工作…… Yi 开源模型在其他方面的精力，比如数据工程、训练方法、baby sitting（训练过程监测）的技巧、hyperparameter 设置、评估方法以及对评估指标的本质理解深度、对模型泛化能力的原理的研究深度、行业顶尖的 AI Infra 能力等，投入了大量研发和打底工作……”

大家可能觉得这是在解释，很无聊。

其实，他说的是对的。即使大模型开源，也很少会开源训练机，更别说独特的训练方法和是数据了。

所以他们是肯定做了大量的工作，也是对得起融资的以亿计算的美元的。

为什么马斯克说开源呢，因为OpenAI公司对于 GPT-2 之后的模型就不再开源了。而Meta公司推出的开源模型LLaMA，其训练使用的公开数据集均超过万亿词元，展现出与非开源大模型相近水平的任务处理能力。当然大家都用这个来作为自己的大模型基础了。

OPENAI也说了，GPT-5以后，研发和突破，将越来越难。在投入和产出的曲线上，将无法达到平衡，因此，可以说，大模型的发展，在爆发之后，基本就到了一个平台期，后续将是各种深度的垂直应用，各种场景的爆发，深度的结合业务，去驱动技术。光是训练模型一个劲的去理解人类，其实是浪费算力的。

还是马斯克想的明白，除了搞AI，更重要的，还是多生孩子，现在生育率太低了。由此可以看出，马斯克的底层逻辑，还是AI为人类所用，并不是要颠覆一切。

三、开源与闭源的商业模式比较

开源，闭源，还是要看哪个能赚到美元。

有人说，怎么不提人类文明了，怎么直接就美元了。

因为这不矛盾。

在《2023年全球最佳大模型》中，开源占据了半壁江山，如果没有很好的商业模式，会有这么多人做吗。

当然，这不是说，你扶老太太，就一定是你撞的。

真的有活雷锋，这个不排除在外。

但是从商业模式角度讲，开源真的是更厉害的商业模式。

这十个大模型，有的真的很厉害。

OpenAI的GPT-4

比如GPT-4，OpenAI已经通过使用来自人类反馈的强化学习（RLHF）与领域专家进行对抗性测试，竭尽全力使GPT-4模型更符合人类价值观。GPT-4是一个混合模型，由8个不同的模型组成，每个模型都有2200亿个参数。

GOOGLE的PaLM 2 AI

Google在PaLM 2模型上专注于常识推理、形式逻辑、数学和20多种语言的高级编码。

META的LLaMA

Llama正式发布了各种类型的LLaMA模型，从70亿个参数到650亿个参数。

这个开源模型，实际上是有商用限制的。

其他的大模型，基本都是OpenAI的前员工、GOOGLE支持的公司，或者从Llama衍生出来的。

说说开源和闭源的对比

实际上，虽然开源，也不是就可以顺便的上手商用，一是许可协议，二是算力、财力和能力的限制。

零一从Llama衍生而来，都用了大几千万美元，才发布出来，更别所小的社区了。

实际上，闭源的大模型公司，默默都在扶持一些开源的大模型的发展。

四：处在大模型洪流中，向何处去？

提示：你认为中国大模型应该何去何从？

这个话题太大了，其实中国的大模型，发展的路线图，基本已经出来了。

除了顶级玩家，更多的玩家，机会必将出现在垂直行业细分领域，值得深度去耕耘。历史总是相似的，之前的成功者，现在会更加成功。

当然，这次技术爆炸给普通人的机会也很多。因为，大模型之大，就是因为操作要足够傻瓜化。

傻瓜相机也是大模型，内部预制了大量的参数，去“撞”当前的光照和焦距条件，找到标签打分更高的模式，设定，拍照，OK！

大模型也是如此，将给我们带来一台新的傻瓜相机，非常好玩！但是单反是不是就卖不动了？不是，单反依旧很贵。

而且，这个傻瓜相机，必将随着时间的发展，不以相机的形式出现，而是融入到你的手机中、手表中，渗透到生活的方方面面。

LLM语言大模型，就有很多经典的应用，可以说大有用武之地，一些厂商预制的典型应用范式中，可窥见一斑：

客服问答、文档分析、数据分析、办公助手、代码助手、网页分析、创意营销、商品导购、教育问答、文档校对等。

而且随着文档、图片的输入和输出，更多大模型，将更深入的影响普通人的生活。

至于开源和闭源，我们谁到知道，开源有赚钱的方法，比如提供服务，闭源也会走公益，比如支持开源社区和基金。你中有我，我中有你。

讲个小故事，前几天和一个超级大厂的大佬聊天，他说，他们企业的管理案例，在哈佛都找不到匹配，因为国外的企业没那么多人呀，那些大师们从来没想过这事儿。所有说，中国的大模型，有足够的群众基础，大数据基础，应用场景基础，去发展的更好。

PDF 拆分合并PDFSam：开源免费多文件合并 + 按页码拆分本地处理文哥工具箱1 电脑开源软件软件构建
各位打工人和学生党们，你知道吗，处理PDF文件简直是咱们的日常噩梦啊，尤其是遇到要合并好几个文件，或者从中抠几页出来的时候，简直头大如斗！今天给你们安利一个神仙工具，PDFSam，听我的，不好用你回来打我（开玩笑的啦）！这家伙可是开源免费的，完全不用你掏一分钱，软件下载地址安装包它能干嘛呢，可太多了！你想把好几个PDF拧成一股绳？没问题，合并功能分分钟搞定。想把一个大PDF拆成小的？也行！按页码拆
GIMP 3.0 中文版下载与安装全指南，附软件下载链接
GIMP（GNUImageManipulationProgram）作为开源图像处理领域的标杆工具，其3.0版本在技术架构上实现了多项突破：界面与性能升级基于GTK3重构的UI支持高分辨率屏幕，SVG图标体系带来更现代的视觉体验；引入多线程渲染与SIMD指令集加速，滤镜处理效率提升300%+非破坏性编辑机制通过图层版本控制与历史状态隔离，实现图像修改与原始数据的分离，这一特性对专业设计流程至关重要跨
Prompt：开启与AI高效对话的钥匙
解密Prompt：开启与AI高效对话的钥匙一、什么是Prompt？——AI的“使用说明书”想象一下，你正在指挥一位无所不知但毫无主动性的“实习生”——人工智能（AI）。你不能指望它“心领神会”，你必须给出清晰、具体的指令，它才能准确地完成你想要的任务。这个指令，就是Prompt（提示或提示词）。简单来说，Prompt是你向AI（如大型语言模型LLM）发出的文本或问题，用以引导它生成特定的、高质量的
opencv 4.12.0版本发布详解：核心优化与新特性全解析 Risehuxyc #opencv opencv 人工智能计算机视觉
OpenCV4.12.0夏季更新带来核心模块优化、图像处理增强、深度学习支持扩展及新兴硬件适配，全面提升计算机视觉开发效率与性能。引言OpenCV（开源计算机视觉库）作为计算机视觉领域最受欢迎的开源库之一，在2025年7月发布了4.12.0版本。这个夏季更新带来了大量性能优化、新功能和错误修复，覆盖了核心模块、图像处理、3D校准、深度学习等多个领域。本文将详细介绍OpenCV4.12.0的主要更新
Redis深度解析：从缓存到分布式系统的核心引擎 JouJz 缓存 redis 数据库
Redis深度解析：从缓存到分布式系统的核心引擎引言：数据时代的极速引擎在当今高并发、低延迟的数字世界中，Redis以其亚毫秒级响应、丰富数据结构和高可用架构，成为现代系统架构的核心组件。从简单的键值存储到复杂的分布式锁实现，从缓存加速到实时分析，Redis的应用场景已远超传统缓存范畴。本文将深入剖析Redis的核心原理、高级特性和最佳实践，带您全面理解这一改变数据处理方式的开源神器。一、Redi
AI人工智能中Actor - Critic算法的深入解析与应用场景 AI智能探索者 AI Agent 智能体开发实战人工智能算法 ai
AI人工智能中Actor-Critic算法的深入解析与应用场景关键词：Actor-Critic、强化学习、策略梯度、价值函数、深度强化学习、马尔可夫决策过程、A2C/A3C摘要：本文将深入解析Actor-Critic算法的核心原理，从基础概念到数学推导，再到实际应用场景。我们将通过生动的比喻解释这一强化学习中的重要算法，展示其Python实现代码，并探讨它在游戏AI、机器人控制等领域的应用。最后，
AI人工智能领域多模态大模型的发展历程回顾 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
AI人工智能领域多模态大模型的发展历程回顾关键词：AI人工智能、多模态大模型、发展历程、技术演变、应用场景摘要：本文旨在全面回顾AI人工智能领域多模态大模型的发展历程。通过对不同阶段核心概念、算法原理、数学模型等方面的深入剖析，结合实际项目案例，探讨其在各个领域的应用场景。同时，推荐相关的学习资源、开发工具和重要论文著作，最后总结多模态大模型的未来发展趋势与挑战，并对常见问题进行解答。1.背景介绍
AI人工智能领域Actor - Critic算法的可视化分析 AI智能探索者 AI Agent 智能体开发实战人工智能算法 ai
AI人工智能领域Actor-Critic算法的可视化分析关键词：Actor-Critic算法、强化学习、策略梯度、价值函数、可视化分析、神经网络、马尔可夫决策过程摘要：本文深入浅出地讲解Actor-Critic算法的核心原理，通过生活化的比喻和可视化分析，帮助读者理解这一强化学习中的重要算法。我们将从基础概念入手，逐步剖析算法架构，并通过Python代码实现和可视化演示，展示算法在实际问题中的应用
如何用深度学习实现图像风格迁移
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。前言图像风格迁移是人工智能领域中一个非常有趣且富有创意的应用。它能够让一张普通的照片瞬间变成梵高笔下的《星月夜》风格，或者像莫奈的《睡莲》一样充满艺术感。这种技术不仅在
Arcs 开源项目实战指南解洲思Ronald
Arcs开源项目实战指南项目介绍Arcs是一个由MichaelF.Bryan开发的开源项目，旨在解决数据流转和管理方面的问题。尽管详细的项目目标和功能在GitHub页面上可能因时间而异，但从其名称推测，它可能围绕“Arcs”这一概念，提供一种新颖的数据处理框架或服务。Arcs可能旨在简化复杂的数据流逻辑，促进数据在不同应用程序和服务间的高效共享。为了获取最新的项目说明，建议直接访问GitHub仓库
AI人工智能领域TensorFlow的模型训练策略 AIGC应用创新大全人工智能 tensorflow python ai
AI人工智能领域TensorFlow的模型训练策略关键词：TensorFlow、模型训练、深度学习、神经网络、优化策略、分布式训练、迁移学习摘要：本文将深入探讨TensorFlow框架下的模型训练策略，从基础概念到高级技巧，全面解析如何高效训练深度学习模型。我们将从数据准备、模型构建、训练优化到部署应用，一步步揭示TensorFlow模型训练的核心技术，并通过实际代码示例展示最佳实践。背景介绍目的
Actor - Critic：AI人工智能领域的新宠儿
Actor-Critic：AI人工智能领域的新宠儿关键词：强化学习、Actor-Critic、策略梯度、价值函数、深度强化学习、A2C、A3C摘要：Actor-Critic是强化学习领域的一种重要算法框架，它结合了策略梯度方法和价值函数方法的优点，成为近年来人工智能领域的热门研究方向。本文将用通俗易懂的方式介绍Actor-Critic的核心概念、工作原理、实现方法以及实际应用，帮助读者理解这一强大
探索AI人工智能中遗传算法的进化奥秘 AI学长带你学AI 人工智能 ai
探索AI人工智能中遗传算法的进化奥秘关键词：遗传算法、自然选择、基因编码、适应度函数、群体进化、交叉变异、优化问题摘要：本文将用生物进化视角解读人工智能中的遗传算法原理。通过达尔文进化论的生活化比喻，结合Python代码实例演示如何模拟基因遗传、自然选择等过程，揭示遗传算法在路径规划、参数优化等场景的应用奥秘。最后探讨遗传算法的局限性与未来发展方向。背景介绍目的和范围本文旨在用通俗易懂的方式解析遗
深度剖析AI人工智能领域多模态大模型 AI学长带你学AI AI人工智能与大数据应用开发 AI应用开发高级指南人工智能 ai
深度剖析AI人工智能领域多模态大模型关键词：AI人工智能、多模态大模型、模型架构、算法原理、应用场景摘要：本文旨在对AI人工智能领域的多模态大模型进行深度剖析。首先介绍多模态大模型的背景知识，包括目的、预期读者等。接着阐述核心概念，分析其架构和原理，并给出相应的流程图。通过Python代码详细讲解核心算法原理和具体操作步骤，同时用数学模型和公式进一步阐释。在项目实战部分，给出实际案例及详细代码解读
Open AI在AI人工智能领域的创新之路 AI学长带你学AI AI人工智能与大数据应用开发 AI应用开发高级指南人工智能 ai
OpenAI在AI人工智能领域的创新之路关键词：OpenAI、人工智能、创新之路、技术突破、应用场景摘要：本文深入探讨了OpenAI在AI人工智能领域的创新之路。首先介绍了OpenAI的背景信息，包括其成立目的、发展历程等。接着详细阐述了OpenAI的核心概念，如强化学习、生成式对抗网络等，并通过示意图和流程图展示其原理和架构。然后讲解了相关核心算法原理，结合Python代码进行具体说明。同时，给
探索AI人工智能领域Actor - Critic的无限潜力
探索AI人工智能领域Actor-Critic的无限潜力关键词：AI人工智能、Actor-Critic、强化学习、策略网络、价值网络摘要：本文将深入探索AI人工智能领域中Actor-Critic方法的无限潜力。我们会先介绍其背景知识，接着用通俗易懂的方式解释核心概念，包括Actor和Critic的含义及它们之间的关系，然后阐述其核心算法原理和具体操作步骤，还会给出数学模型和公式并举例说明。通过项目实
AI人工智能领域多模态大模型的技术瓶颈与解决方案 AI学长带你学AI 人工智能 ai
AI人工智能领域多模态大模型的技术瓶颈与解决方案关键词：多模态大模型、技术瓶颈、跨模态对齐、计算效率、数据稀缺、模型泛化、解决方案摘要：本文深入探讨了AI人工智能领域多模态大模型发展过程中面临的主要技术瓶颈，包括跨模态对齐困难、计算资源消耗巨大、高质量多模态数据稀缺、模型泛化能力不足等问题。针对这些挑战，我们提出了系统性的解决方案，涵盖算法优化、架构创新、数据增强等多个维度。文章通过理论分析、数学
【杂谈】-人工智能：从无序部署到可问责治理的转型之路
人工智能：从无序部署到可问责治理的转型之路文章目录人工智能：从无序部署到可问责治理的转型之路1、失控的人工智能与“漂移”现象的潜在危机2、穿透迷雾：探寻人工智能治理的真谛3、民主化进程中的治理觉醒4、迈向未来：构建可问责的人工智能生态体系5、抉择时刻：关乎人工智能发展走向的关键权衡人工智能已然步入一个关键的转折阶段。当下，众多企业竞相投身于各类人工智能系统的部署浪潮之中，从功能多样的生成式人工智能
文心4.5开源背后的战略棋局：百度为何选择All in开放？度假的小鱼 AI/大数据创作活动打卡 #人工智能基础文心大模型开源 GitCode 百度
文章目录引言：一场颠覆AI行业格局的孤注国内开源模型的崛起与威胁国际竞争格局的重塑1.技术维度：开源是突破模型性能瓶颈的“加速器”1.1闭源模型的“内卷化”困境1.2文心4.5的开源技术架构：从“黑箱”到“乐高”1.2.1文心4.5的技术创新1.2.2工具链的成熟配套2.商业维度：开源是重构AI市场规则的“核武器”2.1闭源时代的“赢家通吃”逻辑2.2文心4.5的开源商业模型：从“卖API”到“卖
自动字幕生成器：Auto-Subtitle — 技术解析与应用指南房耿园Hartley
自动字幕生成器：Auto-Subtitle—技术解析与应用指南在视频内容日益丰富的今天，自动字幕生成工具变得越来越重要，尤其是对于听障人士、非母语者和在嘈杂环境下观看视频的人来说。Auto-Subtitle是一个开源项目，它利用先进的自然语言处理（NLP）技术为你的视频自动生成准确的字幕。本文将深入探讨这个项目的原理、功能、应用场景及特点，以期吸引更多开发者和用户关注并使用。项目简介Auto-Su
web直播弹幕抓取分析 signature
声明:本文章中所有内容仅供学习交流使用，不用于其他任何目的，抓包内容、敏感网址、数据接口等均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！前言最近遇到太多难点了卡了很久，魔改编译node，和直播弹幕dy/tiktok简单记录一下。进阶卡了好几天。逆向过程我也看了很多人开源了但是基本都是用不了的。不是417就是415补环境基本没补所以很容易被检测。我就随便照着网上开源
为什么选择Selenium自动化测试？ AIZHINAN selenium 测试工具自动化测试 pytest python 职场和发展
选择Selenium作为自动化测试工具的主要原因包括其开源、跨平台、多语言支持和强大的生态系统等优势。以下是详细分析：软件测试-Selenium自动化测试教程，零基础小白也能快速入门！python+selenium1.开源免费零成本：Selenium是开源工具，无需支付许可费用，适合预算有限的团队。社区支持：活跃的开发者社区提供丰富的学习资源、插件和问题解决方案。2.跨平台&跨浏览器支持多浏览器：
Appium 简介 AIZHINAN appium 测试工具自动化测试
Appium是一个开源的移动应用自动化测试框架，用于测试原生应用(native)、混合应用(hybrid)和移动网页应用(mobileweb)。它支持iOS、Android和Windows平台。https://www.bilibili.com/video/BV1R93szkEhi/?App自动化测试：App测试Appium+UiAutomator2技巧、实战项目核心特点跨平台：同一套API可用于i
本地部署 Kimi K2 全指南（llama.cpp、vLLM、Docker 三法）迎风斯黄 llama docker 容器 kimi
KimiK2是MoonshotAI于2025年7月11日发布的高性能多专家语言模型（MoE），支持最大128K上下文，激活参数规模为32B，具备极强的推理、代码生成与多轮对话能力。自从其权重以多种格式开源以来，许多开发者希望将其部署在本地，以获得更高的私密性和灵活性。本文将详细介绍三种主流本地部署路径，并提供完整的配置步骤和使用建议。准备工作（通用部分）在进行部署前，请准备如下环境与资源：✅最低硬
Python+Selenium自动化
1，什么是seleniumselenium是一个开源的自动化测试框架，主要适用WEB测试，可以支持多种语言(Java,C#,Python,php等)，既然支持多语言开发，那跨平台自然就不用多说啦，selenium有几个版本，一个是seleniumIDE(是一个安装在火狐浏览器上的一个插件，可以用来录制脚本，然后导出自动生成对应的开发语言文件)，seleniumGrid(自动化辅助工具，楼主还没深入
从“直觉抢答”到“深度思考”：大模型的“慢思考”革命，思维链、树、图如何让AI越来越像人？陈敬雷-充电了么-CEO兼CTO 《GPT多模态大模型与AI Agent智能体》新书内容人工智能 chatgpt AIGC 神经网络 python 大模型思维链
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】文章目录GPT多模态大模型与AIAgent智能体系列十六从“直觉抢答”到“深度思考”：大模型的“慢思考”革命，思维链、树、图如何让AI越来越像人？引言：当AI从“快
AI-调查研究-33- 咖啡价格战连锁咖啡低价策略全景分析：补贴、成本与盈利模型
点一下关注吧！！！非常感谢！！持续更新！！！AI篇持续更新中！（长期更新）AI炼丹日志-30-新发布【1T万亿】参数量大模型！Kimi‑K2开源大模型解读与实践，持续打造实用AI工具指南！Java篇正式开启！（300篇）目前2025年07月16日更新到：Java-74深入浅出RPCDubboAdmin可视化管理安装使用源码编译、Docker启动MyBatis已完结，Spring已完结，Nginx已
大模型本地部署-dify私有化部署-教程
一、简介dify是一个开源的LLM应用开发平台。其直观的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等，可以让您快速从原型到生产。二、核心功能列表1、工作流：在画布上构建和测试功能强大的AI工作流程。2、全面的模型支持：与数百种专有/开源LLMs以及数十种推理提供商和自托管解决方案无缝集成，涵盖GPT、Mistral、Llama3以及任何与OpenAIAPI兼容的模型。完整
搭建 B2B2C 商城必懂：ZKmall开源商城业务流程与模块关联
B2B2C模式作为电商领域的主流形态，核心就在于“平台方、商家、消费者”三方的高效配合。一套成熟的B2B2C商城系统，必须能实现“商家入驻-商品管理-用户消费-订单履约-平台结算”全链路的顺畅衔接。ZKmall开源商城凭借8年电商经验，用模块化设计把复杂业务拆成一个个协同模块，让每个环节都能高效运转。下面就来深入解析它的业务流程与模块关联，帮开发者和企业快速掌握系统核心逻辑。一、B2B2C核心业务
借助AI学习开源代码git0.7之编译和使用余很多之很多源码学习 git 学习
如何学习优秀的开源代码？目前大部分的优秀开源代码，代码量都已经非常庞大，比如git。以git为例，git最新版本代码有279814行，而git0.7版本已经大部分实现了现在git版本的基本功能，而代码量却只有4950行，借助ai工具帮忙分析和整理，加上自己的代码阅读和学习验证，就可以从这些开源大神的代码中学到很多，从而提高自己。学习源码之前，先编译和研究下现有编译的程序的使用。编译本人使用的笔记本
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

【AI】马斯克说大模型要开源，我们缺的是源代码？（附一图看懂6大开源协议）

一、说说开源和闭源

1. GUN GPL协议

2. BSD（Berkeley Software Distribution，伯克利软件发布版）协议

3. Apache 许可证版本（Apache License Version）协议

4. MIT（Massachusetts Institute of Technology）协议

5. GUN LGPL（GPL V2）

6. Mozilla许可证

二、开源和闭源对大模型技术发展的影响

三、开源与闭源的商业模式比较

OpenAI的GPT-4

GOOGLE的PaLM 2 AI

META的LLaMA

说说开源和闭源的对比

四：处在大模型洪流中，向何处去？

你可能感兴趣的:(人工智能,人工智能,开源)