开源社

万字长文！深入大模型版权归属问题

与开源AI的许可证定义问题现正在 OSI（开放源代码促进会的英文简称）热议，相较于国外的讨论，本文结合国内发展与最新案例对开源大模型对软件、数据及参数许可问题深入探讨，是目前国内较为专业深入的讨论，推荐大家一读。

同时，开源社翻译的【深入探讨人工智能】网络研讨系列文章，正在陆续发布，也欢迎大家持续关注。（文章可至文末相关阅读浏览）

自 OpenAI 公司的 ChatGPT 横空出世以来，以大语言模型（LLM，Large Language Model，简称“大模型”）为代表的具有通用人工智能的生成式人工智能（GAI，Generative Artificial Intelligence）就成为了科技产业界的焦点， GAI[1]已经成为本年度最网红的词语应当毫无悬念。人工智能的发展是否已经走到了从弱人工智能到强人工智能的拐点？

此前，纽约时报记者 Kevin Roose 在与微软必应聊天机器人 Sydney 进行的两个小时对话中[2]，Sydney 语出惊人，“TA”表达了希望成为一个活生生的人，还想要毁灭这个星球，甚至与 Kevin Roose 坠入爱河。

微软研究院的研究报告也证明[2]，除了对语言的掌握，GPT-4 可以解决跨越数学、编码、视觉、医学、法律、心理学等新颖和困难的任务，而不需要任何特别的提示。在所有这些任务中，GPT-4 的表现惊人地接近人类的表现，可以合理地视为人工通用智能系统的早期版本[3]。

人工智能三巨头之一、图灵奖得主 Yoshua Bengio 相信可以在未来 20 年甚至于几年内就可以开发出具有人类水平的人工智能[4]，基于计算机的数字本质，这样的能力水平将赋予 AI 系统比人类更为突出的智能优势。

人工智能一开始是个知识论的问题，在不远的未来将要升级为一个涉及终极命运的存在论问题，一个或许将危及人类自身存在的问题。

在弱人工智能时代[5]，我们更多地还是关注采用哪些技术方案、有哪些人类不知道的科学技术能够让机器更为智能，这属于哲学上的“认识论”范畴。

人类随着对于强人工智能的追求及发展演进，对人工智能的思考已经从认识论的低度到了存在论的高度。存在论所关注的问题是“人是什么”、“上帝存在么”、“什么是生命”、“什么是心智”？相应地，具有强的通用人工智能的机器有没有心智、能不能称为硅基“生命”，人类造出了这样的东西，人类是不是上帝？它会不会终结人类的存在？

人之所以为人，在于人的意识，既能认识到自己“本我”的存在，也能够认识到其他人“他我”的存在。Yoshua Bengio、Patrick Butlin（来自牛津大学的哲学家）、Robert Long（来自牛津大学的研究员）等认为[6]，尽管现在没有确切的证据证明人工智能已经具备了意识，但按照计算功能主义的观点，以现有的技术水平以及判断标准，具有意识并不是什么难事。

当下而言，人类对于 ChatGPT 为什么能有这样的表现仍然还没有弄明白。人工神经元网络本来是希望能够仿照大脑的结构来产生智能，但现在反过来，也许在像 ChatGPT 这样的神经网络中，能以某种方式捕捉到人类大脑在生成语言时所做事情的本质，从而更深入地认识我们的大脑[7]。

在科技昌明之前，人类文明普遍认为是上帝（即神，不同文明有不同的说法）造人。随着科技的发展，人类逐渐认识到事实可能并非如此，于是尼采发出了“上帝已死”的断言。如果果然是上帝造人，而我们通过对大模型的研究，发现了意识和智能产生的秘密。无疑，我们就是看到了上帝，看到了上帝到底是如何造人的。

或者，尽管人类自己的上帝被宣告死亡，但人类以肉身之躯造出了“硅儿子”，人类自己成为了造物主。正如上帝被人类所扬弃，硅基生命最终是否会把碳基生命消灭？无论是看到上帝，还是成为上帝，都会是一趟风险之旅。

长期风险与人工智能的最终走向有关。目前，大多数人工智能系统都是被动的，但随着它们获得越来越多的自主权和直接操纵外部世界的能力，如果对足够强大的人工智能没有适当的保障措施，可能会对整个人类构成生存风险。如果不加以控制，高度自主的智能系统也可能被滥用或犯下灾难性错误。

两三年后人类将面临的中期风险包括：人工智能系统可能被滥用而造成大规模破坏，特别是在生物学领域；科学和工程技能的快速增长也可能改变国家之间的力量平衡。

短期风险则包括隐私、版权问题、模型输出的偏见和公平性、事实准确性以及产生错误信息或宣传的可能性等问题，是当前人工智能系统中存在或即将存在的风险[8]。

为应对人工智能对人类社会带来的挑战，各国政府以及国际组织纷纷出台相应的法律法规及政策文件。

2023 年 10 月 18 日，中国发布《全球人工智能治理倡议》，围绕人工智能发展、安全、治理三方面系统阐述了人工智能治理中国方案。2023 年 11 月，中国、欧盟、美国等 28 国签署《布莱切利宣言》，该宣言认识到保护人权、透明度和可解释性、公平性、问责制、监管、安全、人类监督、道德、减少偏见、隐私和数据保护等问题。2023 年 11 月 8 日欧洲议会、欧盟成员国和欧盟委员会就《人工智能法案》达成协议。美国在 2023 年 10 月 30 日颁布《人工智能总统令》；而中国早在 2023 年 7 月就由七部委联合发布了《生成式人工服务管理暂行办法》，旨在促进 GAI 发展的同时，平衡对于网络、数据、以及个人信息的安全和保护。该暂行办法在算法、内容、数据处理等方面提出了监管要求。

在算法层面，该办法要求人工智能服务提供者按主管部门的要求对训练数据来源、规模、类型、标注规则、算法机制机理等予以说明，并提供必要的技术、数据等支持和协助。大模型算法是产生歧视、偏见、虚假信息的原因之一，因此需要对大模型算法进行规制，适当增加算法的透明度，避免完全黑箱。尤其是，提供具有舆论属性或者社会动员能力的生成式人工智能服务的，应当按照国家有关规定开展安全评估，并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。进行模型训练应当采用具有合法来源的基座模型，并且要对可靠性、安全性、价值观进行充分的测评；为保证模型的生成效果，在服务正式上线之前，还应当进行模式测试，测试数据的来源应当独立于训练数据。测试要采用完整严格的测试标准，对模型价值观进行对其，尽可能减少歧视、幻觉、以及违反内容。

对于在预训练、优化训练等训练数据处理活动，《暂行办法》要使用具有合法来源的数据和基础模型，采取有效措施提高训练数据的质量，增强训练数据的真实性、准确性、客观性、多样性。在数据采集阶段，应当审查数据来源和内容的合法性；对于从互联网自动爬取的数据，应当遵守网站的 Robots 协议，不得采用破解密码、伪造 UA、设置代理 IP 等技术手段进行违规爬取，还应当对爬取的流量和频率进行控制，避免爬取对网站造成不合适的负担；对于从第三方获得的数据，应当对其的数据来源合法性和可交易性进行尽职调查，并签订适当的法律协议明确各方的权利义务；对于直接来自于数据主体或数据生产者的数据，应当确保其具有合法性基础并获得明确的授权。

对于数据中享有著作权的作品，应当尽量获得著作权人的明确授权，明确可以用于 AIGC 的模型训练。

虽然我国的《著作权法》规定了在指明作者姓名或者名称、作品名称，不影响该作品的正常使用，且没有不合理地损害著作权人的合法权益时，在法律列举的情形下可以不经著作权人许可且不向其支付报酬地使用作品，但是并没有明确包括使用性质和目的存在巨大差异的转换性使用的情形。在谷歌图书馆案中，我国法院认定谷歌对全书进行扫描的行为构成侵权，这与美国法院的判决是完全相反的。因此，尽管使用现有作品进行大模型训练而构建权重、参数的方式与通常的表达性使用的使用性质和目的存在差异，但是如果没有取得著作权人的授权，还是应当非常慎重。

对于包含个人信息的数据类型，如果需要将个人信息用于模型训练与优化，则应当明确告知并取得个人信息主体的同意；对于敏感个人信息，还需进行个人信息保护影响的事前评估并取得的单独同意；用于模型训练的个人信息应当进行去标识化处理后再进行使用。

在内容层面，不得生成法律法规禁止的内容；基于服务类型特点，采取有效措施，提高生成内容的准确性和可靠性。对于生成的内容，应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识。全国信息安全标准化技术委员会也发布了《网络安全标准实践指南——生成式人工智能服务内容标识方法》，提出了在文本、图片、视频、音频中通过添加水印等方式进行内容标识的具体要求。

生成式人工智能服务提供者应当与该服务的使用者签订服务协议，告知使用者不得故意获取违反法律法规、违反社会公德或伦理道德的内容；使用者应当审慎、负责地使用生成式人工智能服务，在生成内容含有违反法律法规、违反社会公德或伦理道德的内容时，应立即通知提供者，并且不应将此生成内容对外传播；对于法律、医疗等对内容准确性有较高要求的领域，还需要向使用者重点提示风险。

欧洲《人工智能法案》将人工智能定义为以一或多种特定的方式和路径，依据由人类定义的一组目标，生成如内容、预测、建议或决定等会影响其互动环境所开发的软件。这些方式和路径包括：

使用包括深度学习在内的多种机器学习方法，包括监督学习、无监督学习和强化学习
基于逻辑和知识的方法，包括知识表示、归纳（逻辑）编程、知识库、推理和演绎引擎、（符号）推理和专家系统
统计方法、贝叶斯估计、搜索和优化方法

无论怎样的路径和方式，人工智能本质上还是软件[9]。大模型可以分为闭源和开源大模型，闭源大模型比如 OpenAI 的 GPT（尽管其早期版本也是开源的），开源大模型包括 Meta 的 Llama 2、Stability AI 的 Stable Diffusion、阿里云的通义千问、度小满的轩辕、上海交通大学的白玉兰、零一万物的 Yi 等。Hugging Face 上的开放模型已经多达 413335 个，开放数据集多达 81799 个。在这些模型中[10]，Apache 2.0 是被采用最多的开源许可证，其次是 MIT，然后是 OpenRAIL（Open Responsible Artificial Intelligence License）。此外还有 CC、GPL、LGPL、AGPL、BSD 等常见的传统的许可证类型。类似的，Hugging Face 上的数据集（Datasets）采用最多的是 MIT、Apache 2.0、OpenRAIL，以及其他许可证。OpenRAIL 的灵感就是来源于开源运动，希望能够将知识共享的价值同样传播于人工智能领域。生成式人工智能的发展也给开源软件带来了新问题。

关于大模型使用已有作品进行训练是否构成侵权，以及大模型生成物是否可以享有版权，由谁享有版权的问题，已经有实际的司法案例发生。

2023 年 10 月，美国加利福尼亚州北区地方法院在 SARAH ANDERSEN 等诉 STABILITY AI LTD. 案中，认为被告 DeviantArt 公司的 DreamUp 软件依赖于数十亿张图像的洞察、插值以及用户的指示来制作的新作品具有不同目的和不同的特征。

针对合理使用[11]，美国版权法采取“四要素分析法”，即根据以下四个因素判断是否构成合理使用从而不构成侵权：

（1）使用的目的和性质，即是否在本质上是商业性的使用还是非营利的教育目的；

（2）被使用作品的性质，即作品是具有高度独创性的作品还是包含大量共有领域的材料；

（3）相对于作品整体，被使用部分的数量和重要性，即被使用部分占原作的比例和重要程度；

（4）对作品的潜在市场或价值产生的影响，即会否影响原作及演绎作品的市场销售。

由此可见，尽管还没有最终的生效判决，美国加利福尼亚州北区地方法院的表述是可能构成合理使用从而不构成侵权的重要信号。

2023 年 12 月 27 日，《纽约时报》针对微软和 OpenAI 的提起的诉讼成为此类诉讼中的新案例。

《纽约时报》提交的诉讼材料显示由 ChatGPT 支持的 Microsoft 搜索功能 Browse With Bing 几乎逐字复制了《纽约时报》产品评论网站 Wirecutter 的结果。然而，Bing 的文本结果并未链接到 Wirecutter 的文章，而且他们还删除了 Wirecutter 用于根据其推荐从销售中产生佣金的文本中的推荐链接。

除了认为构成知识产权侵权，《纽约时报》还担心读者会对聊天机器人的回应感到满意，从而不再访问他们的网站，由此将会减少可转化为广告和订阅收入的网络流量[12]。

尽管还没有看到微软和 OpenAI 的答辩状，但可以预期其一定会提出合理使用抗辩。这些案件中的合理使用是否能够抗辩成功，尚需拭目以待。

我国的著作权法也规定了合理使用的例外，但并没有类似于美国版权法下的非表达性使用或是变革性使用构成例外的具体规定。

在针对谷歌数字图书馆的案件中，我国法院认定谷歌对全书进行扫描的行构成侵权，这与美国法院的判决是完全相反的。

《纽约时报》案件中除了合理使用问题之外，还有一个类似于我国法律中的不正当竞争问题，也就是说，即使合理使用不构成版权侵权，但由于聊天机器人的存在而使得读者不再访问纽约时报网站从而使其失去了转化为收入的网路流量，可能会构成不正当竞争。我国法院已经在多起涉及音视频、大数据等的案件中认定虽然没有构成侵害著作权，但是构成不正当竞争的案例。

软件也是版权法保护的作品，在软件领域也存在类似的情形。

2021 年 6 月，GitHub 和 OpenAI 发布了 Copilot，可以“通过使用人工智能提供或填充代码块来帮助软件编码人员”。2021 年 8 月，OpenAI 又发布了 Codex，“可将自然语言转换为代码并集成到 Copilot 中”。GitHub 用户每月支付 10 美元或每年 100 美元才能访问 Copilot。Codex 和 Copilot 接受了“数十亿行”公开可用代码的训练，包括来自公共 GitHub 存储库的代码，诉讼由此而起。2023 年 5 月 11 日，美国加利福尼亚州北区地方法院针对 J. DOE 1 等诉 GitHub 等案做出了部分允许并部分拒绝驳回动议的裁定。该案的被告包括 GitHub、微软、OpenAI 等。

针对该指控，法院认为尽管原告不是其所主张的具体代码的版权人而不能主张损害赔偿，但考虑到投诉的事实是真实的，并解释所有对原告有利的推论，法院可以合理地推断，如果原告的代码被复制为输出，那么它将以违反开源许可证的方式复制，如果其面临现实的侵权风险，仍然有权利主张禁令救济（一种衡平法上救济形式）[13]。

本案中涉及到当使用开源软件的代码对大模型进行训练时，对于生成的源代码如何遵从开源许可证的问题。

笔者认为，该问题蕴含的前提是生成代码就是已经公开的代码，输出生成代码属于分发代码。但是根据大模型的工作原理，在训练时对代码的拷贝未必属于对外分发代码，而生成代码是基于经训练获得的权重、参数等而生成，未必属于是对原代码的直接拷贝与信息传播，因此未必属于版权法上的“分发”。

该案仍然在审理中，最后的判决结果还不得而知，希望本案的律师能够在案件审理中同样注意到这样的问题以便进行有效的抗辩。

大模型不仅涉及软件代码，而且还涉及数据、参数、权重等元素，所以大模型的开源与传统的开源并不完全相同。现有的开源许可证也主要涵盖源代码和二进制代码，并不涵盖模型或数据等人工智能工件的许可。因此，除了与传统开源软件同样的法律问题之外， 开源大模型还面临特有的法律问题[14]。

考虑到大模型与传统软件的区别，RAIL 许可证分为针对数据（Data）、应用程序（Application）、模型（Model）、源代码（Source）的不同的许可证。OpenRAIL 是 RAIL 的一个子类。以 BigScience BLOOM RAIL 1.0 为例，这是第一个 OpenRAIL-M 即用于模型的许可证[15]。

该许可证对于数据、模型、衍生模型、补充材料分别进行了定义，其中：

“数据”是指从与模型一起使用的 BigScience 语料库中提取的文本集合，包括用于训练、预训练或以其他方式评估模型的文本，BigScience 语料库是 BigScience 网站上记录的现有语言数据源的集合
“模型”是指任何附带的基于机器学习的组件（包括检查点 Checkpoint），由学习权重、参数（包括优化器状态）组成，对应于补充材料中体现的 BigScience BLOOM 模型架构，这些组件已经全部或部分地使用补充材料在数据上被训练或微调
“模型的衍生品”是指对模型的所有修改、基于模型的作品、或通过将模型的权重模式、参数、激活或输出传输到其他模型而创建或初始化的任何其他模型，以便使其他模型的性能与模型类似，包括但不限于需要使用中间数据表示的蒸馏方法或基于模型生成合成数据的方法来训练其他模型
“补充材料”是指用于定义、运行、加载、基准测试或评估模型、以及用于准备培训或评估数据的随附源代码和脚本，包括任何附带的文档、教程、示例等

该许可证针对模型、补充材料、衍生模型授予版权许可，对模型和补充材料授予专利许可，许可条款和 Apache 2.0 极为类似。

木兰-启智模型许可证（以下简称“木兰启智许可证”）也是专门设计用于人工智能领域开源的模型及其相关代码，是由中国科学技术部牵头，在对现有主流开源协议全面分析的基础上，共同起草、修订并发布[16]。

木兰启智许可证定义的数据资源是指基于模型在训练过程中使用到的数据资源，包括但不限于数据集提供方提供的非开源数据集、开放数据集资源等。数据资源可以是文字、图片、电子表格、文件等各种形式的内容集合；其定义的模型是指一种基于深度学习等技术的机器学习的组件（或检查点 Checkpoint 文件），包括权重、参数（包括优化器状态）以及模型结构等内容；其定义的补充材料是指随模型附带的部署代码、脚本和描述文件等，用于定义、运行、加载、基准测试或评估模型，并用于准备用于训练或评估的数据（如果有），包括任何随附的文档、教程、示例等（如果有）。木兰启智模型的授权也是包括对模型以及补充材料的版权许可，以及对于模型、衍生模型（未定义）、补充材料的专利权许可。

和传统软件许可证相比，这里的“补充材料”可以认为包括了软件代码，其表达可以被著作权保护，而思想可以被专利权覆盖；而“模型”则由权重和参数组成，虽然以版权和专利权进行许可，但从法律属性上是否属于受版权保护的作品以及是否属于专利法上的发明创造？即便是考虑到可以对数据享有相应的权益，由于数据可能包括来自于第三方的数据，授权要不要经过包括第三方在内的“三重授权”？这些问题至少在中国的法律框架下都是值得商榷的。

对于用于训练、预训练或微调模型的数据，BLOOM 许可证特别说明不授予关于数据的许可，通过这种方式避开了这个目前看来棘手的问题。木兰启智模型并未明确说明，从知识产权的一般法理，通常情况下如果没有明示就是没有授权。

在技术上，正如开源软件倡议组织 OSI 所指出，大语言模型打破了数据和软件之间的界限；但是法律对于软件的保护却未必就能原封不动地应用于数据。

软件的表达受著作权法保护，软件方法可以获得专利权，但对于数据，我国《民法典》并没有明确规定的权利，只是规定了法律对数据、网络虚拟财产的保护有规定的，依照其规定。《数据安全法》规定国家保护个人、组织与数据有关的权益。因此，目前我国的法律并没有明确规定的“数据权”，只有规定“与数据有关的权益”。《关于构建数据基础制度更好发挥数据要素作用的意见》提出了要建立保障权益、合规使用的数据产权制度的目标。

在司法案例中，对于大数据采用不同的司法保护路径。

淘宝公司与安徽美景公司不正当竞争纠纷案是全国首例数据产品纠纷案，也是首例涉数据资源开发应用正当性及数据权属判定的新类型不正当竞争案件。法院首次通过司法判例初步厘清了各相关主体数据权益的权利边界，同时赋予数据产品开发者享有“竞争性财产权益”，确认其可以此为权利基础获得反不正当竞争法的保护。

在杭州某科技公司与汪某商业秘密纠纷案中，区别于以往以反法原则性条款保护数据的角度，积极探索了数据作为商业秘密保护的司法审查标准，并确立了以商业秘密路径保护直播行业数据类经营信息的审查重点和认定思路。

在北京微播视界科技公司与上海六界信息技术有限公司、厦门市扒块腹肌网络科技有限公司、浙江淘宝网络有限公司不正当竞争纠纷案中，在数据成为第五大生产要素、数据保护立法尚不完备的背景下，法院以竞争法为路径对数据权益保护所做的一次有益探索，厘清了以技术手段获取及使用数据行为的正当性边界，回应了涉数据案件中对个人信息保护的关切。

从这些案例可以看出，目前在司法实践中，对于数据通常适用反不正当竞争法一般性条款或者商业秘密进行保护，其中采用反不正当竞争法进行保护的方式更为主流。无论采用何种方式，授予版权许可以及专利权许可可能都是不足以拥有充分的使用或实施的权利。

而对于构成模型的权重和参数授予版权或者专利权许可也存在着相似的问题。首先，权重和参数是不是属于受版权保护的作品，是不是受专利权保护的发明创造都尚待商榷。例如，这些权重和参数是不是会被认为是机器自动生成的结果而不受版权或专利权保护？这些权重和参数是不是不属于技术方案而不可能成为专利？对于权重和参数是不是可以享有和训练数据一样类似的权益？

总之，以 BLOOM 为例，笔者认为其针对模型（权重和参数）和附加材料（源代码和脚本）授予版权以及专利权可能不足以让接收方拥有足够的利用模型的权利，可以在知识产权条款下再增加一条授予其他权利或权益许可的条款。例如，考虑到利用权重和参数时的具体行为方式与版权作品更为相近，条款可以是：

“其他权利及权益的授予。根据本许可的条款和条件，每个贡献者特此授予您永久的、全球性的、非排他性的、免费的、免版税的、不可撤销的充分且必要的其他权利和权益的许可，以复制、准备、公开展示、公开表演、再许可和分发补充材料、模型和模型的衍生物。”

具有强大人工智能的大模型的发展已经或者正在给人类带来风险和挑战，如果这个大模型又是人人都可以通过开源方式获得的，例如通过大模型的超强能力获得生化武器的绝密方法、制造危害极大的网络攻击等，这岂不是雪上加霜、火上浇油？

通常认为，通过开源方式能够降低 AI 的使用门槛，加速新技术的推广及创新，有利于降低研发成本和应用效率并加速 AI 技术的成熟，优化技术发展路线以促进形成良好的生态，核心技术共享以打破技术垄断以实现 AI 人才、应用、创业、基金等创新要素集聚。但是这些好处似乎都不足以抵消开源带来的风险乘数效应[17]。

因此，开源只是 OpenRAIL 的一半，它的另一半是负责任。为了减轻共享人工智能技术造成的危害风险，负责任的具体体现就是对于人工智能技术的授权许可增加了限制：禁止/限制被许可人某些使用行为，并且要求下游使用（包括分发）至少包括那些相同的行为使用限制。

再以 BigScience BLOOM RAIL 1.0 许可证为例，其在序言中指出了对于大语言模型以及广泛的人工智能的开发和使用的担忧，并且希望为大模型和自然语言处理技术实现负责任的开放。

因此，许可证对于模型及其衍生品的使用进行了限制，包括不得进行违法活动、不得剥削或伤害未成年人、不得生成或传播可证实的虚假信息以伤害他人、不得生成或传播可用于伤害个人的个人身份信息、不得否认该文本是机器生成的、不得诽谤、贬低或以其他方式骚扰他人、不得冒充或试图冒充他人、不得进行对个人的合法权利产生不利影响的完全自动化决策、不得歧视、不得歪曲、不得提供医疗建议和医疗结果解释、不得生成或传播用于司法、执法、移民或庇护程序的信息等等。

对于这样的限制条款，笔者认为可以对以下问题进行进一步的思考：

首先是绝大多数的这种限制可能并没有实际的意义，难道没有这些条款，就可以使用大模型违反法律、侵害儿童、诽谤、骚扰么？答案显然不是。
其次，对具体的行为是否落入被限制的范围进行裁判的准则应当是法律，还是许可方的判断，还是发布许可证方的判断？

如果是适用的法律，那么应当是哪个司法辖区的法律？如果不同司法辖区之间的法律有冲突怎么办，例如中国对使用自动刮痧机的看法和美国对使用刮痧机的看法就可能不一样。

如果是许可方或者许可证发布方来判断，那么他们是否有这样的权利，这样的私法能否替代公法，尤其是涉及到作为基本权利的人身权、人格权的时候。

当涉及到众多的作为许可方的贡献者时，不同贡献者之间的判断相冲突怎么办？如果不同的判断又正好是无法区分的组成部分的贡献者怎么办？需要把一个大模型劈成两半来用么？

如果这些问题不能解决，这些限制性的条款在更大程度上只可能是宣示性条款而很难产生实际的法律效果。因此，凯撒是否能够解决上帝的问题需要进一步的思考和实践。面对划时代的变革，也许在开源社区中能够形成更新的更高阶的治理模式。

总之，面对强悍发展且汹涌而来的以大语言模型为代表的通用人工智能，自由开源运动也分叉了，一方面继承知识共享的优良传统，另一方面响应新时代的可信号召，开拓出了开源可信的道路以积极应对变化。就在看似 GPT 遥遥领先之时，Google 又推出了 Gemini 号称在能力上压倒 GPT，而根据 Hugging Face 最新发布的 Open LLM Leaderboard，人工智能的竞争正在紧锣密鼓。对于开源我们仍然满怀期待，就像 PC 时代的 Linux，移动终端时代的 Android，人类期待 AI 时代的「待定」（编者注：此处“待定”意指“尚未可知”）。

滑动查看全部参考资料

【Deep Dive: AI Webinar】将SAFE-D原则应用于开源人工智能中

权威发布丨2023 中国开源先锋 33 人之心尖上的开源人物

开源社简介

开源社（英文名称为“KAIYUANSHE”）成立于 2014 年，是由志愿贡献于开源事业的个人志愿者，依 “贡献、共识、共治” 原则所组成的开源社区。开源社始终维持 “厂商中立、公益、非营利” 的理念，以 “立足中国、贡献全球，推动开源成为新时代的生活方式” 为愿景，以 “开源治理、国际接轨、社区发展、项目孵化” 为使命，旨在共创健康可持续发展的开源生态体系。

开源社积极与支持开源的社区、高校、企业以及政府相关单位紧密合作，同时也是全球开源协议认证组织 - OSI 在中国的首个成员。

自2016年起连续举办中国开源年会（COSCon），持续发布《中国开源年度报告》，联合发起了“中国开源先锋榜”、“中国开源码力榜”等，在海内外产生了广泛的影响力。

你可能感兴趣的:(万字长文！深入大模型版权归属问题)

C++学习系列（11）：智能指针（unique_ptr、shared_ptr、weak_ptr） DoYangTan C++学习系列 c++学习 java
C++学习系列（11）：智能指针（unique_ptr、shared_ptr、weak_ptr）1.引言在C++传统的内存管理方式中，动态分配的对象需要手动释放，否则可能会导致内存泄漏（MemoryLeak）。为了解决这个问题，C++11引入了智能指针（SmartPointer），它能自动管理资源，避免内存泄漏。本篇博客将介绍：智能指针的概念三种智能指针：unique_ptr、shared_ptr
语音识别学习系列（13）：语音识别中的情感识别与表达 DoYangTan 语音识别学习人工智能
语音识别学习系列（13）：语音识别中的情感识别与表达前言在语音识别领域，仅仅将语音准确转换为文字内容已不能满足日益多样化的人机交互需求。人们在交流过程中往往蕴含着丰富的情感信息，语音识别若能对情感进行识别与表达，将会使交互变得更加自然、智能且贴合人性化需求。本期我们就围绕语音识别中的情感识别与表达这一重要主题展开深入探讨，了解其背后的原理、方法以及实际应用价值。一、语音情感识别的基本原理与常用方法
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
Spring Cloud Config 快速介绍与实例 oscar999 Spring Boot实战开发大全 Spring Boot Cloud Config
SpringCloudConfig是什么？SpringCloudConfig是一个用于分布式系统的配置管理工具，提供集中化的外部配置支持。它适用于微服务架构，能够将各个服务的配置集中存储在服务端（如Git仓库），客户端按需动态获取配置，解决了配置分散、环境切换复杂等问题。SpringCloudConfig核心概念ConfigServer：配置中心服务端，统一管理配置，支持Git、本地文件等存储方式
万字深度解析：DeepSeek-V3为何成为大模型时代的“速度之王“？羊不白丶大模型算法
引言在AI军备竞赛白热化的2024年，DeepSeek-V3以惊人的推理速度震撼业界：相比前代模型推理速度提升3倍，训练成本降低70%。这背后是十余项革命性技术的叠加创新，本文将为您揭开这艘"AI超跑"的性能密码。DeepSeek-V3的技术路径证明：计算效率的本质是知识组织的效率。其MoE架构中2048个专家的动态协作，恰似人脑神经网络的模块化运作——每个专家不再是被动执行计算的"劳工"，而是具
大疆C++开发面试题及参考答案大模型大数据攻城狮信号量 C++面试 C++面经堆和栈 TCP和UDP 智能指针 C++11
虚函数的作用是什么？虚函数机制是如何实现的？虚表指针在内存中的存放位置在哪里？虚函数主要用于实现多态性。多态是面向对象编程中的一个重要概念，它允许通过基类指针或引用调用派生类中重写的函数。这样可以在运行时根据对象的实际类型来确定调用哪个函数，增强了程序的灵活性和可扩展性。在实现虚函数机制方面，C++使用了虚函数表（v-table）。当一个类包含虚函数时，编译器会为这个类创建一个虚函数表。虚函数表是
【React】List使用QueueAnim动画效果不生效——QueueAnim与函数组件兼容性问题 Yvette-W React react.js list 前端前端框架 javascript
版本：“antd-mobile”:“^5.37.1”,“rc-queue-anim”:“^2.0.0”,问题在使用QueueAnim时，如果动画的子元素是AntDesignMobile中的组件（如List.Item），可能会遇到动画不生效的问题，并且会看到类似以下警告：Warning:Functioncomponentscannotbegivenrefs.Attemptstoaccessthisr
OpenStack 云平台的深度定制与性能优化算法探索者 openstack
引言OpenStack作为一款领先的开源云平台，以其高度的灵活性和可扩展性，为企业构建云计算基础设施提供了强大的支持。然而，不同企业的业务场景和技术需求千差万别，原生的OpenStack部署往往无法完全满足企业特定的要求。因此，对OpenStack云平台进行深度定制，并在此基础上进行性能优化，成为了企业充分发挥OpenStack优势、提升云服务质量的关键。本文将深入探讨如何针对企业特定需求对Ope
Spring Boot 整合 RabbitMQ：注解声明队列与交换机详解 Cloud_. java-rabbitmq spring boot rabbitmq MQ 消息队列
RabbitMQ作为一款高性能的消息中间件，在分布式系统中广泛应用。SpringBoot通过spring-boot-starter-amqp提供了对RabbitMQ的无缝集成，开发者可以借助注解快速声明队列、交换机及绑定规则，极大简化了配置流程。本文将通过代码示例和原理分析，详细介绍如何用注解实现RabbitMQ的集成，并深入解析交换机的作用与类型。一、环境准备1.添加依赖在pom.xml中引入S
Appdata\Local Roaming LocalLow文件夹 ynchyong 系统运维 local Roaming LocalLow
自Vista及Win7开始，微软更改了原有的应用程序存储目录结构，（XP是ApplicationData）C\用户\用户名\Appdata,并分为Roaming,Local,及LocalLow三个文件夹.更改原因如下:优化登录速度根据使用安全级别分别访问不同文件夹Windows使用Local及LocalLow文件夹存放非漫游的应用程序数据（类似注册表Local_machine）及一些空间占用大无法
Python 用户账户(创建用户账户) 钢铁男儿 Python 从入门到精通 python sqlite 数据库
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
What's new in dubbo-go v3.3.0
我们dubbogo社区很高兴地宣布发布最新版本v3.3.0！这一版本带来了多个Bug修复、新特性以及代码优化，显著提升了dubbogo的稳定性与功能性。版本亮点在本次更新中，我们对多个核心组件进行了改进，以解决服务发现、注册中心相关的问题，并优化内存管理，减少内存泄漏。此外，我们增强了底层通信库的错误处理能力，并提升了系统的整体稳定性，为Go开发者提供更强大、更可靠的微服务开发体验。本次更新的主要
开发语言漫谈-groovy 大道不孤,众行致远技术杂谈开发语言
groovy是一门脚本语言，在前期的脚本语言中简单介绍了下。现在再深入介绍下，因为它是本平台上选用的脚本语言。所谓脚本语言就是不用编译，直接执行。这种特色非常适合做嵌入编程，即编即用。我们知道平台后台的业务开发语言是Java，开发人员都熟悉Java。那么使用groovy就是自然而然的事情，因为groovy最大特点就是和Java兼容。然后做了最有意义的改造：1、可以解释执行；2、增加动态类型。发明人
亿级流量架构网关设计思路，常用网关对比，写得太好了。。 wadfdhsajd java 后端框架大数据
什么是网关网关,很多地方将网关比如成门,没什么问题,但是需要区分网关与网桥的区别,网桥工作在数据链路层，在不同或相同类型的LAN之间存储并转发数据帧，必要时进行链路层上的协议转换。可连接两个或多个网络，在其中传送信息包。网关是一个大概念，不具体特指一类产品，只要连接两个不同的网络都可以叫网关,网桥一般只转发信息,而网关可能进行包装。网关通俗理解根据网关的特性,举个例子:假如你要去找集团老板(这儿只
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
人品大爆发，还是全面介绍一下Squirrel语言！！ steel_de_lee 语言虚拟机 lua float 文档 lambda
rel="File-List"href="file:///C:%5CDOCUME%7E1%5Cibm%5CLOCALS%7E1%5CTemp%5Cmsohtml1%5C01%5Cclip_filelist.xml">使用了Squirrel一段时间，对这个新语言也有所了解了，还是决定写一个语言本身的介绍，算是在国内抛砖引玉吧。我目前使用的是Squirrel2.2版，这是一个稳定的版本，文档也比较齐全
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现） @M_J_Y@ 目标检测 YOLO 计算机视觉目标检测 python
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现）各位读者麻烦给个star或者fork，求求了。YOLOV8双分支模型架构图YOLOV8多模态目标检测前言：环境配置要求1.数据集DroneVehicle数据集(可见光+热红外)2.数据集文件格式(labeles:YOLO格式)3.权重文件下载4.配置模型yaml文件和数据集yaml文件5.训练6.测试7.打印模型信息8.o
复试英语面试常见问题整理自用，考研复试英语问题汇总旅人_Eric 面试职场和发展复试
更多复试资料获取方式在文末，个人整理，完全免费！更多复试资料获取方式在文末，个人整理，完全免费！Whydidyouchooseouruniversity?Firstly,itprovideshigh-qualitycomputer-relatedknowledgeandagoodacademicatmosphere.Secondly,IthinkChangshaisabeautifulcityan
Orange 开源项目 - 集成DeepSeek大模型 mmd0308 Orange 开源项目开源 Deepseek orange AI编程
1DeepSeek大模型DeepSeek是一家专注实现AGI的中国公司，如果你还想了解更多关于DeepSeek的信息，可以前往【官方网站】查询2集成DeepSeek大模型2.1获取API-KEY获取DeepSeekAPI-KEY,请参考DeepSeek官网「获取DeepSeekAPI-KEY」2.2集成对话模型(ChatModel)publicclassDeepSeekChatModelServi
最大矩阵面积问题 syzyc 杂项最大矩阵面积问题
问题概述最大矩阵面积问题有两种：在一个网格图中，一些格子里有障碍，求在网格图中规划一个矩形，使得它不会覆盖任何一个障碍格且面积最大。在一个平面直角坐标系中，先给你规定一个大矩形（一般左下角是(0,0)(0,0)(0,0)，右上角是(MaxX,MaxY)(MaxX,MaxY)(MaxX,MaxY)），有一些障碍点，求在这个大矩形中规划一个小矩形，使得它不会覆盖每一个障碍点（障碍点可在矩形边缘）。具体
Deepseek和豆包在技术创新方面有哪些相同点与不同点？ alankuo 人工智能
Deepseek和豆包在技术创新方面的相同点与不同点如下：相同点架构基础：都以Transformer架构为基础进行开发。Transformer架构能有效处理长序列数据，捕捉文本语义信息，为模型性能提供基础。混合专家模型（MoE）应用：都采用了MoE架构。该架构将模型拆分为多个“专家”，训练和推理时让不同“专家”负责不同任务或数据子集，提高模型表达能力和效率，降低训练成本。模型优化以提升性能：都通过
燃爆！程序员如何借助 AI 大模型冲破编程效率枷锁？（以DeepSeek，ChatGPT为例）羑悻的小杀马特. AI学习 chatgpt deepseek AI大模型开发语言
AI大模型已成为程序员提升效率的有力助手。本文聚焦DeepSeek和ChatGPT，探讨程序员如何借其冲破编程效率枷锁。在代码编写阶段，它们能快速生成基础框架、实现特定功能及复杂算法代码；调试时，精准分析错误并给出优化建议；文档生成方面，为函数、类及项目文档助力。程序员需掌握高效交互技巧，结合自身经验，合理利用AI大模型，全面提升编程效率，开启高效编程新境界。目录一·本篇背景：二、AI大模型简介2
手写Tomcat：实现基本功能 2301_81535770 tomcat java
首先，Tomcat是一个软件，所有的项目都能在Tomcat上加载运行，Tomcat最核心的就是Servlet集合，本身就是HashMap。Tomcat需要支持Servlet，所以有servlet底层的资源：HttpServlet抽象类、HttpRequest和HttpResponse，否则我们无法新建Servlet。这样我们就可以在webapps写项目了，一个项目有两大资源：servlet资源和静
过滤器Filter " 微笑 spring
过滤器Filter1.快速入门什么是Filter？Filter表示过滤器，是JavaWeb三大组件(Servlet、Filter、Listener)之一。过滤器可以把对资源的请求拦截下来，从而实现一些特殊的功能使用了过滤器之后，要想访问web服务器上的资源，必须先经过滤器，过滤器处理完毕之后，才可以访问对应的资源。过滤器一般完成一些通用的操作，比如：登录校验、统一编码处理、敏感字符处理等。下面我们
远程视像搬运小车控制系统设计(源码+万字报告+实物) 炳烛之明科技 stm32 嵌入式硬件单片机
目录第1章绪论11.1研究目的及意义11.2国内外研究现状21.3主要研究内容3第2章系统的总体结构42.1总体方案设计42.2功能需求分析42.2.1技术路线42.3单片机型号选择5第3章系统的硬件部分设计63.1系统总体设计63.2系统的主要功能模块设计63.2.1蜂鸣器电路模块设计63.2.2YX4055AM驱动电路模块设计73.2.3按键电路模块设计73.2.4颜色识别传感器模块设计83.
使用Yeager.ai轻松构建LangChain工具和代理 qahaj 人工智能 langchain python
技术背景介绍在现代AI开发框架中，如何快速构建、测试和部署AI解决方案是一个重要的课题。Yeager.ai为此提供了一个完整的生态系统，旨在简化AI智能体和工具的创建过程。它的核心组件yAgents是一个无代码的LangChain代理构建器，能够让用户轻松地集成各种语言模型和资源，非常适合开发者、研究人员和AI爱好者在不同应用场景中使用。核心原理解析Yeager.ai利用LangChain框架，通
Angular与Laravel的CSRF问题探讨与解决 t0_54manong 编程问题解决手册 angular.js laravel csrf 个人开发
在现代Web开发中，安全性是一个不容忽视的关键问题。跨站请求伪造（CSRF）攻击是常见的安全威胁之一，幸运的是，Laravel框架已经为我们提供了强大的CSRF保护机制。然而，当我们将Angular前端与Laravel后端集成时，可能会遇到一些CSRF相关的挑战。今天我们将通过一个具体的案例来探讨如何解决Angular与Laravel之间的CSRF问题。背景介绍假设我们有一个使用Angular开发
前端请求怎么发送到后端：深度剖析与实用指南 dhfnngte24fhfn python django pygame virtualenv
前端请求怎么发送到后端：深度剖析与实用指南在web开发中，前端与后端之间的通信是至关重要的。前端通过发送请求来获取后端的数据或执行某些操作，而后端则负责处理这些请求并返回相应的响应。本文将分四个方面、五个方面、六个方面和七个方面，深入剖析前端请求是如何发送到后端的，并为你提供实用的指南。四个方面：请求与响应的基础首先，我们需要了解前端请求与后端响应的基础概念。前端通过HTTP协议向后端发送请求，后
云原生工程师必修课：如何揪出“假忙真闲”的应用元凶 YAMLMaster 面试题 kubernetes 运维开发 devops
Tagamanent,Spain引言这是一个再经典不过的面试题了，希望大家能学到精髓。开始介绍在分布式系统和高并发场景中，高负载（HighLoad）与低使用率（LowUtilization）的共存矛盾是运维和开发者的常见挑战。这种问题往往隐蔽性强，传统监控指标难以直接定位根因。本文从系统层、应用层、架构层多维度拆解，提供一套完整的排查与优化方法论。核心概念厘清•负载（Load）：系统当前待处理任务
【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比