预乘

CI/CD构建与注意事项

CD（ContinuousDelivery/Deployment，持续交付/持续部署）：持续交付：是在持续集成的基础上，将经过测试的代码自动部署到预生产环境，

Sirius Wu·2025-03-24 03:13

大语言模型微调和大语言模型应用的区别？

关键要点微调大型语言模型（LLM）是调整预训练模型以适应特定任务或领域的过程，研究表明这能显著提升性能。大型语言模型应用是指将LLM用于实际问题解决或任务执行，如聊天机器人或文本生成。

AI Echoes·2025-03-23 11:30

统一的视频动作模型

为了弥补这一差距，引入统一的视频动作模型（UVA），它联合优化视频和动作预

三谷秋水·2025-03-23 08:36

一文说清预训练与微调：AI的双重训练法则

什么是预训练？预训练是大型语言模型训练的第一步。它在资金和计算能力的支持下，通过深入分析大量的文本数据，使模型建立起语言的基本构架。

TGITCIC·2025-03-23 07:02

Python预训练模型实现俄语音频转文字

Python预训练模型实现俄语音频转文字使用CommonVoice8.0、Golos和MultilingualTEDx的训练和验证分割对俄语的facebook/wav2vec2-xls-r-1b进行了微调

啥都鼓捣的小yao·2025-03-23 05:03

Python列表的创建

列表都可以进行的操作包括索引，切片，加，乘，检查成员。此外，Python已经内置确定序列的长度以及确定最大和最小的元素的方法。列表是最常用的Python数据类型，它可以作为一个方括号内的逗号分隔值出现

只是没遇到·2025-03-23 04:53

深入了解盘古大模型：技术、应用与未来

随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。

Hardess-god·2025-03-23 02:10

NLP高频面试题（七）——GPT和Bert的mask有什么区别？

GPT和BERT的Mask机制对比：核心区别与优化策略在NLP领域，GPT和BERT是最具代表性的预训练语言模型之一。

Chaos_Wang_·2025-03-23 02:35

知识图谱中NLP新技术

以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入

魔王阿卡纳兹·2025-03-23 02:34

算法设计与分析4（变治法）

变治法的应用：预排序思想用预排序可以简化许多问题，如检查元素唯一性，检查出现次数最多的元素等堆算法堆的定义首先它是一个完全二叉树，完全二叉树表明树的每一层都是满的，只有最后一层最右边的元素有可能缺位。

songx_99·2025-03-23 01:57

PyTorch数据归一化处理：transforms

torchvision*torchvision.transforms：常用的图像预处理方法*torchvision.datasets：常用的数据集Dataset实现*torchvision.models：常用的CV（预训练

2401_87555420·2025-03-22 23:48

kafka生产消息失败 ...has passed since batch creation plus linger time

背景：公司要使用华为云的kafka服务，我负责进行技术预研，后期要封装kafka组件。从华为云下载了demo，完全按照开发者文档来进行配置文件配置，但是会报以下错误。

Lichenpar·2025-03-22 23:47

CBNet--一种新的目标检测的复合骨干网体系结构

一、Introduction一般来说，在一个典型的基于CNN的目标检测器中，使用主干网络来提取检测对象的基本特征，该网络通常是为图像分类任务而设计的，并在ImageNet上预训练。

weixin_45963617·2025-03-22 22:43

深入探讨盘古大模型的高精度多尺度能力

一、盘古模型概述盘古模型是华为推出的中文预训练大模型系列，拥有数十亿甚至千亿级的参数规模。它以Transformer架构为基础，通过海量文本数据进行训练，表现出优异的自然语言理解和生成能

Hardess-god·2025-03-22 22:40

如何使用YOLOv8在AI-TOD数据集上进行遥感目标检测，从安装依赖项、准备数据集、配置YOLOv8、训练和评估模型以及构建GUI应用程序展示检测

YOLOv8在AI-TOD数据集上进行遥感目标检测，从安装依赖项、准备数据集、配置YOLOv8、训练和评估模型以及构建GUI应用程序展示检测文章目录1.安装依赖2.数据准备3.配置YOLOv83.1加载预训练模型或自定义模型

计算机C9硕士_算法工程师·2025-03-22 22:08

一文说清楚什么是预训练（Pre-Training）、微调（Fine-Tuning），零基础小白建议收藏！！

前言预训练和微调是现代AI模型的核心技术，通过两者的结合，机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力，而微调则确保了模型能够根据特定任务进行细化和优化。

小城哇哇·2025-03-22 20:26

minimind2学习：（1）训练

1、数据下载参考：https://github.com/jingyaogong/minimind/tree/master2、预训练训练6个epochspythontrain_pretrain.py--epochs6

溯源006·2025-03-22 14:47

MiniMind

Pretrain数据：这是用于预训练模型的数据集，它可以帮助模型学习语言的基本结构和特征。

亚伯拉罕·黄肯·2025-03-22 14:46

LLMs之minimind：minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混

LLMs之minimind：minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混合精度优化

一个处女座的程序猿·2025-03-22 14:43

摄影工作室预约管理系统基于Spring BootSSM

然而，传统的摄影工作室预

QQ1978519681计算机程序·2025-03-22 13:00

RRU 软件中 DPD（数字预失真）的全面测试方案

RRU软件中DPD（数字预失真）的全面测试方案一、DPD原理在无线通信系统中，功率放大器（PA）用于放大射频信号以满足通信距离和覆盖范围的要求。

youngerwang·2025-03-22 12:52

【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT

PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题：SAM是一个基于大规模数据预训练的强大提示框架，推动了分割领域的发展。

s1ckrain·2025-03-22 04:42

一个后端工程师对前端云 Vercel 的体验和探索

借助集成的CI/CD功能，开发者可以预

·2025-03-22 01:02

分享12个国内AI对话聊天的免费网站（含DeepSeek大模型）

1、腾讯元宝地址：https://hunyuan.tencent.com/bot/chat腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预

码上飞扬·2025-03-21 23:20

(LeetCode 每日一题) 2680. 最大或值（前缀和、位运算）

这样只需要枚举每一个数乘k次2，也就是位运算移位k次。通过前缀和可以预处理出左右俩边的或值，实际上只需要预处理出一边的，另外一边在遍历时可得出。

岁忧·2025-03-21 18:42

北斗导航｜接收机自主完好性监测算法研究现状及发展趋势

早期研究聚焦单星故障场景，主要方法包括：残差分析法：通过比较观测残差与阈值判断故障，如最小二乘残差和法、奇偶矢量法等。距离比较法：基于

单北斗SLAMer·2025-03-21 14:33

一、大语言模型微调 vs. 大语言模型应用

一、大语言模型微调vs.大语言模型应用1.微调（Fine-Tuning）的含义与特点定义与作用微调指在预训练好（通用）的基础模型上，通过在特定领域或任务的数据集上进一步训练来调整模型参数，使其在该领域任务中获得更优表现

AI Echoes·2025-03-21 13:54

ollama 基本使用教程

目录1.安装OllamamacOS或LinuxWindows(WSL2)2.基础命令启动与停止更新Ollama3.模型管理下载预训练模型运行模型查看已安装模型删除模型从Modelfile创建自定义模型4

海上彼尚·2025-03-21 12:17

SM系列密码算法在网络空间安全中的体系化应用研究

椭圆曲线构建，采用Weierstrass方程形式：y²≡x³+ax+b(modp)，其核心安全参数满足：素数模p：256位大素数基域Fp上椭圆曲线阶n满足n>2^191抗MOV约化攻击特性支持高效标量乘运算优化密钥协商协议采用改进的

·2025-03-21 11:36

“四预”驱动数字孪生水利：让智慧治水守护山河安澜

数字孪生水利以“预报、预警、预演、预案”（四预）为核心，正在掀起一场水利治理的智慧革命。

GeoSaaS·2025-03-21 11:03

Hugging Face预训练GPT微调ChatGPT（微调入门！新手友好！）

HuggingFace预训练GPT微调ChatGPT（微调入门！新手友好！）在实战中，⼤多数情况下都不需要从0开始训练模型，⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。

y江江江江·2025-03-21 10:31

NLU-预训练模型-2018：Bert（二）【“Masked LM”缺点：①预训练与微调不一致；②忽略了掩码位置间的依赖关系】【复杂度：O(n^2·d)；n：输入序列长度（规定最长512）】

五、BERT中的词嵌入1、为什么要使用BERT的嵌入使用BERT从文本数据中提取特征，即单词和句子的嵌入向量。我们可以用这些词和句子的嵌入向量做什么？首先，这些嵌入对于关键字/搜索扩展、语义搜索和信息检索非常有用。例如，如果你希望将客户的问题或搜索与已经回答的问题或文档化的搜索相匹配，这些表示将帮助准确的检索匹配客户意图和上下文含义的结果，即使没有关键字或短语重叠。其次，或许更重要的是，这些向量被

u013250861·2025-03-21 04:08

模型部署实战：PyTorch生产化指南

二、模型转换：TorchScript与ONNX‌‌1.准备预训练模型importtorchimporttorchvision#加载预训练模型model=torc

小诸葛IT课堂·2025-03-21 01:45

【AI论文】RWKV-7“鹅”模型，具备富有表现力的动态状态演化能力

摘要：我们推出RWKV-7“鹅”，这是一种全新的序列建模架构，同时发布的还有预训练语言模型。

东临碣石82·2025-03-21 00:02

项目经理的验收突围战：从风险预判到价值交付的破局之道

在软件项目交付失败的统计中，近40%的问题集中爆发在验收环节。当某智慧城市项目在验收阶段遭遇23个功能点争议时，项目经理发现合同中的验收标准竟写着"系统运行稳定"这样的模糊表述——这个真实案例折射出验收管理的复杂性。项目经理需要构建从需求源头到价值交付的全周期验收防御体系。一、验收危机的三大引爆点与拆解策略需求迷雾：概念共识的断层某医疗AI项目开发时，客户口中的"智能分诊"被工程师理解为规则引擎，

·2025-03-20 23:16

人工智能之数学基础：线性子空间

如果W对于V中的加法运算和数乘运算也构成F上的一个线性空间，则称W为V的线性子空间（或称向量子空间）。具体来说，设V是一个线性空间，W是

每天五分钟玩转人工智能·2025-03-20 23:53

巨人学术搜索官网入口，免费参考文献论文及学术搜索引擎

这款专注于学术领域的专业搜索引擎，覆盖了自然科学、人文科学、社会科学等多个学科领域，整合了国内外众多主流数据库，包括维普、万方、Elsevier、WebofScience等，为用户提供了期刊论文、学位论文、专利、图书、预印本等多种类型资源的精准检索服务

黄豆匿zlib·2025-03-20 21:36

开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇（十二）

无论是语言模型还是多模态模型，均在大规模多语言和多模态数据上进行预训练，并通过高质量数据进行后期微调以贴近人类偏好。

开源技术探险家·2025-03-20 19:23

用结构体类型实现复数的加、减、乘、除运算，每种运算用函数完成

任务描述本关任务：编程实现两个复数的加、减、乘、除运算。

Stimpay·2025-03-20 19:49

模型微调：让AI更懂你的魔法棒

模型微调：让AI更懂你的魔法棒✨在人工智能的世界里，模型微调（Fine-tuning）就像是一位魔法师用魔法棒对预训练模型进行“个性化改造”，让它更适应特定的任务。

带上一无所知的我·2025-03-20 14:10

Matlab 基于最小二乘向量机 LSSVM + NSGAII 多目标优化算法的工艺参数优化

Matlab基于最小二乘向量机LSSVM+NSGAII多目标优化算法的工艺参数优化一、引言1.1研究背景与意义在现代工业生产中，工艺参数优化占据着举足轻重的地位。

前程算法屋·2025-03-20 13:37

FastAPI测试策略：参数解析单元测试

扫描二维码关注或者微信搜一搜：编程智域前端至全栈交流与成长探索数千个预构建的AI应用，开启你的下一个伟大创意第一章：核心测试方法论1.1三层测试体系架构#第一层：模型级测试deftest_user_model_validation

qcidyu·2025-03-20 12:27

Amazon S3上传文件访问限制

以下是几种常见的方法：1.使用预签名URL和条件限制AWSS3预签名URL支持通过条件（Condition）来限制访问。虽然不能直接使用clientID，但可以通过IP地址、请求头等条件来限制访问。

MetaverseMan·2025-03-20 09:01

通过LoRA（Low-Rank Adaptation）低秩矩阵分解来高效微调权重变化

基本公式假设预训练模型的某一层权重为(W\in\mathbb{R}^{d\timesk})，LoRA的调整方式是：[W’=W+\DeltaW]其中(\DeltaW)是调整后的权重变化。

背太阳的牧羊人·2025-03-20 08:53

五、AIGC大模型_09手动实现ReAct_Agent

0、前言在上一章节中，我们了解到：create_react_agent是LangGraph提供的一个预构建方法（fromlanggraph.prebuiltimportcreate_react_agent

学不会lostfound·2025-03-20 05:59

Ai时代初期全球不同纬度的层级辐射现象

大语言模型的训练方式（预训练→多任务学习→强化学习

龙胥伯·2025-03-20 04:48

Websoft9 开源软件实操平台：快速积累企业级软件技能，深入理解真实业务场景

Websoft9作为开源软件自动化部署工具，通过预集成200+企业级应用模板（如GitLab、Odoo、Jenkins）和全流程管理能力，

·2025-03-19 20:52

A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用

应用尽管预训练为大型语言模型（LLMs）赋予了强大的基础能力，但在部署于专业领域时，LLMs仍经常遇到持续的限制，包括上下文长度受限、容易产生幻觉（hallucination）、推理能力欠佳和固有的偏见

王金-太想进步了·2025-03-19 19:31

迁移学习基础知识

注意：在使用别人预训练的参数模型时，要注意别人的预处理方式。

zhooooooou·2025-03-19 16:44

迁移学习入门

迁移学习1迁移学习的概念预训练模型定义:简单来说别人训练好的模型。

EmbodiedTech·2025-03-19 16:14

推荐频道

预乘