图标微调第3页

模型优化之强化学习（RL）与监督微调（SFT）的区别和联系

强化学习（RL）与监督微调（SFT）是机器学习中两种重要的模型优化方法，它们在目标、数据依赖、应用场景及实现方式上既有联系又有区别。

搏博·2025-03-02 10:08

Office 2013、2016、2019三版本区别

Office2019：在用户界面和用户体验方面进行了一些改进，软件更加直观和易用，图标设计、菜单布局等方面更加现代化。功能改进Office201

小魚資源大雜燴·2025-03-02 09:00

麒麟系统中删除权限不够的文件方法

在麒麟系统中删除权限不够的文件，可以尝试以下几种方法：通过修改文件权限删除打开终端：点击左下角的“终端”图标，或者通过搜索功能找到并打开终端。定位文件：使用cd命令切换到文件所在的目录。

乙龙·2025-03-02 01:33

idea将某个分支的某些提交记录提交到另一分支

1、Idea将某个分支的某些提交记录提交到另一分支（1）切换到合并的目标分支（2）找到源分支和需要合并的源分支记录（3）选中需要合并的记录后，点击“Cherry-Pick”图标，（4）在目标分支中(当前就是目标分支

墨明&棋妙·2025-03-01 21:35

高性能PHP框架webman爬虫引擎插件，如何爬取数据

Ai 编码·2025-03-01 18:11

2.4K star的GOT-OCR2.0：端到端OCR 模型

产品功能及特点多语言支持：GOT-OCR2.0主要支持中文和英文字符识别，并能够通过进一步的微调扩展到更多语言。这种灵活性使其适用于国际化应用，满足不同

AI 研习所·2025-03-01 17:34

大模型训练与微调（4）——Top-k 和 Top-p 采样策略介绍

大模型训练与微调（4）——Top-k和Top-p采样策略介绍**一、Top-k采样****1.核心思想****2.数学实现****3.示例****4.特点****二、Top-p（Nucleus）采样**

John_今天务必休息一天·2025-03-01 12:33

Coze——搭建一个AI 助手智能体

输入智能体名称和功能介绍，然后单击图标旁边的生成图标，自动生成一个头像。你也可以切

不二人生·2025-03-01 08:30

全网国内外总结Prompt&LLM论文，开源数据&模型，AIGC应用（持续更新，收藏查看）

全网国内外总结Prompt&LLM论文，开源数据&模型，AIGC应用（持续更新，收藏查看）目录顺序如下国内外，垂直领域大模型Agent和指令微调等训练框架开源指令，预训练，rlhf，对话，agent训练数据梳理

代码讲故事·2025-03-01 07:54

BERT模型深入理解——自然语言处理的里程碑

BERT创新性地使用预训练+微调模式，先用预训练在大量无标注的语料中进行自监督学习，学习到语言的通用规律，然后在少量有标注的数据中进行有监督学习，适配更精细化的任务。这种模式一直影响到最新的大模型结

cufewxy2018·2025-03-01 06:47

如何使用Anyscale平台运行、微调和扩展大语言模型(LLMs)

Anyscale是一个功能强大的平台，主要用于运行、微调和扩展大语言模型(LLMs)，并且通过生产就绪的API提供成本效益的调用服务。

eahba·2025-03-01 03:49

谁说消费级硬件不能玩 DeepSeek - R1 微调？手把手教你进阶AI玩家

微调像DeepSeek-R1这样的大规模人工智能模型可能需要大量资源，但借助正确的工具，在消费级硬件上进行高效训练是可行的。

硅基创想家·2025-02-28 22:51

实现中间凸起导航鸿蒙示例代码

介绍本示例实现点击底部TabBar切换展示页面，同时会有选中的图标变化动效，中间凸起的底部导航。实现中间凸起导航源码链接效果预览使用说明点击切换导航，选中后展示不同特效。

·2025-02-28 20:33

vue - 详解西瓜视频插件xgplayer自定义播放器界面布局及样式细节，强力覆盖修改西瓜播放器的CSS样式，修改播放/暂停按钮大小或图标、增加扩展按钮、修改快捷键图标、整体颜色主题、视频加载状态等

效果图在vue2、vue3项目开发中，详解vue引入使用xgplayer西瓜视频播放器后如何修改界面样式和快捷按钮样式大小等，强力修改西瓜播放器的视频加载图标及大小、播放和暂停按钮样式、全屏按钮样式、音量调解

街尾杂货店&·2025-02-28 17:16

2.8 通过微调提升模型的准确度与效率-大模型ACP模拟题-真题

A.通过低秩矩阵间接影响模型行为B.会直接修改原始模型权重✅C.支持参数回退操作D.训练效率高于全参微调解析：LoRA通过添加额外参数而非修改原权重实现微调当训练过程中出现

admin皮卡·2025-02-28 17:12

【AI测试学习】AnythingLLM+Ollama+DeepSeek部署私人知识库

这里我们借助Ollama大预言模型部署工具进行搭建官网如下：Ollama安装包也可百度网盘获取：安装完成后，桌面右下角会显示ollama图标1.2.安装DeepSeek复制oll

艳Yansky·2025-02-28 16:37

低代码革命：基于DeepSeek微调模型实现前端代码自动生成与私有JS API调用的实战指南

摘要本文探讨如何微调DeepSeek平台的大语言模型，以实现前端代码的智能生成与自建JavaScriptAPI库的无缝调用。

Light60·2025-02-28 15:58

微软发布 Phi-4 迷你模型,适合本地部署ChatBot

该模型经历了一个增强过程，包含了监督微调和直接偏好优化，以支持精确的指令遵循和稳健的安全措施。

吴脑的键客·2025-02-28 13:43

大模型调优方法：提示工程、RAGs 与微调对比

前言每一个搭建大语言模型应用的AI工程师都会面临一个难题，如何选择一个合适调优方法。就算是强大的预训练LLM也可能无法直接满足项目中的特定需求。如项目需要一个特定结构的应用程序，如预训练缺失上下文的重要文件，再比如有特定术语和结构的高专业性的行业领域，面对这些问题，需要有特定的方法来调整LLM。要决定用哪种调优方法，首先得明白这些方法的含义。提示工程（PromptEngineering）提示工程相

AI大模型探索者·2025-02-28 11:03

DeepSeek R1 简单指南：架构、训练、本地部署和硬件要求

这项研究在如何仅依靠强化学习而不是过分依赖监督式微调的情况下，增强LLM解决复杂问题的能力上，取得了重要进展。

爱喝白开水a·2025-02-28 07:52

深度解析：大模型开源的真与假

目录大模型企业开闭源策略各异开源大模型的定义与现状开源内容的局限性通常开放的内容实际未开放的关键内容法律与商业模式的约束开源许可证的重要性大模型的定制许可证及其限制性条款商业公司对开源大模型的策略和目的建立生态系统吸引开发者提升品牌形象保持竞争优势技术创新和改进技术与协助开发的挑战训练和推理过程的资源需求差异微调和衍生模型的技术实现及其局限性开源大模型在协作开发中的局限总结大模型的发展开启了

rs勿忘初心·2025-02-28 05:39

利用DSPy优化LangChain RAG系统的实战指南

具体来说，DSPy编译器会在内部追踪你的程序，然后为大型语言模型（LLMs）创建高质量的提示（或为小型LLMs训练自动微调），以教会它们任务的步骤。

scaFHIO·2025-02-28 04:01

前言：什么是大模型微调

一、大模型微调的基础知识1.什么是大模型微调？大模型微调（Fine-tuning）是指在预训练模型的基础上，针对特定的任务或数据集进行进一步训练的过程。

伯牙碎琴·2025-02-28 04:26

Pycharm远程连接服务器和配置远程python环境

首先在setting中添加PythonInterpreter，点击右边齿轮图标添加输入连接和用户名然后选择python环境的路径，一般是/home/username/anaconda3/envs/envsname

hlee-top·2025-02-28 02:12

DeepSeek本地部署必要性分析及云端替代方案推荐

本地部署适用场景分析硬件要求完整版模型需≥32GB显存（推荐NVIDIAA100/A800）基础版也需RTX3090级别显卡（约150W功耗）适用人群建议✔️企业用户：需私有化部署处理敏感数据✔️研究人员：需定制模型微调

Asher_Yao·2025-02-28 01:08

通过vLLM部署LLM模型到生产环境中

文章目录1使用vLLM部署模型2部署过程2.1准备GPU环境2.2安装vLLM依赖项3使用vLLM部署模型并启动服务3.1部署开源模型3.2部署微调模型4测试服务是否正常运行5评估服务性能1使用vLLM

MichaelIp·2025-02-28 01:04

微调 LLM （RLHF + DPO）

微调LLM（RLHF+DPO）使用强化学习（RL）根据人类反馈微调大语言模型（即RLHF）的方法，以及一种更有效的改进方法（即DPO）。

·2025-02-27 21:56

android 系统状态栏高度,关于Android状态栏高度为0仍显示的问题

前言这里有一个比较坑的事，系统将状态栏的高度已经设置为0，然后界面上确实已经看不到时间，WiFi等图标，也无法通过下拉，显示通知栏。

weixin_40005330·2025-02-27 19:10

Ghostty 终端配置指南

Ghostty终端配置详解：打造个性化终端体验文章目录**Ghostty配置文件说明Ghostty字体配置字体微调Ghostty主题和颜色配置Ghostty鼠标和剪贴板配置Ghostty窗口和界面配置Ghostty

·2025-02-27 17:38

解决pyinstaller打包exe后运行会弹出黑框的问题

解决方法是在命令末尾输入--noconsole如下pyinstaller-Fmycode.py--noconsole如果打包时想要自己设置图标需要写成pyinstaller--onefile--icon

wave_sky·2025-02-27 14:27

grafa导出数据图标_grafana dashboard的导入导出

grafana的官方提供了很多社区或者官方设置的漂亮的dashboard，地址如下：导入图表大大节省了我们配置监控的时间，非常方便.以linuxhostoverview为例，首先确保telegraf(貌似现在telegraf+influxdb+grafana已经成为了主流，并且这个监控架构支持全windows环境部署)中的配置包含(部分参数请根据系统情况自行修改，这里不是挖坑)如下图：然后下载js

承诺谎言·2025-02-27 12:49

在docker中运行R容器，并在Windows下的vscode中使用该R

启动DockerDesktop并确保服务运行正常（任务栏出现Docker图标）。

smx6666668·2025-02-27 09:00

扣子和DIfy调用deepseek对比分析

又闻言，Dify、TensorFlow、PyTorch、Keras、Fastai、HuggingFace等工具可以微调诸如deepseek、chatgpt、doubao等大模型。

ISDF-CodeInkVotex·2025-02-27 06:30

网站显示不安全的解决办法

●查看证书状态（浏览器操作）：点击地址栏左侧的“不安全”图标→选择“证书”→检查：●证书是否失效。●证书域名是否与当前访问的域名完全匹配。●证书颁发机构（CA）是

·2025-02-27 00:12

深入解析 DeepSeek R1：强化学习如何驱动大模型推理能力的进化

引言在AI竞赛日益激烈的时代，DeepSeek-AI推出了DeepSeekR1，试图以强化学习（RL）直接训练推理能力，而非仅依赖传统的监督微调（SFT）。

海棠AI实验室·2025-02-26 23:07

npm : 无法加载文件 D:\nodejs\npm.ps1，因为在此系统上禁止运行脚本

右键点击PowerShell图标：在搜索结果中，找到“WindowsPowerShell”或“WindowsPowerShellISE”（如果你使用的

rjc_lihui·2025-02-26 21:17

论文笔记：Enhancing Sentence Embeddings in Generative Language Models

这些模型固有的语义空间各向异性，往往需要通过大量数据集进行微调，才能生成高质量的句子嵌入。

UQI-LIUWJ·2025-02-26 20:17

Ollama微调

通过Ollama的ModeFile文件进行微调。通过ModelFile微调1、创建名为Modelfile的空白文件。2、在空白文件内写配置信息。FROMq

软件不硬·2025-02-26 19:08

有哪些开源大数据处理项目使用了大模型

**SWIFT**：阿里开源的大模型微调轻量级框架，用于提高RAG应用的准确度。3.**Text2SQL**：阿里发布的最新实践开源模型，其准确度超过了GPT4。4

魔王阿卡纳兹·2025-02-26 19:02

Python微调DeepSeek-R1-Distill-Qwen-1.5B模型：使用Transformers和PyTorch进行训练

为了让这些模型更加适应特定任务，我们通常会进行微调（Fine-tuning）。

煤炭里de黑猫·2025-02-25 21:02

Avalonia-wpf介绍

ExperimentalAcrylicBorder”和“ExperimentalAcrylicMaterial”的介绍ExperimentalAcrylicBorderExperimentalAcrylicMaterial按钮排版按钮图标按钮命令响应式命令添加一个新对话框对话框窗口样式对话框的输入与输出显示对话框对话框的位置和大小添加对话框内容模拟搜索

晓纪同学·2025-02-25 16:30

鸿蒙原生绘图API：从基础到高阶的绘制之旅（进阶版）

一、复杂图形绘制（一）路径绘制当绘制不规则图形，比如独特的图标、创意的装饰元素时，Path类就成了

·2025-02-25 12:02

C++ 单列模式在touchGFX 中的应用

一）资源管理场景1)图像资源管理：在TouchGFX应用中，通常会有许多图像资源，如界面图标、背景图片等。使用单例模式创建一个图像资源管理器，可以确保这些图像资源在整个应用中被有效地管理。

黑果果的思考·2025-02-25 08:30

SAM应用：医学图像和视频中的任何内容分割中的基准测试与部署

医学图像和视频中的任何内容分割：基准测试与部署目录摘要：一、引言1.1SAM2在医学图像和视频中的应用二.结果2.1数据集和评估协议2.2二维图像分割的评估结果三讨论四局限性和未来的工作五、方法5.1数据来源和预处理5.2微调协议

烧技湾·2025-02-25 02:42

用人类反馈微调大模型，InstructGPT 让 GPT-3 脱胎换骨

用人类反馈微调大模型，InstructGPT让GPT-3脱胎换骨本文展示了一种通过利用人类反馈进行微调，使大语言模型在广泛任务中契合用户意图的方法。

·2025-02-24 23:50

DeepSeek-R1秘籍轻松迁移，只需原始数据0.3% | 邱锡鹏团队联合出品

他们提出了MHA2MLA这种数据高效的微调方法，使基于MHA（多头注意力）的大语言模型（LLMs）能够顺利转换到MLA架构。以Llama2-7B为例

·2025-02-24 19:13

遥控器显示分别对应的无人机状态详解！！

飞行状态：如起飞、悬停、飞行中、降落等状态，这些状态可能通过遥控器的指示灯颜色或显示屏上的图标来表

云卓SKYDROID·2025-02-24 19:55

Meta官宣Llama3：迄今为止最强大的开源大模型

此版本具有经过预训练和指令微调的语言模型，具有8B(80亿)和70B(700亿)参数，可以支持广泛的用例。Llama3在各种行业基准上展示了最先进的性能，并提供了新功能，包括改进的推理能力。

·2025-02-24 19:09

DeepSeek 和 Qwen 模型快速部署指南

DeepSeek-V3DeepSeek-R1模型大小总参数量6710亿(671B),MoE架构,每个token激活370亿参数总参数量与V3相当,基于DeepSeek-V3-Base,采用类似的MoE架构训练方法包含预训练、监督微调

moton2017·2025-02-24 18:47

Vmware桥接开放ip端口给局域网访问

点击编辑，选择虚拟网络编辑器点击更改设置选择NAT模式点击NAT设置选择添加添加后点击确定或应用即完成需要打开防火墙7.控制面板，选择右上角小图标8.选择防火墙9.高级设置10.入站规则11.新建规则12

舌尖上的五香·2025-02-24 16:37

推荐频道

图标微调