E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
图标微调
模型优化之强化学习(RL)与监督
微调
(SFT)的区别和联系
强化学习(RL)与监督
微调
(SFT)是机器学习中两种重要的模型优化方法,它们在目标、数据依赖、应用场景及实现方式上既有联系又有区别。
搏博
·
2025-03-02 10:08
深度学习
人工智能
机器学习
架构
transformer
Office 2013、2016、2019三版本区别
Office2019:在用户界面和用户体验方面进行了一些改进,软件更加直观和易用,
图标
设计、菜单布局等方面更加现代化。功能改进Office201
小魚資源大雜燴
·
2025-03-02 09:00
windows
麒麟系统中删除权限不够的文件方法
在麒麟系统中删除权限不够的文件,可以尝试以下几种方法:通过修改文件权限删除打开终端:点击左下角的“终端”
图标
,或者通过搜索功能找到并打开终端。定位文件:使用cd命令切换到文件所在的目录。
乙龙
·
2025-03-02 01:33
linux
kylin
idea将某个分支的某些提交记录提交到另一分支
1、Idea将某个分支的某些提交记录提交到另一分支(1)切换到合并的目标分支(2)找到源分支和需要合并的源分支记录(3)选中需要合并的记录后,点击“Cherry-Pick”
图标
,(4)在目标分支中(当前就是目标分支
墨明&棋妙
·
2025-03-01 21:35
idea
java
spring
boot
intellij-idea
git
spring
cloud
高性能PHP框架webman爬虫引擎插件,如何爬取数据
文章精选推荐1JetBrainsAiassistant编程工具让你的工作效率翻倍2ExtraIcons:JetBrainsIDE的
图标
增强神器3IDEA插件推荐-SequenceDiagram,自动生成时序图
Ai 编码
·
2025-03-01 18:11
php教程
php
爬虫
开发语言
2.4K star的GOT-OCR2.0:端到端OCR 模型
产品功能及特点多语言支持:GOT-OCR2.0主要支持中文和英文字符识别,并能够通过进一步的
微调
扩展到更多语言。这种灵活性使其适用于国际化应用,满足不同
AI 研习所
·
2025-03-01 17:34
人工智能
大模型
AI
AIGC
人工智能
大模型训练与
微调
(4)——Top-k 和 Top-p 采样策略介绍
大模型训练与
微调
(4)——Top-k和Top-p采样策略介绍**一、Top-k采样****1.核心思想****2.数学实现****3.示例****4.特点****二、Top-p(Nucleus)采样**
John_今天务必休息一天
·
2025-03-01 12:33
自然语言处理
深度学习
算法
python
chatgpt
人工智能
Coze——搭建一个AI 助手智能体
输入智能体名称和功能介绍,然后单击
图标
旁边的生成
图标
,自动生成一个头像。你也可以切
不二人生
·
2025-03-01 08:30
大模型
人工智能
大模型
全网国内外总结Prompt&LLM论文,开源数据&模型,AIGC应用(持续更新,收藏查看)
全网国内外总结Prompt&LLM论文,开源数据&模型,AIGC应用(持续更新,收藏查看)目录顺序如下国内外,垂直领域大模型Agent和指令
微调
等训练框架开源指令,预训练,rlhf,对话,agent训练数据梳理
代码讲故事
·
2025-03-01 07:54
智能工具
Prompt
LLM
AIGC
模型
开源
数据集
深度学习
BERT模型深入理解——自然语言处理的里程碑
BERT创新性地使用预训练+
微调
模式,先用预训练在大量无标注的语料中进行自监督学习,学习到语言的通用规律,然后在少量有标注的数据中进行有监督学习,适配更精细化的任务。这种模式一直影响到最新的大模型结
cufewxy2018
·
2025-03-01 06:47
自然语言处理
bert
人工智能
如何使用Anyscale平台运行、
微调
和扩展大语言模型(LLMs)
Anyscale是一个功能强大的平台,主要用于运行、
微调
和扩展大语言模型(LLMs),并且通过生产就绪的API提供成本效益的调用服务。
eahba
·
2025-03-01 03:49
语言模型
人工智能
自然语言处理
python
谁说消费级硬件不能玩 DeepSeek - R1
微调
?手把手教你进阶AI玩家
微调
像DeepSeek-R1这样的大规模人工智能模型可能需要大量资源,但借助正确的工具,在消费级硬件上进行高效训练是可行的。
硅基创想家
·
2025-02-28 22:51
#
大模型-DeepSeek系列
人工智能
DeepSeek
大模型微调
大模型
GPU
实现中间凸起导航鸿蒙示例代码
介绍本示例实现点击底部TabBar切换展示页面,同时会有选中的
图标
变化动效,中间凸起的底部导航。实现中间凸起导航源码链接效果预览使用说明点击切换导航,选中后展示不同特效。
·
2025-02-28 20:33
vue - 详解西瓜视频插件xgplayer自定义播放器界面布局及样式细节,强力覆盖修改西瓜播放器的CSS样式,修改播放/暂停按钮大小或
图标
、增加扩展按钮、修改快捷键
图标
、整体颜色主题、视频加载状态等
效果图在vue2、vue3项目开发中,详解vue引入使用xgplayer西瓜视频播放器后如何修改界面样式和快捷按钮样式大小等,强力修改西瓜播放器的视频加载
图标
及大小、播放和暂停按钮样式、全屏按钮样式、音量调解
街尾杂货店&
·
2025-02-28 17:16
前端组件与功能(开箱即用)
西瓜视频xgplayer
vue2.js
vue3.js
自定义西瓜视频界面排版布局
css如何修改覆盖西瓜播放器
如何更换按钮及加载图标样式
播放器暂停播放按钮太大怎么调小
2.8 通过
微调
提升模型的准确度与效率-大模型ACP模拟题-真题
A.通过低秩矩阵间接影响模型行为B.会直接修改原始模型权重✅C.支持参数回退操作D.训练效率高于全参
微调
解析:LoRA通过添加额外参数而非修改原权重实现
微调
当训练过程中出现
admin皮卡
·
2025-02-28 17:12
阿里云大模型ACP-考试回忆
人工智能
java
ai
【AI测试学习】AnythingLLM+Ollama+DeepSeek部署私人知识库
这里我们借助Ollama大预言模型部署工具进行搭建官网如下:Ollama安装包也可百度网盘获取:安装完成后,桌面右下角会显示ollama
图标
1.2.安装DeepSeek复制oll
艳Yansky
·
2025-02-28 16:37
AI测试
Python学习笔记
人工智能
DeepSeek
Ollama
AnythingLLM
低代码革命:基于DeepSeek
微调
模型实现前端代码自动生成与私有JS API调用的实战指南
摘要本文探讨如何
微调
DeepSeek平台的大语言模型,以实现前端代码的智能生成与自建JavaScriptAPI库的无缝调用。
Light60
·
2025-02-28 15:58
低代码
实战篇
AI应用
低代码开发
DeepSeek
微调模型
JavaScript
API
智能生成
微软发布 Phi-4 迷你模型,适合本地部署ChatBot
该模型经历了一个增强过程,包含了监督
微调
和直接偏好优化,以支持精确的指令遵循和稳健的安全措施。
吴脑的键客
·
2025-02-28 13:43
人工智能
microsoft
人工智能
开源
AIGC
自然语言处理
语言模型
大模型调优方法:提示工程、RAGs 与
微调
对比
前言每一个搭建大语言模型应用的AI工程师都会面临一个难题,如何选择一个合适调优方法。就算是强大的预训练LLM也可能无法直接满足项目中的特定需求。如项目需要一个特定结构的应用程序,如预训练缺失上下文的重要文件,再比如有特定术语和结构的高专业性的行业领域,面对这些问题,需要有特定的方法来调整LLM。要决定用哪种调优方法,首先得明白这些方法的含义。提示工程(PromptEngineering)提示工程相
AI大模型探索者
·
2025-02-28 11:03
人工智能
机器学习
深度学习
ai
语言模型
DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
这项研究在如何仅依靠强化学习而不是过分依赖监督式
微调
的情况下,增强LLM解决复杂问题的能力上,取得了重要进展。
爱喝白开水a
·
2025-02-28 07:52
人工智能
AI大模型
DeepSeek
R1
DeepSeek
算法
人工智能训练
大模型部署
深度解析:大模型开源的真与假
目录大模型企业开闭源策略各异开源大模型的定义与现状开源内容的局限性通常开放的内容实际未开放的关键内容法律与商业模式的约束开源许可证的重要性大模型的定制许可证及其限制性条款商业公司对开源大模型的策略和目的建立生态系统吸引开发者提升品牌形象保持竞争优势技术创新和改进技术与协助开发的挑战训练和推理过程的资源需求差异
微调
和衍生模型的技术实现及其局限性开源大模型在协作开发中的局限总结大模型的发展开启了
rs勿忘初心
·
2025-02-28 05:39
#
AI大模型
大模型
开源闭源对比
开源闭源区别
利用DSPy优化LangChain RAG系统的实战指南
具体来说,DSPy编译器会在内部追踪你的程序,然后为大型语言模型(LLMs)创建高质量的提示(或为小型LLMs训练自动
微调
),以教会它们任务的步骤。
scaFHIO
·
2025-02-28 04:01
langchain
python
前言:什么是大模型
微调
一、大模型
微调
的基础知识1.什么是大模型
微调
?大模型
微调
(Fine-tuning)是指在预训练模型的基础上,针对特定的任务或数据集进行进一步训练的过程。
伯牙碎琴
·
2025-02-28 04:26
大模型微调
深度学习
人工智能
机器学习
大模型
微调
训练
Pycharm远程连接服务器和配置远程python环境
首先在setting中添加PythonInterpreter,点击右边齿轮
图标
添加输入连接和用户名然后选择python环境的路径,一般是/home/username/anaconda3/envs/envsname
hlee-top
·
2025-02-28 02:12
技巧
pycharm
服务器
DeepSeek本地部署必要性分析及云端替代方案推荐
本地部署适用场景分析硬件要求完整版模型需≥32GB显存(推荐NVIDIAA100/A800)基础版也需RTX3090级别显卡(约150W功耗)适用人群建议✔️企业用户:需私有化部署处理敏感数据✔️研究人员:需定制模型
微调
Asher_Yao
·
2025-02-28 01:08
人工智能
通过vLLM部署LLM模型到生产环境中
文章目录1使用vLLM部署模型2部署过程2.1准备GPU环境2.2安装vLLM依赖项3使用vLLM部署模型并启动服务3.1部署开源模型3.2部署
微调
模型4测试服务是否正常运行5评估服务性能1使用vLLM
MichaelIp
·
2025-02-28 01:04
人工智能实验室
大语言模型
人工智能
python
AIGC
自然语言处理
语言模型
prompt
llama
微调
LLM (RLHF + DPO)
微调
LLM(RLHF+DPO)使用强化学习(RL)根据人类反馈
微调
大语言模型(即RLHF)的方法,以及一种更有效的改进方法(即DPO)。
·
2025-02-27 21:56
人工智能
android 系统状态栏高度,关于Android状态栏高度为0仍显示的问题
前言这里有一个比较坑的事,系统将状态栏的高度已经设置为0,然后界面上确实已经看不到时间,WiFi等
图标
,也无法通过下拉,显示通知栏。
weixin_40005330
·
2025-02-27 19:10
android
系统状态栏高度
Ghostty 终端配置指南
Ghostty终端配置详解:打造个性化终端体验文章目录**Ghostty配置文件说明Ghostty字体配置字体
微调
Ghostty主题和颜色配置Ghostty鼠标和剪贴板配置Ghostty窗口和界面配置Ghostty
·
2025-02-27 17:38
终端
解决pyinstaller打包exe后运行会弹出黑框的问题
解决方法是在命令末尾输入--noconsole如下pyinstaller-Fmycode.py--noconsole如果打包时想要自己设置
图标
需要写成pyinstaller--onefile--icon
wave_sky
·
2025-02-27 14:27
服务器
grafa导出数据
图标
_grafana dashboard的导入导出
grafana的官方提供了很多社区或者官方设置的漂亮的dashboard,地址如下:导入图表大大节省了我们配置监控的时间,非常方便.以linuxhostoverview为例,首先确保telegraf(貌似现在telegraf+influxdb+grafana已经成为了主流,并且这个监控架构支持全windows环境部署)中的配置包含(部分参数请根据系统情况自行修改,这里不是挖坑)如下图:然后下载js
承诺谎言
·
2025-02-27 12:49
grafa导出数据图标
在docker中运行R容器,并在Windows下的vscode中使用该R
启动DockerDesktop并确保服务运行正常(任务栏出现Docker
图标
)。
smx6666668
·
2025-02-27 09:00
docker
docker
r语言
windows
扣子和DIfy调用deepseek对比分析
又闻言,Dify、TensorFlow、PyTorch、Keras、Fastai、HuggingFace等工具可以
微调
诸如deepseek、chatgpt、doubao等大模型。
ISDF-CodeInkVotex
·
2025-02-27 06:30
人工智能+
科技前沿杂谈
人工智能
网站显示不安全的解决办法
●查看证书状态(浏览器操作):点击地址栏左侧的“不安全”
图标
→选择“证书”→检查:●证书是否失效。●证书域名是否与当前访问的域名完全匹配。●证书颁发机构(CA)是
·
2025-02-27 00:12
安全运维
深入解析 DeepSeek R1:强化学习如何驱动大模型推理能力的进化
引言在AI竞赛日益激烈的时代,DeepSeek-AI推出了DeepSeekR1,试图以强化学习(RL)直接训练推理能力,而非仅依赖传统的监督
微调
(SFT)。
海棠AI实验室
·
2025-02-26 23:07
智元启示录
人工智能
deep
learning
DeepSeek-R1
npm : 无法加载文件 D:\nodejs\npm.ps1,因为在此系统上禁止运行脚本
右键点击PowerShell
图标
:在搜索结果中,找到“WindowsPowerShell”或“WindowsPowerShellISE”(如果你使用的
rjc_lihui
·
2025-02-26 21:17
npm
前端
node.js
论文笔记:Enhancing Sentence Embeddings in Generative Language Models
这些模型固有的语义空间各向异性,往往需要通过大量数据集进行
微调
,才能生成高质量的句子嵌入。
UQI-LIUWJ
·
2025-02-26 20:17
论文阅读
语言模型
人工智能
Ollama
微调
通过Ollama的ModeFile文件进行
微调
。通过ModelFile
微调
1、创建名为Modelfile的空白文件。2、在空白文件内写配置信息。FROMq
软件不硬
·
2025-02-26 19:08
LLM
tool
AIGC
有哪些开源大数据处理项目使用了大模型
**SWIFT**:阿里开源的大模型
微调
轻量级框架,用于提高RAG应用的准确度。3.**Text2SQL**:阿里发布的最新实践开源模型,其准确度超过了GPT4。4
魔王阿卡纳兹
·
2025-02-26 19:02
大数据治理与分析
开源
大数据
数据清洗
Python
微调
DeepSeek-R1-Distill-Qwen-1.5B模型:使用Transformers和PyTorch进行训练
为了让这些模型更加适应特定任务,我们通常会进行
微调
(Fine-tuning)。
煤炭里de黑猫
·
2025-02-25 21:02
pytorch
python
人工智能
机器学习
Avalonia-wpf介绍
ExperimentalAcrylicBorder”和“ExperimentalAcrylicMaterial”的介绍ExperimentalAcrylicBorderExperimentalAcrylicMaterial按钮排版按钮
图标
按钮命令响应式命令添加一个新对话框对话框窗口样式对话框的输入与输出显示对话框对话框的位置和大小添加对话框内容模拟搜索
晓纪同学
·
2025-02-25 16:30
C#技巧总结
wpf
鸿蒙原生绘图API:从基础到高阶的绘制之旅(进阶版)
一、复杂图形绘制(一)路径绘制当绘制不规则图形,比如独特的
图标
、创意的装饰元素时,Path类就成了
·
2025-02-25 12:02
C++ 单列模式在touchGFX 中的应用
一)资源管理场景1)图像资源管理:在TouchGFX应用中,通常会有许多图像资源,如界面
图标
、背景图片等。使用单例模式创建一个图像资源管理器,可以确保这些图像资源在整个应用中被有效地管理。
黑果果的思考
·
2025-02-25 08:30
touchGFX学习笔记
stm32
SAM应用:医学图像和视频中的任何内容分割中的基准测试与部署
医学图像和视频中的任何内容分割:基准测试与部署目录摘要:一、引言1.1SAM2在医学图像和视频中的应用二.结果2.1数据集和评估协议2.2二维图像分割的评估结果三讨论四局限性和未来的工作五、方法5.1数据来源和预处理5.2
微调
协议
烧技湾
·
2025-02-25 02:42
AI
&
Computer
Vision
SAM
MED2SAN
医学图像分割
分割一切
用人类反馈
微调
大模型,InstructGPT 让 GPT-3 脱胎换骨
用人类反馈
微调
大模型,InstructGPT让GPT-3脱胎换骨本文展示了一种通过利用人类反馈进行
微调
,使大语言模型在广泛任务中契合用户意图的方法。
·
2025-02-24 23:50
人工智能
DeepSeek-R1秘籍轻松迁移,只需原始数据0.3% | 邱锡鹏团队联合出品
他们提出了MHA2MLA这种数据高效的
微调
方法,使基于MHA(多头注意力)的大语言模型(LLMs)能够顺利转换到MLA架构。以Llama2-7B为例
·
2025-02-24 19:13
量子位
遥控器显示分别对应的无人机状态详解!!
飞行状态:如起飞、悬停、飞行中、降落等状态,这些状态可能通过遥控器的指示灯颜色或显示屏上的
图标
来表
云卓SKYDROID
·
2025-02-24 19:55
无人机
遥控器
科普
知识
云卓科技
Meta官宣Llama3:迄今为止最强大的开源大模型
此版本具有经过预训练和指令
微调
的语言模型,具有8B(80亿)和70B(700亿)参数,可以支持广泛的用例。Llama3在各种行业基准上展示了最先进的性能,并提供了新功能,包括改进的推理能力。
·
2025-02-24 19:09
人工智能开源
DeepSeek 和 Qwen 模型快速部署指南
DeepSeek-V3DeepSeek-R1模型大小总参数量6710亿(671B),MoE架构,每个token激活370亿参数总参数量与V3相当,基于DeepSeek-V3-Base,采用类似的MoE架构训练方法包含预训练、监督
微调
moton2017
·
2025-02-24 18:47
深度学习
运维
模型部署
DeepSeek
Qwen
大型语言模型
LLM
人工智能
AI
Vmware桥接开放ip端口给局域网访问
点击编辑,选择虚拟网络编辑器点击更改设置选择NAT模式点击NAT设置选择添加添加后点击确定或应用即完成需要打开防火墙7.控制面板,选择右上角小
图标
8.选择防火墙9.高级设置10.入站规则11.新建规则12
舌尖上的五香
·
2025-02-24 16:37
tcp/ip
网络
服务器
后端
运维
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他