E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
预训练语言模型
大模型AI应用安全与合规测试实战指南-数据层
核心痛点直击:黑盒失控:生成内容不可预测,传统规则引擎失效数据深渊:
训练
数据含敏感信息,清洗难度指数级上升合规迷宫:全球AI监
测试匠心:技能精进·职场跃迁·面试赢家
·
2025-02-08 21:20
人工智能
安全
ai
测试工具
DQN深度强化学习:CartPole倒立摆任务(完整代码)
三、安装环境四、定义QNet五、定义DQNAgent初始配置动作选择(ε-贪婪策略)六、完整代码七、
训练
结果一、什么是DQN?
林泽毅
·
2025-02-08 21:45
强化学习
深度学习
DQN
QLearning
训练实战
深度强化学习
人工智能
Vision Transformer学习笔记(2020 ICLR)
摘要(Abstract):简述了ViT(VisionTransformer)模型的设计和实验结果,展示了其在大规模图像数据集上进行
训练
时的优越性能。
刘若里
·
2025-02-08 21:15
论文阅读
学习
笔记
网络
计算机视觉
transformer
Deepseek成功启示:从 TRPO 到 GRPO
训练
LLM
这是深入了解大型
语言模型
LLMs如何
训练
的绝佳机会。
大模型之路
·
2025-02-08 20:03
强化学习
大模型(LLM)
人工智能
LLM
强化学习
deepseek
GRPO
TRPO
速看!openKylin本地部署并运行DeepSeek-R1全攻略!
这款
语言模型
,一经发布直接在全球范围内爆火,成为顶流,在热搜上更是牢牢占据一席之地。无论是技术大神,还是紧跟潮流的技术小白,都被它强大的自然语言处理能力狠狠吸引,谁不想赶紧上手体验一把呢?
·
2025-02-08 19:31
知识库升级新思路:用生成式AI打造智能知识助手
生成式AI,特别是像ChatGPT这样的
语言模型
,为知识库管理系统带来了新的可能性。一、知识库管理系统的现
·
2025-02-08 19:01
《探秘卷积神经网络的核心—卷积核》
卷积核中的每个元素都是一个权重参数,这些参数会在网络
训练
过程
·
2025-02-08 19:57
机器学习人工智能深度学习
速看!openKylin本地部署并运行DeepSeek-R1全攻略!
这款
语言模型
,一经发布直接在全球范围内爆火,成为顶流,在热搜上更是牢牢占据一席之地。无论是技术大神,还是紧跟潮流的技术小白,都被它强大的自然语言处理能力狠狠吸引,谁不想赶紧上手体验一把呢?
·
2025-02-08 18:52
锂电池剩余寿命预测 | 基于PSO-SVM粒子群优化支持向量机的锂电池剩余寿命预测研究附Matlab参考代码
1.2、研究现状目前,锂电池剩余寿命
预
默默科研仔
·
2025-02-08 15:36
锂电池寿命预测
支持向量机
PSO-SVM
粒子群优化支持向量机
锂电池剩余寿命预测
熬夜整理模型下载、量化、代码调用可免费使用离线部署的上千个国内外开源大模型梳理,整理开源的大
语言模型
,以规模较小、可私有化部署、
训练
成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等
熬夜整理模型下载、量化、代码调用,可免费使用离线部署的上千个国内外开源大模型梳理,整理开源的大
语言模型
,以规模较小、可私有化部署、
训练
成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等
代码讲故事
·
2025-02-08 15:32
机器人智慧之心
模型
离线
量化
大模型
开源
部署
训练
DeepSeek:知识图谱与大模型参数化知识融合的创新架构
大模型,凭借其在海量数据上的深度
训练
,拥有强大的语言理解与生成能力,能够处理多种自然语言处理任务,如文本生成、问答系统、机器翻译等,像GPT系列模型,一经推出便在全球范围内引起了广泛关注,展示了大模型在语言处理方面的卓越能力
·
2025-02-08 14:49
deepseek
超火的DeepSeek使用了大模型蒸馏技术嘛?
以下是通过互联网公开信息整理的内容:从多个证据中可以确认,DeepSeek在其模型
训练
和优化过程中采用了蒸馏技术。
魔王阿卡纳兹
·
2025-02-08 14:28
IT杂谈
DeepSeek
大模型蒸馏
OpenAI
【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析
一、引言与背景在人工智能领域,大型
语言模型
(LLM)如DeepSeek以其卓越的自然语言理解和生成能力,推动了众多应用场景的发展。
后端研发Marion
·
2025-02-08 14:24
AI大模型技术
机器学习
人工智能
深度学习
deepseek
本地部署
图神经网络实战(8)——图注意力网络(Graph Attention Networks, GAT)
图注意力层原理1.1线性变换1.2激活函数1.3Softmax归一化1.4多头注意力1.5改进图注意力层2.使用NumPy中实现图注意力层3.使用PyTorchGeometric实现GAT3.1在Cora数据集上
训练
盼小辉丶
·
2025-02-08 12:09
图神经网络从入门到项目实战
图神经网络
pytorch
图注意力网络
GNN
动手学图神经网络(12):MovieLens上的链接回归
MovieLens上的链接回归在MovieLens数据集上进行评分预测的实践过程,包括数据处理、模型构建、
训练
以及评估等步骤,预测用户对电影的评分(即边的属性值)。
段智华
·
2025-02-08 11:07
图神经网络
图神经网络
神经网络压缩实验-Deep-compression
首发于个人博客,结合论文阅读笔记更佳实验准备基础网络搭建为了实现神经网络的deepcompression,首先要
训练
一个深度神经网络,为了方便实现,这里实现一个两层卷积+两层MLP的神经网络classnet
无用技术研究所
·
2025-02-08 11:06
大
语言模型
应用指南:Gemini简介
1.背景介绍1.1大型
语言模型
的兴起近年来,随着计算能力的提升和数据量的爆炸式增长,大型
语言模型
(LLM)逐渐成为人工智能领域的研究热点。
AI天才研究院
·
2025-02-08 11:03
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
深度学习的文本生成:从seq2seq到GPT2和GPT3
文章目录1.背景介绍1.1序列到序列(seq2seq)模型1.1.1编码器1.1.2解码器1.1.3
训练
1.2Transformer模型1.2.1自注意力机制1.2.2位置编码1.2.3多头注意力1.2.4
AI天才研究院
·
2025-02-08 11:33
AI大模型应用入门实战与进阶
ChatGPT
大数据
人工智能
语言模型
AI
LLM
Java
Python
架构设计
Agent
RPA
DeepSeek MoE 项目教程
DeepSeek-MoE项目地址:https://gitcode.com/gh_mirrors/de/DeepSeek-MoE1、项目介绍DeepSeekMoE是一个基于Mixture-of-Experts(MoE)架构的
语言模型
姬牧格Ivy
·
2025-02-08 10:59
AI学习指南HuggingFace篇-项目实战:情感分析系统
本文将通过一个完整的项目案例,从数据收集、模型
训练
到部署,展示HuggingFace在情感分析中的实战应用。二、项目实战:情感分析系统(一)数据收集情感分析通常需要一个包含文本和对应情感标签的数据集。
俞兆鹏
·
2025-02-08 10:25
AI学习指南
ai
大
语言模型
多token预测技术
近年来,大
语言模型
(LLM)在自然语言处理领域取得了突破性进展,凭借其强大的语言理解和生成能力,在各种NLP任务中展现出惊人的性能。
deepdata_cn
·
2025-02-08 09:21
NLP
语言模型
人工智能
自然语言处理
【Python】将不规则凸多边形映射到单位正方形
写在前面在机器学习领域常需要将数据归一化后才能进行
训练
等操作,一维数据很容易处理,但对于二维的不规则数据,则需要一些手段,本文就是用来解决这个问题此外,有时候希望可以用循环遍历一个不规则的二维平面,显然难以直接实现
辰尘_星启
·
2025-02-08 09:16
python
开发语言
算法
映射
数学
AI编程工具合集
OpenAI)这里是一些知名和广泛使用的AI编程工具及其简要介绍:1.框架和库(FrameworksandLibraries)-TensorFlow:由谷歌开发的开源深度学习框架,支持多种平台,适合构建和
训练
复杂神经网络
109702008
·
2025-02-08 09:14
人工智能
ai编程
人工智能
学习
GPT-4.0 新手使用教程(保姆级入门)
一、GPT-4.0简介GPT-4.0是OpenAI推出的最新版本的生成式
预
训练
模型,较之前的版本,它在自然语言理解和生成方面有了显著提升。
玩AI的小胡子
·
2025-02-08 09:42
chatgpt
【Ollama+Deepseek】本地化部署运行Deepseek模型
二、Ollama下载安装Ollama是一个开源工具,用于在本地计算机上快速部署和运行大型
语言模型
(LLMs)。它专注于简化LLM的本地运行流程,无需复杂的配置即可在个人设备(如
·
2025-02-08 06:32
大模型的
训练
与应用 | 二十二、DeepSeek API 申请与使用指南
DeepSeekAPI,一个兼容OpenAIAPI格式的强大工具,为开发者提供了丰富的自然语言处理能力。本文将为您展示如何申请和使用DeepSeekAPI,让您能够轻松集成智能对话补全功能。一、DeepSeekAPI概览DeepSeekAPI基于先进的MoE模型,支持对话生成和补全,适用于聊天机器人、虚拟助手等应用场景。二、申请APIKey1)注册DeepSeek平台账号访问DeepSeek平台,
西琴小竹
·
2025-02-08 06:50
【AI原理解析】— Gemini模型
目录1.模型概述定义特点2.模型基础与架构模型架构模型尺寸3.多模态处理能力输入处理数据处理
训练
过程4.技术细节与优化
预
训练
上下文长度注意机制5.安全性与编程能力安全性评估编程能力6.模型发布与应用发布时间应用方向
coolkidlan
·
2025-02-08 06:49
AI学习路径
AIGC
人工智能
AIGC
DeepSeek-R1深度报告:基于Python强化学习的前沿长链推理模型揭秘与实战——兼谈SEO优化与实用经验分享
优化与实用经验分享】配合此文章使用,效果更佳:DeepSeek-R1深度报告——50道相关面试题——深刻理解相关概念(DeepSeek-R1大模型+强化学习(RL)+推理能力)一、前言与背景铺垫在当今人工智能与大
语言模型
快撑死的鱼
·
2025-02-08 05:19
算法工程师面试宝典(面试必备)
python
搜索引擎
开发语言
AI大
语言模型
的全面解读
大
语言模型
(LargeLanguageModels,LLMs)无疑是近年来最耀眼的星辰之一。
草莓屁屁我不吃
·
2025-02-08 05:48
人工智能
语言模型
自然语言处理
chatgpt
DeepSeek模型与OpenAI模型原理和技术架构的异同分析
DeepSeek模型与OpenAI模型原理和技术架构的异同分析一、模型原理(一)DeepSeekR1DeepSeekR1的核心原理是基于强化学习(RL)的
训练
方式,其创新之处在于不依赖任何监督微调(SFT
程序猿000001号
·
2025-02-08 04:10
DeepSeek
大模型
qwen vllm function_call
教程:使用vLLM部署Qwen模型并实现工具调用前言vLLM是一个高效、易于使用的大型
语言模型
推理和部署库。
xnuscd
·
2025-02-08 04:07
java
LangGraph入门教程
与知识图谱定义工具构建Agent类自定义模板和输出解析运行示例扩展与优化常见问题与故障排除总结简介LangGraph是一个结合LangChain与知识图谱(KnowledgeGraph)的应用,旨在通过结构化的知识库增强
语言模型
的理解和响应能力
xnuscd
·
2025-02-08 04:37
python
NAS(神经架构搜索)基准数据集
在NAS(神经架构搜索)任务中,基准数据集是指专门设计并提供固定的搜索空间、评价指标和
预
训练
结果的数据集,用于公平评估和比较不同NAS算法的表现。
TAICHIFEI
·
2025-02-08 03:31
神经架构搜索(NAS)
架构
神经网络
人工智能
机器学习
【Ollama+Deepseek】本地化部署运行Deepseek模型
二、Ollama下载安装Ollama是一个开源工具,用于在本地计算机上快速部署和运行大型
语言模型
(LLMs)。它专注于简化LLM的本地运行流程,无需复杂的配置即可在个人设备(如
·
2025-02-08 02:59
说话人识别----技术挑战点
技术挑战点为:与文本无关;说话人识别中的跨信道、噪音;短语音;多说话人、防假冒处理;
训练
库大小限制;
sunfoot001
·
2025-02-08 01:54
Chapter4.1 Coding an LLM architecture
4ImplementingaGPTmodelfromScratchToGenerateText4.1CodinganLLMarchitecture4ImplementingaGPTmodelfromScratchToGenerateText本章节包含编写一个类似于GPT的大型
语言模型
亲持红叶
·
2025-02-08 01:53
构建大语言模型(从头开始)
gpt
python
人工智能
自然语言处理
transformer
基于Pytorch的猫狗分类的代码演练
这个代码是以tensorflow为框架
训练
的,由于之前一直没有系统的了解tensorflow框架和Pytorch框架的区别,得着今天闲来无事,了解了一下,顺便看看能不能自己用Pytorch框架来
训练
猫狗分类的代码
摸爬滚打的包菜
·
2025-02-07 23:09
pytorch
分类
人工智能
机器学习算法分类
以下是详细的分类介绍:1.根据学习方式进行分类1.1监督学习(SupervisedLearning)监督学习是指在
训练
过程中,输入数据(特征)和输出数据(标签)都是已知的。
和风化雨
·
2025-02-07 23:07
人工智能
机器学习
算法
分类
DeepSeek-V3:低成本高性能的AI代码生成器,开源大模型的又一里程碑
这款拥有6710亿参数的超大规模
语言模型
,以其低廉的
训练
成本(仅557万美元)和接近GPT-4o的性能,成为开源大模型领域的又一个里程碑,也为AI代码生成器领域带来了新的可能性。
·
2025-02-07 22:52
前端
【vLLM 学习】使用 CPU 安装
vLLM是一款专为大
语言模型
推理加速而设计的框架,实现了KV缓存内存几乎零浪费,解决了内存管理瓶颈问题。
·
2025-02-07 22:51
毕业设计:基于卷积神经网络的鲜花花卉种类检测算法研究
目录前言课题背景和意义实现技术思路一、算法理论基础1.1卷积神经网络1.2目标检测算法二、数据集2.1数据集2.2数据扩充三、实验及结果分析3.1实验环境搭建3.2模型
训练
最后前言大四是整个大学期间最忙碌的时光
HaiLang_IT
·
2025-02-07 20:23
深度学习毕业设计
机器学习
毕业设计
目标检测
大模型实战篇之Deepseek二、一键部署DeepSeek-V3和DeepSeek-R1模型
DeepSeek作为一款高性能的
语言模型
,已经在多个领域展现出巨大的应用潜力。然而,传统的模型部署流程往往复杂且耗时。
伯牙碎琴
·
2025-02-07 19:44
大模型
Deepseek
AI
大模型
Word接入DeepSeek r1,轻松实现智能文本生成与润色
随后出现的大型
语言模型
要么难以调用,要么收费昂贵。如今,随着DeepSeek的开源,结合Word这一办公常用场景,我决定将DeepSeek模型接入Word,实现文本生成和文本润色两大功能。
细节处有神明
·
2025-02-07 18:12
chatgpt
deepseek
经验分享
word
AIGC
agi
ai
deepseek
生成式AI之下,软件供应链安全的升级迫在眉睫
随着生成式AI和大
语言模型
技术的快速发展和广泛应用,尤其是在软件供应链安全领域,AI与软件供应链的深度融合催生了新的安全课题。
DevSecOps选型指南
·
2025-02-07 17:05
人工智能
安全
开源软件
AI商业化:如何包装技术并找到客户需求?
一、引言在过去几年里,从GPT、Transformer到DeepSeek,以及分布式
训练
和微调技术的发展,为AI技术带来了质的飞跃。然而,光有先进的技术并不足以实现商业成功。如何将这些技术包装成易于
hjy1821
·
2025-02-07 17:34
AI
人工智能
深入浅出 DeepSeek-Coder-V2 是如何打破闭源模型封锁的
今天,我们就从模型架构、
训练
数据、强化学习优化三
fertiland
·
2025-02-07 17:33
人工智能
深度学习
传统AI算法工程师转型指南:如何成功切入大模型领域赛道“
1.从多模态入手一开始我完全没有纯
语言模型
的相关经验,因此首先做了一个图文多模态的项目。通过这个项目了解到了文本的大致编解码流程,以及一些常见的文本
预
训练
任务(mlm等等)。
大模型玩家
·
2025-02-07 17:33
人工智能
算法
面试
ai
职场和发展
语言模型
agi
ubuntu22.04,瑞芯微RK3568部署YOLOv5(纯干货版)
目录1,
训练
自己的数据集转换为onnx2,onnx格式→rknn格式3,3588平台部署1,
训练
自己的数据集转换为onnx在Anaconda的yolov5,进入yolov5根目录,终端运行如下pythonmodels
今夕是何年,
·
2025-02-07 16:58
视觉算法部署
YOLO
人工智能
深度学习
如何应对ADAS/AD海量数据处理挑战?
目录一、问题背景二、内部构建或获取
预
组装解决方案三、总结随着软件定义汽车的发展,车辆生成的数据量也以前所未有的速度不断增加。这些数据包含广泛的信息,包括传感器数据、遥测数据、诊断数据等。
康谋自动驾驶
·
2025-02-07 15:50
汽车
数据分析
自动驾驶
测试
人工智能
深度搜索MoE:利用大规模
预
训练
模型提升信息检索效能
深度搜索MoE:利用大规模
预
训练
模型提升信息检索效能DeepSeek-MoE项目地址:https://gitcode.com/gh_mirrors/de/DeepSeek-MoE项目简介DeepSeek-MoE
杭律沛Meris
·
2025-02-07 15:20
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他