E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
模型融合猫狗大战
GPT 系列
模型
发展史:从 GPT 到 ChatGPT 的演进与技术细节
GPT(2018):划时代的起点:GPT(GenerativePre-trainedTransformer)首次将Transformer架构与无监督预训练结合,开启了大规模语言
模型
的新时代。
Ash Butterfield
·
2025-02-14 00:08
nlp
gpt
chatgpt
YOLO各版本原理和优缺点解析
模型
结构简单,易于实现和训练。缺点:对小目标检测效果差,容易
Ash Butterfield
·
2025-02-14 00:08
计算机视觉
Java NIO基础与实战:如何提升IO操作性能
JavaNIO(NewI/O)是对传统I/O(java.io)
模型
的改进,它引入了非阻塞I/O操作和面向缓冲区的数据读写方式,解决了传统I/O
模型
中的性能瓶颈。
薛伟同学
·
2025-02-14 00:08
Netty:高性能网络编程技巧
java
nio
【实测】用全志A733平板搭建一个端侧Deepseek算力平台
随着DeepSeek的蒸馏技术的横空出世,端侧SoC芯片上运行大
模型
成为可能。那么端侧芯片跑大
模型
的效果如何呢?
小文哥嵌入式开发
·
2025-02-14 00:07
嵌入式
人工智能
AI编程
【AI论文】OmniHuman-1: 重新思考一阶段条件式人体动画
模型
的扩展升级
然而,现有方法在大规模通用视频生成
模型
方面的扩展仍然存在困难,限制了它们在实际应用中的潜力。
东临碣石82
·
2025-02-13 23:06
人工智能
【AI论文】使用大型推理
模型
进行竞技编程
摘要:我们的研究表明,将强化学习应用于大型语言
模型
(LLMs)能显著提升复杂编码和推理任务的性能。
东临碣石82
·
2025-02-13 23:06
人工智能
如何微调(Fine-tuning)大语言
模型
?看完这篇你就懂了!!
前言本文介绍了微调的基本概念,以及如何对语言
模型
进行微调。从GPT3到ChatGPT、从GPT4到GitHubcopilot的过程,微调在其中扮演了重要角色。什么是微调(fine-tuning)?
datian1234
·
2025-02-13 23:05
语言模型
人工智能
chatgpt
LLM
ai
AI大模型
大模型微调
大型语言
模型
的核心机制解析
摘要大型语言
模型
的核心机制依赖于Transformer架构,该架构通过嵌入层将输入数据转换为向量形式,并结合位置编码以保留序列中单词的顺序信息。
耶耶Norsea
·
2025-02-13 23:05
网络杂烩
人工智能
Deepseek
【AI系列】从零开始学习大
模型
GPT (2)- Build a Large Language Model (From Scratch)
前序文章【AI系列】从零开始学习大
模型
GPT(1)-BuildaLargeLanguageModel(FromScratch)BuildaLargeLanguageModel背景第1章:理解大型语言
模型
第
Tasfa
·
2025-02-13 23:33
AI人工智能教程
人工智能
学习
gpt
自学人工智能大
模型
,满足7B
模型
的训练和微调以及推理,预算3万,如何选购电脑
如果你的预算是3万元人民币,希望训练和微调7B参数规模的人工智能大
模型
(如LLaMA、Mistral等),你需要一台高性能的深度学习工作站。
岁月的眸
·
2025-02-13 23:03
人工智能
多模态大
模型
(LMMs)与大语言
模型
(LLMs)的比较
前言现在的大
模型
分为两大类:大语言
模型
(LargeLanguageModels,简称LLMs)和多模态大
模型
(LargeMultimodalModels,简称LMMs)。
大F的智能小课
·
2025-02-13 23:02
底层技术解析
人工智能
语言模型
【好书推荐2】AI提示工程实战:从零开始利用提示工程学习应用大语言
模型
【好书推荐2】AI提示工程实战:从零开始利用提示工程学习应用大语言
模型
写在最前面AI辅助研发方向一:AI辅助研发的技术进展方向二:行业应用案例方向三:面临的挑战与机遇方向四:未来趋势预测方向五:与法规的影响方向六
是Yu欸
·
2025-02-13 23:02
粉丝福利
人工智能
深度学习
bert
AIGC
prompt
gpt
AI写作
MVC和react
MVC1.MVC是一种使用MVC(ModelViewController
模型
-视图-控制器)设计创建Web应用程序的模式.(1)Model(
模型
)表示应用程序核心(比如数据库记录列表).(2)View(
吃蛋糕的居居
·
2025-02-13 23:00
javascript
css
node.js
html
RESTful API 和 WebSocket 的区别
文章目录1.RESTfulAPI特点使用场景示例2.WebSocket特点使用场景示例3.RESTfulAPI和WebSocket对比总结4.哪种方式适合大
模型
服务?
戎梓漩
·
2025-02-13 22:30
计算机
restful
websocket
后端
分布式数据库面试整理
原因:mc多线程
模型
引入了缓存一致性和锁,加锁带来了性能损耗。2、redis主从复制如何实现
Necther
·
2025-02-13 22:28
数据库
面试
分布式
Web3 的虚实
融合
之路:从虚拟交互到元宇宙构建
在这个数字技术日新月异的时代,我们正站在Web3的门槛上,见证着互联网的又一次革命。Web3不仅仅是技术的迭代,它代表了一种全新的交互方式和价值创造模式。本文将探讨Web3如何推动虚拟交互的发展,并最终实现元宇宙的构建,揭示这一技术演进背后的关键理念与现实意义。Web3:去中心化的新交互方式Web3,即第三代互联网,是一个去中心化、用户主权、数据自主的网络环境。它依托于区块链、分布式存储等技术,实
dingzd95
·
2025-02-13 22:55
web3
web3
交互
通义灵码全新上线
模型
选择功能,新增支持 DeepSeek-V3 和 DeepSeek-R1
模型
近期,阿里云百炼平台重磅推出DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B等6款
模型
,进一步丰富其AI
模型
矩阵。
TONGYI_Lingma
·
2025-02-13 22:54
阿里云
云原生
AI程序员
通义灵码
《Stable Diffusion绘画完全指南:从入门到精通的Prompt设计艺术》 第一章
Prompt设计基础1.1什么是StableDiffusion:生成原理与核心优势一、颠覆性生成逻辑:从噪声到艺术的魔法逆向降噪原理传统AI绘画:直接生成完整像素StableDiffusion:通过潜扩散
模型
Allen-Steven
·
2025-02-13 22:54
python相关应用
SD
创作实践
stable
diffusion
prompt
人工智能
解码DeepSeek家族系列:大语言
模型
赛道上的黑马传奇
DeepSeek自成立之初,便专注于开发先进的大语言
模型
(LLM)及相关技术,致力于通过数据蒸馏技术提取更精炼、有用的数据,以提升
模型
性能。在发展历程中,DeepSeek
大F的智能小课
·
2025-02-13 22:52
语言模型
人工智能
自然语言处理
【必看】凭啥?DeepSeek如何用1/179的训练成本干到GPT-4o 98%性能
尽管初期计算开销较大,但添加少量冷启动数据后,训练稳定性和
模型
推理能力大幅提升。此外,DeepSeek还采用了组相对策略优化(GRPO)算法替代
大F的智能小课
·
2025-02-13 21:51
人工智能
算法
Sora
模型
的商业应用及成本效益分析
Sora
模型
简介Sora
模型
,作为一种先进的长视频生成
模型
,具有广泛的应用潜力。
大F的智能小课
·
2025-02-13 21:51
玩转大模型
人工智能
DeepSeek R1:开启AI推理新时代,强在哪里?
:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】你是否曾好奇,AI
模型
是如何学会拆解数学问题
·
2025-02-13 20:19
人工智能
解锁Rust:
融合
多语言特性的编程利器
实际上,Rust巧妙地借鉴了众多其他语言的优秀特性,并将它们
融合
成了一个完美的整体。深入了解Rust这些重要特性的来源以及它是如何在此基础上进行拓展的,对于有效运用Rust至关重要。
老猿讲编程
·
2025-02-13 20:16
Rust
rust
开发语言
DeepSeek使用手册,其中一份是清华大学出品
DeepSeek(深度求索)是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能平台,专注于提供高效易用的AI
模型
训练与推理能力。
cpa007
·
2025-02-13 20:45
云计算
获取 OpenAI o1-preview/o1-Mini API key 进行 API 调用的详细教程
如何使用OpenAI推理
模型
:o1-preview/o1-Mini
模型
的API调用在快速发展的人工智能领域,OpenAI推出了o1系列
模型
(草莓),包括o1-preview和o1-Mini。
·
2025-02-13 20:17
openaiapikey
使用openai api key不支持识别base64的图片?开发者上传多图的示例代码
还是说兼容的接口就是所有message的形式全部使用openai的官方文档,我只需要改一个model=xxx,然后其他规则得遵守openai而不是我使用的
模型
的官方文档?
·
2025-02-13 20:46
openaiclaude
获取 OpenAI API Key GPT-4o Mini
模型
并开发调用部署ChatGPT聊天
获取OpenAIAPIKey并开发调用GPT-4oMini
模型
OpenAI提供的API可以让开发者轻松调用其强大的自然语言处理
模型
。
·
2025-02-13 20:16
chatgptopenai
DeepSeek爆火:程序员的“饭碗”危机,还是进化转机?
目录前言一、挑战:低端编程岗位需求锐减二、机遇:能力升级与角色转型三、行业趋势与应对策略总之前言毋庸置疑的是DeepSeek等AI大
模型
的爆火确实对初级程序员的职业前景带来了显著冲击,但并非完全取代,在很大的程度上而是推动行业格局重构
禁默
·
2025-02-13 20:13
话题探讨
人工智能
大数据
免费体验!DeepSeek一键部署全攻略
自从深度求索团队开源了DeepSeek-R1和DeepSeek-V3,这两款
模型
迅速成为AI领域的焦点,引发了全球范围的热议!
·
2025-02-13 20:13
deepseek
拉格朗日乘数法算法详解及python实现
算法在编程中的实现二、案例分析案例一:二维最优化问题——求f(x,y)=x2+y2f(x,y)=x^2+y^2f(x,y)=x2+y2在约束x+y=1x+y=1x+y=1下的极值2.1.1问题描述2.1.2数学
模型
构建
闲人编程
·
2025-02-13 19:36
python
算法
python
开发语言
拉格朗日
乘数法
数学模型
oracle-XML解析XMLDOM对象转字符类型&&PLJSON解析所有
模型
名称
这两天有个小需要,摆弄一下oracle-XMLDOM,发现一个极其恶心的问题,就是CLOBvarchar2能转XML,但是反过来不行,硬是在BAIDU里找,唯一有问的一贴好多年前的事了,没有回复,其余的全是垃圾,我找到用法了,给大家共享一下。问题是这样的XML长度超过4000,假设源xml数据是分页的数据结果,想把长度超过4000的XMLDOM对象简单快捷的解析出来,就必须一行/一列分开解析,可是
lswsmail
·
2025-02-13 19:33
具身智能训练新思路!将生成视频用于训练机器人
将生成视频用于训练具身智能(EmbodiedAI)确实是近年来备受关注的前沿方向,这一思路通过结合生成式AI(如扩散
模型
、神经辐射场等)与机器人学习,为解决真实世界数据稀缺、训练成本高等问题提供了新可能
天机️灵韵
·
2025-02-13 18:02
具身智能
人工智能
具身智能
Langchain.js与ScriptEcho:推动AI文本生成与前端开发的创新
Langchain.js不仅连接了多个大型语言
模型
,还通过其灵活的架构,帮助开发者简化了AI应用的开发流程。同时,ScriptEcho作为一款创新的前端开发工具,正通过自动化功能提升开发效率。
2401_89747417
·
2025-02-13 18:31
langchain
javascript
人工智能
前端
从零开始大
模型
开发与微调:Miniconda的下载与安装
从零开始大
模型
开发与微调:Miniconda的下载与安装1.背景介绍随着人工智能和机器学习技术的快速发展,大型语言
模型
(LargeLanguageModel,LLM)已经成为当前研究和应用的热点。
AGI大模型与大数据研究院
·
2025-02-13 18:30
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Deepseek的MOE架构中ColumnParallelLinear()是怎么实现的
我记得在PyTorch中,
模型
并行通常涉及到将
模型
的层分布到不同的GPU上。ColumnParallelLinear可能指的是将线性层的列(即输出神经元)分布在多个设备上。
DukeYong
·
2025-02-13 18:00
架构
100.10 AI量化面试题:AI大
模型
中的MOE架构主要类型,和DeepSeek使用了哪一种类型?
目录0.承前1.解题思路1.1基础概念维度1.2架构对比维度1.3实践应用维度2.标准MOE架构2.1基本概念3.稀疏MOE架构3.1实现原理4.共享专家稀疏MOE架构4.1核心设计5.架构对比5.1主要特点对比5.2DeepSeek的选择6.回答话术0.承前本文通过通俗易懂的方式介绍MOE(混合专家系统)架构的几种变体,包括标准MOE、稀疏MOE和共享专家稀疏MOE,并分析它们的异同。如果想更加
AI量金术师
·
2025-02-13 18:00
金融资产组合模型进化论
人工智能
架构
金融
lstm
python
机器学习
如何避免交叉验证中的数据泄露?
大家好,我是小青在机器学习中,交叉验证(Cross-Validation)是一种常用的
模型
评估技术,目的是通过将数据集分割为多个子集,反复训练和验证
模型
,以便更好地估计
模型
的性能。
奋进小青
·
2025-02-13 17:25
人工智能
深度学习
机器学习
青少年编程与数学 02-009 Django 5 Web 编程 08课题、数据库操作
青少年编程与数学02-009Django5Web编程08课题、数据库操作一、数据操作1.创建记录2.查询记录3.更新记录4.删除记录5.聚合与注解二、创建记录1.定义
模型
2.迁移
模型
到数据库3.使用
模型
创建记录方法一
明月看潮生
·
2025-02-13 17:25
编程与数学
第02阶段
青少年编程
django
数据库
python
编程与数学
基于分布式架构的毕业设计题目50例
基于分布式架构的毕业设计题目1-10题1、基于分布式架构的网络考试系统的设计2、基于分布式架构的
融合
客户数据中心探讨3、基于分布式架构的内网监控系统的应用与研究4、基于分布式架构的铁路企业社会保障管理信息系统设计
love_java_code
·
2025-02-13 17:23
计算机专业毕业设计题目
分布式
架构
系统架构
小白零基础学习深度学习之张量
张量是PyTorch中最基本的东西,就像乐高积木一样,你可以用它来搭建各种复杂的
模型
。2.张量的用途存储数据:你可以把张量当作一个容器,用来存储各种数据。
爱理科的小王子
·
2025-02-13 17:53
学习
深度学习
人工智能
十大中国流行的AI大
模型
企业及平台汇总
特别是在我国,AI大
模型
技术的发展速度令人瞩目,各种平台纷纷涌现,表现出强大的技术实力和广泛的应用前景。
deepseek大模型
·
2025-02-13 16:50
人工智能
AIGC
chatgpt
面试
产品经理
AI前端开发技能提升路径:从入门到精通,成为AI时代的前端专家
AI前端开发,这个
融合
人工智能与前端技术的领域,正以前所未有的速度蓬勃发展,为开发者们带来了巨大的机遇与挑战。本文将为你详细解读AI前端开发技能提升路径,助你成为AI时代的前端专家。
·
2025-02-13 16:08
前端
无人机遥感在农林信息提取中的实现方法与GIS
融合
制图教程
遥感技术作为一种空间大数据手段,能够从多时、多维、多地等角度,获取大量的农情数据。数据具有面状、实时、非接触、无伤检测等显著优势,是智慧农业必须采用的重要技术之一。一:综合态势分析1.1研究区及作物品种分析(1)形态指标分析(2)生理生化指标分析(3)胁迫指标分析(4)产量指标分析(5)综合分析1.2无人机平台分析:析目前常用于农林行业的无人机平台。1.3无人机机载传感器分析:析目前常用于农林行业
岁月如歌,青春不败
·
2025-02-13 16:16
生态遥感
无人机
农业科学
林业科学
GIS
制图
遥感
生态学
如何训练LLMs进行“思考”(如o1和DeepSeek-R1)
近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】一台会思考的笔记本电脑OpenAI的o1
模型
为大型语言
模型
·
2025-02-13 16:07
人工智能
团队领导者指南:如何选择和应用项目管理方法论
以下是几种常见的项目管理方法论:1.瀑布
模型
(Waterfall)●特点:线性顺序的项目管理方法,项目分为多个阶段(如需求分析、设计、开发、测试、部署),每个阶段完成后才能进入下一个阶段。
·
2025-02-13 16:36
项目管理软件
【深度学习】常见
模型
-GPT(Generative Pre-trained Transformer,生成式预训练 Transformer)
GenerativePre-trainedTransformer,生成式预训练Transformer)是由OpenAI开发的基于Transformer解码器(Decoder)的自回归(Autoregressive)语言
模型
IT古董
·
2025-02-13 16:15
深度学习
人工智能
深度学习
gpt
transformer
Tritonserver 在得物的最佳实践
一、Tritonserver介绍Tritonserver是Nvidia推出的基于GPU和CPU的在线推理服务解决方案,因其具有高性能的并发处理和支持几乎所有主流机器学习框架
模型
的特点,是目前云端的GPU
·
2025-02-13 16:03
运维
python同花顺交易接口_开启量化第一步!同花顺iFinD数据接口免费版简易操作教程...
而量化交易,旨在以先进的数学
模型
替代人为的主观判断,利用计算机技术从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略,辅助投资者进行理性投资。
weixin_39564527
·
2025-02-13 15:12
python同花顺交易接口
DeepSeek与Web3:科技
融合
的新纪元
近年来,AI与Web3的
融合
正以前所未有的速度发展,而DeepSeek的出现加速了这一趋势。
·
2025-02-13 15:02
人工智能深度学习
AI前端开发:与新技术
融合
,重塑职业发展之路
本文将探讨AI前端开发与其他技术的
融合
,分析其对职业发展的影响,并以ScriptEcho为例,解读AI如何赋能前端开发。
·
2025-02-13 15:30
前端
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他