E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
TensorRT推理加速
技术债务的隐患:何时重构,何时妥协?
在快节奏的软件开发环境中,企业为了抢占市场或满足紧迫需求,往往不得不在短期内采取“捷径”来
加速
产品交付,这便引入了“技术债务”。
测试者家园
·
2025-03-20 08:23
测试开发和测试
质量效能
软技能
软件测试
质量效能
AI赋能
人工智能
项目管理
研发管理
技术债务
神经网络之参数初始化
合适的参数初始化方法有助于提高训练速度、避免梯度消失/爆炸问题,并且
加速
网络的收敛。一、参数初始化目的避免梯度消失和梯度爆炸:在深度神经网络中,参数初始化对梯度流动非常重要。
硬水果糖
·
2025-03-20 08:21
人工智能
神经网络
人工智能
深度学习
deepseek具体应用场景
以下是基于证据的详细总结:金融领域DeepSeek在金融领域的应用表现突出,例如通过其大语言模型(如DeepSeekLLM67Bt)提供数学、逻辑
推理
等能力,帮助金融机构提升服务效率。
ahyouxiang
·
2025-03-20 06:06
人工智能
【AI Agent教程】各种Agent开发框架都是如何实现ReAct思想的?深入源码学习一下
ReAct方式是AIAgent最常用的实现思路之一,它强调在执行任务时结合
推理
(Reasoning)和行动(Acting)两个方面,使得Agent能够在复杂和动态的环境中更有效地工作。
同学小张
·
2025-03-20 05:29
大模型
人工智能
学习
笔记
经验分享
AIGC
AI
Agent
ReAct
Docker入门篇:安装与
加速
今天接着上一篇文章来写,本来计划以paopaorobot/dvo为例带入docker的基本操作,然后中间插播一下docker的安装和
加速
,但是发现写的有点罗嗦,刚写完安装与
加速
就挺大篇幅了,所以决定将docker
slamml
·
2025-03-20 03:47
Docker
docker
容器
运维
如何缓存聊天模型响应以提高效率
为了应对这一挑战,LangChain提供了一种可选的缓存机制,可以有效地减少API调用次数,从而节省费用并
加速
应用程序响应。核心原理解析缓存机制的基本原理是在第一次请求时,将响应存储在缓存中。
scaFHIO
·
2025-03-20 03:46
缓存
java
oracle
python
Tree of Thought Prompting(思维树提示)
TreeofThoughtPrompting(思维树提示)是一种新兴的提示工程技术,旨在通过模拟人类解决问题时的多步
推理
过程,提升大型语言模型(LLM)在复杂任务中的表现。
大数据追光猿
·
2025-03-20 02:28
大模型
人工智能
大数据
深度学习
语言模型
计算机视觉
【大模型科普】AIGC技术发展与应用实践(一文读懂AIGC)
当前正
加速
与教育、科研融合,未来需平衡技术创新与伦理风险,推动可持续发展。文章目录一、AIGC概述(一)什么是
·
2025-03-20 01:36
人工智能
Canary Capital 向 SEC 递交首个 SUI ETF 申请文件
随着对Sui这一L1区块链的机构兴趣不断增长,其生态正在
加速
迈向大规模采用。
Sui_Network
·
2025-03-20 00:46
区块链
大数据
物联网
人工智能
智能合约
ETF
AXI总线之相关应用
AXI总线作为现代SoC设计的核心互连协议,其应用场景极为广泛,覆盖移动设备、AI
加速
器、FPGA、存储控制器等多个领域。
逾越TAO
·
2025-03-19 23:39
fpga开发
硬件工程
笔记
思途CMS高并发、高性能、高可用架构设计
二、各层技术特点及实现方式客户层1.1CDN
加速
思途CMS支持与主流CDN服务商(如阿里云CDN、腾讯云CDN等
·
2025-03-19 21:29
php
Deepseek的本地化部署软件工具包
选择模型版本参数规模硬件要求(最低)适用场景1.5B/7B8GB内存,无专用GPU文本处理、简单问答14B16GB内存+12GB显存代码生成、逻辑
推理
32B/70B24GB显存+32GB内存企业级复杂任务执行命令
哈拉少12
·
2025-03-19 20:14
人工智能
使用LangChain实现大规模语言模型自发现
推理
结构
使用LangChain实现大规模语言模型自发现
推理
结构在现代自然语言处理(NLP)的研究中,大规模语言模型(LLMs)已经展示了强大的能力。然而,在应对复杂的
推理
问题时,传统的提示方法常常力不从心。
VYSAHF
·
2025-03-19 20:43
langchain
语言模型
人工智能
python
现在的AI,到底是背答案的高手,还是真正的会思考
这让我也产生了一个疑问:现在的AI究竟是背答案的复读机呢,还是真会
推理
的最强大脑?于是我搜索了很多资料来了解这件事。毕竟这事儿可不单单跟作业有关系——它对未来的AI起着决
沐凡资源
·
2025-03-19 19:06
人工智能
A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用
应用尽管预训练为大型语言模型(LLMs)赋予了强大的基础能力,但在部署于专业领域时,LLMs仍经常遇到持续的限制,包括上下文长度受限、容易产生幻觉(hallucination)、
推理
能力欠佳和固有的偏见
王金-太想进步了
·
2025-03-19 19:31
语言模型
人工智能
自然语言处理
知识蒸馏:从软标签压缩到
推理
能力迁移的工程实践(基于教师-学生模型的高效压缩技术与DeepSeek合成数据创新)
知识蒸馏通过迁移教师模型(复杂)的知识到学生模型(轻量),实现模型压缩与性能平衡。核心在于利用教师模型的软标签(概率分布)替代独热编码标签,学生模型不仅学习到教师模型输出数据的类别信息,还能够捕捉到类别之间的相似性和关系,从而提升其泛化能力核心概念知识蒸馏的核心目标是实现从教师模型到学生模型的知识迁移。在实际应用中,无论是大规模语言模型(LLMs)还是其他类型的神经网络模型,都会通过softmax
AI仙人掌
·
2025-03-19 17:20
人工智能
AI
人工智能
深度学习
语言模型
机器学习
KV 缓存简介
KV缓存是Transformer架构(如GPT、LLaMA等大模型)在自回归生成任务(如文本生成)中,用于
加速
推理
过程的核心技术。
dev.null
·
2025-03-19 17:49
AI
缓存
探索AI知识库的无限潜力:定义、应用与未来展望
它不仅包含了大量的结构化、半结构化和非结构化数据,还具备智能检索、
推理
分析、自我学习和优化等高级功能。
·
2025-03-19 16:15
知识库知识库管理知识库软件
用户行为路径分析(Google Analytics数据挖掘)
(GoogleAnalytics数据挖掘)1.引言2.项目背景与意义2.1用户行为路径的重要性2.2GoogleAnalytics数据概述2.3数据规模与挑战3.数据集生成与介绍4.数据预处理与GPU
加速
闲人编程
·
2025-03-19 14:00
Python数据分析实战精要
数据挖掘
人工智能
用户行为路径分析
Analytics
数据分析
用户习惯
GPT-4o mini小型模型具备卓越的文本智能和多模态
推理
能力
GPT-4omini在学术基准测试中,无论是在文本智能还是多模态
推理
方面,都超越了GPT-3.5Turbo和其他小型模型,并支持与GPT-4o相同的语言范围。
FlowUs息流使用宝典
·
2025-03-19 14:55
GPT-4o
mini
推理
速度超快!vLLM本地部署Mistral-Small 3.1+全方位测试多模态大模型!超越Gemma3.1,最适合企业项目的大模型!中文OCR能力也不弱
本篇笔记所对应的视频https://www.bilibili.com/video/BV1Q9XLYiEwD/MistralAI最新推出的MistralSmall3.1模型无疑是近期科技界的一大亮点。这款由法国AI实验室MistralAI开发的开源多模态模型,以其卓越的性能和灵活性,为开发者、企业和研究人员带来了全新的可能性。凭借24B参数、对文本与图像的处理能力,以及在多个关键指标上的突破,Mis
AI超元域
·
2025-03-19 12:14
ocr
人工智能
ai
AI编程
aigc
DeepSeek高能低耗AI创作突破
内容概要随着人工智能技术向垂直领域
加速
渗透,生成式模型的应用边界正经历革命性拓展。DeepSeek系列产品通过670亿参数混合专家架构,构建起覆盖学术研究、内容创作与编程开发的多模态解决方案。
智能计算研究中心
·
2025-03-19 11:06
其他
算力未来演进与多场景创新
从技术架构层面来看,异构计算通过整合CPU、GPU、FPGA等多元芯片实现性能跃升,边缘计算则借助分布式节点降低时延并提升响应效率,而量子计算在特定领域的指数级
加速
潜力已进入验证阶段。
智能计算研究中心
·
2025-03-19 11:06
其他
未来5年AI人工智能与信息技术领域发展趋势
以Transformer为核心的序列建模技术持续迭代,字节跳动云雀模型通过动态结构优化,在保持语言理解能力的同时将参数量压缩至GPT-4的1/10,
推理
速度提升3倍。
海宁不掉头发
·
2025-03-19 11:03
人工智能
软件工程
人工智能
人工智能
软件工程
笔记
chatgpt
Selenium 中并行测试的重要性
随着技术的进步,测试解决方案变得更具可扩展性,
加速
了团队从手动测试到Selenium测试自动化的转型。但是成年人的世界,没有什么是容易的。对于许多团队来说,并行运行多个测试仍然是不可扩展的。
测试大大怪
·
2025-03-19 10:23
selenium
测试工具
单元测试
测试用例
压力测试
jmeter
功能测试
使用 DeepSeek-R1 为 RAG 运行本地 Gradio 应用程序
第1步:先决条件在深入研究实现之前,我们确保已安装以下工具和库:Python3.8+Python3.8+版Langchain:用于构建由大型语言模型()LLMs提供支持的应用程序的框架,支持轻松检索、
推理
和工具集成
呱牛 do IT
·
2025-03-19 10:53
人工智能
deepseek
OctoTools:一个具有复杂
推理
可扩展工具的智体框架
解决复杂的
推理
任务可能涉及视觉理解、域知识检索、数值计算和多步骤
推理
。现有方法使用外部工具增强大语言模型(LLM),但仅限于专业领域、有限的工具类型或需要额外的训练数据。
三谷秋水
·
2025-03-19 09:09
智能体
大模型
机器学习
人工智能
语言模型
机器学习
【大模型开发】ONNX 格式的大模型在 Android 上的部署与测试
最后会给出一些针对在移动设备上部署ONNX
推理
的优化方法和未来建议。
云博士的AI课堂
·
2025-03-19 08:05
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
android
大模型部署
本地推理引擎
大模型开发
机器学习
边缘设备
从混乱到高效:企业如何利用CMDB优化资产管理与战略决策
在数字化转型
加速
的今天,企业在面对海量且日益复杂的IT资产和系统配置时,往往会出现数据混乱、信息孤岛和决策盲区等问题。
·
2025-03-19 07:54
运维
Linux中部署DeepSeek R1
DeepSeek-R1本地部署硬件需求表模型规模GPU需求CPU需求内存需求存储需求备注1.5B-GTX16504GB(可选)四核i5/Ryzen3000+16GBDDR450GBSSD需4-bit量化,CPU
推理
延迟约
Java探索者 °
·
2025-03-19 07:26
linux
服务器
语言模型
生物分子仿真软件: Desmond_(3).分子动力学模拟基础
通过解决牛顿运动方程,MD模拟可以提供分子系统的详细动力学信息,包括原子位置、速度和
加速
度。这些信息对于理解生物分子的结构、功能和相互作用至关重要。
kkchenjj
·
2025-03-19 07:54
分子动力学2
模拟仿真
分子动力学
仿真模拟
金融租赁系统的创新发展与市场竞争力提升探讨
在现今环境下,新兴技术如人工智能、大数据和区块链等正
加速
推动金融租赁的创新。通过这些技术,不仅可以优化业务流程,提升运营效率,还可以增强风险管理能力。
红点租赁系统开发
·
2025-03-19 05:33
其他
Ubuntu20.04 RTX4060 AI环境搭建
下面记录在Ubuntu20.04环境下,使用ASUSATS-RTX4060-O8G-V2显卡,搭建Nvidia
TensorRT
开发环境。
stxinu
·
2025-03-19 05:03
人工智能
人工智能
自建智能算力中心 vs 第三方算力租赁:AI企业的算力博弈与最优解
从ChatGPT到DeepSeek,从自动驾驶到智能医疗,AI模型的训练和
推理
需求呈现指数级增长。在这场技术革命中,算力已成为企业竞争的“命脉”。
·
2025-03-19 03:50
近期docker镜像
加速
器被封杀,需要的请看此内容 点赞加关注
{“registry-mirrors”:[“https://docker.m.daocloud.io”],“insecure-registries”:[“harbor.sunya.com”],“exec-opts”:[“native.cgroupdriver=systemd”],“data-root”:“/data/docker”,“log-driver”:“json-file”,“log-opt
加油干sit!
·
2025-03-19 03:43
docker
docker
《Python实战进阶》No26: CI/CD 流水线:GitHub Actions 与 Jenkins 集成
No26:CI/CD流水线:GitHubActions与Jenkins集成摘要持续集成(CI)和持续部署(CD)是现代软件开发中不可或缺的实践,能够显著提升开发效率、减少错误并
加速
交付流程。
带娃的IT创业者
·
2025-03-19 00:50
Python实战进阶
python
ci/cd
github
Spring AI Alibaba 应用框架挑战赛圆满落幕,恭喜获奖选手
SpringAIAlibaba是一款Java语言实现的AI应用开发框架,用于
加速
和简化Java开发者的AI应用开发,定义Spring框架下的AI应用开发模式。
·
2025-03-18 22:44
云原生
理解深度学习1-简介
它覆盖了众多方法,涵盖了基于逻辑、搜索和概率
推理
的技术。机器学习是AI的一个分支,它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展,现在几乎(虽不完全准确)与AI同义。
shangjg3
·
2025-03-18 21:35
PyTorch深度学习实战
深度学习
人工智能
程序员必看!DeepSeek全栈开发实战指南:从代码生成到性能优化
这两项技术突破对程序员群体意义重大:通信效率飞跃:DeepEP通过NVLink优化实现GPU间158GB/s传输速度,后端开发者训练大模型时可节省60%集群资源
推理
性能突破:R1模型在H
AI创享派
·
2025-03-18 20:59
后端
前端架构师具备什么能力?前端性能优化全链路指南
加载时:
加速
资源加载(懒加载、预加载)。运行时:提升渲染效率(虚拟列表、WebWorker)。监控与诊断:用工具定位问题(ChromePerformance、Lighth
kerwin_1727
·
2025-03-18 20:25
前端架构师具备什么能力
前端
性能优化
智慧社区2.0
面试时可以强调:Redis作为缓存,
加速
社区热点数据访问,减少MySQL压力。HDFS存储海量日志和AI任务数据,支持后续分析。OSS解决图片
陈陈爱java
·
2025-03-18 19:53
java
五、AIGC大模型_05模型的vLLM部署与LangChain调用
0、概述要搭建一个大模型应用服务,通常需要包含以下五层结构,即:基础环境、模型层、
推理
层、对外接口、外挂应用在了解了模型的微调训练之后,本文将以vLLM、OpenAI、LangChain为例,介绍大模型的
推理
部署以及对外接口开放调用
学不会lostfound
·
2025-03-18 19:20
AI
人工智能
langchain
openai
vLLM
AIGC
PyTorch 深度学习实战(17):Asynchronous Advantage Actor-Critic (A3C) 算法与并行训练
本文将介绍强化学习领域的重要里程碑——AsynchronousAdvantageActor-Critic(A3C)算法,并展示如何利用PyTorch实现并行化训练来
加速
学习过程。
进取星辰
·
2025-03-18 19:17
PyTorch
深度学习实战
深度学习
pytorch
算法
开源应用驱动企业新质生产力:Websoft9以EPP+AI+知识库助您领跑未来
开源应用驱动企业新质生产力:Websoft9以EPP+AI+知识库助您领跑未来在数字化转型
加速
的今天,企业新质生产力的核心已从传统资源投入转向技术驱动的效率革命。
·
2025-03-18 18:35
开源软件
最新NPU芯片详解及应用场景
近年来,NPU(神经网络处理器)技术快速发展,各大厂商推出多款高性能AI
加速
芯片,覆盖从端侧设备到云端数据中心的多样化需求。
美好的事情总会发生
·
2025-03-18 18:10
AI
嵌入式硬件
硬件工程
linux
人工智能
ai
3D-AFFORDANCELLM: HARNESSING LARGE LANGUAGE MODELS FOR OPEN-VOCABULARY AFFORDANCE DETECTION
为了解决这些限制,我们将传统的可及性检测范式重新定义为指令
推理
可及性分割(IRAS)任务。该任务旨在根据查询
推理
文本输出可及性掩码区域,避免了输入标签的固定类别。相应地,我们提出了
UnknownBody
·
2025-03-18 16:00
LLM
Daily
3d
语言模型
人工智能
yolov4
从数据层面和网络设计层面来进行改善消融实验,感觉能做的都让他给做了,这工作量不轻全部实验都是单GPU完成,不用太担心设备了Bagoffreebies(BOF)只增加训练成本,但是能显著提高精度,并不影响
推理
速度数据增强
zzh-
·
2025-03-18 16:28
笔记
llama.cpp 和 LLM(大语言模型)
它通过海量文本数据训练,能够生成连贯、语义丰富的文本,完成问答、创作、
推理
等任务。特点:参数规模大:如GPT-3(1750亿参数)、Llama-65B(650亿参数)等。
这个懒人
·
2025-03-18 14:12
llama
语言模型
人工智能
Elasticsearch:为
推理
端点配置分块设置
推理
端点对一次可处理的文本量有限,具体取决于模型的输入容量。分块(Chunking)是指将输入文本拆分成符合这些限制的小块的过程,在将文档摄取到semantic_text字段时会进行分块。
Elastic 中国社区官方博客
·
2025-03-18 13:35
Elasticsearch
AI
Elastic
elasticsearch
大数据
搜索引擎
人工智能
全文检索
数据库
ai
Yolov11目标检测(ultralytics)
Yolov11目标检测(ultralytics)1.克隆仓库2.安装环境依赖3.训练、验证、
推理
以及onnx模型导出1.克隆仓库从官网下载Yolov11到本地。
@M_J_Y@
·
2025-03-18 13:02
目标检测
YOLO
目标检测
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他