E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
model
笔记-《A Survey of Large Language
Model
s》- 尾声
尾声:尾声:本综述是由我们研究团队在一次讨论会上计划的,我们旨在总结LLM的最新进展,为我们的团队成员提供一份高度可读性的报告。第一稿于2023年3月13日完成,我们的团队成员尽最大努力以相对客观、全面的方式囊括有关LLM的相关研究。接着,我们进行了多次细致的写作和内容修订。尽管我们付出了巨大的努力,但这份综述仍远非完美:我们可能会遗漏重要的参考文献或主题,也可能存在不严谨的表述或讨论。由于空间有
L_serein
·
2025-02-17 13:46
玩转LLM
笔记
语言模型
人工智能
本地部署
model
scope魔搭大模型流程
一、安装python二、安装Gradio三、添加镜像加速四、运行字符串倒叙五、运行绘图六、安装常用软件包和库七、我目前使用的软件包和库简介八、文字生成图片AI模型九、文字回复AI模型一、安装python可参考安装步骤:python学习笔记-python安装与环境变量配置_python环境变量-CSDN博客二、安装Gradio在cmd执行以下命令。Gradio封装了功能丰富的前端用户界面,一会儿用来
CQller
·
2025-02-17 13:15
python
算法
深度学习
机器学习
jupyter
pytorch
LLM 大模型学习必知必会系列(一):大模型基础知识篇
LLM大模型学习必知必会系列(一):大模型基础知识篇魔搭
Model
Scope开源的LLM模型魔搭
Model
Scope欢迎各个开源的LLM模型在社区上做开源分享。
汀、人工智能
·
2025-02-17 12:40
LLM技术汇总
人工智能
自然语言处理
prompt
RAG
LLM
模型训练
模型部署
<Attention Is All You Need>:全网首次提出Transformer模型论文中英文对照学习
论文摘要英文Thedominantsequencetransduction
model
sarebasedoncomplexrecurrentorconvolutionalneuralnetworksthatincludeanencoderandadecoder.Thebestperforming
model
salsoconnecttheencoderanddecoderthroughanattenti
kingking44
·
2025-02-17 12:08
transformer
学习
人工智能
【论文精读】Sparse4D v2: Recurrent Temporal Fusion with Sparse
Model
1背景团队:地平线时间:代码:简介:这篇论文是Sparse4D的续作,区别主要在于特征时序融合上,新版提高了运算效率。后续端到端SparseDrive的基本框架与这篇基本类似。2存在的问题2.1其他稀疏3D检测的问题PETR是query-based方法,但是为了实现特征融合,进行了全局注意力机制,导致高计算量。2.2Sparse4Dv1的问题Sparse4Dv1的时序特征融合hierarchyfu
EEPI
·
2025-02-17 12:36
自动驾驶
人工智能
论文阅读
深度学习
目标检测
时间序列分析之AR、MA、ARMA、ARIMA详解(5)
乔治·博克斯被认为是二十世纪的一代统计学大师,他有一句广为人知的名言:所有的模型都是错误的,但有一些是有用的(“All
model
sarewrong,butsomeareuseful”)。
白马负金羁
·
2025-02-17 12:36
机器学习之术
协整
cointegration
ARIMA
时间序列分析
宇树G1嵌入式软件架构及技术实现
avp_teleoperateOpensourcelearningalgorithms:https://github.com/unitreerobotics/unitree_IL_lerobotOpensourcedatasetsand
model
s
爱吃青菜的大力水手
·
2025-02-17 10:55
架构
fpga开发
机器人
算法
MTTK Vue Wrap 项目介绍
JavaScript/TypeScript替代传统的单文件组件(SFC)开发模式,同时兼容与SFC的混合使用.它允许开发者通过类似JSON的配置对象或动态生成的脚本快速构建Vue组件,涵盖模板、双向绑定(v-
model
MTTKbelinda
·
2025-02-17 10:53
VUE
Wrap
vue.js
前端
javascript
Prism 框架基础介绍
Prism支持MVVM(
Model
-View-View
Model
)设计模式,模块化开发,以及依赖注入(DependencyInjection),并为WPF应用提供导航、事件管理和区域管理的功能。
光之使者-聪
·
2025-02-17 06:14
Prism框架
c#
visual
studio
windows
系统架构
使用Python实现深度学习模型:知识蒸馏与模型压缩
知识蒸馏(KnowledgeDistillation)和模型压缩(
Model
Compression)是两种有效的技术,可以在保持模型性能的同时减少模型的大小和计算需求。
Echo_Wish
·
2025-02-17 04:34
Python
笔记
从零开始学Python人工智能
Python算法
python
深度学习
开发语言
qt UI架构之MVD
在Qt中,MVD(
Model
-View-Delegate)是一种用于分离数据、显示和用户交互的设计架构。
yaofei2006
·
2025-02-17 03:58
ui
架构
8.12 orm-聚合查询
Django使用聚合查询前要先从django.db.
model
s引入Avg、Max、Min、Count、Sum(首字母大写)。
yangshiting84
·
2025-02-17 03:28
暑期规划
django
python
后端
监控系统和AI辅助建议功能的实现
翻箱倒柜,找到一个9年前买的树莓派2
Model
B,32位,4核1GB的设备,正好可以利用起来,做
·
2025-02-17 03:59
后端
qt UI设计架构对比
以下是几种常见的QtUI设计架构及其对比:1.MVC(
Model
-View-Controller)MVC是一种经典的设计模式,将应用程序分为三个部分:
Model
:管理数据和业务逻辑。
yaofei2006
·
2025-02-17 03:23
qt
ui
架构
MobileNetV4(2024 ECCV)
论文标题MobileNetV4:Universal
Model
sfortheMobileEcosystem论文作者DanfengQin,ChasLeichner,ManolisDelakis,MarcoFornoni
刘若里
·
2025-02-17 01:07
论文阅读
学习
网络
计算机视觉
笔记
Mooncake:kimi后端推理服务的架构设计
背景服务端面临的问题随着大模型技术越来越强,很多应用都是以Maas(
Model
asaService)的方式对外提供服务,服务端的能力受模型的能力约束。对于C端应用来
风生水气
·
2025-02-17 00:03
大模型应用技术栈
大模型
人工智能
ai
语言模型
后端
理论一、大模型—概念
大模型全称是大型语言模型(LLM,LargeLanguage
Model
),这个“大”主要指模型结构容量大,结构中的参数多,用于预训练大模型的数据量大。一个大模型可以
伯牙碎琴
·
2025-02-16 20:31
大模型
自然语言处理
ai
Flux架构及Redux实践
Flux是一种前端应用架构模式,旨在解决传统MVC(
Model
-View-Controller)模式在大型应用
GbkMobile
·
2025-02-16 19:53
架构
大语言模型常用微调与基于SFT微调DeepSeek R1指南
概述大型语言模型(LLM,LargeLanguage
Model
)的微调(Fine-tuning)是指在一个预训练模型的基础上,使用特定领域或任务的数据对模型进行进一步训练,以使其在该领域或任务上表现更好
知来者逆
·
2025-02-16 16:08
LLM
深度学习
人工智能
自然语言处理
DeepSeek
SFT
微调
InfiniteHiP - 在单个GPU上扩展 LLM 上下文至300万tokens
InfiniteHiP:ExtendingLanguage
Model
ContextUpto3MillionTokensonaSingleGPUPaper:https://huggingface.co/papers
伊织code
·
2025-02-16 14:18
#
Paper
Reading
InfiniteHiP
推理
GPU
LLM
token
什么是 Ollama?如何安装运行?一文讲清
Model
ParametersSizeD
程序员老冉
·
2025-02-16 13:16
人工智能
开源
语言模型
学习
程序员创富
产品经理
面试
winform中的mousemove事件,click与mouseup,mousedown事件的关系,
,但是我只是想移动button,只发生mousemove事件代码如下:usingSystem;usingSystem.Collections.Generic;usingSystem.Component
Model
qq_43361844
·
2025-02-16 13:41
button的事件处理
c#
winform
SQLMesh系列教程-3:SQLMesh模型属性详解
SQLMesh的
MODEL
提供了丰富的属性,用于定义模型的行为、存储、调度、依赖关系等。通过合理配置这些属性,可以构建高效、可维护的数据管道。
梦想画家
·
2025-02-16 13:40
数据分析工程
#
python
数据工程
分析工程
AI 大模型创业:如何利用市场优势?
1.背景介绍随着人工智能技术的不断发展,大模型(Large
Model
s)在商业化应用中日益受到关注。大模型是指在特定领域中应用广泛、参数量巨大的神经网络模型,如BERT、GPT-3、DALL-E等。
SuperAGI2025
·
2025-02-16 12:37
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
yolov8(8.2.10)+deepsort(demo)
只需要训练好yolov8的检测模型然后调用:results=
model
.track(frame,persist=True)#执行跟踪,persist=True表示持续跟踪。
fengsongdehappy
·
2025-02-16 10:19
YOLO
对界面简单易用封装SDK
1.两大接口1.CheckTuplepackagecom.x.globalcommonservice.
model
.permissioncontrolservice.openfga.service;importcom.x.globalcommonservice.global.exception.CodeException
荭色海湾
·
2025-02-16 09:39
中间件实战
java
开发语言
MNIST Examples for GGML - Fully connected network
Build2.MNISTExamplesforGGML2.1.Obtainingthedata2.2.Fullyconnectednetwork2.2.1.Totrainafullyconnected
model
inPyTorchandsaveitasaGGUFfile2.2.2
Yongqiang Cheng
·
2025-02-16 09:06
ggml
-
llama.cpp
-
whisper.cpp
GGML
MNIST
Examples
Fully
connected
MNIST Examples for GGML - Convolutional network
Obtainingthedata2.2.Convolutionalnetwork2.2.1.TotrainaconvolutionalnetworkusingTensorFlow2.2.2.Toevaluatethe
model
ontheCPUusing
Yongqiang Cheng
·
2025-02-16 09:06
ggml
-
llama.cpp
-
whisper.cpp
GGML
MNIST
Examples
Convolutional
network
Golang
Model
字段自动化校验设计
背景在我们日常开发中,不可避免的总要去进行各种参数校验,但是如果在某个场景中,要校验的字段非常多,并且在其中还有耦合关系,那么我们手写校验逻辑就变得非常的低效且难以维护。本篇文档就基于DDD领域模型设计的思想下,提供自动化的校验模型字段。常见的字段校验方式数据校验在业务逻辑代码中有着至关重要的作用,关系到整个后续业务是否可以正常运行。对参数的校验根据其具体业务逻辑与场景,可以分为字段校验、依赖校验
Gerald Kwok
·
2025-02-16 08:31
golang
自动化
DDD领域架构设计
golang使用redis实现全文搜索
redis中,每个词语后记录含有该分词的段落ID集使用一个哈希键记录下每个段落的分词,用于分词信息的删除查询时先分词,再根据分的词把分词查到的对应的段落返回结果具体实现文章分段文章段落表结构typeText
Model
struct
千年死缓
·
2025-02-16 07:52
golang
redis
开发语言
Java(Springboot)
get请求在Controller中--->从仓库里取出要用的mysql----->对于get请求(httpsession,
model
容器)----->从httpsession取出userid再赋值给userid
奶龙牛牛
·
2025-02-16 06:46
java
spring
boot
开发语言
Pix2PixHD代码小白解读(3)——Pix2PixHD_
model
.py
spm=1001.2014.3001.5501Pix2PixHD代码小白注释(2)——Base
Model
.pyhttps://blog.csdn.net/qq_73991479/article/details
咖啡百怪
·
2025-02-16 06:14
Pix2PixHD代码解读
深度学习
机器学习
人工智能
python
deepseek+python,离线api,持续对话
功能:通过start开启新对话,stop结束对话,exit退出程序,并且可持续对话代码fromtransformersimportAuto
Model
ForCausalLM,AutoTokenizer,BitsAndBytesConfigimporttorch
守着黎明看日出
·
2025-02-16 05:43
python
DeepSeek-R1-Distill-Qwen-7B-Int8-W8A16 量化高精校准
下载方法SDK下载#安装
Model
Scopepipinstall
model
scope#SDK模型下载from
model
scopeimportsnapshot_download
model
_dir=snapshot_download
AI天才研究院
·
2025-02-16 04:35
DeepSeek
R1
&
大数据AI人工智能大模型
计算
DeepSeek
deepseek
【报错解决】 OSError: [Errno 22] Invalid argument
/
model
\
model
_gatenet\2024-03-2215:33:05.731866.txt’要打开的arg文件名称中包含了非法符号,需要将其替换为"-“或”_"二、改正方法:找到时间戳:datetime.datetime
靠才华吃土
·
2025-02-16 02:47
报错解决
python
学习
DeepSeek本地部署的一些问题记录
1、模型怎么不保存到C盘:关掉ollama之后,设置环境变量:OLLAMA_
MODEL
S,环境变量的地址,改为你想要的地址,参考文章:https://blog.csdn.net/u012151594/article
沐沐uuu
·
2025-02-16 00:33
DeepSeek
大模型转换为 GGUF
一、GGUF介绍GGUF格式的全名为(GPT-GeneratedUnifiedFormat),提到GGUF就不得不提到它的前身GGML(GPT-Generated
Model
Language)。
奔跑中的小象
·
2025-02-15 22:48
AI
GGUF
android liveData更新UI数据
1.创建LiveData的javaBean对象publicclass
Model
BeanextendsLiveData{privateintflag;privateStringtime;privateStringbatteryStr
weixin_44693887
·
2025-02-15 20:05
android
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比在当今人工智能快速发展的时代,大语言模型(LargeLanguage
Model
,LLM)的应用场景日益广泛。
MaxCode-1
·
2025-02-15 12:35
搭建本地gpt
Deepseek
23. AI-大语言模型
、Transformer架构1.简介2.基本原理和结构3.应用场景4.最新进展三、开源1.开源概念2.开源模式3.模型权重四、再谈DeepSeek前言AI一、LLMLLM(LargeLanguage
Model
真上帝的左手
·
2025-02-15 12:34
23.
AI
人工智能
语言模型
自然语言处理
【C#】的WPF或是WinForm实现Ctrl+ 的快捷键组合使用
在这个例子中,YourCommand应该是你在View
Model
中定义的一个ICommand,它将在用户按下Ctrl+时被执行。如果想要直接在后台代码中处理这个事件,可以使用Preview
wangnaisheng
·
2025-02-15 12:29
C#
c#
python:文件操作
f=open(name,
model
)name:路径加文件名,
model
:w,a如果文件不存在,创建文件。w:重写a:末尾追加r:只读,文件不存在时会报错。
muxue178
·
2025-02-15 11:23
python
开发语言
pyrender smpl 渲染
render.pyatmaster·naver/multi-hmr·GitHubclassMulti_Hmr2Smpl_Handler(GigaBaseHandler):classParams:pass
model
_cfg
AI算法网奇
·
2025-02-15 11:22
3d渲染
人工智能
[转载] awesome big data
原文:https://github.com/onurakpolat/awesome-bigdata#graph-data-
model
作者把分布式领域相关的大部分开源项目和论文分类整理了一遍,造福人类啊.
weixin_30343157
·
2025-02-15 10:15
javascript
java
runtime
ViewUI
windows rdp 将远程技术嵌入到你的软件——未来之窗行业应用跨平台架构
远程桌面usingSystem;usingSystem.Collections.Generic;usingSystem.Component
Model
;usingSystem.Data;usingSystem.Drawing
未来之窗软件服务
·
2025-02-15 06:46
windows
远程技术
deepseek本地部署需要多少显卡资源
华为昇腾环境(MindIE)参考资料:https://
model
ers.cn/
model
s/MindIE/deepseekv3部署DeepSeek-V3、R1模型浮点权重至少需要4台Atlas800IA2
yuanlulu
·
2025-02-15 06:45
LLM
国产算力/昇腾
自然语言处理
deepseek
LLM
大语言模型
昇腾
人工智能
Python+Appium+POM实现APP端自动化测试
1.POM及POM设计原理POM(pageobject
model
)页面对象模型,主要应用于UI自动化测试框架的搭建,主流设计模式之一,页面对象模型:结合面向对象编程思路:把项目的每个页面当做一个对象进行编程
测软件的小bug
·
2025-02-15 05:32
python
自动化
开发语言
php mongodb分组查询,Laravel使用MongoDB复杂的查询
city_id:城市IDsex:性别,1男,2女age:年龄需要通过城市ID分组查询性别未男女的平均值,那么在laravel中实现如下,其他框架也大同小异$cityId=1;//城市ID$count=User
Model
weixin_39633165
·
2025-02-15 04:31
php
mongodb分组查询
Android技术栈(四)Android-Jetpack-MVVM-完全实践
本文包含Android中MVVM体系中的很多部分,主要对View
Model
+DataBinding+RxJava+LiveData+Lifecycle等笔者所使用的技术体系进行解析.本文字数较多,内容较为完整并且后续还会追加更新
2401_85112677
·
2025-02-14 23:18
作者\/
android
android
jetpack
ECE 219
Model
s and Algorithms
Large-ScaleDataMining:
Model
sandAlgorithmsECE219Winter2025Project2:DataRepresentationsandClusteringDueFebruary07,2025by11
·
2025-02-14 22:31
后端
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他