E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
规模估算
《深入实现事件发布-订阅模式:从基础到优化》
《深入实现事件发布-订阅模式:从基础到优化》引言在软件开发的世界中,随着应用程序
规模
的扩大,模块化、解耦和可扩展性变得尤为重要。
dorabighead
·
2025-02-04 21:05
前端八股总结
javascript
前端
Llama最新开源大模型Llama3.1
以下是关于Llama3.1的详细介绍:参数
规模
与训练数据Llama3.1拥有4050亿(405B)参数,是目前开源领域中参数
规模
最大的模型之一。
kcarly
·
2025-02-04 21:32
LLaMA2
食用指南
llama
开源
开源大模型
AI大模型学习的七个阶段,学完你就是大模型大师!
数据的可用性与
规模
性、软件与工具的进步。生成式模型与大语言模型。Transformer架构解析。预训练、SFT、RLHF。第三阶段:编程基础与工具使用目标:掌握大
AGI大模型老王
·
2025-02-04 19:48
人工智能
学习
大模型
大模型学习
AI大模型
RAG
大模型教程
大模型文件格式GGUF格式
GGUF简介当前的大模型的参数
规模
较大,数以千亿的参数导致了它们的预训练结果文件都在几十GB甚至是几百GB,这不仅导致其使用成本很高,在不同平台进行交换也非常困难。
·
2025-02-04 18:36
人工智能大模型
利用Python高效处理大
规模
词汇数据
在本篇博客中,我们将探讨如何使用Python及其强大的库来处理和分析大
规模
的词汇数据。我们将介绍如何从多个.pkl文件中读取数据,并应用一系列算法来筛选和扩展一个核心词汇列表。
东方佑
·
2025-02-04 16:23
量子变法
python
开发语言
什么是大模型?大模型从入门到精通(超详细)看这一篇就够了!!!
这些模型由于其
规模
庞大,能够捕捉到数据中的复杂模式,因此在自然语言处理(NLP)、计算机
AI产品经理
·
2025-02-04 15:51
java
人工智能
开发语言
金融
运维
Dubbo与Spring Cloud的区别?
一、框架背景与生态Dubbo是阿里巴巴开源的高性能RPC框架,主要用于服务间通信,尤其擅长大
规模
的微服务架构。它最初用于内部的服务调用,随着开源的推
·
2025-02-04 14:28
DeepSeek R1 AI 论文翻译
DeepSeek-R1-Zero是一个通过大
规模
强化学习(RL)训练的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。
·
2025-02-04 14:27
后端java
04树 + 堆 + 优先队列 + 图(D1_树(D10_决策树))
决策树算法具有简单、易于理解和解释的特点,且在处理大
规模
数据时具有较高的效率。本文将介绍决策树算法的基本原理,并提供了Java代码示例来说明其实现过程。二、算法原理决策树算法基于“分而治之”
Java丨成神之路
·
2025-02-04 12:54
06数据结构与算法
数据结构
算法
全场景深度学习开源框架(MindSpore)
无论是在数据中心的大
规模
计算,还是在手机、物联网设备等资源受限的终端上,MindSpore都能灵活适配,充分发挥各硬件平台的性能优势,实现模型的高效训练和推理。
deepdata_cn
·
2025-02-04 11:41
人工智能
深度学习
开源
人工智能
DeepSeek R1 AI 论文翻译
DeepSeek-R1-Zero是一个通过大
规模
强化学习(RL)训练的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。
老马啸西风
·
2025-02-04 06:04
java
Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型,旨在以更少的参数和计算量实现更高的准确率
高效计算:使用MoE架构,40B总参数中仅有3.7B激活参数,训练计算消耗仅为同
规模
密集模型的9.25%,推理成本与3.7B参数的密集模型相当。
东方佑
·
2025-02-04 06:01
量子变法
架构
语言模型
人工智能
蓝桥杯——试题集——入门训练
样例输入1245样例输出57数据
规模
与约定-10000intmain(){inta,b;scanf("%d%d",&a,&b);printf("%d",a+b);return0;}BEGIN-2序列求和问题描述求
唐煜鑫
·
2025-02-04 04:54
蓝桥杯
c语言
蓝桥杯——BASIC-02——基础练习 序列求和
数据
规模
与约定:1<=n<=1,000,000,000。说明:有一些试题会给出多组样例输入输出以帮助你更好的做题。
满天星✧
·
2025-02-04 04:24
蓝桥杯
职场和发展
算法
MySQL 插入数据指南
MySQL插入数据指南引言MySQL是一款广泛使用的开源关系数据库管理系统,被广泛应用于各种
规模
的组织中。在数据库管理中,数据的插入是基础操作之一。
wjs2024
·
2025-02-04 03:45
开发语言
Neo4j图数据库初识
graphdatabase图数据库的笔记之Neo4j图数据库初识目录什么是图数据库为什么使用图数据库Neo4j的下载安装Cypher查询语言Neo4j的各类API事务Neo4j数据建模大
规模
数据导入neo4j
六尘
·
2025-02-04 03:45
知识图谱
nosql
neo4j
数据库
[创业之路-272]:不同
规模
的赚钱,需要的杠杆不同
小
规模
赚钱个人投资与创业:在小
规模
赚钱活动中,如个人创业或小型投资,杠杆可能主要体现在个人信用贷款、亲友借款或众筹等方式上。这些杠杆通常
规模
较小,但能够帮助初创者或投资者快速启动项目或抓住市场机会。
文火冰糖的硅基工坊
·
2025-02-04 00:17
创业之路
战略
创业
华为
大数据(一)MaxCompute
所以在进行学习研究,总会有一些疑问产生,这里讲讲作者的疑问和思路二、介绍MaxCompute(原名ODPS-OpenDataProcessingService)是阿里云提供的大数据处理平台,专门用于批量数据存储和大
规模
并行计算
胖当当技术
·
2025-02-03 23:39
架构
云计算
odps
学习
大数据
DeepSeek的出现对全球GPT产业产生的冲击
特别是以GPT(GenerativePre-trainedTransformer)系列模型为代表的大
规模
预训练语言模型,已经在全球范围内引发了广泛关注和应用。
不要em0啦
·
2025-02-03 23:07
机器学习
gpt
Qwen2.5-Max
Qwen2.5-Max是阿里巴巴于2024年1月29日发布的一款旗舰级人工智能模型,基于混合专家(MoE)架构开发,拥有超过20万亿tokens的超大
规模
预训练数据。
百态老人
·
2025-02-03 20:18
笔记
大数据
人工智能
DeepSeek R1 AI 论文翻译
DeepSeek-R1-Zero是一个通过大
规模
强化学习(RL)训练的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。
·
2025-02-03 20:09
后端java
三十四、领域驱动设计DDD(DDD 与微服务架构结合)
在现代企业应用中,领域驱动设计(DDD)与微服务架构的结合被认为是应对复杂业务系统和大
规模
分布式系统的有效方法。
伯牙碎琴
·
2025-02-03 17:20
架构
架构
微服务
运维
分布式架构中的事务管理:需要了解的常见解决方案
随着系统
规模
的扩大,越来越多的业务和数据被分布到不同的服务和数据库中。虽然分布式架构带来了诸多优势,但也引入了一个新的问题:分布式事务。一、什么是分布式事务?
四七伵
·
2025-02-03 16:12
Java
面试宝典
分布式
架构
后端
分布式事务
GPU硬件架构分析
这种设计使得GPU能够同时处理大量的并行任务,特别适合大
规模
数据处理和图形渲染。内存设计:CPU:内
你一身傲骨怎能输
·
2025-02-03 13:49
渲染管线
硬件架构
SlimGPT: Layer-wise Structured Pruning for Large Language Models
SlimGPT:大型语言模型的分层结构化修剪摘要1引言2相关工作3前言4方法5实验6结论摘要大型语言模型(LLM)因其在各个领域的卓越能力而受到广泛关注,其巨大的参数
规模
为实际部署带来了挑战。
UnknownBody
·
2025-02-03 11:35
LLM
Daily
LLM
Pruning
剪枝
语言模型
人工智能
运行megatron框架的运行环境
megatron是什么,为什么要用主要是在实现Yuan1.0大
规模
模型时,他们引用了Nvidia开发的megatron这个框架,因为这个框架就是为了分布式多卡环境而设计的,而要上大参数量的模型时要获得比较可观的速度就避免不了要上这个框架
David's Code
·
2025-02-03 08:39
自然语言处理
机器学习
Megatron:深度学习中的高性能模型架构
Megatron:深度学习中的高性能模型架构Megatron是由NVIDIA推出的深度学习大
规模
预训练模型框架,主要针对大
规模
Transformer架构模型的高效训练与推理。
gs80140
·
2025-02-03 08:06
基础知识科谱
AI
机器学习
人工智能
ElasticSearch集群搭建步骤
Elasticsearch加密HTTP客户端通信五、配置集群编辑elasticsearch.yml启动集群一、前言Elasticsearch是一个开源的分布式搜索和分析引擎,用于全文搜索、结构化搜索、分析和可视化大
规模
数据
Asui2233
·
2025-02-03 08:35
Elasticsearch
elasticsearch
大数据
linux
网络安全之云架构
限制:资源利用率低,扩展性差,难以满足大
规模
、高并发的业务需求。阶段二:虚拟化技术阶段背景:随着处理器的不断进化,虚拟机出现了。它
南卿安全
·
2025-02-03 07:03
云服务
架构
kylin套_Apache Kylin(一)Kylin介绍
1.传统大数据分析的问题在基于Hadoop生态的传统大数据分析中,主要使用的技术是MPP(MassivelyParallelProcessing)大
规模
并行处理和列式存储。
weixin_39898011
·
2025-02-03 07:57
kylin套
什么是MOE架构?哪些大模型使用了MOE?
在人工智能快速发展的今天,大语言模型(LLM)的
规模
越来越大,参数量动辄上千亿甚至万亿。然而,更大的模型往往意味着更高的计算成本和更多的资源消耗。
明哲AI
·
2025-02-03 06:18
AIGC
架构
人工智能
大模型
MOE
Kubernetes(K8s)技术深度解析与实战案例
一、K8s的起源与发展K8s的诞生源于Google内部对大
规模
我的运维人生
·
2025-02-03 04:07
kubernetes
容器
云原生
运维开发
技术共享
Redis持久化数据之RDB和AOF_redisrdb数据持久化的特点
如果需要进行大
规模
数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。Fork的作用是复制一个与
2501_90226046
·
2025-02-03 04:02
redis
数据库
缓存
Java 在包管理与模块化中的优势:与其他开发语言的比较
在开发复杂的、
规模
庞大的软件系统时,包管理和模块化设计起着至关重要的作用。它们不仅决定了代码的组织和可维护性,还直接影响到团队协作效率、扩展性和性能。
nbsaas-boot
·
2025-02-03 03:01
开发语言
java
DeepSeek-R1,DeepSeek-V3,DeepSeek-VL,DeepSeek-V2,DeepSeek-R1-Zero各个模型区别
目录1.各个模型架构2.训练方式3.模型参数与
规模
4.应用场景5.性能表现6.发布时间7.价格1.各个模型架构DeepSeek-R1:未明确有特殊架构说明,但属于推理模型,可能在Transformer架构基础上针对推理做了优化
fpga和matlab
·
2025-02-03 01:12
前言技术汇集
#
人工智能
大模型
DeepSeek
极致体验,揭晓抖音背后的音视频技术
抖音是国内音视频技术应用的典型代表,无论是春节红包项目遇到的超大
规模
并发,还是海量用户上传短视频作品带来的带宽压力,亦或是用户智能设备、网络环境的参差不齐,都给技术方
火山引擎边缘云
·
2025-02-03 00:02
边缘计算
音视频
从零开始大模型开发与微调:汉字拼音数据集处理
随着深度学习技术的飞速发展,大
规模
语言模型(LargeLanguageModel,LLM)在NLP领域取得了显著的成果。
AGI大模型与大数据研究院
·
2025-02-02 22:43
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
DeepSeek 使用的核心技术预测
1.大
规模
预训练模型架构Transformer变种与优化:基于Transformer架构进行改进,可能引入稀疏注意力机制(如Longform
eso1983
·
2025-02-02 18:22
人工智能
深度学习
机器学习
python
LLM - 大模型 ScallingLaws 的设计 100B 预训练方案(PLM) 教程(5)
ScalingLaws(缩放法则)是大模型领域中,用于描述模型性能(Loss)与模型
规模
N、数据量D、计算资源C之间关系的经验规
ManonLegrand
·
2025-02-02 18:21
大模型
(LLM)
人工智能
LLM
ScalingLaws
100B
预训练
DeepNorm
EGS
C语言:函数递归
递归步骤:函数通过调用自身来解决
规模
更小的子问题,逐步向终止条件靠近。递归的工作原理当一个函数调用
南玖yy
·
2025-02-02 09:40
c语言
开发语言
分布式数据库应用实践:架构设计与性能优化
它能够在多台服务器之间分散数据存储和处理任务,从而解决传统集中式数据库在处理大
规模
数据和高并发访问时的瓶颈问题。
一ge科研小菜鸡
·
2025-02-02 08:08
大数据
数据库
数据库
软件架构原理与实战:模块化和组件化设计的最佳实践
1.背景介绍随着计算机技术的不断发展,软件系统的
规模
和复杂性不断增加。为了更好地组织和管理软件系统的代码和功能,软件架构设计成为了一个重要的研究领域。
AI天才研究院
·
2025-02-02 08:01
AI实战
AI大模型企业级应用开发实战
大数据
人工智能
语言模型
AI
LLM
Java
Python
架构设计
Agent
RPA
Python数据处理(一):处理 JSON、XML、CSV 三种格式数据
后面几章还会讲数据清洗、网页抓取、自动化和
规模
化等使用技能。我也是
solocoder222
·
2025-02-02 08:00
Python
python
数据处理
CodeRiver
探索React项目的Typescript Monorepo架构
TypescriptMonorepo架构typescript-monorepo项目地址:https://gitcode.com/gh_mirrors/ty/typescript-monorepo项目介绍在现代前端开发中,随着项目
规模
的不断扩大
赵品静Ambitious
·
2025-02-02 05:38
FastExcel的使用
FastExcel的主要功能高性能读写:FastExcel专注于性能优化,能高效处理大
规模
Excel数据,显著降低内存占用。简单易用:提供简洁直观的API,易于集成和使用。流式
码农~明哥
·
2025-02-02 03:36
java工具类封装
spring
cloud
如何使用Spark Streaming
一、什么叫SparkStreaming基于SparkCore,大
规模
、高吞吐量、容错的实时数据流的处理二、SparkStreaming依赖org.apache.sparkspark-streaming_
会探索的小学生
·
2025-02-02 00:46
spark
大数据
分布式
spark streaming python_Spark入门:Spark Streaming简介(Python版)
SparkStreaming是构建在Spark上的实时计算框架,它扩展了Spark处理大
规模
流式数据的能力。
weixin_39531582
·
2025-02-01 23:12
spark
streaming
python
前端微应用体系
前端微应用体系在现代前端开发中,随着项目
规模
的不断扩大和团队协作的日益复杂,传统的单一应用架构面临着种种挑战。
趙子昂
·
2025-02-01 23:41
前端
前端框架
从零开始学习电池SOC算法
电池的SOC(StateofCharge,荷电状态)
估算
是电池管理系统(BMS)中的核心算法之一。SOC表示电池当前剩余电量与标称容量的比值,通常以百分比形式表示。
洛溪之恋
·
2025-02-01 22:30
新能源BMS
算法
LitGPT - 20多个高性能LLM,具有预训练、微调和大
规模
部署的recipes
文章目录一、关于LitGPT二、快速启动安装LitGPT高级安装选项从20多个LLM中进行选择三、工作流程1、所有工作流程2、微调LLM3、部署LLM4、评估LLM5、测试LLM6、预训练LLM7、继续预训练LLM四、最先进的功能五、训练方法示例六、项目亮点教程一、关于LitGPTLitGPT用于使用、微调、预训练和部署LLMLightning快速⚡⚡每个LLM都是从头开始实现的,没有抽象和完全控
伊织产研
·
2025-02-01 19:38
#
AI
开源项目
LitGPT
预训练
微调
部署
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他