- DeepSeek开源周:面向大模型训练的三个工具包
花生糖@
AIGC学习资料库DeepSeek实用集DualPipeEPLBProfile-dataDeepseek
在2025年的开源周中,DeepSeek推出了一系列旨在优化大规模模型训练效率的工具。这些工具包括DualPipe、EPLB以及Profile-data,它们分别从不同的角度解决了万亿参数模型训练中的算力瓶颈问题,为行业带来了前所未有的加速和效率提升。DualPipe:双向流水线架构的创新DualPipe通过其首创的双向流水线架构,极大地提高了计算与通信的重叠率至92%,相比NVIDIAMegat
- 搜广推校招面经三十八
Y1nhl
搜广推面经算法pytorch推荐算法搜索算法机器学习
字节推荐算法一、场景题:在抖音场景下为用户推荐广告词,吸引用户点击搜索,呈现广告这一流程的关键点以及可能遇到的困难。二、Transformer中对梯度消失或者梯度爆炸的处理在Transformer模型中,梯度消失和梯度爆炸是深度学习中常见的问题,尤其是在处理长序列数据时。为了克服这些问题,Transformer采用了一系列技术:2.1.残差连接(ResidualConnections)每个子层(包
- DeepSeek开源周:全面革新AI基础设施技术的盛宴
大刘讲IT
开源人工智能ai
在2025年2月24日至28日,DeepSeek举办了备受瞩目的开源周活动,期间连续五天发布了一系列覆盖AI基础设施全链路的核心技术项目。这些项目横跨计算优化、通信加速、并行策略、存储系统等多个关键维度,为AI领域的发展注入了强大的动力,引发了广泛的行业关注。开源项目发布时间线项目2月24日2月25日2月26日2月27日2月28日FlashMLA★DeepEP★DeepGEMM★DualPipe与
- MGT204 Corporate Finance
后端
MGT204CorporateFinance&PortfolioValuationIndividualassignmentWeighting-100%ofthemarksforthismoduleThisisanindividualassignmentof2,500wordsforguidancepurposes.Thehandindateis:Tuesday20thMay2025by4.00pm
- CE4208 Distributed Systems
后端
CE4208DistributedSystemsAssignment#1:DataCentredDistributedSystemsAssignmentPage1of3CE4208DistributedSystemsDataCentredDistributedSystemsAssignment1.OverviewThisisanindividualassignment,whereeachstude
- DeepSeek 开源狂欢周(四)DualPipe与EPLB双弹齐发,训练效率的“双引擎”加速器!
OpenCSG
开源人工智能社区算法
在DeepSeek开源周的第四天,DualPipe和EPLB这两项全新技术一同亮相,它们不仅为DeepSeek的低成本、高效训练大模型提供了强大支持,还为全球AI爱好者和从业者送上了两份“技术大礼包”。这些创新技术展示了DeepSeek如何以600万美元成本,训练出能与GPT-4o、Claude3.5Sonnet等先进模型一较高下的顶级AI模型。DualPipe:管道气泡的“终结者”训练大模型时,
- oracle生成ddl语句,oracle导出DDL
杰克小号
oracle生成ddl语句
dbms_metadata.get_ddl[@more@]dbms_metadata.get_ddl1.得到一个表或索引的ddl语句SELECTDBMS_METADATA.GET_DDL('TABLE','DEPT','SCOTT')FROMDUAL;selectdbms_metadata.get_ddl('INDEX','PK_DEPT','SCOTT')fromdual;2.得到一个用户下的所
- MKTG7501 Fundamentals of Marketing STP Analysis
后端
MKTG7501FundamentalsofMarketingSem12025Assessment2:STPAnalysisInstructionsandGuidelinesWeight:40%Assessmenttype:Report(Individual)Wordlimit:2,000wordsmaximum.Anycontentsubmittedbeyondthelimitisineligi
- 【探商宝】DeepSeek开源周第四弹:双向流水并行与专家负载均衡技术解析
探熵科技
数据分析人工智能
引言在千亿级大模型训练领域,计算资源利用率与通信效率是制约训练速度的核心瓶颈。DeepSeek开源周第四日重磅发布的DualPipe双向流水并行算法与EPLB专家并行负载均衡器(ExpertParallelismLoadBalancer),为解决这些难题提供了创新方案。本文将从技术原理、性能优势、应用场景三个维度深度解读这两项技术。一、DualPipe:重新定义流水线并行效率1.1传统流水线并行的
- AI基建狂魔!DeepSeek五天开源5大杀器实测:训练成本砍半+推理速度起飞,算法圈已疯(附删库跑路教程)
AI仙人掌
人工智能深度学习人工智能大模型算法开源
DeepSeek开源周「王炸」连发!FlashMLA让推理速度飙升40%,DeepEP根治MoE通信癌,FP8核弹库DeepGEMM暴力提效,DualPipe+EPLB把GPU榨到一滴不剩,3FS化身数据闪电侠!算法圈惊呼:训练成本腰斩,AGI进度条拉爆!根本学不完,学不完速删祖传代码,GitHub星链已就位:https://github.com/deepseek-aiDay1:FlashMLA(
- Deepseek开源周第四天:从 DualPipe 到 EPLB
deepseek开源
Deepseek开源周第四天:从DualPipe到EPLB前言上周deepseek宣布,将在本周陆续发布五个开源项目,这些库已经在生产环境中经过了记录、部署和实战测试。今天是deepseek开源周的第四天,deepseek发布了三个开源项目,分别是GitHub-deepseek-ai/DualPipeGitHub-deepseek-ai/eplbGitHub-deepseek-ai/profile
- DAT 560G: Database Design and SQL
后端
DAT560G:DatabaseDesignandSQLSpring2025,MiniAAssignment#4:SQLPart3Instructions1.Thisisanindividualassignment.Youmaynotdiscussyourapproachtosolvingthesequestionswithanyone,otherthantheinstructororTA.2.P
- 【YashanDB 知识库】通过 dblink 查询 Oracle 数据时报 YAS-07301 异常
数据库运维
问题现象某客户在通过yasql查询Oracle数据时,报如下异常:SQL>select1fromdual@link_oracle;YAS-07301externalmoduletimeout,reason:yex_serverheatbeattimeout问题的风险及影响dblink功能无法正常使用问题影响的版本所有的YashanDB版本问题发生原因查看YashanDB的run.log,有如下异常
- Big Data (H/M) Assessed Exercise
后端
BigData(H/M)AssessedExerciseTaskSheet2024/25–Individual–v107/02/25SummaryThegoalofthisexerciseistofamiliarizeyourselveswiththedesign,implementationandperformancetestingofBigDataanalysistasksusingApach
- GhostBottleneck; InvertedResidual;Squeeze and Excite 是什么,怎么用
ZhangJiQun&MXP
教学2024大模型以及算力2021AIpython深度学习人工智能langchain算法自然语言处理
GhostBottleneck;InvertedResidual;SqueezeandExcite是什么,怎么用目录GhostBottleneck;InvertedResidual;SqueezeandExcite是什么,怎么用GhostBottleneckInvertedResidualSqueezeandExcite(SE)GhostBottleneck概念:GhostBottleneck是在
- python有限元传热求解_用python实现简单的有限元方法(一)
weixin_39545102
python有限元传热求解
华中师范大学hahakity有限元算法(FiniteElementMethod,简称FEM)是一种非常流行的求解偏微分方程的数值算法。有限元被广泛应用于结构受力分析、复杂边界的麦克斯韦方程求解以及热传导等问题。这一节介绍有限元方法的基本原理,以及如何用Python从头实现一个有限元算法,数值求解麦克斯韦方程。学习内容筑基:加权残差法(WeightedResidualMethod)心法:有限元与有限
- MTHM506 - Statistical Data Modelling
后端
MTHM506-StatisticalDataModellingIndividualassessmentsheetMarksachievedinthisassignmentwillcontributetowards50%ofthefinalmodulemark.Youshouldattemptallquestionsonthissheet.Notethatthequestionsareorgani
- 第二十六天:WEB攻防-通用漏洞&SQL注入&Sqlmap&Oracle&Mongodb&DB2等
新奇八
网络安全mongodbsqloracle
数据库注入-联合猜解-Oracle&MongodbOracle参考:https://www.cnblogs.com/peterpan0707007/p/8242119.html测回显:and1=2unionselect‘1’,‘2’fromdual爆库:and1=2unionselect‘1’,(selecttable_namefromuser_tableswhererownum=1)fromdu
- SCOT 500M Operations Analytics: Simulation
后端
FinalExamOperationsAnalytics:SimulationSCOT500M,Spring2025IndividualFinalExam:DueFriday,February28,11p.m.OnCanvasAfewguidelinesfortheexam:•Thisassignmentistobedoneentirelyindividually.•Youmaydiscussit
- Oracle to_char()函数 - 解决:小数与%拼接后,小数点前的0消失问题
moqiyong666
Oracle
/*FM:除空格9999999.0099:允许小数点左边最大正数为7位,小数点右边最少2位,最多4位,且在第5位进行四舍五入*/SelectTO_CHAR(123.0233,'FM9999999.0099')FROMDUAL说明:有9的地方如果有数字就显示如果没有数字就不显示,有0的地方在没有数字的时候也会有0来占位参考:Oracleto_char()函数相关详解oracleto_char()函数
- 网络技术变迁:从IPv4走向IPv6
是垚不是土
网络技术变迁服务器网络网络协议安全ip
目录前言旧时代产物:IPv4什么是IPv4?IPv4的工作方式IPv4的缺点为什么要从IPv4过渡到IPv6?走向IPv6:新一代互联网协议IPv6的技术特性我们需要过渡技术双栈(DualStack)隧道技术(Tunneling)NAT64/DNS64总结:IPv4与IPv6的时代更替与科技发展从技术演进角度看从时代发展角度看从科技发展角度看从全球互联网治理角度看从时代更替角度看结语前言IP协议是
- Integrated Business Functions
后端
Year2IntegratedBusinessFunctions(2025SpringTerm)Module6:FinancingforGrowthAssignment1(Individual)ThisisanINDIVIDUALassignment.Thisassignmentismarkedoutof100.Itisworth20marksofthetotalcoursescores(i.e.
- DMSD1 2433A Principles of Marketing
后端
Course:DiplomainManagementStudies(DMSD12433A/2434A/2535A)ModuleTitle:PrinciplesofMarketingAssessment:IndividualAssignmentDate/DueDate:28February2025Weighting:30%(100marks)Note:SubmissionofSoftandHardc
- Databases for Management Information Systems
后端
DatabasesforManagementInformationSystemsAssignment1AssignmentType:PercentageofModuleMark:DueDate:Title:TheDevelopmentandroleofDatabaseManagementSystemsaspartoftheDecision-MakingIndividualReportandDBMS
- BSc Accounting and Finance
后端
AssignmentRemitProgrammeTitleBScAccountingandFinanceModuleTitleFinancialReportingModuleCode0733175AssignmentTitleIndividualreportLevelLIWeighting50%HandOutDate20/01/2025DueDate&Time27/02/2025Before12p
- 使用opencv实现深度学习的图片与视频的超分辨率
人工智能研究所
人工智能之计算机视觉opencv深度学习视频超分辨率图片超分辨率
图片超分辨率什么是视频与图片的超分辨率,总结一下便是给一张分辨率比较低的图片,进行超分辨率的处理后,生成比较清晰的高分辨率的图片,上图图片完美解释了超分辨率的过程,由于不同的算法不同,处理的结果也不相同,本期我们介绍一下如何进行图片的超分辨率的处理。·EDSR模型图像超分辨率EDSR:EnhancedDeepResidualNetworksforSingleImageSuper-Resolutio
- CSCI 4041 Algorithms and Data Structures
后端
CSCI4041AlgorithmsandDataStructures-Spring2025Homework2-CorrectnessandSortingDueDate:Friday,February21,2025by11:59pm.Instructions:Thisisanindividualhomeworkassignment.Youmayworktogethertodiscusscon-ce
- 5QQMN938 Intermediate Econometrics
后端
IntermediateEconometrics-5QQMN938Assessment1–IndividualCoursework(40%oftotalmodulegrade)TheTaskProjectBriefTheglobaleconomyhasrecentlyexperiencedaperiodofinflationarypressurecharacterisedbyacomplexset
- MSIN0047 Entrepreneurial Finance
后端
Assessment(non-exam)BriefModulecode/nameMSIN0047EntrepreneurialFinanceAcademicyear2024/25Term2AssessmenttitleFinancialModelSpreadsheetandFinancialPitchDeck(Level7)Individual/groupassessmentIndividualS
- 关于Union 中 ORA-12704:字符集不匹配问题的解决
招財進寳
ORACLE
在使用Unionall连接时,若A集合中某列为nvarchar2或nvarchar类型,而B集合中无此列,用‘’来代替是会报字符集不匹配,解决方法有两种,见下面的示例例:select'中国','China',cast('中国'asnvarchar2(10))Tfromdualunionallselect'美国','USA',''fromdual;如上,T的类型为nvarchar2,长度为10,如果
- Java 并发包之线程池和原子计数
lijingyao8206
Java计数ThreadPool并发包java线程池
对于大数据量关联的业务处理逻辑,比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式,并且可以提高线程利用率,并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。
这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
- java编程思想 抽象类和接口
百合不是茶
java抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持
1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错)
抽象方法 : 在方法中仅有声明而没有方法体
package com.wj.Interface;
- [房地产与大数据]房地产数据挖掘系统
comsci
数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间...
所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产
&nb
- 数组队列总结
沐刃青蛟
数组队列
数组队列是一种大小可以改变,类型没有定死的类似数组的工具。不过与数组相比,它更具有灵活性。因为它不但不用担心越界问题,而且因为泛型(类似c++中模板的东西)的存在而支持各种类型。
以下是数组队列的功能实现代码:
import List.Student;
public class
- Oracle存储过程无法编译的解决方法
IT独行者
oracle存储过程
今天同事修改Oracle存储过程又导致2个过程无法被编译,流程规范上的东西,Dave 这里不多说,看看怎么解决问题。
1. 查看无效对象
XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
- 重装系统之后oracle恢复
文强chu
oracle
前几天正在使用电脑,没有暂停oracle的各种服务。
突然win8.1系统奔溃,无法修复,开机时系统 提示正在搜集错误信息,然后再开机,再提示的无限循环中。
无耐我拿出系统u盘 准备重装系统,没想到竟然无法从u盘引导成功。
晚上到外面早了一家修电脑店,让人家给装了个系统,并且那哥们在我没反应过来的时候,
直接把我的c盘给格式化了 并且清理了注册表,再装系统。
然后的结果就是我的oracl
- python学习二( 一些基础语法)
小桔子
pthon基础语法
紧接着把!昨天没看继续看django 官方教程,学了下python的基本语法 与c类语言还是有些小差别:
1.ptyhon的源文件以UTF-8编码格式
2.
/ 除 结果浮点型
// 除 结果整形
% 除 取余数
* 乘
** 乘方 eg 5**2 结果是5的2次方25
_&
- svn 常用命令
aichenglong
SVN版本回退
1 svn回退版本
1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version
两者的区别:
revert this version:表示回退到当前版本(该版本后的版本全部作废)
revert chanages from this versio
- 某小公司面试归来
alafqq
面试
先填单子,还要写笔试题,我以时间为急,拒绝了它。。时间宝贵。
老拿这些对付毕业生的东东来吓唬我。。
面试官很刁难,问了几个问题,记录下;
1,包的范围。。。public,private,protect. --悲剧了
2,hashcode方法和equals方法的区别。谁覆盖谁.结果,他说我说反了。
3,最恶心的一道题,抽象类继承抽象类吗?(察,一般它都是被继承的啊)
4,stru
- 动态数组的存储速度比较 集合框架
百合不是茶
集合框架
集合框架:
自定义数据结构(增删改查等)
package 数组;
/**
* 创建动态数组
* @author 百合
*
*/
public class ArrayDemo{
//定义一个数组来存放数据
String[] src = new String[0];
/**
* 增加元素加入容器
* @param s要加入容器
- 用JS实现一个JS对象,对象里有两个属性一个方法
bijian1013
js对象
<html>
<head>
</head>
<body>
用js代码实现一个js对象,对象里有两个属性,一个方法
</body>
<script>
var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
- 探索JUnit4扩展:使用Rule
bijian1013
java单元测试JUnitRule
在上一篇文章中,讨论了使用Runner扩展JUnit4的方式,即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。
1. Rule
&n
- [Gson一]非泛型POJO对象的反序列化
bit1129
POJO
当要将JSON数据串反序列化自身为非泛型的POJO时,使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种:
1. POJO对象不包含任何泛型的字段
2. POJO对象包含泛型字段,例如泛型集合或者泛型类
Data类 a.不是泛型类, b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
 
- 【Kakfa五】Kafka Producer和Consumer基本使用
bit1129
kafka
0.Kafka服务器的配置
一个Broker,
一个Topic
Topic中只有一个Partition() 1. Producer:
package kafka.examples.producers;
import kafka.producer.KeyedMessage;
import kafka.javaapi.producer.Producer;
impor
- lsyncd实时同步搭建指南——取代rsync+inotify
ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync
最近一直在寻求生产服务服务器上的同步替代方案,原先使用的是 inotify + rsync,但随着文件数量的增大到100W+,目录下的文件列表就达20M,在网络状况不佳或者限速的情况下,变更的文件可能10来个才几M,却因此要发送的文件列表就达20M,严重减低的带宽的使用效率以及同步效率;更为要紧的是,加入inotify
- java-9. 判断整数序列是不是二元查找树的后序遍历结果
bylijinnan
java
public class IsBinTreePostTraverse{
static boolean isBSTPostOrder(int[] a){
if(a==null){
return false;
}
/*1.只有一个结点时,肯定是查找树
*2.只有两个结点时,肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
- MySQL的sum函数返回的类型
bylijinnan
javaspringsqlmysqljdbc
今天项目切换数据库时,出错
访问数据库的代码大概是这样:
String sql = "select sum(number) as sumNumberOfOneDay from tableName";
List<Map> rows = getJdbcTemplate().queryForList(sql);
for (Map row : rows
- java设计模式之单例模式
chicony
java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的:
作为对象的创建模式,单例模式确保某一个类只有一个实例,而且自行实例化并向整个系统提供这个实例。这个类称为单例类。 单例模式的结构
单例模式的特点:
单例类只能有一个实例。
单例类必须自己创建自己的唯一实例。
单例类必须给所有其他对象提供这一实例。
饿汉式单例类
publ
- javascript取当月最后一天
ctrain
JavaScript
<!--javascript取当月最后一天-->
<script language=javascript>
var current = new Date();
var year = current.getYear();
var month = current.getMonth();
showMonthLastDay(year, mont
- linux tune2fs命令详解
daizj
linuxtune2fs查看系统文件块信息
一.简介:
tune2fs是调整和查看ext2/ext3文件系统的文件系统参数,Windows下面如果出现意外断电死机情况,下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检,而且是可以通过tune2fs命令,自行定义自检周期及方式。
二.用法:
Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
- 做有中国特色的程序员
dcj3sjt126com
程序员
从出版业说起 网络作品排到靠前的,都不会太难看,一般人不爱看某部作品也是因为不喜欢这个类型,而此人也不会全不喜欢这些网络作品。究其原因,是因为网络作品都是让人先白看的,看的好了才出了头。而纸质作品就不一定了,排行榜靠前的,有好作品,也有垃圾。 许多大牛都是写了博客,后来出了书。这些书也都不次,可能有人让为不好,是因为技术书不像小说,小说在读故事,技术书是在学知识或温习知识,有
- Android:TextView属性大全
dcj3sjt126com
textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时,文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置,将自动执行输入值的拼写纠正。此处无效果,在显示输入法并输
- tomcat虚拟目录安装及其配置
eksliang
tomcat配置说明tomca部署web应用tomcat虚拟目录安装
转载请出自出处:http://eksliang.iteye.com/blog/2097184
1.-------------------------------------------tomcat 目录结构
config:存放tomcat的配置文件
temp :存放tomcat跑起来后存放临时文件用的
work : 当第一次访问应用中的jsp
- 浅谈:APP有哪些常被黑客利用的安全漏洞
gg163
APP
首先,说到APP的安全漏洞,身为程序猿的大家应该不陌生;如果抛开安卓自身开源的问题的话,其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上,有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测(ineice.com)的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。
1. 应用反编译漏洞:APK 包非常容易被反编译成可读
- C#根据网址生成静态页面
hvt
Web.netC#asp.nethovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页,以及显示用户名,退出等功能。根据网址生成页面的方法:
bool CreateHtmlFile(string url, string path)
{
//http://keleyi.com/a/bjae/3d10wfax.htm
stri
- SVG 教程 (一)
天梯梦
svg
SVG 简介
SVG 是使用 XML 来描述二维图形和绘图程序的语言。 学习之前应具备的基础知识:
继续学习之前,你应该对以下内容有基本的了解:
HTML
XML 基础
如果希望首先学习这些内容,请在本站的首页选择相应的教程。 什么是SVG?
SVG 指可伸缩矢量图形 (Scalable Vector Graphics)
SVG 用来定义用于网络的基于矢量
- 一个简单的java栈
luyulong
java数据结构栈
public class MyStack {
private long[] arr;
private int top;
public MyStack() {
arr = new long[10];
top = -1;
}
public MyStack(int maxsize) {
arr = new long[maxsize];
top
- 基础数据结构和算法八:Binary search
sunwinner
AlgorithmBinary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
- 12个C语言面试题,涉及指针、进程、运算、结构体、函数、内存,看看你能做出几个!
刘星宇
c面试
12个C语言面试题,涉及指针、进程、运算、结构体、函数、内存,看看你能做出几个!
1.gets()函数
问:请找出下面代码里的问题:
#include<stdio.h>
int main(void)
{
char buff[10];
memset(buff,0,sizeof(buff));
- ITeye 7月技术图书有奖试读获奖名单公布
ITeye管理员
活动ITeye试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束,非常感谢广大用户对本次活动的关注与参与。
7月试读活动回顾:
http://webmaster.iteye.com/blog/2092746
本次技术图书试读活动的优秀奖获奖名单及相应作品如下(优秀文章有很多,但名额有限,没获奖并不代表不优秀):
《Java性能优化权威指南》