- 大语言模型常用微调与基于SFT微调DeepSeek R1指南
知来者逆
LLM深度学习人工智能自然语言处理DeepSeekSFT微调
概述大型语言模型(LLM,LargeLanguageModel)的微调(Fine-tuning)是指在一个预训练模型的基础上,使用特定领域或任务的数据对模型进行进一步训练,以使其在该领域或任务上表现更好。微调是迁移学习的一种常见方法,能够显著提升模型在特定任务上的性能。在大型语言模型(LLM)的微调中,有几种常见的方法,包括SFT(监督微调)、LoRA(低秩适应)、P-tuningv2和**Fre
- (15-3)DeepSeek混合专家模型初探:模型微调
码农三叔
训练RAG多模态)人工智能Deekseep深度学习大模型transformer
3.4模型微调在本项目中,微调脚本文件finetune.py提供了一套全面的工具,用于对DeepSeek-MoE预训练语言模型进行微调。支持加载特定任务的数据、对数据进行预处理和编码,以及通过多种配置选项(如LoRA量化、分布式训练等)对模型进行高效训练。用户可以根据自己的需求,通过命令行参数或配置文件调整微调策略,以优化模型在特定任务或数据集上的性能。3.4.1微调原理在DeepSeek-MoE
- django上传文件
大得369
djangosqlitepython
1、settings.py配置#静态文件配置STATIC_URL='/static/'STATICFILES_DIRS=[BASE_DIR/'static',]上传文件#定义一个视图函数,该函数接收一个request参数fromdjango.shortcutsimportrender#必备引入importjsonfromdjango.views.decorators.httpimportrequi
- MD5加密
计蒙不吃鱼
Android开发相关MD5MD5加密
简介:MD5的全称是Message-DigestAlgorithm5(信息-摘要算法),它是一种单向加密算法,可以将输入的信息加密转换为128位固定长度的散列值,用于检验数据传输过程中的完整性。在90年代初由MITLaboratoryforComputerScience和RSADataSecurityInc的RonaldL.Rivest开发出来,经MD2、MD3和MD4发展而来。出现的两种观点:1
- 【无标题】
qq_43361844
QTQt学习
#QRubberBandArubberbandisoftenusedtoshowanewboundingarea(asinaQSplitteroraQDockWidgetthatisundocking).HistoricallythishasbeenimplementedusingaQPainterandXOR,butthisapproachdoesn’talwaysworkproperlysin
- “告别服务器:5步在AWS S3部署静态网站,费用低至每月4刀?
AWS官方合作商
aws云计算云存储静态网站java
在数字化转型的浪潮中,静态网站凭借其速度快、安全性高、维护成本低的优势,成为企业官网、博客、产品展示页的首选。然而,传统的服务器托管方案不仅需要高昂的运维成本,还可能面临流量突增导致的宕机风险。AWSS3(SimpleStorageService)作为全球领先的云存储服务,提供了一种革命性的静态网站托管方案,将成本、性能和易用性完美结合。本文带你深入解析AWSS3托管的优势与成本,助你轻松上云一、
- ACM- 2-SAT问题
胖亚亚
2-SAT算法总结2-SAT
前言:这篇文章是参考着饶齐的总结写出来的,但只有一些文字性的描述类似。现在有一个由N个布尔值组成的序列A,给储户一些限制关系比如A[x]ANDA[y]=0、A[x]ORA[y]ORA[z]=1等,要确定A[0...N-1]的值,使其满足所有限制关系。这个问题称为2-SAT问题特别的,若每种限制关系中最多只对两个元素进行限制,则称为2-SAT问题。由于在2-SAT问题中,最多只对两个元素进行限制,所
- pdsh 2.29 源码编译安装教程
云墨丹青
windowsssh
pdsh2.29源码编译安装教程简介pdsh(ParallelDistributedShell)是一个高效的多服务器并行shell命令执行工具。本文将详细介绍如何从源码编译安装pdsh2.29版本。环境要求Linux操作系统gcc编译器make工具足够的磁盘空间(建议至少1GB可用空间)安装步骤1.下载源码包首先,下载pdsh2.29的源码包:wgethttps://storage.googlea
- 3.pg客户端工具
bunny_lhc
postgresqlpostgresql数据库
客户端工具一、使用psql连接数据库psqlpostgrespostgres[root@oracle~]#su-pgsql[pgsql@oracle~]$psqlpostgrespostgrespsql(13.4)Type"help"forhelp.第一个postgres表示库名第二个postgres表示用户名1.1.创建用户createrolepguserwithencryptedpasswor
- python字符串怎么转换成字典_用python将字符串转换成字典
weixin_39777018
Iknowthatthisquestionsoundaduplicate,butit'snot,atleastlookedforawhileandIcouldn'tfinenothingformyspecificproblem.Ihavethefollowingstring:"{first:{name:'test',value:100},second:{name:'test2',value:50}
- cmake 编译找不到 Qt5WebKitConfig.cmake
SimpleForest
杂七杂八
用cmake编译时出现如下错误提示:CMakeErroratCMakeLists.txt:313(FIND_PACKAGE):Bynotproviding"FindQt5WebKit.cmake"inCMAKE_MODULE_PATHthisprojecthasaskedCMaketofindapackageconfigurationfileprovidedby"Qt5WebKit",butCMa
- Java 设计模式之装饰模式
xiangxiongfly915
#Java设计模式装饰模式设计模式
文章目录Java设计模式之装饰模式概述UML图代码实现Java设计模式之装饰模式概述装饰模式(Decorator),动态地给一个对象添加一些额外的职责,比直接生成子类更为灵活。UML图Component:抽象接口,给对象动态的添加职能。ConcreteComponent:继承Component,具体被装饰对象。Decorator:抽象装饰类,继承Component,扩展Component类的功能。
- PC端微信的文件夹都是些什么
宇宙第一小趴菜
Windows使用技巧微信
目录Windows微信文件wxid_xxxxxxxxxxxx(账号数据)AllUsers(头像和登录信息)Applet(小程序文件)FileStorage(聊天文件)Msg(数据存储文件)ResUpdateV2(压缩包)config(配置文件)BackupFiles(手机微信备份)Backup(一般为空)Applet(小程序数据)Cache(小程序、公众号、视频号图片缓存)CustomEmotio
- Oracle系列---【如何修改Oracle字符集?】
少年攻城狮
oracle数据库
1.字符集修改的一般步骤:su-oracle#切换到oracle用户sqlplus/assysdba#以sysdba身份登录到数据库shutdownimmediate;#停止数据库startupmount;#启动数据库到MOUNT状态,数据库在这个状态下可以修改字符集然后尝试执行以下SQL命令来修改字符集:alterdatabasecharactersetZHS16GBK;#将字符集修改为ZHS1
- SpringWebFlux结合多线程编写流式处理异步返回接口
starsAreCloser
springWebFlux多线程编排springmvcspringboot
文章目录概要整体架构流程技术细节小结概要java使用多线程为关系型数据库结合spring响应式编程模拟流式处理整体架构流程使用webFlux的时候如果涉及到数据库操作是需要数据库支持的,非关系型数据库对此支持比较友好如redis的ReactiveStringRedisTemplate和MongoDB的ReactiveMongoRepository就支持该功能,但是关系型数据库oracle,mysq
- Expand Reach with Multilingual Data Editors
SEO-狼术
DelphinetCrack开发语言
ExpandReachwithMultilingualDataEditorsEnhanceuserexperience,accessibility,andglobalcollaborationwithlocalizeddataeditorsthatadapttomultiplelanguageworkflows.Localizationistheprocessofadaptingtheuserin
- cocos creator从零开发虚拟摇杆(06)-跟随摇杆
cocos
摇杆共有3种类型,即固定、跟随、跟随并移动,之前已经做了固定摇杆类型,这里做跟随摇杆类型。编辑scripts/JoyStick.ts,添加JoystickType枚举。const{ccclass,property}=cc._decoratorexportenumJoystickType{Fixed,Follow,FollowMove,}添加joystickType属性。@property({typ
- android sensorhub框架,sensorhub-cloud-iot
Jack遇见冰山
androidsensorhub框架
HowtobecomeacontributorandsubmityourowncodeContributorLicenseAgreementsWe'dlovetoacceptyoursampleappsandpatches!Beforewecantakethem,wehavetojumpacoupleoflegalhurdles.Pleasefillouteithertheindividualor
- leetcode 297. 二叉树的序列化与反序列化
萌の鱼
leetcode算法c++数据结构
题目如下我们常常说单独先序遍历不能完整的表示一棵树是有前提条件的。为什么?先序遍历是按根节点左子树右子树的方向遍历树且遇到空子树直接返回,这样会造成我们并不知道某个节点的左右子树存在与否,故我们无法确定树的形状。但是如果我们在遍历的时候加入该子树为空的标记不就知道某个节点后面跟的是左子树还是右子树了吗?好了,把这个思想用到本题就迎刃而解了。通过代码/***Definitionforabinaryt
- localStorage实现本地信息存储
半旧夜夏
前端javascript
基于HTML,CSS,JS代码,利用localStorage本地存储实现学生信息添加的综合小案列效果图:本地存储格式:HTML代码:学生信息管理新增学员姓名:年龄:性别:男女薪资:就业城市:北京上海广州深圳曹县录入学生就业统计表共有数据0条学号姓名年龄性别薪资就业城市录入时间操作CSS代码:*{/*外边距*/margin:0;/*内边距*/padding:0;}h1{/*使元素内的文本居中对齐*/
- 【ElementUI实现table表格行拖拽切换顺序】
电竞蒋劲夫
ElementUIelementui前端javascriptvue.js
实现效果逻辑思路通过el-table的row-class-name设置行的自定义class类名.在mounted和updated生命周期钩子中调用this.$nextTick,确保DOM元素渲染完成后,使用document.querySelectorAll获取所有.drag-row元素。设置dom的draggable(用于标识元素是否允许使用浏览器原生行为或HTML拖放操作API拖动。)为true
- DHCP协议概述
周周周诶。
通信协议物联网网络协议信息与通信网络服务器嵌入式硬件
目录1.DHCP协议概述1.1什么是DHCP?1.2DHCP适用于哪些设备?2.DHCP协议标准3.DHCP详细工作原理3.1DHCP的DORA过程3.2Wi-Fi设备DHCP过程4.DHCP报文格式解析4.1DHCP报文结构(1)固定字段(2)可变字段5.DHCP服务器IP分配算法5.1DHCP服务器IP分配策略5.2DHCP续约机制6.DHCP调试&故障排查6.1Wireshark抓包分析6.
- Python:字典嵌套
lcqin111
python
可以在列表中嵌套字典、在字典中嵌套列表甚至在字典中嵌套字典alien_0={'color':'green','points':5}alien_1={'color':'yellow','points':10}alien_2={'color':'red','points':15}aliens=[alien_0,alien_1,alien_2]foralieninaliens:print(alien)这
- 【Oracle】基础知识面试题
菜鸟进阶站
数据库Oracle面试大数据
1.delete与Truncate区别?1)Truncate是DDL语句,DELETE是DML语句。2)Truncate的速度远快于DELETE;原因是:当执行DELETE操作时所有表数据先被COPY到回滚表空间,数据量不同花费时间长短不一。而TRUNCATE是直接删除数据不进回滚表空间。3)delete数据可以运行Rollback进行数据回滚。而Truncate则是永久删除不能回滚。4)Trun
- $ operator is invalid for atomic vectors什么意思
滚菩提哦呢
"$operatorisinvalidforatomicvectors"意思是在对原子向量使用"$"操作符时是无效的。"$"操作符是R语言中用于访问数据框(dataframe)中的列的常用操作符。但是,原子向量(atomicvector)是R中的一种基本数据类型,它是一个长度固定的向量,并且所有元素都是相同的数据类型。因此,在对原子向量使用"$"操作符时是无效的,因为原子向量没有列的概念。例如,下
- 《Operating System Concepts》阅读笔记:p13-p16
操作系统
《OperatingSystemConcepts》学习第4天,p13-p16总结,总计4页。一、技术总结1.storage指令只能在memory上执行,所以要执行程序,那么就要加载到内存上。2.primarystorageprimarystorage包含下面这些分类:(1)register(2)cache(3)mainmemory3.secondarystorageThemostcommonsec
- oracle TNS-01153 错误处理
90的程序爱好者
oracle数据库
oracle启动监听的时候提示Tns-01153未能处理字符串1、解决办法:删除oracle的安装目录下的listener\trace目录下listener.log文件2、出现原因log文件超过4G,在无法写入
- oracle 比较两个字符串相似度
90的程序爱好者
oraclesqloracle数据库
select*from(select字段a,字段b,sys.utl_match.edit_distance_similarity(字段a,字段b)相似度formtable)orderby相似度desc说明:SYS.UTL_MATCH.EDIT_DISTANCE_SIMILARITY函数用于计算两个字符串之间的编辑距离相似度
- 探索数据云的无缝桥梁:Apache Spark 与 Snowflake 的完美结合
窦育培
探索数据云的无缝桥梁:ApacheSpark与Snowflake的完美结合spark-snowflakeSnowflakeDataSourceforApacheSpark.项目地址:https://gitcode.com/gh_mirrors/sp/spark-snowflake项目介绍在大数据处理的浩瀚宇宙中,Snowflake以其独特的云数据仓库能力闪耀,而ApacheSpark则是数据分析和
- 深入了解 Oracle 正则表达式
一只fish
oracle数据库
目录深入了解Oracle正则表达式一、正则表达式基础概念二、Oracle正则表达式语法(一)字符类(二)重复限定符(三)边界匹配符(四)分组和捕获三、Oracle正则表达式函数(一)REGEXP\_LIKE函数(二)REGEXP\_REPLACE函数(三)REGEXP\_SUBSTR函数四、实际应用场景(一)数据清洗(二)数据验证(三)文本分析五、注意事项六、总结深入了解Oracle正则表达式一、
- JVM StackMapTable 属性的作用及理解
lijingyao8206
jvm字节码Class文件StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率,在字节码规范中添加了Stack Map Table属性,以下简称栈图,其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
- 回调函数调用方法
百合不是茶
java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记 记录一下
代码很简单:
MainDemo :调用方法 得到方法的返回结果
- [时间机器]制造时间机器需要一些材料
comsci
制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质
和材料...
甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
 
- 开口埋怨不如闭口做事
邓集海
邓集海 做人 做事 工作
“开口埋怨,不如闭口做事。”不是名人名言,而是一个普通父亲对儿子的训导。但是,因为这句训导,这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子,叫张明正。 张明正出身贫寒,读书时成绩差,常挨老师批评。高中毕业,张明正连普通大学的分数线都没上。高考成绩出来后,平时开口怨这怨那的张明正,不从自身找原因,而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。
- jQuery插件开发全解析,类级别与对象级别开发
IT独行者
jquery开发插件 函数
jQuery插件的开发包括两种: 一种是类级别的插件开发,即给
jQuery添加新的全局函数,相当于给
jQuery类本身添加方法。
jQuery的全局函数就是属于
jQuery命名空间的函数,另一种是对象级别的插件开发,即给
jQuery对象添加方法。下面就两种函数的开发做详细的说明。
1
、类级别的插件开发 类级别的插件开发最直接的理解就是给jQuer
- Rome解析Rss
413277409
Rome解析Rss
import java.net.URL;
import java.util.List;
import org.junit.Test;
import com.sun.syndication.feed.synd.SyndCategory;
import com.sun.syndication.feed.synd.S
- RSA加密解密
无量
加密解密rsa
RSA加密解密代码
代码有待整理
package com.tongbanjie.commons.util;
import java.security.Key;
import java.security.KeyFactory;
import java.security.KeyPair;
import java.security.KeyPairGenerat
- linux 软件安装遇到的问题
aichenglong
linux遇到的问题ftp
1 ftp配置中遇到的问题
500 OOPS: cannot change directory
出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了
修改方法:1 修改/etc/selinux/config 中SELINUX=disabled
2 source /etc
- 面试心得
alafqq
面试
最近面试了好几家公司。记录下;
支付宝,面试我的人胖胖的,看着人挺好的;博彦外包的职位,面试失败;
阿里金融,面试官人也挺和善,只不过我让他吐血了。。。
由于印象比较深,记录下;
1,自我介绍
2,说下八种基本类型;(算上string。楼主才答了3种,哈哈,string其实不是基本类型,是引用类型)
3,什么是包装类,包装类的优点;
4,平时看过什么书?NND,什么书都没看过。。照样
- java的多态性探讨
百合不是茶
java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况
//package 1;
class A{
public void test(){
System.out.println("A");
}
}
class D extends A{
public void test(){
S
- 网络编程基础篇之JavaScript-学习笔记
bijian1013
JavaScript
1.documentWrite
<html>
<head>
<script language="JavaScript">
document.write("这是电脑网络学校");
document.close();
</script>
</h
- 探索JUnit4扩展:深入Rule
bijian1013
JUnitRule单元测试
本文将进一步探究Rule的应用,展示如何使用Rule来替代@BeforeClass,@AfterClass,@Before和@After的功能。
在上一篇中提到,可以使用Rule替代现有的大部分Runner扩展,而且也不提倡对Runner中的withBefores(),withAfte
- [CSS]CSS浮动十五条规则
bit1129
css
这些浮动规则,主要是参考CSS权威指南关于浮动规则的总结,然后添加一些简单的例子以验证和理解这些规则。
1. 所有的页面元素都可以浮动 2. 一个元素浮动后,会成为块级元素,比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动,会向最近的块级父元素的左上角移动,直到浮动元素的左外边界碰到块级父元素的左内边界;如果这个块级父元素已经有浮动元素停靠了
- 【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景
bit1129
partition
0.Kafka服务器配置
3个broker
1个topic,6个partition,副本因子是2
2个consumer,每个consumer三个线程并发读取
1. Producer
package kafka.examples.multibrokers.producers;
import java.util.Properties;
import java.util.
- zabbix_agentd.conf配置文件详解
ronin47
zabbix 配置文件
Aliaskey的别名,例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1], 或者ttlsa的用户ID。你可以使用key:vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1],也可以使用ttlsa.userid。备注: 别名不能重复,但是可以有多个
- java--19.用矩阵求Fibonacci数列的第N项
bylijinnan
fibonacci
参考了网上的思路,写了个Java版的:
public class Fibonacci {
final static int[] A={1,1,1,0};
public static void main(String[] args) {
int n=7;
for(int i=0;i<=n;i++){
int f=fibonac
- Netty源码学习-LengthFieldBasedFrameDecoder
bylijinnan
javanetty
先看看LengthFieldBasedFrameDecoder的官方API
http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html
API举例说明了LengthFieldBasedFrameDecoder的解析机制,如下:
实
- AES加密解密
chicony
加密解密
AES加解密算法,使用Base64做转码以及辅助加密:
package com.wintv.common;
import javax.crypto.Cipher;
import javax.crypto.spec.IvParameterSpec;
import javax.crypto.spec.SecretKeySpec;
import sun.misc.BASE64Decod
- 文件编码格式转换
ctrain
编码格式
package com.test;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
- mysql 在linux客户端插入数据中文乱码
daizj
mysql中文乱码
1、查看系统客户端,数据库,连接层的编码
查看方法: http://daizj.iteye.com/blog/2174993
进入mysql,通过如下命令查看数据库编码方式: mysql> show variables like 'character_set_%'; +--------------------------+------
- 好代码是廉价的代码
dcj3sjt126com
程序员读书
长久以来我一直主张:好代码是廉价的代码。
当我跟做开发的同事说出这话时,他们的第一反应是一种惊愕,然后是将近一个星期的嘲笑,把它当作一个笑话来讲。 当他们走近看我的表情、知道我是认真的时,才收敛一点。
当最初的惊愕消退后,他们会用一些这样的话来反驳: “好代码不廉价,好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。”
我只
- Android网络请求库——android-async-http
dcj3sjt126com
android
在iOS开发中有大名鼎鼎的ASIHttpRequest库,用来处理网络请求操作,今天要介绍的是一个在Android上同样强大的网络请求库android-async-http,目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库,网络处理均基于Android的非UI线程,通
- ORACLE 复习笔记之SQL语句的优化
eksliang
SQL优化Oracle sql语句优化SQL语句的优化
转载请出自出处:http://eksliang.iteye.com/blog/2097999
SQL语句的优化总结如下
sql语句的优化可以按照如下六个步骤进行:
合理使用索引
避免或者简化排序
消除对大表的扫描
避免复杂的通配符匹配
调整子查询的性能
EXISTS和IN运算符
下面我就按照上面这六个步骤分别进行总结:
- 浅析:Android 嵌套滑动机制(NestedScrolling)
gg163
android移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后,为了更好的用户体验,Google为Android的滑动机制提供了NestedScrolling特性
NestedScrolling的特性可以体现在哪里呢?<!--[if !supportLineBreakNewLine]--><!--[endif]-->
比如你使用了Toolbar,下面一个ScrollView,向上滚
- 使用hovertree菜单作为后台导航
hvt
JavaScriptjquery.nethovertreeasp.net
hovertree是一个jquery菜单插件,官方网址:http://keleyi.com/jq/hovertree/ ,可以登录该网址体验效果。
0.1.3版本:http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm
hovertree插件包含文件:
http://keleyi.com/jq/hovertree/css
- SVG 教程 (二)矩形
天梯梦
svg
SVG <rect> SVG Shapes
SVG有一些预定义的形状元素,可被开发者使用和操作:
矩形 <rect>
圆形 <circle>
椭圆 <ellipse>
线 <line>
折线 <polyline>
多边形 <polygon>
路径 <path>
- 一个简单的队列
luyulong
java数据结构队列
public class MyQueue {
private long[] arr;
private int front;
private int end;
// 有效数据的大小
private int elements;
public MyQueue() {
arr = new long[10];
elements = 0;
front
- 基础数据结构和算法九:Binary Search Tree
sunwinner
Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
- 项目出现的一些问题和体会
Steven-Walker
DAOWebservlet
第一篇博客不知道要写点什么,就先来点近阶段的感悟吧。
这几天学了servlet和数据库等知识,就参照老方的视频写了一个简单的增删改查的,完成了最简单的一些功能,使用了三层架构。
dao层完成的是对数据库具体的功能实现,service层调用了dao层的实现方法,具体对servlet提供支持。
&
- 高手问答:Java老A带你全面提升Java单兵作战能力!
ITeye管理员
java
本期特邀《Java特种兵》作者:谢宇,CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答,欢迎网友积极提问,与专家一起讨论!
作者简介:
淘宝网资深Java工程师,CSDN超人气博主,人称“胖哥”。
CSDN博客地址:
http://blog.csdn.net/xieyuooo
作者在进入大学前是一个不折不扣的计算机白痴,曾经被人笑话过不懂鼠标是什么,