- 复旦:LLM不同层位置编码缩放
大模型任我行
大模型-结构原理人工智能自然语言处理语言模型论文笔记
标题:Layer-SpecificScalingofPositionalEncodingsforSuperiorLong-ContextModeling来源:arXiv,2503.04355摘要尽管大型语言模型(LLM)在处理长上下文输入方面取得了重大进展,但它们仍然存在“中间丢失”问题,即上下文中间的关键信息往往不足或丢失。我们广泛的实验表明,这个问题可能源于旋转位置嵌入(RoPE)的快速长期衰
- Gymnasium学习笔记
songyuc
gymnasium
1.Customwrapper[doc]1.1reset()方法重写说明重写函数模板:defreset(self,**kwargs):obs=super().reset(**kwargs)...returnobs1.1.1签名解释Deepseek-r1-Cursor:reset()方法的定义如下:defreset(self,*,seed=None,options=None):...注意参数前的星号
- Java学习--关键字
月色很柔
Java学习java
Java学习--关键字前言关键字finalstaticsuperthis实现前言本文主要参考:here;若需要可直接前往学习。关键字final、Static、super、this…final区分final、finally、finalize:理解final的含义:final意为最终的含义,用来修饰类、方法和变量。修饰类:publicfinalclassClassName{}被final修饰的类不能被
- java------方法的覆盖[重写],super和final关键字
从未止步..
JavaSE基础java开发语言jvm
方法覆盖(也称为方法的重写,Override)定义:它是多态性的重要体现之一,是动态多态性的表现形式,他是指子类中可以定义名称,参数列表,返回值类型均与父类中某个方法完全相同的方法,我们就说子类中定义的这个方法覆盖了父类中的同名方法。举例://anmial为父类packageanmial;publicclassAnimal{publicvoidshow
- Java学习------static、final、this、super关键字
日暮南城故里
Java学习记录java学习
1.static关键字static修饰的变量叫做静态变量。当所有对象的某个属性的值是相同的,建议将该属性定义为静态变量,来节省内存的开销。静态变量在类加载时初始化,存储在堆中。static修饰的方法叫做静态方法。所有静态变量和静态方法,统一使用“类名.”调用。静态方法中不能使用this关键字。因此无法直接访问实例变量和调用实例方法。静态代码块在类加载时执行,一个类中可以编写多个静态代码块,遵循自上
- AI学习第二天--监督学习 半监督学习 无监督学习
iisugar
机器学习支持向量机人工智能
目录1.监督学习(SupervisedLearning)比喻:技术细节:形象例子:2.无监督学习(UnsupervisedLearning)比喻:技术细节:形象例子:3.半监督学习(Semi-SupervisedLearning)比喻:技术细节:形象例子:4.三者的对比与选择表格总结:5.实际案例对比案例:电商平台用户分群6.关键逻辑总结1.监督学习(SupervisedLearning)比喻:老
- 基于生成对抗网络(GAN)的图像超分辨率实战:从SRGAN到ESRGAN
Evaporator Core
#深度学习强化学习生成模型生成对抗网络人工智能神经网络
图像超分辨率(ImageSuper-Resolution)是一种通过算法将低分辨率图像转换为高分辨率图像的技术,广泛应用于医学影像、卫星图像和视频增强等领域。生成对抗网络(GAN)是图像超分辨率的经典方法,而增强型超分辨率生成对抗网络(ESRGAN)则通过引入残差网络和感知损失进一步提升了图像质量。本文将通过一个完整的实战案例,展示如何使用SRGAN和ESRGAN进行图像超分辨率,并提供详细的代码
- React-state响应式内部数据(类组件&Hook两种方式整理)
一蓑烟雨,一任平生
Reactjavascript前端react.js
类组件在类组件中要定义内部数据,由两种方案构造器里面定义state属性,在这个对象中定义你需要的数据constructor(){super()this.state={count:1}}在类的下面直接定义一个属性state(推荐)state={count:10}页面要使用state数据{this.state.count}建议大家在React中使用内部state数据的时候,使用解构的方式将内容解构出来
- 使用 Supervisor 管理 Gunicorn 实现高可用 Python Web 应用
莫忘初心丶
gunicornpython
前言在生产环境中,部署PythonWeb应用时,我们通常使用Gunicorn(GreenUnicorn)作为WSGI服务器。为了确保应用能够稳定运行,能够在崩溃后自动重启,Supervisor是一个常用的进程管理工具,它可以很好地与Gunicorn配合使用,实现进程监控、自动重启等功能。本文将详细介绍如何使用Supervisor来管理Gunicorn,确保PythonWeb应用在生产环境中的高可用
- 【sklearn 02】监督学习、非监督下学习、强化学习
@金色海岸
sklearn学习人工智能
监督学习、非监督学习、强化学习**机器学习通常分为无监督学习、监督学习和强化学习三类。-第一类:无监督学习(unsupervisedlearning),指的是从信息出发自动寻找规律,分析数据的结构,常见的无监督学习任务有聚类、降维、密度估计、关联分析等。-第二类:监督学习(supervisedlearning),监督学习指的是使用带标签的数据去训练模型,并预测未知数据的标签。监督学习有两种,当预测
- LLaMA-Factory 训练数据默认使用 instruction、input、output 三个 key
背太阳的牧羊人
模型微调llama人工智能大模型微调
在LLaMA-Factory进行SFT(Directivesupervisionfine-tuning指令监督微调)时,训练数据的格式非常重要,因为大模型依赖标准化的数据结构来学习指令-响应模式。identity.json文件的数据采用了“instruction”、“input”、“output”这三个key,它们的作用如下:Key作用示例“instruction”代表用户给AI的指令(问题或任务
- 【手撕算法系列】多头自注意力机制MHSA
Nastu_Ho-小何同学
python深度学习机器学习
importtorch.nnasnnclassAttention(nn.Module):def__init__(self,dim,num_heads=8,qkv_bias=False,qk_scale=None,attn_drop=0.,proj_drop=0.,num_classes=20):super().__init__()self.num_classes=num_classesself.n
- NLP复习3,手撕多头attention
地大停车第二帅
NLP学习自然语言处理人工智能
importmathimporttorchimportcollectionsimportnumpyasnpimporttorch.nnasnnclassMultiHeadAttention(nn.Module):def__init__(self,heads,d_model,dropout=0.1):super().__init__()#输入的特征维度self.d_model=d_model#每个头
- llama源码学习·model.py[1]RMSNorm归一化
小杜不吃糖
llamapython
一、model.py中的RMSNorm源码classRMSNorm(torch.nn.Module):def__init__(self,dim:int,eps:float=1e-6):super().__init__()self.eps=epsself.weight=nn.Parameter(torch.ones(dim))def_norm(self,x):returnx*torch.rsqrt(
- IKM 测试题 - Java SE 8 评估测试题目
843294669
java开发语言
关于JavaSE中this()和super()关键字的使用问题:以下哪些陈述正确描述了JavaSE中this()和super()关键字的使用?选项:如果super()没有被编码,则编译器将生成对零参数超类构造函数的调用。this()和super()可以在同一构造函数中使用。如果使用,this()或super()调用必须始终是构造函数中的第一条语句。this()和super()调用可以在构造函数之外
- ARM SVC指令
小米人er
我的博客arm开发
在ARM汇编中,SVC(SupervisorCall)指令用于从用户模式切换到特权模式(如Supervisor模式),以便执行操作系统内核提供的服务。它通常用于系统调用。具体作用触发异常:执行SVC指令时,处理器会进入Supervisor模式,并跳转到异常向量表中的SVC异常处理程序。传递参数:SVC指令后的立即数可作为参数传递给异常处理程序,帮助识别具体的系统调用。语法SVC#是一个24位的立即
- 图像拼接-UDIS详细推导和精读Unsupervised Deep Image Stitching: ReconstructingStitched Features to Images
cccc来财
算法计算机视觉深度学习
无监督粗对齐1.基于消融的策略主要是为了找到重叠区,去除无效区2.拼接域的TransformerLayer无监督图像重建1.低分辨率变形单应性变换仅能表示同一深度的空间变换,在实际的图像拼接任务中,由于输入图像的多样性和复杂性,经过第一阶段的粗对齐后,图像往往无法完全对齐。为了让网络能够感知到这些错位区域,特别是在高分辨率和大视差的情况下,设计了低分辨率变形分支,先在低分辨率下对图像进行处理和学习
- 设计一个基于flask的高并发高可用的查询ip的http服务
职场亮哥
其他
结构设计基础架构为flask+gunicorn+负载均衡,负载均衡分为阿里云硬件负载均衡服务和软负载nginx。gunicorn使用supervisor进行管理。使用nginx软件负载结构图使用阿里云硬件负载均衡服务结构图因为flaskapp需要在内存中保存ip树以及国家、省份、城市相关的字典,因此占用内存较高。gunicorn的1个worker需要占用300M内存,nginx的4个worker内
- 简单的网页链接爬虫
笑颜218
爬虫python简单
fromurllib.requestimporturlopenfromurllib.parseimporturljoinfromhtml.parserimportHTMLParser#自定义HTML解析器classLinkParser(HTMLParser):def__init__(self,base_url):super().__init__()self.base_url=base_url#基础
- spring event发布及监听实例
weixin_33924220
java测试
序本文主要介绍下如何在spring中进行发布时间以及接收事件定义事件publicclassDemoEventextendsApplicationEvent{privateStringmessage;publicDemoEvent(Objectsource,Stringmessage){super(source);this.message=message;}publicStringgetMessag
- LLM:RMSNorm
微风❤水墨
LLM&AIGC&VLPLLMRMSNorm
importtorchimporttorch.nnasnnclassLayerNorm(nn.Module):def__init__(self,dim:int,eps:float):super(LayerNorm,self).__init__()self.dim=dimself.eps=epsself.weight=nn.Parameter(torch.ones(self.dim))self.bi
- 使用线程池ThreadPoolExecutor调用Callable并接收返回值(用Future接收)
supermiketho
javajavajvm开发语言
/**MyCallableA实现Callable接口**/packagecom.product.supermiketho.threaddemo;importjava.util.concurrent.Callable;publicclassMyCallableAimplementsCallable{@OverridepublicMyVocall()throwsException{Thread.sle
- 在hadoop上运行python_hadoop上运行python程序
廷哥带你小路超车
数据来源:http://www.nber.org/patents/acite75_99.zip首先上传测试数据到hdfs:[root@localhost:/usr/local/hadoop/hadoop-0.19.2]#bin/hadoopfs-ls/user/root/test-inFound5items-rw-r--r--1rootsupergroup1012010-10-2414:39/us
- 【论文阅读】Learning Transferable Visual Models From Natural Language Supervision(2021)
Bosenya12
论文阅读
摘要State-of-the-art(最先进的)computervisionsystems(计算机视觉系统)aretrainedtopredictafixedsetofpredeterminedobjectcategories(被训练来预测一组固定的预定对象类别).Thisrestrictedformofsupervision(受限制的监督形式)limitstheirgenerality(通用性)
- 基于pytorch的神经病网络搭建学习
停走的风
pytorch学习学习pytorch人工智能
1.pycharm中code方法的使用1.1父类重写技巧操作:在需要重写的方法上右键,选择code-->Generate>OverrideMethods。作用:自动生成重写父类或接口的方法2.简单神经网络importtorchfromtorchimportnnclassyu(nn.Module):def__init__(self,*args,**kwargs)->None:super().__in
- 电力行业中的SCADA系统(Supervisory Control and Data Acquisition,监控与数据采集系统)
小赖同学啊
人工智能智能硬件网络服务器运维
在电力行业中,SCADA系统(SupervisoryControlandDataAcquisition,监控与数据采集系统)是核心的自动化控制系统,用于实时监测、控制和优化电力系统的运行。SCADA系统通过集成数据采集、通信、监控和控制功能,帮助电力公司实现电网的高效管理和故障快速响应。以下是SCADA系统在电力行业中的关键功能、组成和应用:SCADA系统的核心功能实时数据采集:从电力设备(如变压
- django allauth 自定义登录界面
waterHBO
djangopythondjango数据库sqlitepython笔记经验分享
起因,目的:为什么前几天还在写强化学习,今天又写django,问就是:客户需求>个人兴趣。问题来源:allauth默认的登录界面不好看,这里记录几个问题。1.注册页面SignUp这里增加,手机号,邮编等等。2.使用谷歌来登录这个步骤其实也简单。xxxxxxxx一定要修改关键的信息,不能随便暴露给别人。xxxxxxxx#HowtouseGoogleLogin.1.createsuperuser.(m
- Win7 火狐浏览器 Mozilla Firefox 115.7.0esr下载地址(及Chrome、Supermium浏览器)
catoop
其他firefox
如题,官网下载地址:MozillaFirefox115.7.0esr已经发布,感兴趣的朋友可去官方下载!https://ftp.mozilla.org/pub/firefox/releases/115.7.0esr/其他方案:1、谷歌Chrome浏览器的109版本,即最后一个支持Win7的官方版本。2、Supermium浏览器。它是一款专门为老旧操作系统而优化的浏览器,使用了最新版本Chromiu
- 运维:Centos8安装supervisor守护Nginx进程笔记
IT技术分享社区
Docker系列服务器linuxwindows运维
目录supervisor介绍1.1简介1.2工作原理1.3运行环境1.4supervisor组成2、安装配置步骤2.1执行安装命令2.2回车继续2.3启动supervisor服务2.4查看配置文件,并修改配置文件2.5创建守护nginx进程配置文件nginx.ini2.6添加配置文件后重启2.7停止掉自己服务器运行的nginx,使用Supervisor进行管理supervisor介绍1.1简介Su
- 人工智能机器学习算法分类全解析
power-辰南
人工智能人工智能机器学习算法python
目录一、引言二、机器学习算法分类概述(一)基于学习方式的分类1.监督学习(SupervisedLearning)2.无监督学习(UnsupervisedLearning)3.强化学习(ReinforcementLearning)(二)基于任务类型的分类1.分类算法2.回归算法3.聚类算法4.降维算法5.生成算法(三)基于模型结构的分类1.线性模型2.非线性模型3.基于树的模型4.基于神经网络的模型
- jquery实现的jsonp掉java后台
知了ing
javajsonpjquery
什么是JSONP?
先说说JSONP是怎么产生的:
其实网上关于JSONP的讲解有很多,但却千篇一律,而且云里雾里,对于很多刚接触的人来讲理解起来有些困难,小可不才,试着用自己的方式来阐释一下这个问题,看看是否有帮助。
1、一个众所周知的问题,Ajax直接请求普通文件存在跨域无权限访问的问题,甭管你是静态页面、动态网页、web服务、WCF,只要是跨域请求,一律不准;
2、
- Struts2学习笔记
caoyong
struts2
SSH : Spring + Struts2 + Hibernate
三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller)
分层原则:单向依赖,接口耦合
1、Struts2 = Struts + Webwork
2、搭建struts2开发环境
a>、到www.apac
- SpringMVC学习之后台往前台传值方法
满城风雨近重阳
springMVC
springMVC控制器往前台传值的方法有以下几种:
1.ModelAndView
通过往ModelAndView中存放viewName:目标地址和attribute参数来实现传参:
ModelAndView mv=new ModelAndView();
mv.setViewName="success
- WebService存在的必要性?
一炮送你回车库
webservice
做Java的经常在选择Webservice框架上徘徊很久,Axis Xfire Axis2 CXF ,他们只有一个功能,发布HTTP服务然后用XML做数据传输。
是的,他们就做了两个功能,发布一个http服务让客户端或者浏览器连接,接收xml参数并发送xml结果。
当在不同的平台间传输数据时,就需要一个都能解析的数据格式。
但是为什么要使用xml呢?不能使json或者其他通用数据
- js年份下拉框
3213213333332132
java web ee
<div id="divValue">test...</div>测试
//年份
<select id="year"></select>
<script type="text/javascript">
window.onload =
- 简单链式调用的实现技术
归来朝歌
方法调用链式反应编程思想
在编程中,我们可以经常遇到这样一种场景:一个实例不断调用它自身的方法,像一条链条一样进行调用
这样的调用你可能在Ajax中,在页面中添加标签:
$("<p>").append($("<span>").text(list[i].name)).appendTo("#result");
也可能在HQ
- JAVA调用.net 发布的webservice 接口
darkranger
webservice
/**
* @Title: callInvoke
* @Description: TODO(调用接口公共方法)
* @param @param url 地址
* @param @param method 方法
* @param @param pama 参数
* @param @return
* @param @throws BusinessException
- Javascript模糊查找 | 第一章 循环不能不重视。
aijuans
Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序,里面要有可展开的大纲,模糊查找等功能。我这个人说实在的懒,本来是不愿意的,但想起了父亲以前教我要给朋友搞好关系,再加上这也可以巩固自己的js技术,于是就开始开发这个程序,没想到却出了点小问题,我做的查找只能绝对查找。具体的js代码如下:
function search(){
var arr=new Array("my
- 狼和羊,该怎么抉择
atongyeye
工作
狼和羊,该怎么抉择
在做一个链家的小项目,只有我和另外一个同事两个人负责,各负责一部分接口,我的接口写完,并全部测联调试通过。所以工作就剩下一下细枝末节的,工作就轻松很多。每天会帮另一个同事测试一些功能点,协助他完成一些业务型不强的工作。
今天早上到公司没多久,领导就在QQ上给我发信息,让我多协助同事测试,让我积极主动些,有点责任心等等,我听了这话,心里面立马凉半截,首先一个领导轻易说
- 读取android系统的联系人拨号
百合不是茶
androidsqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢
关键代码:
1, 使用javabean操作存储读取到的数据
package com.example.bean;
/**
*
* @author Admini
- ORACLE自定义异常
bijian1013
数据库自定义异常
实例:
CREATE OR REPLACE PROCEDURE test_Exception
(
ParameterA IN varchar2,
ParameterB IN varchar2,
ErrorCode OUT varchar2 --返回值,错误编码
)
AS
/*以下是一些变量的定义*/
V1 NUMBER;
V2 nvarc
- 查看端号使用情况
征客丶
windows
一、查看端口
在windows命令行窗口下执行:
>netstat -aon|findstr "8080"
显示结果:
TCP 127.0.0.1:80 0.0.0.0:0 &
- 【Spark二十】运行Spark Streaming的NetworkWordCount实例
bit1129
wordcount
Spark Streaming简介
NetworkWordCount代码
/*
* Licensed to the Apache Software Foundation (ASF) under one or more
* contributor license agreements. See the NOTICE file distributed with
- Struts2 与 SpringMVC的比较
BlueSkator
struts2spring mvc
1. 机制:spring mvc的入口是servlet,而struts2是filter,这样就导致了二者的机制不同。 2. 性能:spring会稍微比struts快。spring mvc是基于方法的设计,而sturts是基于类,每次发一次请求都会实例一个action,每个action都会被注入属性,而spring基于方法,粒度更细,但要小心把握像在servlet控制数据一样。spring
- Hibernate在更新时,是可以不用session的update方法的(转帖)
BreakingBad
Hibernateupdate
地址:http://blog.csdn.net/plpblue/article/details/9304459
public void synDevNameWithItil()
{Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
- 读《研磨设计模式》-代码笔记-观察者模式
bylijinnan
java设计模式
声明: 本文只为方便我个人查阅和理解,详细的分析以及源代码请移步 原作者的博客http://chjavach.iteye.com/
import java.util.ArrayList;
import java.util.List;
import java.util.Observable;
import java.util.Observer;
/**
* “观
- 重置MySQL密码
chenhbc
mysql重置密码忘记密码
如果你也像我这么健忘,把MySQL的密码搞忘记了,经过下面几个步骤就可以重置了(以Windows为例,Linux/Unix类似):
1、关闭MySQL服务
2、打开CMD,进入MySQL安装目录的bin目录下,以跳过权限检查的方式启动MySQL
mysqld --skip-grant-tables
3、新开一个CMD窗口,进入MySQL
mysql -uroot
 
- 再谈系统论,控制论和信息论
comsci
设计模式生物能源企业应用领域模型
再谈系统论,控制论和信息论
偶然看
- oracle moving window size与 AWR retention period关系
daizj
oracle
转自: http://tomszrp.itpub.net/post/11835/494147
晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程.
SQL> select * from v$version;
BANNER
-------------------
- Python版B树
dieslrae
python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树...
首先是数据实体对象,很简单,只存放key,value
class Entity(object):
'''数据实体'''
def __init__(self,key,value)
- C语言冒泡排序
dcj3sjt126com
算法
代码示例:
# include <stdio.h>
//冒泡排序
void sort(int * a, int len)
{
int i, j, t;
for (i=0; i<len-1; i++)
{
for (j=0; j<len-1-i; j++)
{
if (a[j] > a[j+1]) // >表示升序
- 自定义导航栏样式
dcj3sjt126com
自定义
-(void)setupAppAppearance
{
[[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]];
[UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
- 11.性能优化-优化-JVM参数总结
frank1234
jvm参数性能优化
1.堆
-Xms --初始堆大小
-Xmx --最大堆大小
-Xmn --新生代大小
-Xss --线程栈大小
-XX:PermSize --永久代初始大小
-XX:MaxPermSize --永久代最大值
-XX:SurvivorRatio --新生代和suvivor比例,默认为8
-XX:TargetSurvivorRatio --survivor可使用
- nginx日志分割 for linux
HarborChung
nginxlinux脚本
nginx日志分割 for linux 默认情况下,nginx是不分割访问日志的,久而久之,网站的日志文件将会越来越大,占用空间不说,如果有问题要查看网站的日志的话,庞大的文件也将很难打开,于是便有了下面的脚本 使用方法,先将以下脚本保存为 cutlog.sh,放在/root 目录下,然后给予此脚本执行的权限
复制代码代码如下:
chmo
- Spring4新特性——泛型限定式依赖注入
jinnianshilongnian
springspring4泛型式依赖注入
Spring4新特性——泛型限定式依赖注入
Spring4新特性——核心容器的其他改进
Spring4新特性——Web开发的增强
Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC
Spring4新特性——Groovy Bean定义DSL
Spring4新特性——更好的Java泛型操作API
Spring4新
- centOS安装GCC和G++
liuxihope
centosgcc
Centos支持yum安装,安装软件一般格式为yum install .......,注意安装时要先成为root用户。
按照这个思路,我想安装过程如下:
安装gcc:yum install gcc
安装g++: yum install g++
实际操作过程发现,只能有gcc安装成功,而g++安装失败,提示g++ command not found。上网查了一下,正确安装应该
- 第13章 Ajax进阶(上)
onestopweb
Ajax
index.html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/
- How to determine BusinessObjects service pack and fix pack
blueoxygen
BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/
The table below is helpful. Reference
BOE XI 3.x
12.0.0.
y BOE XI 3.0 12.0.
x.
y BO
- Oracle里的自增字段设置
tomcat_oracle
oracle
大家都知道吧,这很坑,尤其是用惯了mysql里的自增字段设置,结果oracle里面没有的。oh,no 我用的是12c版本的,它有一个新特性,可以这样设置自增序列,在创建表是,把id设置为自增序列
create table t
(
id number generated by default as identity (start with 1 increment b
- Spring Security(01)——初体验
yang_winnie
springSecurity
Spring Security(01)——初体验
博客分类: spring Security
Spring Security入门安全认证
首先我们为Spring Security专门建立一个Spring的配置文件,该文件就专门用来作为Spring Security的配置