邓哈哈哈哈

【又一个作业】基于强化学习的雷达干扰样式选择（MATLAB实现）

【前情提要】有可能写的不对，发出来想做个纪念，也算是一种分享。

目录

实验原理
- 雷达干扰决策
- - 基于强化学习的干扰决策
- 时序差分强化学习
- - Sarsa算法
  - Q-learning算法
- Epsilon-greedy算法
实验步骤和内容
- 实验分析
- 参数设置
- 具体实现
实验结果
- sarsa
- Q-Learning
- 分析

实验原理

雷达干扰决策

基于强化学习的干扰决策

雷达干扰决策是干扰方在侦察雷达信息的基础上,通过观测敌方雷达模式的变化，选择合适的干扰目标，合理地分配干扰资源，并根据雷达的工作模式选择对应干扰样式的过程。
基于强化学习的雷达干扰决策的具体过程为：

干扰方先侦察雷达辐射信号、提取雷达特征并识别雷达工作模式。然后根据工作模式的威胁等级，同时观测雷达前后工作模式的变化得到的干扰收益，可以选择针对当前雷达工作模式的干扰样式并实施干扰。雷达受到干扰后，因其自身的抗干扰措施，具备实时更新工作模式的能力。

基于强化学习的雷达干扰决策模型如下：

强化学习的基本要素为一个四元组（X,A,P,R），其中X表示外界环境的状态空间，A是Agent的动作空间，P是状态转移概率矩阵，R是即时回报矩阵。在基于深度强化学习的雷达干扰决策模型里,雷达对应是环境，雷达在收到干扰方实施干扰后，我们考虑雷达通过改变工作模式进行抗干扰。

在强化学习算法中，有以下四个要素：

环境模型（model）：对环境信息的完整描述，包括：状态转移概率矩阵、即时回报矩阵等。

策略（policy）：从状态空间到动作措施的映射，(,) 表示在状态s下选择动作a的概率。

回报或奖励（reward）：环境对Agent采取动作后的响应。

价值函数（value function）：计算状态 $s_t$ 或状态-动作对 $< s_{t}, a_{t} >$ 的累积回报，是从长远的角度考察某个状态或状态-动作对的好坏。

这里，强化学习的目标就是最大化Agent接收到的延迟会报，而强化学习算法的目的就是对价值函数进行估计。此外，强化学习算法一般要求环境状态满足马尔可夫性，即环境在t+1时刻的响应仅依赖于其在t时刻的状态及接收到的动作。因此，我们采用的是马尔可夫决策模型。

假设雷达共有N种状态，将第 $n$ 种工作模式记作 $s_n$ ，则雷达的状态集合可以表示为 $S=\left\{s_1,...s_n,...,s_N\right\}$ ，雷达状态可以是雷达的工作模式，如搜索、跟踪、识别等。

干扰方无法直接获得雷达状态，而是通过侦察雷达的辐射信号并提取信号的特征，通过工作模式识别方法，获得当前雷达的工作模式，再根据当前的工作模式，以雷达干扰决策算法进行决策，选择干扰样式对雷达实施干扰。

假设可实施的干扰样式共有M种，第 $m$ 种干扰样式记作 $j_m$ ，总的干扰样式集合为 $J=\left\{j_1,...j_m,...,j_M\right\}$ ，常用的干扰样式有压制干扰、欺骗干扰等。干扰方的干扰收益可以通过雷达工作模式的改变估计干扰收益，将干扰收益记作 $R$ 。

时序差分强化学习

Sarsa算法

Sarsa算法是一种免模型的使用时序差分求解强化学习控制问题的方法，由于更新一次动作值函数需要用到五个量，即 $\left(s,a,r,s',a'\right)$ ，其中 $s$ 表示状态state， $a$ 表示动作action， $r$ 表示奖励reward，因此被称为sarsa算法。
在迭代的时候，我们首先根据某种算法（如 $\epsilon$ -贪婪法）在当前状态 $S$ 选择一个动作 $A$ ，系统此时会进入新的状态 $S^{'}$ ，同时给我们一个奖励 $R$ 。然后，在新的状态 $S^{'}$ 下，我们再基于某算法（如 $\epsilon$ -贪婪法）选择一个动作 $A^{'}$ ，但是此时我们并不执行动作 $A^{'}$ ，只是用来更新我们的价值函数（Q表），其更新公式为
$Q\left(S,A\right)=Q\left(S,A\right)+\alpha\left(R+γQ\left(S',A' \right)-Q\left(S,A\right)\right)$ 其中， $\gamma$ 是衰减因子, $\alpha$ 是迭代步长。

算法总结:

Q-learning算法

Q-Learning算法和sarsa算法都是时序差分方法，它与sarsa算法的主要区别为：在“在状态 $S$ 执行当前动作 $A$ ,得到新状态 $S'$ 和奖励 $R$ 后，直接更新Q表，不需要再选择新的动作 $A ’$ 。

算法总结：

Epsilon-greedy算法

$\epsilon$ -greedy策略基于一个概率来对探索和利用进行折中：

每次开始实验时，随机一个大于0小于1的值。
如果该值小于 $\epsilon$ ，以均匀概率随机选取动作，即探索；
否则，以 $1-\epsilon$ 的概率选择当前平均回报最高的动作，即利用。

除当前最优动作（贪婪动作）外，其余动作（探索动作）的选择概率相等，而没有利用它们当前所获得的回报信息，使得 Agent 有可能选择一个很“差”的动作，降低学习效率。

实验步骤和内容

实验分析

本题需要对即时回报矩阵（干扰收益）进行设计。由于考虑的是雷达通过转变工作模式进行抗干扰，因此干扰收益与雷达模式的转变和干扰样式相关。
在雷达处于工作模式 $s_n$ 的情况下，若受到第 $m$ 种干扰后，工作模式转变为k的概率为 $p_{nk}^q$ ，那么雷达在受到第 $m$ 种干扰后的工作模式转移概率矩阵 $P^m$ 为
其中，矩阵里的概率满足以下约束条件 $\sum_{k=1}^Np_{nk}^m=1\quad$

工作模式奖励是指干扰方在实施不同干扰样式后，导致雷达工作模式发生改变,干扰方从中获得的收益。针对雷达不同的工作模式，不同的干扰样式达到的干扰效果不同，因此获得的工作模式转移奖励不同。由题知，干扰方的即时回报矩阵 $R_t$ 为（行：t 时刻雷达状态，列：t+1 时刻雷达状态）

由于我们干扰方的目的是让雷达处于较低风险值的时候，也就是状态S1识别状态，因此我们设置terminal为S1。

参数设置

参数设置
state_num = 3; % 3种雷达状态
jam_num = 4; % 4种干扰样式，动作（在下文代码对应了action_num，也就是采取的干扰动作）
gamma = 0.8; % 衰减因子
alpha = 0.2; % 步长
epsilon = 0.8; % epsilon-greedy策略
episode_max = 10000;
iterative_max = 100;

具体实现

选用语言：MATLAB

sarsa

function [Q,time,epi,action,state,reward_list] = sarsa(R,P)
    global state_num action_num;
    global terminal_state;
    global gamma alpha iterative_max episode_max;
    tic;
    Q = zeros(state_num,action_num);
    action = [];
    state = [];
    reward_list = [];
    for epi = 1:episode_max
        Q0 = Q;  % 上一个episode的Q
        is_terminal = false;
        step_count = 0;
        % 随机选择一个初始状态
        start_state = unidrnd(state_num);
        S = start_state;
        % 使用epsilon-贪婪法在当前状态S的所有可能动作中选取一个动作A
        A = choose_action(S,Q);
        while ~is_terminal
            step_count = step_count +1;
            S_ = new_state(S,A,P); % 执行动作，得到新的状态S' 
            reward =  R(S,S_);   % 动作A->状态S' 的即时回报
            A_ = choose_action(S_,Q);  % SARSA对 下一个状态的 动作
            % 更新Q表
            if S_~= terminal_state   % 不是终点
                Q_target = reward + gamma * Q(S_,A_);
            else  % 如果是终点，就没有下一步，直接复制
                Q_target = reward;
                is_terminal = true;
            end
            Q(S,A) = Q(S,A) + alpha*(Q_target - Q(S,A));
            % 更新状态和动作
            S = S_;
            A = A_;
            action = [action A];
            state = [state S];
            reward_list = [reward_list reward];
            
            if step_count > iterative_max  % 迭代次数过多
                break
            end
        end
         if norm(Q-Q0,2)<0.00005
             break
         end    
    end
    time=toc;
end

Q-Learning

function [Q,time,epi,action,state,reward_list] = ql(R,P)
    global state_num action_num;
    global terminal_state;
    global gamma iterative_max alpha episode_max;
    Q = zeros(state_num,action_num);
    tic;
    action = [];
    state = [];
    reward_list=[];
    for epi = 1:episode_max
        Q0 = Q;  % 上一个episode的Q
        is_terminal = false;
        step_count = 0;
        % 随机选择一个初始状态
        start_state = unidrnd(state_num);
        S = start_state;
        while ~is_terminal
            step_count = step_count +1;
            % 使用e-贪婪法在当前状态S的所有可能动作中选取一个动作A
            A = choose_action(S,Q);
            % 执行动作，得到新的状态S'和奖励R
            S_ = new_state(S,A,P); % 获得回报，下一个状态
            reward = R(S,S_);
            % 更新Q表
            if S_~= terminal_state   % 不是终点
                Q_target = reward + gamma * max(Q(S_,:));
            else  % 如果是终点，就没有下一步，直接复制
                Q_target = reward;
                is_terminal = true;
            end
            Q(S,A) = Q(S,A) + alpha*(Q_target - Q(S,A));
            % 更新状态
            S = S_;
            action = [action A];
            state = [state S];
            reward_list = [reward_list,reward];
            if step_count > iterative_max  % 迭代次数过多
                break
            end
        end
        if norm(Q-Q0,2)<0.00005
            break
        end
    end
        time=toc;
end

子函数
（1）获得新的状态

function [S_ ]= new_state(S,A,P) % 获得回报值和下一个状态
	global state_num
	% A：干扰动作 
	% S：现在的状态 
	% P：状态转移矩阵
	prob = P(S,:,A);
	S_  = randsrc(1,1,[(1:1:state_num); prob]);  % 以一定的概率产生下一个状态
end

（2）选择动作 $\epsilon$ -贪婪算法

function [A] = choose_action(S,Q)
	% greedy-policy
	global epsilon  action_num; 
	a = rand;
	if a > epsilon         % epsilon的概论进行探索
	    A = unidrnd(action_num);  % 随机选取一个动作
	else                   % 以1-epsilon的概率进行利用
	    [~, A] = max(Q(S,:));
	end
end

实验结果

sarsa

最优策略:3 3 1
运行时间:0.074913
Q表:
0.4271 0.3393 0.5998 0.3074
-0.2900 -0.2750 0.4690 -0.2194
0.2255 -0.1436 0.0820 -0.0037

根据最佳策略，进行10步测试得到：

Q-Learning

最优策略: 3 3 1
运行时间: 0.042841
Q表
0.4435 0.3784 0.5998 0.3218
0.0236 0.0714 0.6999 -0.3360
0.2332 0.1087 0.0027 -0.0765

根据最佳策略，进行10步测试得到：

我们设置的算法收敛条件为：两次episode结束后的Q矩阵差异不大，即 $\Vert Q^{epi}-Q^{epi-1}\Vert_F<\beta$ ，其中 $\beta$ 是我们自设的阈值，这里我们设置为 $5\times10^{-5}$ 。

分析

Sarsa算法和Q-learning算法收敛时间分别为：0.080820和0.038544，其中Q-learning算法的收敛速度要优于Sarsa算法。
然后，我们绘制了Sarsa算法和Q-Learning算法的每一个episode内的迭代次数和episode的图像。这张图可以用来表示两种算法每次episode的耗费时间。

算法收敛后，得到的最优策略为 $< S_{1}, J_{3} >, < S_{2}, J_{3} >, < S_{3}, J_{1} >$

到这里，正是内容就结束了。BUT我的结果还是存在一些问题，比如偶尔会出现两种算法的最优策略不同的情况，如下图所示。
但是调试代码我也没有找到解决方案，我分析可能是episode的最大数目不够大造成的。

你可能感兴趣的:(matlab,强化学习)

基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
matlab mle 优化,MLE+: Matlab Toolbox for Integrated Modeling, Control and Optimization for Buildings... Simon Zhong matlab mle 优化
摘要：FollowingunilateralopticnervesectioninadultPVGhoodedrat,theaxonguidancecueephrin-A2isup-regulatedincaudalbutnotrostralsuperiorcolliculus(SC)andtheEphA5receptorisdown-regulatedinaxotomisedretinalgan
如何用matlab灵活控制feko的求解 NingrLi matlab 开发语言
https://bbs.rfeda.cn/read.php?tid=3778Feko中的模型和求解设置等都可以通过editfeko进行设置，其文件存储为.pre文件，该文件可以用文本打开，因此，我们可以通过VB、VC、matlab等工具对.pre文件进行读写操作，以达到更灵活的使用feko。同样，对于.out文件，我们也可以进行读操作。熟练使用对.pre文件和.out文件的操作后，我们可以方便的计
matlab delsat = setdiff(1:69,unique(Eph(30,:)))；语句含义黄卷青灯77 matlab 开发语言 setdiff
这行MATLAB代码用于计算在范围1:69中不包含在Eph矩阵第30行的唯一值集合中的所有元素。具体解释如下：delsat=setdiff(1:69,unique(Eph(30,:)));解释Eph(30,:)Eph(30,:)提取矩阵Eph的第30行的所有列元素。这是一个行向量，包含了第30行的所有值。unique(Eph(30,:))unique函数返回Eph(30,:)中的唯一元素。这意味着
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
matlab设置图像窗口大小,matlab 图形窗口大小的设置 weixin_39534002 matlab设置图像窗口大小
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%常用选项和小技巧%%%%%%画等值线[cchh]=contour(peaks(30),'LINESPEC','b-')clabel(cc,hh,'manual')%写文本text(5,10,'\bfmath\slmath\itmath\rmmath\alpha','color',[0.10.10.9],'fonts
Matlab在工业机器人中的运用,基于MATLAB的工业机器人建模与仿真.docx weixin_34518801
摘要：机器人运动系统作为机器人系统中最重要的组成部分之一，其重要性不言而喻，因为它影响着机器人的主要性能，因此为了提高机器人的质量，对机器人进行运动学分析和仿真是不可或缺的。本次毕业设计主要对KUKA机器人的三维仿真进行了一系列的分析，主要是以下几个内容：(1)研究了机器人运动学仿真的背景意义及发展趋势。(2)通过对齐次坐标变换理论的研究,说明了KUKA机器人结构及参数,并且建立了相应的D-H参数
matlab游标标注移动,matlab实现图形窗口的数据游标莫白想 matlab游标标注移动
DatacursorsforfigurewindowSeveralrelatedfunctions:CreateCursorsetsupaverticalcursoronallaxesinafigure.Thecursorscanbemovedaroundusingthemouse.MultiplecursorsaresupportedineachfigureGetCursorLocationre
MATLAB语言基础教程、小项目1：简单的计算器、小项目2：有页面的计算器、使用App Designer创建GUI计算器 azuredragonz 学习教程 matlab 开发语言
MATLABMATLAB语言基础教程1.MATLAB简介2.基本语法变量与赋值向量与矩阵矩阵运算数学函数控制流3.函数4.绘图案例：简单方程求解小项目1：简单的科学计算器功能代码项目说明小项目2：有页面的计算器使用AppDesigner创建GUI计算器主要步骤：完整代码（使用MATLAB编写）说明：如何运行：小项目总结MATLAB语言基础教程1.MATLAB简介MATLAB（矩阵实验室）是一种用于
MATLAB在无线通信系统测试和验证中的应用 2401_85812053 matlab 开发语言
在无线通信系统的开发过程中，测试和验证是确保系统性能满足设计要求的关键步骤。MATLAB提供了一系列的工具和功能，这些工具在无线通信系统的测试和验证中发挥着重要作用。本文将详细介绍MATLAB在无线通信系统测试和验证中的应用，包括信道建模、调制解调、射频（RF）链路分析以及硬件验证等方面。1.信道建模信道建模是无线通信系统设计中的关键环节，它影响着信号的传输质量和系统的整体性能。MATLAB提供了
MATLAB中的函数编写有哪些最佳实践 2401_85812053 matlab 算法人工智能
在MATLAB中，函数是执行特定任务的代码块，可以通过自定义函数来提高代码的可重用性和模块化。以下是一些关于MATLAB函数编写的最佳实践：函数结构和语法：MATLAB函数由函数名、参数列表和函数体组成。函数名必须以字母开头，后面可以跟字母、数字或下划线。参数列表包含函数接收的输入变量，用逗号分隔。函数体包含要执行的代码。functiony=my_function(x)%函数体y=x^2;end参
Python和MATLAB及C++信噪比导图(算法模型) 亚图跨际算法交叉知识 Python 视频图像修复模数转换信号链噪音频谱计算量化周期性视觉刺激高斯噪声的矩形脉冲心率失常检测算法
要点视频图像修复模数转换中混合信号链噪音测量频谱计算和量化周期性视觉刺激脑电图高斯噪声的矩形脉冲总谐波失真周期图功率谱密度各种心率失常检测算法胶体悬浮液跟踪检测计算交通监控摄像头图像噪音计算Python信噪比信噪比是科学和工程中使用的一种测量方法，用于比较所需信号水平与背景噪声水平。信噪比定义为信号功率与噪声功率之比，通常以分贝表示。高于1:1（大于0dB）的比率表示信号大于噪声。信噪比是影响处理
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
OpenAI o1 的价值意义及“强化学习的Scaling Law” & Kimi创始人杨植麟最新分享：关于OpenAI o1新范式的深度思考光剑书架上的书 ChatGPT 大数据AI人工智能计算人工智能算法机器学习
OpenAIo1的价值意义及“强化学习的ScalingLaw”蹭下热度谈谈OpenAIo1的价值意义及RL的Scalinglaw。一、OpenAIo1是大模型的巨大进步我觉得OpenAIo1是自GPT4发布以来，基座大模型最大的进展，逻辑推理能力提升的效果和方法比预想的要好，GPT4o和o1是发展大模型不同的方向，但是o1这个方向更根本，重要性也比GPT4o这种方向要重要得多，原因下面会分析。为什
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
含光热电站、有机有机朗肯循环、P2G的综合能源优化调度（Matlab代码实现）冒泡芳能源 matlab 开发语言
‍个人主页：研学社的博客欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述2运行结果3参考文献4Matlab代码实现1概述光热发电(concentratingsolarpower，CSP）是一种新型可再生能源发电技术，具有低碳发电和高效储能的优势，但当前光热电站常充当单一发电源进行能源供应，其供能潜力未得到充分
Day25_0.1基础学习MATLAB学习小技巧总结（25）——四维图形的可视化非常规定义M 0.1基础学习MATLAB 学习 matlab 开发语言 SIMULINK 数学建模
利用空闲时间把碎片化的MATLAB知识重新系统的学习一遍，为了在这个过程中加深印象，也为了能够有所足迹，我会把自己的学习总结发在专栏中，以便学习交流。参考书目：1、《MATLAB基础教程(第三版)(薛山)》2、《MATLABR2020a完全自学一本通》之前的章节都是基础的数据运算用法，对于功课来说更加重要的内容是建模、绘图、观察数据趋势，接下来我会结合自己的使用经验，来为大家分享绘图、建模使用的小
matlab时域离散信号与系统,时域离散信号和系统的频域分析远方有城 matlab时域离散信号与系统
信号与系统的分析方法有两种：时域分析方法和频域分析方法。在连续时间信号与系统中，信号一般用连续变量时间t的函数表示，系统用微分方程描述，其频域分析方法是拉普拉斯变换和傅立叶变换。在时域离散信号与系统中，信号用序列表示，其自变量仅取整数，非整数时无定义，系统则用差分方程描述，频域分析方法是Z变换和序列傅立叶变换法。Z变换在离散时间系统中的作用就如同拉普拉斯变换在连续时间系统中的作用一样，它把描述离散
基于matlab的离散系统变换域分析实验,实验3 离散时间系统的变换域分析 mmjang
电子科技大学实验报告学生姓名：项阳学号：2010231060011指导教师：邓建一、实验项目名称：离散时间系统的变换域分析二、实验目的：线性时不变(LTI)离散时间系统的特性可以用其冲击响应序列来表示，也可以用传递函数和频率响应来表示,本实验通过使用MATLAB函数对离散时间系统的一些特性进行仿真分析，以加深对离散时间系统的零极点、稳定性，频率响应等概念的理解。三、实验内容：1、设X1(z)23z
matlab上下标如何输入,在Matlab中怎样输入特殊符号或者上标、下标李一舟DESIGN matlab上下标如何输入
Matlab的text/title/xlabel/ylabel对象支持简单的TeX排版语法，如希腊字母，上下标等例如text(0.5,0.5,'\alpha^\beta_2');Matlab图形中允许用TEX文件格式来显示字符。使用\bf，\it，\rm表示黑体，斜体，正体字符，特别注意大括号{}的用法。实例：在存在的图形上写一段有黑体、有斜体、有整体的句子。1、画图x=0:0.01:8;y=si
matlab带下标的字母,matlab的特殊字符（上下标和希腊字母等）赤脚大仙儿 matlab带下标的字母
‘T=25\circC‘，(摄氏度)下标用_(下划线)上标用^(尖号)希腊字母等特殊字符用α\alphaβ\betaγ\gammaθ\thetaΘ\ThetaГ\Gammaδ\deltaΔ\Deltaξ\xiΞ\Xiη\eltaε\epsilonζ\zetaμ\miuυ\nuτ\tauλ\lamdaΛ\Lamdaπ\piΠ\Piσ\sigmaΣ\Sigmaφ\phiΦ\Phiψ\psiΨ\Psiχ
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
掌握MATLAB中的图形用户界面布局管理器原机小子 matlab 前端开发语言
在MATLAB中，图形用户界面（GUI）的设计对于创建专业且用户友好的应用至关重要。布局管理器在GUI设计中扮演着核心角色，它们负责在窗口中自动管理和调整控件的位置和大小。本文将详细介绍MATLAB中的布局管理器，包括它们的使用方法和实际代码示例。1.布局管理器的基本概念布局管理器是GUI设计中的一个关键组件，它允许控件根据窗口的大小变化自动调整布局。MATLAB提供了多种布局管理器，如网格布局（
Matlab2024a安装教程是阿宇呢信息可视化开发语言
MATLAB是一款商业数学软件，用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境，主要包括MATLAB和Simulink两大部分，可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等，主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。1.解压安装包：①鼠标右击【MATLABR2024a(64bit)
MATLAB中的控制系统工具箱：深入指南与实践应用 2401_85812026 matlab
MATLAB的控制系统工具箱（ControlSystemToolbox）是一个强大的工具集，它为工程师和研究人员提供了全面的控制系统设计、分析和仿真解决方案。本文将详细介绍如何在MATLAB中使用控制系统工具箱，包括系统建模、控制器设计、系统仿真和分析等方面。1.系统建模在控制系统工具箱中，可以通过多种方式对系统进行建模，包括状态空间模型、传递函数模型和零极点模型。1.1状态空间模型状态空间模型是
MATLAB中的代码覆盖测试：深入指南与实践应用 2401_85812026 matlab 开发语言
在软件测试领域，代码覆盖测试是一种重要的技术，用于评估测试用例的完整性和有效性。在MATLAB环境中，代码覆盖测试可以帮助开发者确保他们的代码在各种条件下都能正常工作，并且能够发现可能被忽视的错误。本文将详细介绍如何在MATLAB中进行代码覆盖测试，包括测试的类型、工具和实践方法。1.代码覆盖测试的基本概念代码覆盖测试旨在通过测试用例执行代码中的不同部分，以确保代码的每个部分都经过了验证。在MAT
连通无向图一般中心的算法及其matlab程序详解夏天天天天天天天# 图论算法 matlab 图论
#################本文为学习《图论算法及其MATLAB实现》的学习笔记#################若服务点只允许取在各顶点上,而服务对象却取在各顶点及各边(或弧)上的点,则在所有顶点中选定一个顶点作为图的一般中心其条件是该点离它本身的最远服务对象(包括顶点及各边(或弧)上的点)的距离达到极小值。寻找无向图的一般中心对解决网络最佳服务点确定的问题是十分有效的，使得服务对象的范围
基于matlab的水下航行器建模与仿真,水下自主航行器(AUV)建模仿真探究.doc 蒙眼说
水下自主航行器(AUV)建模仿真探究水下自主航行器(AUV)建模仿真探究【摘要】本文对鱼雷形状的水下自主航行器的六自由度非线性动态模型的研制作了较为详细的介绍。该动态模型充分考虑了各方面的因素，其中包括静水力学，超重，流体力学，操舵、推进力和力矩等。此外模型还考虑了航行器动力学和环境的影响。【关键词】水下自主航行器；建模；仿真研究1.引言水下自主航行体是一种重要的用于水下勘探的机器人，同时也是用于
MATLAB|基于多时段动态电价的电动汽车有序充电策略优化科研工作站电动汽车 matlab 电动汽车动态电价场景分析无序充电有序充电粒子群
目录主要内容模型研究一、蒙特卡洛模拟部分代码部分结果一览下载链接主要内容该模型参考文献《基于多时段动态电价的电动汽车有序充电策略优化》，采用蒙特卡洛随机抽样方法来模拟电动汽车无序充电状态下的负荷曲线，并设置三个对比算例--基础场景（无电动汽车）、电动汽车无序充电和电动汽车有序充电场景，有序充电场景以电网端负荷差最小和用户侧充电成本最经济为目标，通过粒子群算法进行求解，程序采用matlab+matp
2-91基于matlab的LQR倒立摆控制仿真 'Matlab学习与应用 matlab工程应用算法 LQR 倒立摆控制仿真 matlab
基于matlab的LQR倒立摆控制仿真。对于x=Ax+Bu和y=Cx+du标准方程，文件qiuk中用LQR函数求解控制数组K，将K值带入fangzhen文件中（文件中已代入），得到倒立摆稳定曲线。程序已调通，可直接运行。下载源程序请点链接：2-91基于matlab的LQR倒立摆控制仿真
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他