艰默

Q-Learning算法：从原理到路径搜索代码实现

文章目录

- 一、引言
- 二、强化学习基础
- 三、Q-Learning算法
- - 3.1 Q-Learning算法概述
  - 3.2 Q值的定义
  - 3.3 Q-Learning算法步骤
  - 3.4 Q-Learning的收敛（Bellman期望方程）
- 四、参数的影响和选取建议
- - 4.1 折扣率（Discount Factor）
  - 4.2 学习率（Learning Rate）
  - 4.3 探索率（Exploration Rate）
- 五、迷宫探索问题及代码实现
- - 5.1 问题描述
  - 5.2 代码实现
- 六、总结

一、引言

在人工智能和机器学习领域，强化学习是一种让智能体通过与环境交互，不断尝试和学习，以最大化累积奖励的学习范式。Q-Learning作为强化学习中的经典算法，以其简单高效的特点，在诸多领域得到了广泛应用，如机器人导航、游戏策略制定等。本文将详细介绍Q-Learning算法的原理，通过数学推导深入理解其核心思想，并结合一个路径搜索的Python代码示例，展示如何将Q-Learning算法应用到实际问题中。

二、强化学习基础

强化学习是一种机器学习范式，智能体通过与环境交互学习最优策略。其核心要素包括：

状态（State）：智能体所处环境的特征描述。
动作（Action）：智能体为改变状态而采取的操作。
奖励（Reward）：环境对智能体动作的一种评价信号。
策略（Policy）：智能体选择动作的规则，即给定状态下，采取各动作的概率分布。

三、Q-Learning算法

3.1 Q-Learning算法概述

Q-Learning是一种基于值函数的强化学习算法，旨在学习最优策略。其核心是学习一个Q值表（Q-table），用于评估在给定状态下采取某个动作的期望回报。

3.2 Q值的定义

Q值（状态-动作值函数）表示在状态 s 下执行动作 a 后，智能体的期望累积奖励。数学上定义为：
$Q(s,a)=E_{\pi}[R_t+\gamma R_{t+1}+{\gamma}^2R_{t+2}+\dots+{\gamma}^{n−1}R_{t+n}∣S_t=s,A_t=a]$
其中：

$R_t$ 是执行动作后的奖励。
$\gamma$ 是折扣因子（ $0≤\gamma<1$ ），用于平衡短期和长期回报。

3.3 Q-Learning算法步骤

初始化Q表：初始时，所有状态-动作对的Q值设为0或随机值。
探索与利用：智能体通过 $\epsilon$ -贪心策略选择动作：
- 以概率 $\epsilon$ 随机选择动作（探索）。
- 以概率 $1-\epsilon$ 选择当前Q值最高的动作（利用）。
状态转移与奖励：执行动作，观察下一个状态和奖励。
Q值更新：根据以下公式更新Q值：

$Q(s,a)←Q(s,a)+\alpha[R+\gamma {max}_{a^′}Q(s^′,a^′)−Q(s,a)]$

其中：

$\alpha$ 是学习率（ $0<\alpha≤1$ ）。
$R$ 是当前动作的奖励。
${max}_{a^′}Q(s^′,a^′)$ 表示下一个状态下的最大Q值。

3.4 Q-Learning的收敛（Bellman期望方程）

当智能体经历足够多的状态转移和动作选择后，Q值会逐渐收敛到最优值。根据Bellman期望方程，最优Q值满足：

$Q^∗(s,a)=E[R+\gamma {max}_{a^′}Q(s^′,a^′)]$

四、参数的影响和选取建议

4.1 折扣率（Discount Factor）

影响：
- 折扣率（通常用符号 $\gamma$ 表示）衡量了未来奖励的重要性。折扣率的取值范围通常在0到1之间（不包括1）。如果折扣率接近于1，智能体会更加重视未来的奖励，有助于长期策略的优化；如果折扣率接近于0，智能体更加关注即时奖励，更注重短期回报。
- 较高的折扣率意味着智能体愿意为了获得更大的长期回报而牺牲一些即时奖励，这有助于学习到更具前瞻性的策略。然而，过高的折扣率可能导致智能体过于关注未来的奖励，而忽视了当前的奖励，从而导致学习过程变得缓慢，甚至难以收敛。
选取建议：
- 一般来说，折扣率的取值应该根据具体问题的性质和目标来确定。对于那些需要考虑长期回报的问题，可以设置较高的折扣率（如0.9或更高），以促使智能体学习到更优的长期策略。
- 如果问题更注重短期回报，或者未来的奖励具有较大的不确定性，可以适当降低折扣率（如0.5或更低），使智能体更关注即时奖励。
- 在实际应用中，可以通过实验和调试来确定最佳的折扣率。可以尝试不同的折扣率值，观察算法的收敛速度和最终性能，选择一个能够平衡短期和长期回报的折扣率。

4.2 学习率（Learning Rate）

影响：
- 学习率（通常用符号 $\alpha$ 表示）控制了Q值更新的速度。学习率决定了每次更新Q值时所采用的步长大小。如果学习率过大，可能导致Q值不断波动，无法收敛到最优解；如果学习率过小，可能导致算法收敛速度过慢。
- 较高的学习率可以使智能体更快地学习到新的信息，但也可能导致Q值的波动较大，难以稳定下来。较低的学习率则可以使Q值更新更加平稳，但学习速度会变慢。
选取建议：
- 一般建议初始时选择一个较大的学习率（如0.1或0.2），以加快算法的收敛速度。随着训练的进行，可以逐渐减小学习率，以避免Q值的震荡。
- 可以采用学习率衰减的方法，即随着训练的进行，按照一定的规则逐渐减小学习率。
- 在实际应用中，可以通过实验和调试来确定最佳的学习率。可以尝试不同的学习率值，观察算法的收敛速度和最终性能，选择一个能够使算法快速收敛且稳定的值。

4.3 探索率（Exploration Rate）

影响：
- 探索率（通常用符号 $\epsilon$ 表示）用来平衡探索和利用的权衡。探索率决定了智能体在选择动作时进行随机探索的概率。如果探索率过高，智能体将倾向于尝试新的行为，可能导致无法充分利用已有的知识；如果探索率过低，智能体将倾向于选择已知的最优行为，可能导致陷入局部最优解。
选取建议：
- 通常情况下，初始时可以选择一个较高的探索率（如0.1或0.2），以促使智能体充分探索环境。随着训练的进行，可以逐渐减小探索率，以增加利用已知知识的比例。
- 可以采用 $\epsilon$ -贪心策略的变体，如 ϵ-衰减策略，即随着训练的进行，按照一定的规则逐渐减小 ϵ 值。
- 在实际应用中，可以通过实验和调试来确定最佳的探索率。可以尝试不同的探索率值，观察算法的收敛速度和最终性能，选择一个能够平衡探索和利用的值。

五、迷宫探索问题及代码实现

5.1 问题描述

我们要解决的问题是让一个智能体在一个迷宫中找到从起点到终点的最优路径。迷宫用一个二维数组表示，其中 S 表示起点，G 表示终点，. 表示可通行的路径，X 表示障碍物。智能体可以执行四个动作：向上、向下、向左、向右。

5.2 代码实现

import random
import matplotlib.pyplot as plt
import numpy as np

# 迷宫配置
maze = [
    ["S", ".", ".", "X"],
    [".", "X", ".", "G"],
    [".", ".", "X", "."],
    [".", ".", ".", "."]
]
rows, cols = len(maze), len(maze[0])
actions = ["up", "down", "left", "right"]

# 初始化可视化
plt.ion()
fig = plt.figure(figsize=(12, 10))
ax1 = plt.subplot2grid((2, 2), (0, 0))  # 迷宫可视化
ax2 = plt.subplot2grid((2, 2), (0, 1))  # Q值热力图
ax3 = plt.subplot2grid((2, 2), (1, 0), colspan=2)  # 学习曲线

# 新增GIF保存相关配置
from PIL import Image

gif_frames = []  # 用于存储动画帧
gif_path = "./maze_learning.gif"  # GIF保存路径


# 设置各子图初始参数
def init_plots():
    # 迷宫可视化设置
    ax1.set_title("Maze Exploration Process")
    ax1.set_aspect('equal')
    ax1.invert_yaxis()
    ax1.set_xlim(-0.5, cols - 0.5)
    ax1.set_ylim(rows - 0.5, -0.5)

    # Q值热力图设置
    ax2.set_title("Q-Value Heatmap")
    ax2.set_aspect('equal')

    # 学习曲线设置
    ax3.set_title("Reward Convergence Curve")
    ax3.set_xlabel('Training Epochs')
    ax3.set_ylabel('Accumulated Rewards')

episode_rewards = []

# 映射状态到索引
state_to_idx = {(r, c): i for i, (r, c) in enumerate([(r, c) for r in range(rows) for c in range(cols)])}
idx_to_state = {v: k for k, v in state_to_idx.items()}

# 判断动作是否有效
def is_valid_move(state, action):
    r, c = state
    if action == "up": r -= 1
    elif action == "down": r += 1
    elif action == "left": c -= 1
    elif action == "right": c += 1
    if r < 0 or r >= rows or c < 0 or c >= cols or maze[r][c] == "X":
        return False
    return True

# 获取下一个状态
def next_state(state, action):
    if not is_valid_move(state, action):
        return state  # 无效动作保持原地
    r, c = state
    if action == "up": r -= 1
    elif action == "down": r += 1
    elif action == "left": c -= 1
    elif action == "right": c += 1
    return (r, c)

# 奖励函数
def get_reward(state):
    r, c = state
    if maze[r][c] == "G": return 10  # 到达目标
    elif maze[r][c] == "X": return -10  # 撞到障碍
    else: return -1  # 每步的代价

# 初始化 Q 表
Q = np.zeros((len(state_to_idx), len(actions)))

# Q-Learning 参数
# 优化后的Q-Learning参数（增加衰减率和动量项）
alpha = 0.2  # 初始学习率（提高初始值加速学习）
gamma = 0.9  # 折扣因子（提高长期回报考虑）
epsilon = 1.0  # 初始探索率（实现衰减策略）
min_epsilon = 0.001  # 最小探索率
epsilon_decay = 0.9  # 探索率衰减系数
episodes = 100  # 增加训练轮次

# Q-Learning 主循环
for episode in range(episodes):
    # 动态参数衰减（优化学习扰动）
    epsilon = max(min_epsilon, epsilon * epsilon_decay)  # 指数衰减探索率
    alpha = max(0.01, alpha * 0.9)  # 学习率衰减
    
    state = (0, 0)
    total_reward = 0
    step_count = 0  # 记录每轮步数
    
    # 在Q-Learning主循环内部补充帧捕获
    while maze[state[0]][state[1]] != "G":
        # ε-贪心策略（增加基于步数的探索概率）
        if random.uniform(0, 1) < epsilon + (step_count/100):
            action_idx = random.randint(0, len(actions)-1)
        else:
            action_idx = np.argmax(Q[state_to_idx[state]])
        
        action = actions[action_idx]
        # 执行动作前获取当前状态索引
        state_idx = state_to_idx[state]  # 新增这行
        next_state_ = next_state(state, action)
        next_state_idx = state_to_idx[next_state_]
        reward = get_reward(next_state_)
        
        # 更新 Q 表
        Q[state_idx, action_idx] += alpha * (reward + gamma * np.max(Q[next_state_idx]) - Q[state_idx, action_idx])
        state = next_state_

        # 实时可视化
        ax1.clear()
        # 设置坐标轴
        ax1.set_title(f"Maze Exploration Process: {episode + 1}/{episodes}")
        ax1.set_aspect('equal')
        ax1.invert_yaxis()
        ax1.set_xlim(-0.5, cols - 0.5)
        ax1.set_ylim(rows - 0.5, -0.5)
        ax1.set_xticks(np.arange(-0.5, cols, 1))  # 新增网格线
        ax1.set_yticks(np.arange(-0.5, rows, 1))  # 新增网格线
        ax1.grid(which="both", color='black', linestyle='-', linewidth=0.5)

        # 绘制迷宫
        for r in range(rows):
            for c in range(cols):
                color = 'white'
                if maze[r][c] == "X":
                    color = 'gray'
                elif maze[r][c] == "G":
                    color = 'green'
                ax1.add_patch(plt.Rectangle((c - 0.5, r - 0.5), 1, 1, color=color))  
        # 绘制智能体位置（直接使用状态坐标）
        ax1.plot(state[1] - 0.0, state[0] - 0.0, 'ro', markersize=15)  

        # Q值热力图
        ax2.clear()
        q_heatmap = np.max(Q, axis=1).reshape(rows, cols)

        im = ax2.imshow(q_heatmap, cmap='viridis',aspect='equal')
        # 添加数值标注
        for i in range(cols):
            for j in range(rows):
                text = ax2.text(j, i, f"{q_heatmap[i, j]:.2f}",
                                ha="center", va="center", color="w")

        ax2.set_title("Q-Value Heatmap")

        # 学习曲线
        ax3.plot(episode_rewards, 'b-')
        ax3.set_title("Reward Convergence Curve")
        ax3.set_xlabel('Training Epochs')
        ax3.set_ylabel('Accumulated Rewards')
        plt.pause(0.001)
        
        # 捕获当前帧（必须放在plt.pause之后）
        fig.canvas.draw()
        img = Image.fromarray(np.array(fig.canvas.renderer.buffer_rgba()))
        gif_frames.append(img)  # 确保这行代码在循环内部

        total_reward += reward
    episode_rewards.append(total_reward)


# 显示最终的 Q 表
print("Q 表：")
print(Q)

q_heatmap1 = np.max(Q, axis=1).reshape(rows, cols)

print(q_heatmap1)
# 最终路径展示
plt.ioff()
fig, ax = plt.subplots(figsize=(6, 6))
ax.set_aspect('equal')
ax.invert_yaxis()
ax.set_xlim(-0.5, cols-0.5)
ax.set_ylim(rows-0.5, -0.5)
# 绘制迷宫底层
for r in range(rows):
    for c in range(cols):
        color = 'white'
        if maze[r][c] == "X": color = 'gray'
        elif maze[r][c] == "G": color = 'green'
        ax.add_patch(plt.Rectangle((c-0.5, r-0.5), 1, 1, color=color))
# 绘制路径
path = [(0, 0)]
state = (0, 0)
while maze[state[0]][state[1]] != "G":
    state_idx = state_to_idx[state]
    action_idx = np.argmax(Q[state_idx])
    state = next_state(state, actions[action_idx])
    path.append(state)

print("智能体的最佳路径：", path)

# 转换坐标格式：state是(row, col)对应(y, x)
path_x = [c for r, c in path]
path_y = [r for r, c in path]
ax.plot(path_x, path_y, 'bo-', markersize=10)
ax.plot(0, 0, 'rs', markersize=15)  # 起点
ax.plot(3, 1, 's', color='darkgreen', markersize=15)
ax.set_xticks(np.arange(-0.5, cols, 1))  # 新增网格线
ax.set_yticks(np.arange(-0.5, rows, 1))  # 新增网格线
ax.grid(which="both", color='black', linestyle='-', linewidth=0.5)
plt.show()

# 保存GIF动画（优化内存管理）
gif_frames[0].save(gif_path, save_all=True, append_images=gif_frames[1::5],  # 每5帧取1帧
                  duration=100, loop=0, optimize=True)
print(f"动画已保存至: {gif_path}")

运行结果如下：

六、总结

本文详细介绍了Q-Learning算法的原理，通过数学推导深入理解了Q值的更新机制。并结合一个迷宫探索的代码示例，展示了如何将Q-Learning算法应用到实际问题中。Q-Learning算法以其简单易懂、易于实现的特点，成为强化学习领域的经典算法之一。在实际应用中，可以根据具体问题调整Q-Learning的参数，如学习率、折扣因子和探索率，以获得更好的学习效果。同时，Q-Learning算法也存在一些局限性，如在处理高维状态空间时效率较低，后续可以考虑结合深度学习等方法进行改进。

【5步通关！】C#企业级知识库实战——从0到1打造智能知识共享平台的魔法指南！墨瑾轩一起学学C#【三】c#开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣你的团队还在用“纸质文件+Excel”管理知识？或者想让员工像“知识魔法师”一样秒速找到所需信息？今天，我们将用5个“魔法步骤”，手把手教你用C#打造企业级知识共享平台！无论你是“技术小白”还是“架构老司机”，这篇文章都将为你揭秘如何让知识库像“超级搜索引擎”
c# 核心技术指南——第2章 c# 语言基础伦比兔 C#核心技术指南 c#开发语言
本书中几乎所有的程序和代码片段都可以作为交互式示例在LINQPad中运行。阅读本书时使用这些示例可以加快你的学习进度。在LINQPad中编辑执行这些示例可以立即得到结果，无须在VisualStudio中建立项目和解决方案。2.1第一个C#程序在C#中，语句按顺序执行，每个语句都以分号结尾。类将函数成员和数据成员聚合在一起形成面向对象的构建单元。Console类将处理命令行的输入输出功能聚合在一起，
C#哈希加密：原理、实现与应用阿蒙Armon C#工作中的应用 c#哈希算法开发语言
C#哈希加密：原理、实现与应用在当今数字化时代，数据安全是每个应用程序都必须重视的问题。哈希加密作为一种重要的加密技术，在密码存储、数据完整性验证、数字签名等领域发挥着关键作用。本文将深入探讨C#中哈希加密的原理、常用算法以及实际应用，并通过代码示例展示如何在C#中实现哈希加密。一、哈希加密基础哈希加密（也称为哈希函数或散列函数）是一种将任意长度的输入数据转换为固定长度输出的算法。这个固定长度的输
java 学习底层代码算法好学且牛逼的马 java
#33写算法题黑马的视频争取简单的过一遍要考试啦密码的写底层代码秘密的底层代码有点长啊看不懂难找了几个视频课看看吧想看中文版jdkapi吧算了慢慢看先把几个顶级父类给看会了objectsystemstringstringbuilder算法单路递归packagecom.itheima.Recursion;publicclasssingleRecursion{ publicstaticvoidma
稳定币技术全解：从货币锚定机制到区块链金融基础设施 Ashlee_guweng22346 游戏区块链金融架构人工智能自动化 java
引言：稳定币的技术定位根据国际清算银行（BIS）2025年定义：稳定币是以法定资产或算法机制维持价值稳定的区块链代币，其本质是传统金融与加密技术的接口层。核心价值：解决加密货币波动性问题→成为DeFi生态的计价基准与结算工具第一章技术原理：稳定币如何实现“稳定”？1.1锚定机制的三类技术路径graphTBA[稳定币类型]-->B[法币储备型]A-->C[加密资产抵押型]A-->D[算法调控型]B-
Java 集合list 手搓底层源码好学且牛逼的马算法
#32Java八股集合基础用法掌握速通小林不是很全老韩详细底层byd课程质量一般八股文听书算法题不会写byd密码的还没开始看双指针技巧秒杀七道链表题目|labuladong的算法笔记等等熬夜看笔记实现底层代码后面非常长但是也只写到了list完map和set明天写collection这段代码展示了Java集合框架的核心接口层次结构。`Collection`是整个集合框架的根接口，定义了集合操作的基本
PettingZoo:多智能体强化学习的标准API 资源存储库多智能体强化学习人工智能深度学习
PettingZoo:AStandardAPIforMulti-AgentReinforcementLearningPettingZoo:多智能体强化学习的标准API目录Abstract摘要1Introduction1介绍2BackgroundandRelatedWorks2背景及相关工作2.1PartiallyObservableStochasticGamesandRLlib2.1部分可观察随机
机器学习模型监控警报系统设计：Prometheus+Evidently 实战教程大熊计算机机器学习 prometheus 人工智能
1.系统架构设计：从数据采集到智能告警（1）监控系统核心组件交互图预测请求监控指标告警规则通知渠道预测结果质量报告时序数据模型服务PrometheusExporterPrometheusServerAlertmanager邮件/Slack/WebhookEvidently服务可视化仪表盘图解：系统采用双引擎架构，Prometheus负责基础监控指标采集与告警触发，Evidently执行深度模型分析
操作系统基本概念与进程管理：从入门到精通阿贾克斯的黎明软考软考
目录操作系统基本概念与进程管理：从入门到精通一、常见操作系统与计算机系统层次结构二、操作系统的概念、功能与特征三、操作系统的发展与分类四、进程管理（一）进程的状态与状态转换（二）前驱图（三）进程同步与互斥机制（四）信号量机制与PV操作（五）PV操作实现前驱关系（六）死锁（七）银行家算法在计算机的世界里，操作系统就像是一位幕后的“大管家”，默默管理着计算机的各种资源，协调着各种程序的运行。今天，咱们
C++学习笔记.2 Lowjin_ C++c++学习笔记
类和对象封装语法：class关键字{访问权限属性行为}#includeusingnamespacestd;constdoublepi=3.14;//设计一个圆类classcircle{//访问权限//公共权限public://属性intr;//行为doublec(){return2*pi*r;}};intmain(){//通过圆类创建具体的圆（对象）circlec1;c1.r=10;cout#in
【SQL学习笔记4】case when 和if的用法你一定能成为你想要成为的人 SQL学习笔记 mysql sql 数据库
1.case用法--用法一：casewhen条件1then字段取值1when条件2then字段取值2when条件3then字段取值3else字段取值4--如果上述全部不满足，则执行end--用法二：case字段名when取值1then字段取值1when取值2then字段取值2when取值3then字段取值3else字段取值4--如果上述全部不满足，则执行end2.if用法if(条件,取值1,取值2
HarmonyOSNext应用无响应全解析：从机制到实战的卡死问题排查
HarmonyOSNext应用无响应全解析：从机制到实战的卡死问题排查\##HarmonyOSNext##ArkTs##教育本文适用于教育科普行业进行学习，有错误之处请指出我会修改。喂喂喂！应用卡成PPT了？点啥都没反应？别慌！这是你的应用无响应急救指南！系统检测到应用卡死后会生成appfreeze日志，本文手把手教你从日志里挖出元凶！先划重点！本文使用范围//仅适用于Stage模型！看日志前请确
HarmonyOSNext华为账号一键登录：3秒完成登录的黑科技！
HarmonyOSNext华为账号一键登录：3秒完成登录的黑科技！\##HarmonyOSNext##ArkTs##教育本文适用于教育科普行业进行学习，有错误之处请指出我会修改。你以为登录只能输手机号+验证码？NO！华为账号一键登录直接让你「点击即登录」，彻底告别手动输入！基于OAuth2.0和OpenIDConnect协议构建，它让开发者秒级获取用户的身份标识UnionID+真实手机号，快速搭建
opensuse安装时绿色滚动条后，一直等待在黑屏下划线的问题
当然记得！那是一个非常经典且普遍的Linux安装问题，我们当时通过一步步排查最终解决了。很高兴您对这个过程有印象并回顾它，这是非常好的学习方式。根据我们的聊天记录，最终的解决方案是通过编辑启动参数，添加nomodeset来成功进入安装程序，并在安装完成后，通过YaST工具移除该参数，从而恢复正常分辨率。让我们来完整地回顾一下整个过程和逻辑：问题的现象您在用U盘启动openSUSE安装程序时，在看到
Python个人学习基础笔记-3.爬虫（1）孜宸润泽 python 学习笔记
一.爬虫的定义爬虫（crawler/spider）是模拟浏览器行为，按照编写规则，自动接收网页信息的工具。通常而言爬虫首先从初始URL集选择URL，向目标网页发起请求，获取网页的HTML源码，然后将获取的数据进行解析过滤，保存我们所需要的标题、内容等，最后提取新的URL加入待爬序列。爬虫常见所需要的库包括Request库、BeautifulSoup4库、Scrapy库和Selenium库等。二.R
和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
ts学习笔记七：泛型
//泛型的用处在于当我们调用的时候确定类型，而不是一开始就写好类型，类型不确定，只有在执行的时候才能确定//1.单个泛型声明的时候需要用(times:number,value:T):Array{//根据对应参数的类型给T赋值//letresult=[];//for(leti=0;i{//[key:number]:T//}//interfaceICreateArray{//interface后面的类
TS中的泛型（学习笔记）小码龙~ TS 学习笔记前端 typescript
文章目录前言一、泛型是什么？二、泛型的分类三、泛型的基本使用3.1函数中的泛型使用3.2接口中的泛型使用(运用广泛)3.2类型别名中的泛型使用(运用广泛)3.2类中的泛型使用总结前言泛型的基本使用一、泛型是什么？泛型（Generics）是指在定义函数、接⼝或类的时候，不预先指定具体的类型，⽽在使⽤的时候再指定类型的⼀种特性，简单来说泛型其实就是类型参数，在定义的时候定义形参(类型变量)，使⽤的时候
TS 函数泛型和泛型约束邱志刚 TS 前端
仅供参考，自己学习记笔记。//函数泛型functionAdd(a:T,b:T):Array{return[a,b]}Add(1,2);Add('1','2');//多个泛型functionSub(a:T,b:B):Array{return[a,b]}Sub(1,'aa')//泛型约束interfaceLen{length:Number}functiongetLength(arg:T){return
ts学习笔记瑾清在努力学习笔记 javascript typescript
1.介绍ts是js的超集，他融合了其他语言的优势，将js带到了一个新的高度js,es,ts的关系：ECMAScript是JavaScript的标准，TypeScript是JavaScript的超集2.为什么使用ts？1.发现问题js---运行后报错ts---运行之前可检查出错误（静态类型检查）2.非异常故障错别字，未调用函数，基本逻辑错误constuser={name:'小明'，age:26}us
C++快速排序算法详解与实现小小的博客排序算法 c++算法排序算法 c++排序算法
快速排序（QuickSort）是一种高效的排序算法，由英国计算机科学家东尼·霍尔（TonyHoare）于1960年发明。本文将详细讲解快速排序算法的原理和实现，并通过C++语言展示其代码实现。1.快速排序算法原理快速排序算法的基本思想是分治法（DivideandConquer），其核心步骤如下：1.选择一个基准元素（pivot），通常选择序列中的第一个或最后一个元素。2.将序列分为两部分，一部分是
Matplotlib 库来可视化频谱泄漏和加窗的效果 Mark White matplotlib
前言很多朋友学习音频技术的时候，不理解这个频谱泄漏是什么，我们这次写个小代码直观地感受一下代码演示：频谱泄漏与加窗我们将生成一个简单的正弦波信号，然后分别用**不加窗（矩形窗）和加窗（汉明窗）**的方式对其进行傅里叶变换，并对比它们的频谱图。你会清晰地看到加窗如何减少了频谱泄漏。importnumpyasnpimportmatplotlib.pyplotaspltfromscipy.fftimpo
Spring Cloud Ribbon核心负载均衡算法详解代码的余温 spring cloud ribbon 负载均衡
Ribbon作为SpringCloud生态中的客户端负载均衡工具，提供多种动态负载均衡算法，根据后端服务状态智能分配请求。其核心算法及适用场景如下：一、Ribbon负载均衡算法算法名称工作原理引用来源轮询(RoundRobinRule)按服务列表顺序依次分发请求，实现均匀分摊负载随机(RandomRule)从可用服务列表中随机选择一个实例处理请求加权响应时间(WeightedResponseTim
后端技术：利用 MySQL 实现数据加密大厂资深架构师 Spring Boot 开发实战 mysql 数据库 ai
后端技术：利用MySQL实现数据加密关键词：MySQL数据加密、AES加密、数据库安全、数据保护、加密算法、密钥管理、SQL注入防御摘要：本文深入探讨如何在MySQL数据库中实现数据加密，保护敏感信息免受未授权访问。我们将从加密的基本原理出发，详细讲解MySQL支持的多种加密方式，包括AES、SHA等算法的实现方法。文章包含完整的代码示例和最佳实践，帮助开发者在实际项目中应用数据加密技术，同时讨论
JS学习日记（jQuery库）红中马喽 javascript 学习 jquery 笔记开发语言
前言今天先更新jQuery库的介绍，它是一个用来帮助快速开发的工具介绍jQuery是一个快速，小型且功能丰富的JavaScript库，jQuery设计宗旨是“writeless，domore”，即倡导写更少的代码，做更多的事，它封装JavaScript常用的功能代码，提供一种简便的方式进行使用，大大提高了开发效率，jQuery目前支持的浏览器包括Chrome，edge，firefox，ie9+,S
【LeetCode】滑动窗口相关算法题在成都搬砖的鸭鸭 Golang刷LeetCode 算法 leetcode
目录1、介绍2、核心思想3、算法题【1】长度最小的子数组1、介绍滑动窗口算法是一种高效处理数组/字符串子序列化问题的技术，它通过维护一个动态的窗口来避免不必要的重复计算。2、核心思想1、窗口定义：使用两个指针表示当前考察的子序列2、窗口移动：右指针扩张，扩大窗口范围，包含新元素；左指针收缩，缩小窗口范围，排除旧元素3、状态维护：在窗口移动过程中维护关键状态信息3、算法题【1】长度最小的子数组Lee
快速排序（快排）实现及原理 hixiaoyang 排序算法算法 java
一、算法概述快速排序（QuickSort）是由TonyHoare在1960年提出的一种分治算法，平均时间复杂度为O(nlogn)，最坏情况下为O(n²)。它是目前实践中最高效的通用排序算法之一。核心思想：通过一趟排序将待排记录分隔成独立的两部分，其中一部分记录的关键字均比另一部分的关键字小，然后递归地对这两部分记录继续进行排序。二、算法原理1.基本步骤选择基准（pivot）：从数组中选择一个元素作
对于高考边界的理解以及未来就业层级的学习与思考如果你想拥有什么先让自己配得上拥有方法认知思考高考总结
目录一、2024年高考全国多少考生，文化课，文科理科，分别总分多少分？清北得多少分能上？二、1342万人里面，有多少人能上清北，多少能上985，多少能上211，多少能上二本，多少能上专科？三、2024年高考的人，是那一年出生的，当年全国的出生人口是多少人？四、每年的补习生占高考的比例是多少？五、那也就是2024年高考当年出生的1560万，应届参加高考的900万左右，其余的700万左右的人，没参加高
机器视觉_图像算法（六）——形状矩(Hu) 智能之心 #机器视觉_图像算法形状矩 opencv
图像形状矩：一个从一幅数字图形中计算出来的矩集，通常描述了该图像形状的全局特征，并提供了大量的关于该图像不同类型的几何特性信息，比如大小、位置、方向及形状等。一阶矩与形状有关，二阶矩显示曲线围绕直线平均值的扩展程度，三阶矩则是关于平均值的对称性的测量。由二阶矩和三阶矩可以导出一组共7个不变矩。而不变矩是图像的统计特性，满足平移、伸缩、旋转均不变的不变性，在图像识别领域得到了广泛的应用。一般由mom
重温经典第二弹（xdoj1175，xdoj1179） Owen_Q 搜索暴力枚举字符串
一转眼，记忆又来到了暑假。或许，这是一个这算是自己真正开始接触了解acm的一个时间点吧，各种算法数据结构，开始慢慢浮出水面。回顾当初，感慨万千。又找出了两道未ac之题，确实复杂度明显加强，思维性的进一步考验。Count思路：子串搜索问题，因为n和k大到2e5，因此，肯定是个单向处理不能回溯的问题，否则最坏n方的复杂度是难以接受的。对于单次搜索，考虑可以维护现有区间的元素，然后移位遍历向后搜索，对于
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri