zachary2wave

OPENAI-Baeslines-详解（二）-DQN中文

Zee带你看代码系列

学习强化学习，码代码的能力必须要出众，要快速入门强化学习搞清楚其中真正的原理，读源码是一个最简单的最直接的方式。最近创建了一系列该类型文章，希望对大家有多帮助。
传送门
另外，我会将所有的文章及所做的一些简单项目，放在我的个人网页上。
水平有限，可能有理解不到位的地方，希望大家主动沟通交流。
邮箱：[email protected]

Thanks for reading, and enjoy yourself

DQN

2013年，DQN算法被提出，奠定了深度学习与强化学习相结合的基础，此后各种DRL算法层出不穷。作为旷世之作，各种文章分析已经非常多，包括其变种算法：dueling DQN、Double DQN、continuous DQN。

比较推荐的2个教程：

莫凡周的DQN教程

CSDN的DQN博客

算法部分

Q Learing算法

Q_learning算法是值函数的经典算法之一，其利用估计动作值函数，然后选择最好的动作。该算法利用时序差分的方式来更新Q值函数：

DQN算法

DQN算法利用神经网络去拟合Q函数，面临3个问题：RL样本不独立、RL分布变化、RL样本没标签。

主要靠2个Trick：

1、经验回放：从经验池中挑选出使得 RL样本互相无关，并且可以学总体概率分布。

2、标签构造-传统训练神经网络的时候是一个监督学习过程，需要标签，DQN将标签构造为
$R_{t+1}+\gamma \max _{a} Q\left(S_{t+1}, a\right)$
利用一个网络main-net 去计算当前的 $Q\left(S_{t}, a\right)$ 用另一个网络target-net 去计算 $Q\left(S_{t+1}, a\right)$ . 这样就可以得到神经网络的训练误差LOSS：
$Q\left(S_{t}, a\right)-(R_{t+1}+\gamma \max _{a} Q\left(S_{t+1}, a\right))$
利用该误差去更新网络参数，最后求得准确的Q值。
target-net的更新都是利用mainnet的参数，更新方式有两种，一种是软更新，即：

Var_tar = $(1-\alpha)$ Var_tar + $\alpha$ Var_main

一种是硬更新，即在多少次迭代之后将Var_main 直接赋值给 Var_tar。

其中Var_tar 为target_net 的参数， Var_main为main_net的参数。

double DQN

double DQN 是为了解决神经网络过拟合的问题。
引用原论文中的例子，来简单说明一下过拟合。首先有一个函数 $Q_*\left(S_{t}, a\right)=2exp（-s^2）$ ，我们通过与环境交互得到了一些状态和动作，假设我们已经知道这些Q值都是正确的Q值。那么利用现在采样的数据去拟合Q函数，然后才可以得到其他状态下的Q值函数。如果尝试用分别用6阶多项式和9阶来进行拟合的时候，上图为6阶拟合明显看出这里没有拟合好，下图为9阶拟合，可以看出过拟合的情况。

其实，神经网络是具有非线性激活函数的多项式。那么可以想到，面对一个环境是寻找一个合适的神经网络也是非常困难的。

所以针对这个问题，2015年 Deep Mind 的Hado van Hasselt 等几个人在文章提出了double DQN网络。具体实现就是在选择 $Q\left(S_{t+1}, a\right)$ 的时候不在利用target net动作a 而是利用main net 的动作a。这样很大程度上避免了每次都选择最大的Q值动作。

更深层次的原理，请移步深度解读系列。
$Y_{t}^{\text {Double } Q} \equiv R_{t+1}+\gamma Q\left(S_{t+1}, \underset{a}{\operatorname{argmax}} Q\left(S_{t+1}, a ; \boldsymbol{\theta}_{t}\right) ; \boldsymbol{\theta}_{t}^{\prime}\right)$

Dueling DQN

2016年Deep Mind 在此基础上又提出了 Dueling DQN，Dueling DQN的主要思路是在实际的环境中，没有必要估计每个操作Q值。所以Dueling DQN用一种更为直接的方式去解决了这个问题，就是用同一个网络的做多输出的状态，其中上面一个输出口作为状态的V值输出，下面的输出口作为每一个动作的Q值输出。
$\theta, \alpha, \beta)=V(s ; \theta, \beta)+A(s, a ; \theta, \alpha)$
上面的 $\theta$ 代表的是前面层网络的输出， $\alpha$ $\beta$ 分别是输出V值和A值的全连接网络层。

调用DQN

在OPENAI-Baeslines-详解（一）中已经有说明，这里具体说一下 DQN与其他的调用的不同。

参数方便，DQN有一些特殊的超参数，需要调整。

普通参数：

env,              # 所要训练的环境  一般为env=gym.make('envID')
network,          # 字符串 'mlp'等几个 ，或者自己建立的网络。
seed=None,        # 随机种子
total_timesteps=100000, # 总训练步数
train_freq=1,           # 总训练的频率，也就是每隔几步一训练
print_freq=100,         # 在运行中多少步 输出一次训练结果
**network_kwargs        # 网络构建参数
checkpoint_freq=10000,  # 多少步保存一次网络参数
checkpoint_path=None,   #
param_noise=False,      # 参数噪声
callback=None,          # 调用的callback
load_path=None,         # 调用

算法超参数

lr=5e-4                     # 学习率
exploration_fraction=0.1,   # 探索退火率
exploration_final_eps=0.02, # 探索最小值
learning_starts=1000,       # 从什么步数开始学习    
gamma=1.0,                  # 公式（1）中的参数gamma
target_network_update_freq=500,  # 硬更新的时候多少步更新一次

经验池参数

包含优先经验回放（参考文章）[https://arxiv.org/abs/1511.05952]

batch_size=32,                      # 每次选用的batch 是多大
buffer_size=50000,                  # 训练池大小
prioritized_replay=False,           # 优先经验回放 
prioritized_replay_alpha=0.6,
prioritized_replay_beta0=0.4,
prioritized_replay_beta_iters=None,
prioritized_replay_eps=1e-6,

训练参数

除了上面呢些还有一些需要在deep单独的参数需要设定。分别在下面程序部分进行说明。

DQN程序部分

DQN的程序主要是有以下几个部分：

Deepq：主程序, 创建与环境交互循环，调用build_graph创建训练器和
build_graph：由于策略固定，所以只需要DQN只包含一个神经网络用于估计Q值，然后直接输出动作，所以整个过程只需要一个actor 输入为状态输出为动作。根据这个过程需要创建几个函数不同的函数
- 总函数 build_train
- 子函数 build_act 创建不带噪声的动作
- 子函数 build_act_with_param_noise 创建带噪的动作
Models：创建神经网络模型
replay_buffer: 经验池

整个流程是这样的的

一、Run 调用Deepq中的 learning 建立agent。

Learning 调用 deepq.model 建立神经网络。
- deepq.model根据 common中models建立神经网络的输入层和隐层，
- 利用 build_q_function 函数建立输出层（这里可以增加duelingDQN）从而形成完整的神经网络。
利用build_grapgh 中的build_act函数建立状态到 action的映射函数actor，在这里将确定性的动作选择变为随机动作
反向传播的trainer ，在这里增加正则化和 double DQN

二、利用建立好的agent 进行训练（在learning内部）

三、测试

附：tf_util.function说明

function(inputs, outputs, updates=None, givens=None)

input、output都是tf.tensor updates是在输入input 之后直接计算出 output 后利用update提供的 loss 反向传播更新神经网络参数。

Deepq

193行，进行步骤一

202行，调用子程序build_graph 建立agent

Models-build_q_func

network                # 网络模型 
hiddens=[32]           # 隐层
dueling=True,          # 是否利用dueling DQN
layer_norm=False       # 隐层normalize
**network_kwargs       # 其他网络参数
### deepq-learner

输入 ：

make_obs_ph ：状态名称用于创建 placeholder
q_func： Q函数的神经网络
num_actions：状态数
optimizer ：优化器
grad_norm_clipping：梯度剪裁
gamma：公式1 中的 gamma
double_q：是否利用 double Q算法
param_noise：参数噪声

输出 ：

act_f #动作输出函数
train #训练函数
update_target # target 更新函数


#####  正向传播 act_f   函数

act_f   函数 直接调用子函数 build_act 或者 build_act_with_param_noise 生成

```python

# 创建placeholder 
# 177~183行in build_act  239 ~ 243 行 in build_act_with_param_noise 
observations_ph = make_obs_ph("observation")
stochastic_ph = tf.placeholder(tf.bool, (), name="stochastic")
update_eps_ph = tf.placeholder(tf.float32, (), name="update_eps")
# 创建神经网络
q_values = q_func(observations_ph.get(), num_actions, scope="q_func")
# 选择动作  184行 in build_act  294行 in build_act
deterministic_actions = tf.argmax(q_values, axis=1) # 确定性动作
random_actions = tf.random_uniform(tf.stack([batch_size]), minval=0, maxval=num_actions, dtype=tf.int64)  
chose_random = tf.random_uniform(tf.stack([batch_size]), minval=0, maxval=1, dtype=tf.float32) < eps
stochastic_actions = tf.where(chose_random, random_actions, deterministic_actions)  # 随机性动作

# 网络更新  191 行 in build_act   301行 in build_act
output_actions = tf.cond(stochastic_ph, lambda: stochastic_actions, lambda: deterministic_actions)
        update_eps_expr = eps.assign(tf.cond(update_eps_ph >= 0, lambda: update_eps_ph, lambda: eps))

# 利用function 更新 193 行 in build_act   308行 in build_act
_act = U.function(inputs=[observations_ph, stochastic_ph, update_eps_ph],
                         outputs=output_actions,
                         givens={update_eps_ph: -1.0, stochastic_ph: True},
                         updates=[update_eps_expr])

反向传播-train 函数

# 估计当前Q值 
q_t = q_func(obs_t_input.get(), num_actions, scope="q_func", reuse=True)  # reuse parameters from act
q_func_vars = tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES, scope=tf.get_variable_scope().name + "/q_func")

# 估计目标Q值
q_tp1 = q_func(obs_tp1_input.get(), num_actions, scope="target_q_func")
target_q_func_vars = tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES, scope=tf.get_variable_scope().name + "/target_q_func")
q_t_selected = tf.reduce_sum(q_t * tf.one_hot(act_t_ph, num_actions), 1)
q_tp1_best = tf.reduce_max(q_tp1, 1)
q_tp1_best_masked = (1.0 - done_mask_ph) * q_tp1_best

# 公式 1  
q_t_selected_target = rew_t_ph + gamma * q_tp1_best_masked
# LOSS 公式2 
td_error = q_t_selected - tf.stop_gradient(q_t_selected_target)
# 创建 train
train = U.function(inputs=[
                obs_t_input,
                act_t_ph,
                rew_t_ph,
                obs_tp1_input,
                done_mask_ph,
                importance_weights_ph
            ],
            outputs=td_error,
            updates=[optimize_expr]
        )
update_target = U.function([], [], updates=[update_target_expr])

q_values = U.function([obs_t_input], q_t)

DQN结果部分

在最后会得到的文件中会记录 3个部分

| % time spent exploring | 80 |
| episodes | 100 |
| mean 100 episode reward | -200 |
| steps | 1.98e+04 |

分别代表多少个回合平均奖励和总步数。

你可能感兴趣的:(baseline)

android——热修复（补丁）
打包补丁流程1.生成基准包(baselineapk)首先需要生成一个基准包，后续的补丁都是基于这个基准包生成的：./gradlewassembleRelease生成的基准包位于app/build/bakApk/目录下。2.修改代码修复bug或进行其他修改后，确保只修改了代码而没有新增或删除资源文件（Tinker对资源文件的修改有限制）。3.配置补丁信息(由于已经配置到单独文件，所以此步可省略)在a
基线定位系统：长基线与超短基线的原理与应用森焱森人工智能
基线定位系统：长基线与超短基线的原理与应用在测量、导航、天文等领域，基线是两个已知位置之间的距离或方向，常用于三角测量、卫星定位等方法来确定其他位置的相对关系。本文将深入探讨长基线（LongBaseline,LBL）与超短基线（Ultra-ShortBaseLine,USBL）定位系统的原理、特点及应用。一、基线的定义与本质基线是参照点之间的已知距离或方向，作为基础数据，帮助确定其他未知位置。它通
Found non-empty schema(s) `XXX` but no schema history table. Use baseline() or set baselineOnMigrate IT莫染 bug笔记 java spring boot mysql
Foundnon-emptyschema(s)XXXbutnoschemahistorytable.Usebaseline()orsetbaselineOnMigratetotruetoinitializetheschemahistorytable.发现非空模式(年代)’XXX'但没有模式历史记录表。使用baseline()或设置baselineOnMigrate为true来初始化模式历史表。解决
SmartDV推出先进的H.264和H.265视频编码器和解码器IP 电子科技圈 h.264 h.265 音视频
向全球市场提供灵活、高度可配置、可定制的半导体设计知识产权（IP）和验证IP（VIP）的开发商SmartDV™Technologies近日宣布：公司现已提供即刻可用的H.264和H.265视频编码器和解码器IP解决方案。针对每一种技术，SmartDV都提供了所有三种配置的IP产品，包括H.264的基本配置（Baseline）、主流配置（Main）和高性能配置（High）版本，以及H.265的主流（
解决在微信小程序中view组件下的text和images设置了样式display: flex； align-items: center；对不齐令人作呕的溏心蛋微信小程序学习笔记微信小程序小程序
原始代码的问题全国问题1：元素的默认行高影响对齐元素默认有行高(line-height)，会导致文字实际占位高度大于字体大小即使设置了align-items:center，图片也会基于文字基线对齐，而不是视觉中心对齐问题2：元素的默认显示方式默认是内联(inline)元素，会受到文本基线对齐规则影响图片的垂直对齐方式默认为baseline，与文字基线对齐会导致微妙的偏移修改后的代码全国line-h
消融实验简介 Komorebi_9999 机器学习
消融实验（AblationStudy）是一种在科学研究、特别是在机器学习和深度学习领域中常用的实验设计方法，用于评估模型中不同组件或特征对整体性能的影响。通过系统地移除（或“消融”）模型中的某些部分，并观察这种变化如何影响模型的性能，研究者可以深入了解各个组件在模型中的贡献程度，从而指导模型的改进和优化。在消融实验中，通常会设定一个基线模型（BaselineModel），这是包含所有预定组件的完整
kinect深度距离误差_关于双目摄像头深度测量精度分析是因为太久 kinect深度距离误差
一、双目摄像头深度测量分析双目摄像头拍摄同一场景下左右两幅图像，运用立体匹配算法获取视差图，进而获取深度图。双目摄像头SDK中采用SGBM算法，由校正后的图像获取视差图。视差图表示，空间物体在左视图中的成像点与在右视图中成像点在水平方向上的像素差，即下图中的Xl-Xr。图1双目视差一维原理图深度与视差转换关系：depth=(fx*baseline)/disparity小觅双目摄像头SDK中采用re
科研论文术语全解析：彻底搞懂什么是Baseline、Pipeline..........等内容【2025最新版！！！】那就举个栗子！计算机视觉解决方案人工智能
引言在撰写科研论文的过程中，尤其是在计算机视觉、机器人、SLAM以及三维重建等领域，准确理解并使用核心术语对于展示研究的科学性、系统性具有至关重要的作用。术语不仅是论文结构的骨架，也是向同行传达研究设计与创新思路的重要桥梁。本文旨在从实际科研写作的角度，系统性分析高频科研术语的定义与应用，帮助初学者准确理解其含义，掌握其写作位置与逻辑，最后以SLAM与3D高斯泼溅（3DGaussianSplatt
Structure-Revealing Low-Light Image Enhancement Via Robust Retinex Model论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
Structure-RevealingLow-LightImageEnhancementViaRobustRetinexModel1.论文研究目标与实际意义1.1研究目标1.2实际问题与产业意义2.论文提出的新方法与模型2.1鲁棒Retinex模型架构2.1.1经典Retinex模型的局限性2.1.2鲁棒Retinex模型的创新引入2.2优化目标函数设计2.2.1基线分解模型（BaselineDe
R3GAN利用配置好的Pytorch训练自己的数据集这张生成的图像能检测吗优质GAN模型训练自己的数据集 pytorch 人工智能 python 生成对抗网络计算机视觉深度学习机器学习
简介简介：这篇论文挑战了"GANs难以训练"的广泛观点，通过提出一个更稳定的损失函数和现代化的网络架构，构建了一个简洁而高效的GAN基线模型R3GAN。作者证明了通过合适的理论基础和架构设计，GANs可以稳定训练并达到优异性能。论文题目：TheGANisdead;longlivetheGAN!AModernBaselineGAN会议：NeurIPS2024源码地址：https://www.gith
基线配置管理：为什么它对网络稳定性至关重要 ManageEngine卓豪网络配置管理基线配置网络配置管理器网络配置管理
什么是基线配置（BaselineConfiguration）基线配置（BaselineConfiguration）是经过批准的标准化主设置，代表所有设备应遵循的安全、合规且运行稳定的配置基准，可作为评估变更、偏差或未授权修改的参考基准。一个完整的基线配置通常包含以下要素：操作系统与固件版本：记录设备使用的系统版本及底层固件信息，确保系统基础环境统一（如Windows操作系统版本、PLC固件版本等）
AKS 基线部署指南雷芯琴
AKS基线部署指南aks-baselineThisistheAzureKubernetesService(AKS)BaselineClusterreferenceimplementationasproducedbytheMicrosoftAzureArchitectureCenter.项目地址:https://gitcode.com/gh_mirrors/ak/aks-baseline本指南旨在帮
【芯片开发】芯片开发流程中的基线是什么？ AndrewHZ 芯芯相印芯片开发基线芯片产品产品技术评审半导体
在芯片开发流程中，基线（Baseline）是指在项目特定阶段对设计、文档或代码等工作产品进行正式评审并达成一致后，冻结形成的一个稳定版本。它是后续开发工作的基准和起点，用于控制变更、确保团队协作的一致性，并为项目管理提供可追溯的里程碑。基线的核心作用版本控制与变更管理基线一旦建立，其内容就被“锁定”，如需修改需通过严格的变更流程（如评审、审批），避免因随意改动导致混乱。例如：芯片架构设计完成并通过
CSS图片垂直居中问题解决方案 Nightne css 前端
在CSS中，使用vertical-align:middle导致图片略微向下偏移的现象，本质上是由于行内元素的基线对齐规则和父容器上下文环境共同作用的结果。以下是具体原因和解决方案：原因详解1.vertical-align:middle的真实含义该属性不会让元素在父容器中垂直居中，而是让元素的中点对齐父元素的基线（baseline）+x-height的一半（x-height是小写字母x的高度）。如果
css中的 vertical-align与line-height作用详解酷爱码编程学习 css 前端
一、vertical-align详解作用对象：行内元素（inline/inline-block）或表格单元格内容核心功能：控制元素在行框内的垂直对齐方式常用取值：baseline（默认）：基线与父元素基线对齐top：元素顶部与行框顶部对齐middle：元素中线与父元素基线+1/2x-height对齐bottom：元素底部与行框底部对齐数值值：2px（上移）、-10%（下移）示例（图标与文本对齐）：
绕过配置文件，配置 docker 以支持远程访问jupyter lab yangkequn jupyter docker
直接在dockercompose文件的command中指定以下参数就可以启用远程访问serviceName:image:imageName:latestcommand:-/bin/bash--c-|jupyterlab--allow-root--no-browser--notebook-dir=/root/stable-baselines--ip"*"--ServerApp.allow_remot
绕过配置文件，配置 jupyter noteook/lab 以支持远程访问 yangkequn jupyter linux
直接在command中指定以下参数就可以启用远程访问jupyterlab--allow-root--no-browser--notebook-dir=/root/stable-baselines--ip"*"--ServerApp.allow_remote_access=True备注：1）--ip是监听所有IP，本地的localhost和其它IP2）--ServerApp.allow_remote
深度学习---常用优化器灬0灬灬0灬深度学习人工智能
优化器一：Adam（AdaptiveMomentEstimation）一、适用场景总结（实践导向）场景是否推荐用Adam说明小模型训练（如MLP、CNN）✅✅✅稳定、无需复杂调参，适合快速实验初学者使用或结构新颖✅✅容错率高，容易收敛医学图像初步建模✅✅常用于baseline训练复杂大模型（如Transformer）❌不推荐替代方案为AdamW，更稳定二、PyTorch代码与推荐参数设置impor
TPAMI 2023：Constructing Stronger and Faster Baselines for Skeleton-based Action Recognition 盖盖的博客论文相关 transformer 深度学习人体行为识别
ConstructingStrongerandFasterBaselinesforSkeleton-basedActionRecognitionAbstract1.INTRODUCTION2.RELATEDWORK2.1EfficientModels3.PRELIMINARYTECHNIQUES3.1DataPreprocessing3.2SeparableConvolution4EFFICIEN
Fast-BEV：A Fast and Strong Bird’s-Eye View Perception Baseline——论文笔记 m_buddy BEV Perception 论文阅读人工智能深度学习
参考代码：Fast-BEV一稿多投的另一篇：Fast-BEV:TowardsReal-timeOn-vehicleBird’s-EyeViewPerception1.概述介绍：这篇文章提供了一种可实际部署的BEV感知方案，能够在当今车端主流计算单元上（NvidiaOrin）实现不错的帧率。从camera到BEV的转换思想来自于M2BEV，但是对这个转换方法中使用查找表和映射方法改进，使得整体视角转
Latex+中国象棋 ImDebuging 经验分享学习
今天闲着没事用latex的cchess宏包记录了一局《梅花谱》中的对局\documentclass[12pt]{article}\usepackage{cchess}\usepackage[UTF8]{ctex}\usepackage{enumitem}\begin{document}\fontsize{15pt}{\baselineskip}\selectfont\section{屏风马破当头炮
动手学大模型应用全栈开发（Datawhale X 魔搭 AI夏令营） Kristina_code #Datawhale夏令营人工智能 ai
DatawhaleX魔搭第四期AI夏令营文章目录前言一、学习内容提要二、什么是大模型三、小白零基础10分钟速通指南1.开通阿里云PAI-DSW试用2.在魔塔社区授权3.在魔塔社区创建PAI实例4.10分钟体验一站式baseline总结前言动手学大模型应用全栈开发是一个涉及多个领域的综合性过程，包括数据收集与处理、模型选择与优化、应用开发与部署等多个环节。以下带你体验零基础大模型应用开发。一、学习内
[论文阅读] Improved Baselines with Visual Instruction Tuning 零澪灵 1024程序员节
启发：1、LLaVA-1.5和LLaVA以及其他大模型相比，做出了哪些改进？（1）使用CLIP-ViT-L-336px作为视觉编码器，使模型能处理336px的高分辨率图像，这使得模型能从图像中提取出更多细节信息。此外，还进一步探索了如何适应更高分辨率的图像，通过对图像做分割的方式成功达到448px的输入。（2）使用双层MLP来增强模型的多模态理解能力。（3）制定了更明确的响应格式提示，使用该提示对
（9-7）基于深度强化学习的量化交易策略（OpenAI Baselines +FinRL+DRL+PyPortfolioOpt）：回测交易策略码农三叔金融大模型人工智能大数据机器学习 python 深度学习
9.10回测交易策略回测在评估交易策略绩效方面至关重要，自动化的回测工具因减少人为错误的风险而备受青睐。通常我们使用Quantopian的pyfolio包进行回测，该工具易于使用，提供了各种独立图表，全面展示了交易策略的绩效情况。1.回测统计在量化金融领域，回测统计通常是指通过回测得到的统计数据，用于评估和比较交易策略的性能。这些统计数据可能包括年
第二届世界科学智能大赛逻辑推理赛道：复杂推理能力评估 #大模型技术之逻辑推理方向 #Datawhale #夏令营 SimpleLifeT_T 机器学习 python 人工智能机器学习神经网络深度学习
赛事链接：http://competition.sais.com.cn/competitionDetail/532231/format往期入门文档Docs本期入门文档Datawhale在跑完baseline的基础上，没有改prompt和微调模型，只是修复和查了一些bug，调用qwen2-72b-instruct的api取得top1的score，积累了一些经验。Prompt模板这里引用了官方base
深度强化学习（DRL）框架与多目标调度优化详解大霸王龙 python 深度学习多目标优化深度强化学习
深度强化学习（DRL）框架与多目标调度优化详解（截至2025年4月，结合最新研究进展）一、DRL主流框架及核心算法通用DRL框架RayRLlib：支持分布式训练，集成PPO、A3C、DQN等算法，适用于大规模多目标调度场景（如云资源分配）。StableBaselines3：基于PyTorch，提供模块化接口，支持自定义奖励函数和状态空间，适合动态多目标优化问题（如柔性车间调度）。TensorFor
反射式人工智能的使用现在是 Shopify 的基本期望 LaughingZhu 人工智能 chatgpt
近日ShopifyCEO发布了一份内部备忘录ReflexiveAIusageisnowabaselineexpectationatShopify（反射性AI使用现在是Shopify的基本要求）。其实随着ChatGPT的出现，AI已经成为了我们工作中不可或缺的一部分，我们需要更多的工具来提高工作效率，基本上每家公司都在或多或少的使用AI，一些头部的公司也在积极的布局AI产业。这篇文章其实向我们阐述了
10 个最新 CSS 功能已在所有主流浏览器中得到支持优联前端前端 css javascript 前端开发优联前端
前言CSS不断发展，新功能使我们的工作更快、更简洁、更强大。得益于最新的浏览器改进（Baseline2024），许多新功能现在可在所有主要引擎上使用。以下是您可以立即开始使用的10CSS新功能。1.Scrollbar-Gutter和Scrollbar-Color当浏览器显示滚动条时，布局会随着空间的占用而移动。使用scrollbar-gutter，您甚至可以在滚动开始之前保留滚动条空间：.scro
基于天池Better Synth多模态大模型数据合成挑战赛的多模态大模型数据合成(2) [Datawhale AI 夏令营] Heorine 人工智能数据分析 python bash
目录官方Baseline学习小题外话数据合成训练小题外话（_关于服务器中的python文件在导入自定义模块中识别不出mgm文件位置情况_）关于Data-juicer参考资料官方Baseline学习再来回顾一下，该问题背景基于天池BetterSynth多模态大模型数据合成挑战赛，详细可以参考该链接。简而言之，本背景基于图片数据方面，在合成与清洗图文数据中提高多模态大模型的图片理解能力。基于Mini-
阿里云oss视频苹果端无法播放问题记录卖柴火的小伙子音视频
记录一下苹果端视频不可以播放的原因.看了一下其他视频可以正常播放,但是今天客户发来的视频无法正常播放.咨询过阿里云售后给出的原因是编码格式过高.需要调整编码格式为:baseline,下面记录如何使用ffmpeg修改视频的编码格式.下载文件(可从官方下载)配置环境变量(系统变量中path添加安装目录)D:\tool\ffmpeg\bin验证是否配置成功(配置完环境变量如不生效可重启)ffmpeg-v
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他