Double Shan

[论文阅读]AlphaStock:使用可以解释性的深度强化学习注意力网络的买入Winners和卖出Losers投资策略

论文原文标题

AlphaStock：A Buying-Winners-and-Selling-Losers Investment Strategy using Interpretable Deep Reinforcement Attention Networks
发表日期：2019年8月

1 主要贡献

主要贡献：
1、将深度注意力网络和夏普率导向的强化学习框架结合，去实现风险回报均衡的投资策略。
2、提出利用资产之间的相互关系进行建模，去避免选择偏差和创建一种跨资产的注意力机制。

2 前情概要

2.1 金融术语

持有期（holding period）：投资资产的最小时间单位。
序列投资（sequential investment）：序列投资是一系列的持有期。
资产价格（asset price）: p⁽ⁱ⁾={ p₁⁽ⁱ⁾, p₂⁽ⁱ⁾,… p_i⁽ⁱ⁾,…}，其中， p₁⁽ⁱ⁾是股票i在时刻t的价格，文中，使用股票作为资产来描述模型。
多仓（long position）：多仓是先在 $t_1$ 时刻买入股票后面 $t_2$ 时刻卖掉平仓的操作，利润： $u_i$ （ p_t₂⁽ⁱ⁾ - p_t₁⁽ⁱ⁾），其中 $u_i$ 是购买股票i 的量。
空仓（short position）：空仓是先在 $t_1$ 时刻借入股票卖掉后面 $t_2$ 时刻买入还回股票的操作，利润： $u_i$ （ p_t₁⁽ⁱ⁾ - p_t₂⁽ⁱ⁾），其中 $u_i$ 是卖出股票i 的量。
投资组合（portfolio）：如果有I只股票，一个投资组合为一个向量b=（b⁽¹⁾,…b⁽ⁱ⁾,…b^(I)）,这里b⁽ⁱ⁾是股票i的资金占比， $\sum_{i=1}^I$ b⁽ⁱ⁾ =1
零-投资组合：资产组合b^(j)的资金记为M^(j)，多仓的M^(j)>0，而空仓M^(j)<0，对于有J个资产组合的投资组合来说，如果 $\sum_{j=1}^J$ M^(j) =0。

例如：投资者借一种组合具有1000元价值的股票卖掉作为空仓，然后使用这个收益去购买另一组1000元的股票作为多仓，空仓和多仓的结合就是一种零-投资组合。

2.2 BWSL策略

策略的关键是买入预测价格会有高涨幅股票（winners）和卖出预测价格涨幅较低的股票（losers）。文中将BWSL策略作为一个零投资组合，由两个投资组合来执行：一个买入winners的多仓投资组合和一个卖出losers的空仓投资组合。
b_t⁺：在第T个时期，多仓投资组合
b_t^-：在第T个T时期，空仓投资组合
具体执行流程：

（1）首先，在时间t，给出 $\widetilde{M}$ 预算限制，向代理商借“loser”股票，可以借到的股票i的数量为

其中，b_t^-(i)是股票i在空仓组合b_t^-的比例。
（2）其次，买掉借的“loser”股票，从而得到 $\widetilde{M}$ 。通过b_t⁺，使用 $\widetilde{M}$ 去买入“winner”的股票，可以在时间t，买入的股票i的数量为

使用买winner股票的预算 $\widetilde{M}$ 是卖空交易的收益，所以在投资组合{b_t⁺，b_t^-}的净资产是0。
（3）在第t个持有期结束的时候，我们卖出多仓组合，使用在t+1时刻的新价格，我们卖出股票可以得到的收益是
（4）然后，我们在做空投资组合中的股票买回来，然后还给代理商，花费的钱为

（5）总的收益
总收益为M_t=M_t⁺-M_t^-，让Z_t⁽ⁱ⁾=p_t+1⁽ⁱ⁾ / p_t⁽ⁱ⁾ 代表第t个持有期内股票i的价格增长率。
集成投资组合的回报率计算为

（5）目标
如果我们想要R_t >0 ，那么需要

意味着投资组合b⁺要比b^-拥有更好的平均价格上升速率。即使市场全部的股票价格在回落，只要确保投资组合b⁺要比b^-价格回落慢一些，我们就可以获利。这体现了股票之间的相对价格的重要性。

2.3 优化目标

夏普比率（sharpe ratio）：夏普比率是每单位波动率，超过无风险回报的平均回报率，表示投资者每承受一单位总风险，会产生多少额外的收益，给定一个包含T个持有期的连续投资，以使投资的夏普比最大化，其夏普比计算为

A_T是投资每个时期的平均回报速率，V_T是用来衡量投资风险的波动性，Θ是一种无风险的回报率，如银行的回报率。
给定一个有T个持有期的连续投资，A_T为

其中TC_t是第t个时期的交易成本，V_T为

对于t期投资，我们的策略的优化目标是生成多仓和空仓的投资组合序列B⁺={b₁⁺,…,b_T⁺}和B^-={b₁^-,…,b_T^-}来最大化投资的夏普比率。

夏普比率从利润和风险的角度来评估战略的表现。这种利润-风险平衡特征要求我们的模型不仅关注每个时期的回报率最大化Rt，而且还考虑了Rt在投资中所有时期的长期波动性。换句话说，设计一个有远见的稳定投资策略比一个具有短期高利润的短见投资策略更有价值。

3 Alphastock 模型

3.1 组成部分

Alphastock 包含了三个部分

LSTM-HA：对于每个股票i，利用LSTM-HA模型从历史状态中X⁽ⁱ⁾，提取股票特征r⁽ⁱ⁾ 。
CAAN：描述股票的相对关系，输入所有股票特征r⁽ⁱ⁾，评估每个股票的winner的分数。
portfolio generator：通过全部股票的分数计算出做多和做空的投资比例b⁺，b^-。
最后，利用强化学习来端到端优化这三个组件作为一个整体，其中一个顺序投资的夏普比率通过一种有远见的方式最大化。

3.2 原始特征

技术面因子

价格增长速率（PR）
细粒度波动率（VOL）：一个持有期可以进一步划分为许多子期。在我们的实验中，我们将一个月设置为一个持有期，因此一个子期可以是一个交易日。VOL定义为从t−1到t的所有子周期价格的标准差。
交易量（TV）：从t−1到t的股票交易总量。它反映了一只股票的市场活动。

基本面因子

市场资本总值（MC）：对于股票i，它被定义为价格P_t⁽ⁱ⁾和已发行流通股的乘积。
价格与获利比率 (PE)：一个公司的市值与其年收益的比率。
账面与市场的比率(BM)：一个公司的账面价值与其市场价值的比率。

3.3 股票特征提取

在LSTM-HA网络中，使用 $\widetilde{x}$ _t去代表在时间t的股票历史状态。其中包括给出的股票特征。我们在t时刻命名最后的K个历史持有期，等同于，从时间t−K到时间t的周期，作为t的回顾窗口。在回顾窗口中，一个股票的历史状态被表示为一个序列X={x₁,…,x_k,…,x_K}，模型使用长短期记忆网络把X编码成向量为
其中h_k是LSTM在第k步编码的隐藏状态，将最后一步的h_K作为股票的表示，它包含X中元素之间的顺序依赖关系。
为了让X之间的全局依赖关系和长期依赖关系能有效被建模，因此，采用历史状态关注来利用所有中间隐藏状态h_k来增强h_K，根据标准的注意力机制，对历史状态的关注增强了代表性，表示而r

其中，ATT(… , …)是注意力函数，公式为
这里，w，W⁽ⁱ⁾和W⁽²⁾是可以被学到的参数。对于t时刻的第i只股票，历史状态注意增强表示记为r _t⁽ⁱ⁾。

3.4 Winners 和 Losers 选择（股票相互关系分数计算）

基础的CAAN模型
CAAN模型采用自注意力机制描述股票间的关系，给定股票的特征r⁽ⁱ⁾，为股票i计算一个查询向量q⁽ⁱ⁾，一个关键向量k⁽ⁱ⁾和一个值向量v⁽ⁱ⁾

其中，W^(Q)，W^(k)和W^(V)是可以被学到的参数。
股票j和i的相互关系建模为：使用股票i的q⁽ⁱ⁾去查询股票j的k⁽ⁱ⁾，D_k是缩放参数。

然后，将归一化的相互关系β_ij作为权重，与其他股票的v^(j)相加作为衰减分数。

自注意力函数SATT(… , …)是一个β_ij的softmax标准化相互关系：

我们使用一个完全连接的层来将注意力向量a⁽ⁱ⁾转换为一个winner 得分：
得分较高的股票更有可能成为winner。

对β的改进
使用历史的股票上涨率排名的先验知识对β进行改进，在最后的从t-1到t时间的持有期C_t-1⁽ⁱ⁾来代表历史的股票上涨率排名。受NLP领域位置信息建模方法的启发，我们使用C_t-1⁽ⁱ⁾坐标轴上的相对位置作为股票相互关系的先验知识。给定两个股票i和j，我们计算它们在坐标轴上的离散相对距离。

Q是一个预设量化系数。
我们使用一个查找矩阵L =（l₁，……，l_L）来表示d_ij的每个离散值，以d_ij为索引，对应的列向量l_d_ij是相对距离d_ij的嵌入向量。

对于一对股票i和j，我们使用l_d_ij 作为来计算先验关系系数ψ_ij ：

股票i和j的关系可以被重写为

这样，就引入了价格上涨率等级中的相对股票头寸作为权重来增强或削弱注意系数。股票有相似的历史价格上涨率将有更强的相互关系，然后有相似的winner得分。

3.5 投资组合生成

给定I个股票的winner分数{s⁽¹⁾,…,s⁽ⁱ⁾,…,s^(I)}，首先根据股票的赢家分数按降序排序，然后得到每个股票i的序列号o ⁽ⁱ⁾，设G表示投资组合b⁺和b^-的预设大小。
如果o ⁽ⁱ⁾∈ [1,G]，股票i会进入投资者b⁺⁽ⁱ⁾，投资比例为

如果o ⁽ⁱ⁾∈ (I-G,I]，股票i会进入投资者b^-(i)，投资比例为
其余的股票因缺乏明确的买入/卖出信号而未被选择，为了简单起见，使用一个向量来记录两个投资组合的全部信息，使用长度I的向量b^c，如果o ⁽ⁱ⁾∈ [1,G]，b ^c(i) = b ⁺⁽ⁱ⁾，如果o ⁽ⁱ⁾∈ (I-G,I]，b ^c(i) = b ^-(i)，其余维度为0，i=1,…, I，在下面的内容中，我们交替使用b^c和{b⁺，b^-}作为 AlphaStock模型的返回。

3.6 RL优化

RL模型优化目标：找到最优参数θ^*=argmax_θJ(θ)

将AlphaStock策略框架为一个具有离散智能体动作的RL游戏来优化模型参数。其中，一个t期投资被建模为一个RL智能体的状态-行动-奖励轨迹π，π={state₁,action₁,reward₁, …,state_t,action_t,reward_t, …, state_T,action_T,reward_T}，state_t是在t时间观察到的历史市场状态，action_t是I 维二元向量，在t时的智能体投资股票i，state_t⁽ⁱ⁾=1 ，反之为0。
通过状态state_t，智能体投资股票i的可能为
让H_π代表π的夏普比率，然后reward_t是action_t对H_π的贡献， $\sum_{t=1}^T$ reward_t =H_π。
目标函数：
对于所有可能的π，RL智能体的平均奖励是
我们使用梯度上升的方法迭代 $\tau$ 轮去优化θ。
$\eta$ 是学习率，被给的训练集包含N个轨迹{π₁,…,π_n,…π_N}， $\nabla$ J(θ)近似计算为：
梯度由反向传播算法计算更新。以确保所提出的模型能够击败市场，在强化学习中引入了阈值方法，梯度 $\nabla$ J(θ)被重写为
阈值H₀被设置为整体市场的夏普比率。梯度上升只会促使能够超越市场的参数。

4 实验

在本节中，我们通过在美国市场的数据对我们的阿尔法股票模型进行了实证评估。中国股市的数据也被用于稳健性检验。

4.1 数据和实验设置

实验中使用的美国股票市场数据来自于沃顿商学院研究数据服务中心（WRDS），数据采集的时间范围为1970年1月至2016年12月。这一长期范围涵盖了几个众所周知的市场事件，如1995年至2000年的互联网泡沫和2007年至2009年的次贷危机，这使对不同市场状态的评估成为可能。这些股票来自四个市场：纽约证券交所、纽交所美国证券交易所、纳斯达克和纽交所Arca。每年有效股票的数量超过1000只。我们使用从1970年1月到1990年1月的数据作为训练和验证集，其余的作为测试集。
在实验中，持有期设置为一个月，投资的持有期T设置为12，即RL每12个月计算一次夏普比奖励。回顾窗口大小K被设置为12，也就是说，我们回顾了12个月的股票历史状态。投资组合的规模G被设置为所有股票数量的1/4。

4.2 baseline 方法

AlphaStock与大量的baseline方法相比较：

Market：统一的买入并持有策略
Cross Sectional Momentum (CSM) and Time Series Momentum (TSM)：两种经典动量策略
Robust Median Reversion (RMR)：一种最新报道的回归策略
Fuzzy Deep Direct Reinforcement (FDDR)：一种最新报道的基于rl的BWSL策略
AlphaStock-NC (AS-NC)：没有CAAN的阿尔法股票模型，其中LSTM-HA的输出被直接用作投资组合生成器的输入。
AlphaStock-NP (AS-NP)：没有价格上升的模型，在我们的模型中使用基本的CAAN
基本的TSM/CSM/RMR代表传统的金融策略，TSM和CSM是基于动量逻辑和RMR是基于回归逻辑，以AS-NC和AS-NP作为对比，验证了CAAN和价格上涨排名先验的有效性。市场是用来表示市场的状态的。

4.3 评价措施

对投资策略最标准的评估标准是累积财富，公式为：
R_t是收益率，TC是交易花费，实验中设置为0.1%，不同投资者的偏好各不相同。因此，我们也使用了其他一些评价措施，包括：

Annualized Percentage Rate (APR)：年度百分利率，是平均收益率的年化平均水平。APR_T=A_T * N_Y，N_Y是一年内持有期限的数量
Annualized Volatility (AVOL)：年化波动率，是一个波动率的年化平均水平AVOL_T=V_T * $\sqrt{N}$ 衡量一个策略在一个单位时间段内的平均风险。
Annualized Sharpe Ratio (ASR)：年化夏普比率，基于APR和AVOL的风险调整年化回报率ASR_T=APR_T/AVOL_T
Maximum DrawDown (MDD)：最大下降幅度，是投资组合从达到峰值到低谷的最大损失。这是衡量投资风险的另一种方法。公式为
Calmar Ratio (CR)：是基于最大递减的风险调整年利率。CR_T=APR_T/MDD_T
Downside Deviation Ratio (DDR)：下行偏差比，衡量策略的下行风险为低于最低可接受回报（MAR）时的回报平均值，它是基于下行偏差的风险调整后的APR，公式为
在我们的实验中，MAR被设为零。

4.4 在美国市场的表现

（1）总收益

说明：
（1）AlphaStock的性能优于AlphaStock-NP，AlphaStock-NP优于AlphaStock，这表明CAAN建模的股票等级先验和相互关系对BWSL策略有很大的帮助。
（2）FDDR也是一种深度RL投资策略，它利用递归深度神经网络提取股票的模糊表示。在我们的实验中，AlphaStockNC的性能优于FDDR，说明了我们的LSTM-HA网络在股票表示学习方面具有优势
（3）TSM策略在牛市中表现良好，但在熊市（2003年和2008年的金融危机）中表现非常差，而RMR的表现则相反。这意味着传统的金融策略只能适应某种类型的市场状态，而没有一个有效的前瞻性机制。RL策略极大地解决了这一缺陷，包括AlphaStock和FDDR，它们在不同的市场状态下表现非常稳定。
（2）其他评价指标
对于下划线的度量（AVOL，MDD），值越低表示性能越好，而其他指标则相反AlphaStock、AlphaStock-NP和AlphaStock-NC的性能都优于其他基线，证实了我们的策略的有效性和稳健性。AlphaStock、AlphaStock-NP和AlphaStock-NC在ASR方面的性能非常接近，这可能是因为所有这些模型都进行了优化，以使夏普比最大化。以APR衡量的AlphaStock和AlphaStock-NP的利润高于AlphaStock-NC的利润，但其波动性略高。
更有趣的是，用MDD、CR和DDR测量的性能比AlphaStock好得多。通过比较AlphaStock-NP和AlphaStock-NC的MDD、CR和DDR，可以观察到相似的结果。这三种指标用于表示投资的极端损失，即最大减少额和低于最低可接受阈值的回报。结果表明，三种模型的极端损失控制能力是AlphaStock>AlphaStock-NP>AlphaStock-nc，这突出了CAAN组件的贡献和价格的上涨。事实上，之前价格上涨的CAAN充分利用了股票之间的排名关系。这种机制可以保护我们的策略不受“buying losers and selling winners”的错误，从而可以极大地避免投资的极端损失。总之，对于不同偏好的投资者来说，AlphaStock是一种非常具竞争力的策略。

4.5 在中国市场的表现

在中国股票市场上对我们的模型和基线进行了回测实验，其中包括两个交易所：上海证券交易所（SSE）和深圳证券交易所（SZSE）。数据来自WIND数据库。股票为人民币定价的普通股（A股），实验使用的股票总数为1131只。我们的数据的时间范围是从六月开始的。2005年至2018年12月，期间自6月起。2005-2011年12月作为训练/验证集，其余作为测试集。由于中国市场不能卖空，所以我们在实验中只使用b⁺投资组合。实验结果为

从表中可以看出，AlphaStock、AlphaStock-np和AlphaStock-nc的性能再次优于其他基线。这验证了我们的模型在中国市场上的有效性。通过进一步比较表2和表1，我们可以发现，我们用AVOL和MDD测量的模型在中国市场的风险高于美国市场。这可能是由于中国等新兴国家的市场低迷，投机资本更多，但治理效率较低。卖空机制的缺乏也导致了市场力量的不平衡。中国市场和其他基线的AVOL和MDD也高于美国市场。与这些基线相比，我们的模型的风险控制能力仍然具有竞争力。综上所述，表2中的实验结果表明了我们的模型对新兴市场的稳健性。

4.6 投资策略的解释

以下四个图描述了历史交易特征对winner 分数的影响，图3(a)-3(b)绘制了来自交易特征的影响。

如图3(a)所示，历史价格上涨率的影响沿时间轴是不均匀的。在长期月，即前9至11个月的公共关系，对winner得分有积极影响，但在短期月，即前1至8个月，影响变为消极。这一结果表明，我们的模型倾向于购买那些价格长期快速上涨（有效的卓越）或短期快速价格回撤（过度低估）的股票。这意味着AlphaStock的行为像长期动量但短期逆转混合策略，此外，由于价格上涨通常伴随着频繁的股票交易。图3(b)显示，交易量（TV）与价格增长率（PR）有相似的趋势。
最后，如图3©所示，波动率（VOL）对所有历史月份的winner得分都有负影响。这意味着我们的模型倾向于选择低波动率的股票作为winner，这确实解释了为什么AlphaStock能够适应不同的市场状态，图3(d)进一步展示了不同公司特征对winner得分的平均影响。结果表明，市值（MC）、价格收益率（PE）和账面市场比率（BM）有积极的影响。这三个特征是上市公司的重要估值因素，这表明AlphaStock倾向于选择具有良好基本价值的公司。相比之下，股息意味着公司价值的一部分会返还给股东，并可能会降低股票的内在价值。这就是为什么股息（DIV）的影响在我们的模型中是负的。具体来说，AlphaStock建议选择那些长期增长高、低波动性、高内在价值和最近被低估的股票作为winner。

5 总结

在本文中，我们提出了一个基于RL的深度注意网络来设计一种称为BWSL的阿尔法策略。我们还设计了一种敏感性分析方法来解释我们的模型的投资逻辑。与现有的基于rl的投资策略相比，AlphaStock充分利用了股票之间的相互关系，为解决在金融市场中使用深度学习模型的“黑盒”问题打开了一扇门。在美国和中国股市上进行的反向测试和模拟实验表明，阿尔法股票的表现比其他竞争策略要好得多。有趣的是，AlphaStock建议购买长期增长高、波动性低、内在价值高、最近被低估的股票。

Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
ChatGPT 之后的下一步是什么？四个迫在眉睫的进步 iCloudEnd
OpenAI的文本生成器ChatGPT进入公共领域已经两个半月了，该机器人令人印象深刻且深思熟虑的答案已经引起了1300万日常用户的注意，他们已经将其用于一般问题、开发想法和写作全长文章。尽管ChatGPT存在重大缺陷（例如一些事实不准确），但许多人担心这可能对劳动力、学校、新闻业等产生影响。然而，我们可能正处于一场巨大的人工智能革命的开端。OpenAI总裁兼联合创始人GregBrockman于1
模型优化-------模型压缩 AI扶我青云志人工智能模型优化
模型压缩是一种优化技术，目标是在尽量保留模型性能的前提下，减少模型的体积、计算成本和内存占用。特别适合模型部署在边缘设备、移动端、嵌入式系统等资源受限环境中。其中，“剪枝（Pruning）、量化（Quantization）和知识蒸馏（KnowledgeDistillation）”是最常用且研究最深入的三种方法。一、剪枝（Pruning）原理：剪枝的核心思想是去掉对模型输出影响较小的参数或结构，使得
云服务器性能优化全攻略：CPU、内存、磁盘IO调优实战 Gloria歌洛莉亚 c语言数据库服务器 python 性能优化
在云计算时代，服务器性能直接影响应用响应速度、用户体验和运营成本。无论是高并发网站、实时数据分析还是机器学习训练，优化云服务器性能都是开发者必须掌握的核心技能。本攻略将从CPU调度、内存管理、磁盘IO三个维度，结合Linux系统特性和实际场景，提供可落地的优化方案。一、CPU性能调优：从调度策略到并行计算1.1CPU资源监控与瓶颈定位实时监控工具：top-c#动态查看进程CPU占用（按P键按CPU
喜爱购有什么新消息？如何打造百城万店氧惠好物
自2020年10月起，西安喜爱购商贸商贸股份有限公司全力打造的“百城万店”新零售商业模式应运而生。在探索新零售的道路上,通过互联网、大数据、云计算、人工智能等新技术,重构“人、货、场”商业元素,秉持“舍利差赚服务”经营理念,在全国至少一百个城市的“一千户以上的中高端社区”,打造至少两万家“一区一店”社区生活超市。大家好！我是氧惠最大团队&联合创始人氧惠达人导师。氧惠佣金更高，模式更好，终端用户不流
AI 驱动自动化运维平台架构与实现大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能决策树大数据
摘要：随着云计算、容器化和大规模分布式系统的普及，传统人工运维方法已难以满足现代IT环境中海量指标、日志和拓扑关系的实时分析与故障响应需求。AI驱动的自动化运维（AIOps）平台通过融合机器学习、深度学习、图分析以及强化学习等多学科技术，实现对海量运维数据的智能感知、预测、诊断和自动化修复。本文深入探讨AI驱动自动化运维平台的整体架构设计与核心技术实现，涵盖数据采集与预处理、AI引擎设计、自动化执
冒充顺华文庭内部群胜天半子毛顺华就是骗子，中粮仓智慧农业虚拟盘及早远离切勿被套！昌龙律法
人到老年，就怕手头没钱。一些不法分子利用老年人信息闭塞、认知较弱等特点瞄准了老年人的“钱袋子”花样百出实施诈骗老年人损失财产的同时还饱受精神打击不能忍！这些套路，应该让爸妈知道智慧农业，低碳环保双探交易市场，数字体育，人工智能十选五就是骗局我们曾曝光了无数种金融骗局，不知道能有多少人看到，能帮一个是一个，再次曝光一种炒股诱导做慈善参加数字经济的骗局，相信作为股民，大家都会经常接到一下分析个股，或者
人工智能真的能编程吗？研究勾勒出自主软件工程的障碍 WSSWWWSSW 人工智能软件工程
想象一下这样一个未来：人工智能悄然承担起软件开发的繁重工作：重构杂乱无章的代码、迁移遗留系统以及排查竞态条件，这样人类工程师就可以专注于架构、设计以及那些机器仍然无法解决的真正新颖的问题。最近的进展似乎让这个未来近在咫尺，但麻省理工学院计算机科学与人工智能实验室（CSAIL）以及其他几家合作机构的研究人员发表的一篇新论文指出，要实现这个潜在的未来，需要认真审视当前面临的挑战。这篇题为《面向软件工程
GPU 之后，IMU 登场：AI 发展的下一次飞跃
你早晨醒来，手机上的大模型帮你写完邮件、翻译合同，却依旧不能帮你把厨房里洒掉的牛奶擦干。你戴上的AR眼镜知道“那里有杯子”，却抓不到它——AI会说不会做。是不是哪里少了一截？人工智能（AI）的发展历程中，我们见证了从简单的数据处理到复杂的语言生成能力的飞跃。然而，尽管AI在虚拟世界中表现出色，它在物理世界中的表现却相对滞后。为了填补这一空白，AI正在进入一个新的发展阶段：行动驱动时代。在本文中，我
快手极速版能赚钱吗？解析快手极速版赚钱的3个方法！ U客直谈APP
快手极速版相信大家都有一定的了解吧，它作为快手打造的轻量化app，在应用市场上占据着一席之位。而对于其能赚钱的说法，更是引得大家的热烈追捧。那么快手极速版能赚钱吧？其赚钱是真的吗？快手极速版怎么赚钱？快手极速版一天赚50元的技巧有哪些呢？本篇文章就将解大家所疑，解析快手极速版赚钱的3个方法，帮助大家成功在该平台赚取收入，达到快手极速版一天赚50元的目标。一、快手极速版能赚钱吗答案显然是肯定的！快手
ESG碳交易骗局揭秘！量化北恒私募实盘大赛周一丰郭沛源被骗历程!受骗不能出金! 易星辰分享普法
量化北恒私募实盘大赛周一丰投票项目安全吗?量化北恒私募实盘大赛周一丰积分投票已经亏损被骗了怎么办？警惕!量化北恒私募实盘大赛周一丰十选五项目合法吗——杀猪盘骗局！被骗提不了款!提不了现!出不来金!不要上当!自古有句话讲得好“人善被欺、马善被骑”，现如今也是被骗子利用到了极致，人善就真该被欺骗吗？狡猾的骗子们就利用到了这点，利用同情心、爱心去进行诈骗，宣传公益捐款、爱心慈善打比赛来骗取资金！正常的投
python学习路线（从菜鸟到起飞）突突突然不会编了 python 学习开发语言
以下是基于2025年最新技术趋势的Python学习路线，综合多个权威资源整理而成，涵盖从零基础到进阶应用的全流程，适合不同学习目标（如Web开发、数据分析、人工智能等）的学习者。路线分为基础、进阶、实战、高级、方向拓展五个阶段，并附学习资源推荐：一、基础阶段（1-2个月）目标：掌握Python核心语法与编程思维，熟悉开发环境。环境搭建安装Python3.10+，配置PyCharm或VSCode开发
实锤“银龙杯量化私募实盘周一丰马建军”带单被骗实情——及时止损可挽回！公正公平
我们接到多起投资者举报，称有人冒充知名财经分析师（知名人物大学教授经济学家，上市企业公司及项目和高管)【银龙杯量化私募实盘周一丰马建军】，利用【银龙杯量化私募实盘周一丰马建军】的声誉和影响力进行诈骗活动。当你看到这篇文章的时候说明你正深陷一场精心准备的騙局之中！如果是还没有投资，千万不要抱有侥幸心理，一定要及时远离！一定不要打草惊蛇一旦遭遇下述相关投资交易资金出不来及时求助文章最下方联系电话！骗子
使用高精度IMU对无人机系统有何提升？ Yuroo zhou IMU 无人机机器学习嵌入式实时数据库算法嵌入式硬件
在无人机自主飞行的核心技术链条中，惯性测量单元（IMU）的精度与可靠性直接决定了整机的控制上限。高精度IMU对无人机系统的提升是全方位的，尤其在导航精度、稳定性、自主性和可靠性等关键性能方面。它通常是实现专业级和工业级无人机应用的核心传感器之一。**技术内核：高精度与小型化的完美平衡**ER-MIMU-063以38.6mm×44.8mm×25.5mm的超小尺寸和≤70g的轻量化设计，能完美适配各类
281129-李晏林-2022/12/6【day56】尘心_aa8c
学《于敏洪案例》第五天今天听民于敏洪案例，学了今天感觉有点疲惫，在听课过程中最大的促动还是在于每天及时送自己鼓励，这件事情，有再做没做好，也没做好精准的数据统计，不养成习惯，对于自己来说会成很大问题，可能这个学这个课程一结束，没过多久这方法就被自己忘于脑后。先给自己制定确实可量化的指标，刚开始，先给自己送20个鼓励，每完成5个做次记录。鼓励分为明的鼓励，与自我暗示。学习于敏洪案例的本质是什么？从于
京东零售重磅开源 | OxyGent：像搭乐高一样组装AI团队，实现群体智能京东零售技术零售开源人工智能
京东零售Oxygen团队正式开源发布多智能体协作框架——OxyGent。这一创新框架致力于帮助开发者高效组装多智能体协作系统，实现智能体间的无缝协作、弹性扩展与全链路可追溯。推动人工智能从“单点突破”迈向“群体智能”时代。OxyGent已在开源社区正式上线。开源地址：https://github.com/jd-opensource/OxyGent官网地址：https://oxygent.jd.co
具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
生命3.0时代，面对人工智能时代的到来，我们可以做些什么笃定的沙丁鱼
生命的定义生命的定义有很多，最为人所熟知的是在生物学上的定义，即生命是蛋白质存在的一种形式。但是，这种定义可能不太适用于未来的智能机器和外星文明，我们不能将我们对未来生命的思考局限在过去遇到过的物种，所以需要将生命定义得更广阔一些：生命是一个能保持自身复杂性并能进行复制的过程。复制的对象并不是由原子组成的物质，而是能阐明原子是如何排列的信息，这种信息由比特组成。换句话说：我们可以将生命看作一种自我
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
不正规不靠谱：假摩根士丹利内部群推荐绿色低碳减排平台骗局揭露!送一万体验资金做慈善全是假的! 易星辰分享普法
关于曝光网上摩根士丹利何晓斌宝丰能源节能减排在炒股群推荐智慧农业中粮仓平台骗局的文章，其内容主要揭示了近期频发的一种投资诈骗手段。以下是该骗局的主要特点和步骤：为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”
车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
假冒朱民！通达OA社科院朱民ST-balance项目就是假的，被骗亏损真相揭秘，亲身亏损经历正义青天
通达OA社科院朱民ST-balance项目不正规——杀猪盘不能提现投票骗局曝光！随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁！因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶 Ryan_sz1
1、过拟合、欠拟合及其解决方案过拟合、欠拟合机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题，但是，一开始我们的模型往往是欠拟合的，也正是因为如此才有了优化的空间，我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了。也就是说欠拟合是模型表达能力不够，达不到很好的表达效果。而过拟合是在训练集的范围内表达能力过强，导致完全拟合了训练集。解决
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen