PaperWeekly

当深度学习遇上量化交易——因子挖掘篇

©PaperWeekly 原创 · 作者｜桑运鑫

学校｜上海交通大学博士生

研究方向｜图神经网络在金融领域的应用

在深度学习的所有应用场景中，股价预测也无疑是其中一个异常诱人的场景。随着传统线性模型的潜力逐渐枯竭，非线性模型逐渐成为量化交易的主要探索方向，深度学习对非线性关系良好的拟合能力让其在量化交易中面临着广阔的应用前景（关于量化交易一些基础知识，推荐知乎专栏：人工智能与量化投资）。

但与常规的回归预测任务不同的是，股价预测问题有其独特性，存在时间序列、噪声高、过拟合等问题。当前对于深度学习在股票交易中的研究主要侧重在因子挖掘、图神经网络与知识图谱、新闻与社交媒体等非结构化数据的利用、以及时序模型改进四个方面。

我们会在文章中依次探讨近 5 年顶会上对这四个方向的研究。此外，因为相关的资料确实相当匮乏，我在 GitHub 上新建了一个 repo：deep-stock, 用于收集、整理相关的研究论文、书籍、数据、网站等，欢迎 star！

deep-stock:

https://github.com/sangyx/deep-stock

本文主要介绍 MSRA 在 KDD 2019 上发表的两篇文章，这两篇文章主要关注深度学习在因子挖掘方面的应用。

TTIO

论文标题：Individualized Indicator for All: Stock-wise Technical Indicator Optimization with Stock Embedding

论文链接：https://dl.acm.org/doi/10.1145/3292500.3330833

对于股票进行分析常用的手段有基本面分析（fundamental analysis）和技术面分析（technical analysis）。技术面分析依靠股票市场历史上的交易价格和成交量衍生出一系列的技术指标，成为技术因子（technical indicators）。

传统的多因子模型认为同一种因子的系数（ , 因子暴露）对于所有的股票的影响是一样的。但我们稍加观察下图就会发现，对于具有不同的内禀属性（intrinsic properties）的股票，同一个因子即使在同一时间取值大致相同，对于股价的影响也是不一样的。

而要解决上述问题，需要解决下面两个问题：

怎么把股票分成不同种类，或者说怎么发现因子的内禀属性？
怎么找出不同的技术因子对不同种类股票的影响程度？即如何计算那个加权系数？

文章对上述问题分别进行了解答。

对于第一个问题，要解决它其实要给每只股票生成一个 embedding，并且这个 embedding 要包含足够的信息。基于“万物皆可 embedding” 的思想，可以很自然的想到 word2vec 中的 skip-gram 和 cbow 两个生成 embedding 的方法。

文章在这里采用了 skip-gram 的方法，但 skip-gram 方法建立在一个词和它周围的词组成的词组更合理的基础上，我们如何得到由有相似属性的股票组成的序列呢？

文章提出了一个有意思的假设：那些专业的基金经理比起我们这些小白来姿势水平肯定不知道高到哪里去了，他们在给自己管理的基金挑选股票组合时肯定倾向于选择有相似属性的股票（但这个假设其实有两个潜在的问题，第二篇文章有提到），所以我们这些基金组合入手，生成股票序列。具体的步骤如下：

1. 我们首先将股票和其所属的基金组织成一个如下图所示的二部图，其中 U 代表股票，V 代表这些股票所述的基金，E 是这两者之间的边，代表一个基金对一只股票的投资。

2. 使用 Random Walk 算法来采样一系列的股票序列。从任意一只股票结点开始，它到基金结点的概率是：

从基金结点开始到另一个股票结点的概率定义如下：

因为我们只需要股票序列，在采样时去掉基金结点，只保留股票结点即可。

3. 使用 Skip-Gram 算法对上面采样得到的股票序列进行训练可以得到股票的 embedding 。

对于第二个问题，文章提出了一个称为 TTIO（Technical Trading Indicator Optimization）的框架。其中最重要的就是通过一种称为 Re-scaling Network 的方法计算股票对每种技术因子的权重。它包括两步：生成初始权重和权重归一化。

因为我们的假设会让具有相似属性的股票生成相似的 embedding。为了保持这种关系，我们不能进行过于复杂的变化，这里只用一个简单的线性变化来得到 re-scaling score，之后使用 softmax 函数进行归一化：

之后使用这个这个权重乘相应的技术因子获得优化过的因子：

之后使用信息系数（Information Correlation，IC）作为目标函数对这个单层神经网络进行优化。

因为投资的动态性，所以文章引入了 Rotation Learning 的方法随时间不断更新因子，如下图所示。

最后，文章对上述方法使用从 2013 年到 2016 年 2000 只股票的交易数据对如下表所示的七种因子进行了实验。

对照方法包括 Raw（原始因子），Norm re-scales（对原始因子进行归一化），NoEmb（将 stock embedding 作为训练参数直接进行训练）、Complex（将原始因子和股票 embedding 直接进行连接，输入一个两层的神经网络进行训练，为了测试过拟合问题）。

实验结果自然是吊打 baseline，如下图所示。但也有两个其他结论值得注意，Norm 方法相比 Raw 方法并不好，甚至要更差，这显示了除了相对大小，因子的绝对大小也很重要。而 Complex 虽然只使用了最简单的的两层神经网络，但过拟合问题也让它表现十分糟糕。

论文标题：Investment Behaviors Can Tell What Inside: Exploring Stock Intrinsic Properties for Stock Trend Prediction

论文链接：https://www.microsoft.com/en-us/research/uploads/prod/2019/11/p2376-chen.pdf

这篇文章的出发点是虽然深度学习已经在这么多领域取得令人瞩目的成就，但在股票市场上却仍然是人类投资者占据主导地位，因为他们在做决策时会考虑股票的内禀属性，把股票分成不同的种类。所以为了达到更好的预测准确率，要向人类投资者学习，解决以下两个问题：

如何挖掘股票的内禀属性？
如何将股票静态的内禀属性融入到深度神经网络中来加强动态的股票预测？

对于第一个问题，我们当然是使用 skip-gram。不好意思，串文了，skip-gram 是上一篇论文采取的方法，这篇文章提出了另一种解决方案，那就是万物皆可 Embedding 的另一个邪教——矩阵分解（Matrix Factorization）。

那去哪找矩阵呢？文章提出了一个有意思的假设：那些专业的基金经理比起我们这些小白来姿势水平肯定不知道高到哪里去了，他们在给自己管理的基金挑选股票组合时肯定倾向于选择有相似属性的股票（嗯，这里没串，两篇文章其实用的是同一个假设）。

所以我们构建一个行列的矩阵，矩阵中的元素表示基金经理对股票的投资行为（应该是金额或者比例，文章没有写明），和分别表示基金经理和股票的数量。之后按下图所示的方式分解得到股票的表示，这个包括和。

分解的目标函数为：

其中是基金经理的隐向量，是股票的隐向量。表示股票的 bias，表示基金经理的 bias，表示模型中的其他偏差。

虽然与上一篇文章生成股票 embedding 基于的假设相同。但是这篇文章指出了这个假设存在的问题：

除了基金经理偏好的股票属性，基金中的投资组合同样依赖于股票的动态趋势和风险分布。没有基金经理会投资一个在持续下跌的股票，即使它具有让他心动的优良属性。同样的，为了保证基金收益更加健壮，很多投资组合都会做风险平均。

但文章指出，这一问题可以通过使用足够长时间的投资组合的数据来解决，因为在长期内累积的投资行为会削弱上面两个因素的影响，让股票的内禀属性更好的暴露出来。

之后要解决的就是如何将上面得到的股票静态的内禀属性用于动态的股票预测呢？传统的做法是将股票在一个时刻的一些因子输入到类 RNN 的网络中，获得一个股票在时刻的动态表示。那么进行融合的简单想法就是直接进行拼接输入到感知机中。

但经验告诉我们，市场是动态的，它在不同的时间段对不同的股票内禀属性的偏好是不同的。所以文章提出了两种不同的方法来分别捕捉动态市场状态（dynamic market state）和和动态市场趋势（dynamic market trend）。

获取动态市场状态的方法较为简单，直接对时刻市场上收益率最高的只股票的表示向量进行平均即可获得时刻的市场偏好。之后利用获得的市场偏好对股票的向量表示做内积获得这只股票的当前市场状态。

基于市场偏好在连续两天很可能是一致的假设，我们可以利用时刻的市场状态来预测股票在时刻的收益排名。

虽然市场偏好在连续两天是一致的情况很有可能发生，但它并不总是对的。并且只使用最后的市场状态可能会遭遇市场上突发的高波动。我们可以使用 LSTM 使用过去的市场状态预测未来的市场趋势。

之后利用与股票表示做内积得，与拼接输入 MLP 即可。

训练的损失函数包括两部分，包括回归损失和排序损失。加入排序损失是因为每个股票都是独立的。其中：

实验部分，文章采用了 2012 年到 2016 年的股市数据，用 101 个因子计算。

对比的方法包括：stock_LSTM (ALSTM with dynamic stock inputs)、stock_SFM (A SFM with dynamic stock inputs)、DASR (Directly appending stock representation，直接拼接和 )，IMSR (Integrating market state representations，第一种融合方法)，IMTR (Integrating market trend representations，第二种融合方法)。

结果显示 IMSR 和 IMTR 优于 stock_LSTM 和 stock_LSTM。其他的发现包括 DASR 因为没有考虑股票和市场的动态特性所以表现不佳，但在 2015 年下半年却表现不错，因为在急剧变动的市场中，股票的内禀属性是保持不变的。

总结

MSRA 的两篇文章都是从传统的量化模型出发，挖掘更多的股票属性，并赋予因子动态时间特性。在将深度学习引入量化交易中的研究中，对传统的手工因子构造进行改造，发现更强大的因子或提出更有效的因子挖掘方法是可行性比较高，也是最为业界所接受的方法。

如果您对深度学习在量化交易中的应用感兴趣，欢迎加我微信一起学习探讨。

点击以下标题查看更多往期内容：

CVPR 2020 | 商汤TSD目标检测算法解读
如何理解用户评论中的细粒度情感？
EAE：自编码器 + BN + 最大熵 = 生成模型
针对复杂问题的知识图谱问答最新进展
深入理解图注意力机制（Graph Attention Network）
浅谈CTR预估模型发展史

#投稿通道#

让你的论文被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学习心得或技术干货。我们的目的只有一个，让知识真正流动起来。

???? 来稿标准：

• 稿件确系个人原创作品，来稿需注明作者个人信息（姓名+学校/工作单位+学历/职位+研究方向）

• 如果文章并非首发，请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发，均会添加“原创”标志

???? 投稿邮箱：

• 投稿邮箱：[email protected]

• 所有文章配图，请单独在附件中发送

• 请留下即时联系方式（微信或手机），以便我们在编辑发布时和作者沟通

????

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

从零开始：使用FunC编写TON智能合约之计数器篇 web3func区块链
在区块链技术的广泛应用中，智能合约无疑是最具前景的领域之一。智能合约允许我们在去中心化的环境中执行可信的交易和协议。TON（TheOpenNetwork）作为新兴的区块链平台，以其高效、可扩展的特性吸引了众多开发者的关注。本文将带你入门TON智能合约的编写，通过实现一个简单的计数器合约，让你掌握使用FunC语言编写智能合约的基本技巧。了解TON与FunC在开始编写智能合约之前，我们需要对TON和F
@RequestBody接收Json参数 | 用自定义注解对Vo对象中Date类型日期格式校验手hold刺猬 003.疑难问题 java springmvc json 正则表达式 spring boot
标题太长有木有？主要是为了把问题描述清楚，免得进错文章。问题描述昨天测试的同事测试接口的时候，测试出来一个Date类型校验问题。要求输入的日期格式是：yyyy-MM-ddHH:mm:ss，Vo中使用的注解如下：@DateTimeFormat(pattern=”yyyy-MM-ddHH:mm:ss”)测试同事输入下面两种参数都是保存成功，当输入为“202105”参数时，保存的数据变为“1970-01
QAT与PTQ模型量化方法的区别 old_power 计算机视觉模型量化深度学习计算机视觉
QAT（QuantizationAwareTraining）和PTQ（PostTrainingQuantization）是两种常见的模型量化方法，用于减少深度学习模型的计算和存储开销，同时尽量保持模型的性能。1.QAT（QuantizationAwareTraining）定义：QAT是在模型训练过程中引入量化操作，使模型在训练时就能感知到量化带来的影响，从而更好地适应量化后的精度损失。流程：在训练
毕设分享深度学习街道行人流量计数系统 fawubio_A 毕业设计 python 毕设
文章目录0前言1项目运行效果2设计概要2原理介绍2.1目标检测概况什么是目标检测？发展阶段2.2行人检测行人检测简介行人检测技术难点行人检测实现效果4最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要
golang工程组件篇:高性能RPC框架gRPC之Resolver服务名称解析器 SMILY12138 golang rpc
gRPC是一种基于Protobuf的高性能RPC框架，可以支持多种编程语言。在实际生产环境中，我们需要使用gRPC来构建分布式系统和微服务，并且保证连接的稳定性和可靠性。本篇文章将介绍gRPC如何使用Resolver服务名称解析器来提供更灵活的服务发现机制。什么是Resolver？在gRPC中，服务名称通常被用作客户端和服务器之间的地址标识符。例如，我们可以通过以下方式创建一个gRPC客户端连接：
Keras、TensorFlow、PyTorch框架对比及服务器配置揭秘小深ai硬件分享人工智能深度学习服务器
深度学习框架：开启智能大门的钥匙在数字化浪潮中，深度学习如明星照亮众多领域。从智能安防的人脸识别，到医疗图像分析、电商商品推荐、智能语音助手等，其身影无处不在，改变着生活与工作方式。在深度学习领域，Keras、TensorFlow和PyTorch是主流框架，能助开发者构建强大智能模型。但这些框架要充分发挥作用，离不开合适的服务器配置，就像魔法师需要魔法棒和魔力，下面我们就来看看这些具体的框架吧:框
深度学习｜表示学习｜卷积神经网络｜局部链接是什么？｜06 漂亮_大男孩表示学习深度学习学习 cnn
如是我闻：局部连接（LocalConnectivity），是卷积神经网络（CNN）中的一个关键特性。什么是局部连接（LocalConnectivity）？局部连接指的是：在卷积操作中，每个神经元（或输出单元）只与输入数据的一个局部区域相关联，而不是与整个输入数据相连。换句话说：全连接网络（FullyConnectedLayer）中，每个神经元会与上一层所有的神经元相连。卷积网络（Convoluti
RabbitMQ系列-异常处理 M_Joes_18 RabbitMQ RabbitMQ系列 EXCEPTION
1.当AcknowledgeMode=AUTO时@Bean(value="myRabbitListenerContainer")publicSimpleMessageListenerContainersimpleMessageListenerContainer(ConnectionFactoryconnectionFactory){SimpleMessageListenerContainercon
feign调用跳过HTTPS的SSL证书校验配置详解秋分的秋刀鱼 Java 网络编程 ssl https 网络 java
一、问题抛出如果不配置跳过SSL证书校验，当Feign客户端尝试连接到一个使用自签名证书的服务器时，可能会抛出类似以下的异常：javax.net.ssl.SSLHandshakeException:sun.security.validator.ValidatorException:PKIXpathbuildingfailed:sun.security.provider.certpath.SunCe
2025春招，Spring 面试题汇总 springjava面试
大家好，我是V哥。2025年金三银四春招马上进入白热化，兄弟们在即将到来的假期，除了吃喝欢乐过新年，想年后跳槽升职的兄弟也要做好充分的准备，要相信，机会永远只留给有准备的人。以下是一份2025年春招Spring面试题汇总，送给大家，关于Java基础相关的请移步V哥上一篇文章《【长文收藏】2025备战金三银四Java大厂面试题》：Spring基础部分一、Spring基础1.什么是Spring框架？答
【檀越剑指大厂--RocketMQ】RocketMQ运维篇 Kwan的解忧杂货铺@新空间代码工作室 s总檀越剑指大厂 java-rocketmq rocketmq 运维
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kuan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
DevEcoStudio性能工具集介绍 harmonyos
课程简介本课程是【HarmonyOSTechTalk】的第15课。本次交流聚焦于IDE性能工具集这一关键开发辅助资源。该工具集涵盖多方面重要功能，性能检测可精准定位应用运行中可能存在的效率瓶颈与问题所在；性能分析则深入挖掘问题根源，剖析各类性能数据背后的关联与原因；而性能指导依据专业知识与经验提供最佳解决方案。开发者借助这一强大的IDE性能工具集，能在鸿蒙应用开发过程中显著提升性能优化分析效率，有
2025 年夸克网盘免费扩容1TB空间指引，超详细教程（建议收藏） chusheng1840 夸克网盘夸克网盘免费扩容‘夸克网盘领取空间夸克网盘扩容
2025年夸克网盘免费扩容1TB空间指引（保姆级教程）哈喽大家好，这里是专注于挖掘各种实用福利的小助手！你有没有遇到过这样的烦恼——网盘存储空间不够用，想存的电影、照片、文件全都放不下？今天我就来给大家安利一个宝藏福利，夸克网盘新用户免费领取1TB存储空间，不仅不限速，还不需要开会员！是不是听着就很心动？别急，今天的教程全程手把手带你走流程，分分钟搞定超大空间！在手机APP登陆操作，电脑端是不能领
c#使用Confluent.Kafka实现生产者发送消息至kafka（远程连接kafka发送消息超时的解决 Local：Message timed out） Shinobi_Jack kafka 分布式
水一篇：参考：c#使用Confluent.Kafka实现生产者发送消息至kafka（远程连接kafka发送消息超时的解决Local：Messagetimedout）-寒冰之光-博客园该死的Kafka，远程连接Kafka超时以及解决办法-博客王大锤-博客园
ERROR: Could not find a version that satisfies the requirement re（from versions: none）异常的解决方法，亲测有效，嘿代码无疆 Python python 开发语言
文章目录问题分析报错原因解决思路解决方法1.如果您是在尝试使用正则表达式，并且误将`re`当成了一个包：2.如果您确实是在寻找一个第三方包，但打错了名字：3.如果您确定`re`是正确的，并且只是想确保它已经安装（虽然它总是预装的）：当您遇到错误ERROR:Couldnotfindaversionthatsatisfiestherequirementre(fromversions:none)时，这通
深度学习中交叉熵函数的导数:(极简) 洪小帅深度学习人工智能神经网络 python
文章目录前言一.交叉熵函数的导数二.Z,y为有n条数据的矩阵前言另一个博主有更详细的推导https://blog.csdn.net/chaipp0607/article/details/101946040一.交叉熵函数的导数softmax:令一条数据最后的输出为[z1,z2,z3,z4,…,z10],这里令输出层的神经元数量为10pi=ezi∑j=110ezjpi=\frac{e^{z_i}}{\
Flask学习笔记(一):基本框架和HTTP处理洪小帅 flask 学习笔记 python web
文章目录前言flask学习笔记1.基本框架1.1视图函数与路由1.2模板与静态文件2.HTTP与flask2.1Request对象2.2request获取url参数2.2.1args.get()方法2.2.2args.getlist()方法2.3处理请求2.4重定向总结前言兄弟们,flak是真好用吧!本文是笔者学习flask时做的笔记的第一篇,记录了一些最基础且常用的入门级操作.flask学习笔记
2025美赛数学建模B题思路+模型+代码+论文灿灿数模数学建模
2025美赛数学建模A题+B题+C题+D题+E题思路+模型+代码（1.24第一时间更新，更新见文末名片）论文数学建模感想纪念逝去的大学数学建模：两次校赛，两次国赛，两次美赛，一次电工杯。从大一下学期组队到现在，大三下学期，时间飞逝，我的大学建模生涯也告一段落。感谢建模路上帮助过我的学长和学姐们，滴水之恩当涌泉相报，写下这篇感想，希望可以给学弟学妹们一丝启发，也就完成我的想法了。拙劣的文笔，也不知道
【Python】已完美解决：ERROR: Could not find a version that satisfies the requirement re 屿小夏 python 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
Qt 控件与布局管理行十万里人生 Qt qt microsoft 数据库华为 harmonyos 华为云华为od
1.Qt控件的父子继承关系在Qt中，继承自QWidget的类，通常会在构造函数中接收一个parent参数。这个参数用于指定当前空间的父控件，从而建立控件间的父子关系。当一个控件被设置为另一控件的子控件时，它会自动成为该父控件的一部分，且具备以下特性：子控件会随着父控件，一起显示或隐藏；子控件会被包含在父控件的几何布局中；当父控件被删除时，所有的子控件会被自动删除，防止内存泄漏。//.hclassS
当 Nginx 出现连接超时问题，如何排查？ m0_74823131 nginx php 数据库
文章目录当Nginx出现连接超时问题，如何排查？一、了解Nginx连接超时的基本概念二、可能导致Nginx连接超时的原因（一）服务器负载过高（二）上游服务响应缓慢（三）网络问题（四）Nginx配置不当（五）客户端问题三、排查Nginx连接超时问题的方法（一）检查服务器资源使用情况（二）分析Nginx日志（三）检查上游服务（四）测试网络环境（五）检查Nginx配置（六）模拟客户端请求四、解决Ngin
vue和reacts数据响应式的差异每天吃饭的羊 react+ts新手 vue.js javascript 前端
Vue的数据响应式：原理：Vue使用Object.defineProperty或Proxy（在Vue3中）来实现数据的响应式。当创建Vue实例时，会对data对象中的属性进行遍历，将其转换为响应式属性。对于Object.defineProperty，它会为每个属性定义getter和setter函数，getter会收集依赖（如模板中的表达式、计算属性或watch监听器），而setter会触发更新，通
下载马斯克Grok-1模型的实战代码 herosunly 大模型 grok-1 下载模型实战代码
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了下载马斯克Grok-1模型的实战代码，希望能对学习大模型的同学们有所帮助
淘宝/天猫获取sku详细信息 API 返回值说明 API-小海豚数据库服务器运维网络爬虫
淘宝和天猫平台允许开发者通过API接口获取商品的详细信息，包括价格、商品属性和SKU（StockKeepingUnit，库存量单位）等。以下是关于获取SKU详细信息API的返回值说明及代码示例：一、API返回值说明当调用获取SKU详细信息的API时，服务器会返回一个包含商品SKU详情的响应。以下是一个简化的返回值示例：json复制代码{"item":{"num_iid":"商品ID",//商品ID
什么是网络爬虫？Python爬虫到底怎么学？糯米导航文末下载资源 python
最近我在研究Python网络爬虫，发现这玩意儿真是有趣，干脆和大家聊聊我的心得吧！咱们都知道，网络上的信息多得就像大海里的水，而网络爬虫就像一个勤劳的小矿工，能帮我们从这片浩瀚的信息海洋中挖掘出需要的内容。接下来，我就带你们一步步看看该怎么用Python搞定网络爬虫。为啥选择Python写爬虫？说到Python，简直是写爬虫的最佳选择！它有许多现成的库，就像拥有了各种好用的工具，使得我们的工作变得
吴恩达深度学习笔记（七）——机器学习策略子非鱼icon 深度学习自学笔记深度学习机器学习人工智能神经网络吴恩达
一、正交化通俗的理解就是：要能够诊断出系统性能瓶颈在哪里，以有策略刚好解决这个问题。一个“按钮”只负责解决一件事情。二、单一数字评估指标准确率（precision）：在分类器中标记为猫的例子中，有多少是真的猫召回率（recall）：对于所有的真猫图片，你的分类器正确识别了多少。但如果有两个评估指标，就很难去选择一个更好的分类器，如下图所示。所以有一个结合这两个指标的标准方法，也即F1分数，定义如下
什么是僵尸进程 C嘎嘎嵌入式开发 C++服务器数据库 c++
什么是僵尸进程1.僵尸进程的定义僵尸进程是指那些已经终止执行（即已经调用了exit()或者完成了main()函数），但其父进程尚未通过wait()或waitpid()系统调用获取其退出状态的进程。在进程的生命周期中，当一个子进程结束时，它会将其退出状态信息（包括退出码、资源使用情况等）发送给其父进程。如果父进程没有及时读取这些信息，子进程就会变成僵尸状态。2.僵尸进程的生命周期创建阶段：父进程通过
Java 大视界 -- Java 大数据文本分析与自然语言处理：从文本挖掘到智能对话一只蜗牛儿 java 大数据自然语言处理
在当今的信息化时代，数据成为了重要的资源。特别是文本数据，随处可见，如社交媒体、新闻网站、技术文档、客户反馈等，这些都包含着大量的潜在信息。因此，如何从海量的文本中提取有价值的信息，成为了大数据分析领域的重要课题。Java作为一种高效、灵活的编程语言，在大数据文本分析与自然语言处理（NLP）中发挥着至关重要的作用。本文将介绍如何利用Java开发大数据文本分析和自然语言处理（NLP）应用，带领你从文
GitHub的主要用途及核心功能王景程 github git
------>在给手机成功root之后，我也经常光临GitHub，在上面挖掘好玩的模块还有，并根据其源代码进行学习。那GitHub是什么网站呢？它又有什么功能？GitHub是什么？GitHub是一个基于Git的版本控制和代码托管平台，也是全球最受欢迎的开发者协作工具之一。它最初于2008年上线，目前已被微软收购。GitHub的核心功能是帮助开发者存储和管理代码，同时支持多人协作开发、版本控制以及项
Oracle筑基篇-体系结构概览 CodeBe@r #Oracle oracle 数据库 Oracle体系结构
1、体系结构一览今天梳理Oracle的整体的体系结构，后面再详细梳理其中重要的那些结构。图1Oracle体系机构思维导图2、组件作用概述Oracle有两大块组成，一大块是Oralce实例（oracleinstance）一大块是Oralce数据库（oracledatabase），Oracle数据库是实实在在存储在硬盘上的三类文件：数据文件、日志文件和控制文件。数据库启动起来以后，首先在内存划出一块空
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

当深度学习遇上量化交易——因子挖掘篇

你可能感兴趣的:(当深度学习遇上量化交易——因子挖掘篇)