AI夏令营(第二期) - AI量化模型预测挑战赛——笔记1赛题解析篇

        参加了第一期没有做笔记,本着第二期量化很感兴趣的想法,打算好好做个笔记,作为AI小白,第一期和第二期都选了机器学习,因为别的都不会啊。

AI夏令营(第二期) - AI量化模型预测挑战赛——笔记1赛题解析篇_第1张图片

 问题背景赛事任务:

      这次报名的具体项目是跟金融相关的AI量化模型预测挑战赛,具体的赛事任务为:

输入数据:

        给定训练集(含验证集), 包括10只股票、79个交易日的L1snapshot数据(前64个交易日为训练数据,用于训练;后15个交易日为测试数据,不能用于训练), 数据已进行规范化和隐藏处理,包括5档量/价,中间价,交易量等数据。可以说是对小白来说很友好了,sysm0-9代表10只股票,date0-78代表79个交易日。

AI夏令营(第二期) - AI量化模型预测挑战赛——笔记1赛题解析篇_第2张图片

  • 行情频率:3秒一个数据点(也称为1个tick的snapshot);行情频率指的是在金融市场中,特定交易品种的价格数据更新的时间间隔。在这里,行情频率为每3秒更新一次,即每3秒记录一个数据点,也称为 "1个tick的snapshot"。

  • 每个数据点包括当前最新成交价/五档量价/过去3秒内的成交金额等数据;当前最新成交价:表示在当前时刻最后一次成交的交易价格。这是市场上最近的一笔交易的成交价格。五档量价:表示当前市场上买卖挂单的五档价格和对应的成交量。通常有五档买盘和五档卖盘,分别显示了当前最高的五个买入价格和对应的买入量,以及最低的五个卖出价格和对应的卖出量。过去3秒内的成交金额:表示在过去三秒内市场上所有的成交交易总金额。这个数据可以用来反映市场在短时间内的交易活跃程度和资金流动情况。

  • 训练集中每个数据点包含5个预测标签的标注;允许利用过去不超过100tick(包含当前tick)的数据,预测未来N个tick后的中间价移动方向。预测时间跨度:5、10、20、40、60个tick,5个预测任务;即在t时刻,分别预测t+5tick,t+10tick,t+20tick,t+40tick,t+60tick以后:最新中间价相较t时刻的中间价:下跌/不变/上涨。

 读取一下数据:n_bid1-5代表买一到买五的价格,n_bsize1-5:代表买一到买五的成交量,n_ask1-5代表卖一到卖五的价格,n_asize1-5代表卖一到卖五的成交量。

AI夏令营(第二期) - AI量化模型预测挑战赛——笔记1赛题解析篇_第3张图片

         带上中间(中间价即买价与卖价的均值)价可视化:

AI夏令营(第二期) - AI量化模型预测挑战赛——笔记1赛题解析篇_第4张图片

 接着跑通baseline,提交成果,下次再战了

最后给出阿水老师的竞赛学习路径,只要能坚持下去的肯定都是牛人呀AI夏令营(第二期) - AI量化模型预测挑战赛——笔记1赛题解析篇_第5张图片

你可能感兴趣的:(AI夏令营第二期机器学习笔记,人工智能,笔记,python)