AI自动写报告,原来如此简单

       笔者在之前的博客(https://mp.csdn.net/postedit/88074516)曾提到过,各券商的研报基本上可以认为是上市公司财报的缩水版,而最近笔者又发现tushare.pro(https://tushare.pro/document/2?doc_id=45)可以提供各大公司的业绩公告,那么利用AI自动来写一篇报告就可以期待了。

       具体说来让AI自动分这么几步:

      1.爬取各上市公司的业绩公告,然后进行清洗并用jieba分词,生成一份语料库。

      2.使用word2vec(fasttext)或者Glove对于语料库进行训练,将相应词语转化为300-500维的向量。

     3.再爬取各券商的研报,然后清洗并用jieba分词,使用第2步生成的词向量结果,将分词后的研报转化为词向量的数组。

      4.利用第3步生成的词向量数组进行整理,生成一个长度为N(一般券商的研报中句子长度在10左右,所以N设为10)的输入X,并取第N+1个位置的词向量为输出Y的训练集,并使用生成模型(LSTM模型)进行训练。

    这里我重点解释一个第四步,假如我们认为一篇研报中出现在后的词是由其前面的单词决定的,那么我们就可以认为第

你可能感兴趣的:(python,quant,AI与最新技术演进)