Twitter 能否预测股市?

http://www.guokr.com/article/62535/


Lithium锂  2011-09-06 20:30

今年5月,世界首家基于社交媒体的对冲基金 Derwent Capital Markets 在屡次跳票后终于上线。它会即时关注 Twitter 中的公众情绪指导投资。正如基金创始人保罗•郝汀(Paul Hawtin)表示:“长期以来,投资者已经广泛地认可金融市场由恐惧和贪婪驱使,但我们从未拥有一种技术或数据来量化人们的情感。”一直为金融市场非理性举动所困惑的投资者,终于有了一扇可以了解心灵世界的窗户——那便是 Twitter 每天浩如烟海的推文[1]。

小试牛刀,成果斐然

尽管针对公众情绪的调查耗时耗力,仍有一些研究另辟蹊径,揭示出情绪与股市关联中的冰山一角。对39个国家的调查表明,当在如世界杯、欧洲杯的国际球赛中输球时,当地的股价指数会受到显著的负面影响[2]。天气变化也会波及股市。给一点阳光,股票收益率便会和人们的心情一样灿烂[3]。

美国印第安纳大学的约翰•博伦(Johan Bollen)等人[4],则将目光投向了新兴的社交网络 Twitter。这个反映公众情绪的绝佳晴雨表,在预测电影票房、选举结果等方面,都有不俗的表现。研究者采用了两种情绪追踪工具。一种是开源工具OpinionFinder,能将推文二分为正面和负面情绪;另一种则是研究者在临床上使用的情绪状态量表(POMS)基础上,新开发出的情绪测试工具GPOMS。它能将公众的情绪分为冷静、警惕、确信、活力、友善和幸福这六个类别。

为了验证两个工具的准确性,研究者将公众情绪和社会事件对比,结果十分吻合。例如,在总统大选日(2008年11月4日)期间,Twitter 在大选日前一天开始紧张,在大选日当天变得冷静、活力、友善、幸福,总体情绪在大选日后又回归平常。在感恩节(11月28日)当天,整个 Twitter 洋溢着浓浓的幸福味道,过后又恢复正常。

而最令人激动的是,将“冷静”情绪指数后移3天,竟然和道琼斯工业平均指数惊人一致。其他情绪则没有这样的效果。另外,研究者还测试了一个称为SOFNN的股市预测模型。当仅输入股市数据时,模型已经有73.3%的准确率;加入“冷静”的情感信息后,准确率更升至86.7%。

但是,Twitter 情绪指标,仍然不可能预测出会冲击金融市场的突发事件。例如,在2008年10月13号,美国联邦储备委员会突然启动一项银行纾困计划,令道琼斯指数反弹,而3天前的Twitter冷静指数自然毫无征兆。而且,研究者自己也意识到,Twitter 用户与股市投资者并不完全重合,这样的样本代表性有待商榷。

公众情绪中的冷静指数(红线)后移3天和道琼斯工业指数(蓝线)能够很好的匹配。这种一致性在灰色区域尤其显著,而在白色区域不尽如人意。

深入挖掘,仍有收获

博伦的研究,也启发着更多研究者对于社交网络进一步地探讨。麻省理工学院的张雪(音译)等人[6],根据情绪词将推文标定为正面或负面情绪。结果发现,无论是如“希望”的正面情绪,或是“害怕”、“担心”的负面情绪,其占总推文数的比例,都预示着道琼斯指数、标准普尔500指数、纳斯达克指数的下跌。研究者据此认为,只要是情绪的突然爆发,无论希望或担忧,都反映出人们对于市场的不确定性,因此能预测股市之后的走向。

慕尼黑工业大学的两位学者对 Twitter 进行了更为细致的分析[5]。他们筛选出提到标准普尔100指数中的公司的推文(比如 $AAPL 代表苹果公司),分为 “买入”、“持有”或“卖出”三类,并算出每支股票的看涨程度。结果同样鼓舞人心。例如,推文的总数和交易量,看涨程度和标准普尔100指数之间,都有密切相关。更具操作意义的是,如果投资者采取“买入”看涨程度最高的3支股票,“卖出”最低3支的策略,半年便有高达15%的收益。

美国佩斯大学的博士生亚瑟•奥康纳(Arthur O’Connor)[7],则采用了另外一种思路。他追踪了星巴克、可口可乐和耐克三家公司在社交媒体上的受欢迎程度,同时比较它们的股价。他发现,Facebook上的粉丝数、Twitter 上的听众数和 Youtude 上的观看人数,都和股价密切相关。品牌的受欢迎程度,还能预测股价在10天、30天之后的上涨情况。

品牌在社交媒体上的受欢迎程度,能够预测它们在股市中的表现。图片来自 famecount.com

争议颇多

这样前瞻性的尝试,自然会招来反对的声音。特许财务分析师(CFA)协会创新与新兴媒体主管莱恩•科斯塔(Len Costa)虽然态度温和,但仍不赞成 Twitter 情绪指数的滥用:“对于严肃的专业投资者来说,在作出投资决定时,没有什么可以替代合理的审慎、独立的专业判断和由适当的研究与调查支持的基础。”[8]

美国圣母大学的研究者则对情绪分析的基础提出质疑。他们发现在语义分析中广泛使用的哈佛心理社会学词典中,近3/4被归为“负面”的词汇,在金融领域中并无情感判断[9]。例如vice(邪恶)、tire(疲劳)、crude(粗鲁的),可能仅仅是vice-president(副总裁)、tire(轮胎)和crude oil(原油)。

然而,这一切反对声音,似乎都无法阻止投资者对于新兴的社交网络倾注更多的热情(希望他们对果壳网也如此)。一份八月份的报道显示,利用 Twitter 的对冲基金 Derwent Capital Markets 在首月的交易中确实盈利了。它以1.85%的收益率,让平均数只有0.76%的其他对冲基金相形见绌[10]。

这是最好的时代。在5亿用户的 Facebook,2亿用户的 Twitter 构筑的社交网络帝国中,似乎一切皆有可能,每天都让人期待。这是最坏的时代。谣言共真相一色,吹捧与贬低齐飞。我们每一个人都身处于社交网络之中,当你正在阅读果壳网这篇文章时尤其如此,而我们却不知道它最终会将我们引向何方。


名词解释

【 对冲基金 (hedge fund)】是指由金融期货(financial futures)和金融期权(financial option)等金融衍生工具(financial derivatives)与金融组织结合后,高风险投机为手段而以盈利为目的的金融基金

【 跳票 】原本为金融用语,指因为支票帐户内没有钱,银行无法兑现支票,遂把此空头支票寄还给支票持有人的行为。“跳票”之后,开此空头支票的人只会受到罚款。现在也指无法在原定发售日推出的产品都可说是跳了票,有“延期发行”的意思。现在跳票通俗说就是本来公布了某天要做什么,但是一直没有做。

【 标准普尔100指数 】标准普尔指数是美国最大的证券研究机构即标准•普尔公司编制的股票价格指数。是继道•琼斯之后美国第二大股票价格指数。标普100指数是由标准普尔公司在标普500当中最强的100只成份股编写而成。

参考文献

[1] The World's First Twitter-Based Hedge Fund Is Finally Open for Business

[2] Edmans A, Garca D, Norli Ø. (2007). Sports Sentiment and Stock Returns. Journal of Finance 62, 1967–1998.

[3] Hirshleifer D, Shumway T. (2003). Good Day Sunshine: Stock Returns and the Weather. Journal of Finance 58, 1009–1032.[4]Bollen J, Mao HN, Zeng XJ. (2010). Journal of Computational Science. 2(1), 1-8.

[4] Bollen J, Mao HN, and Zeng XJ. (2010). Twitter mood predicts the stock market, Arxiv working paper, Indiana University.

[5] Sprenger, Timm O. and Welpe, Isabell M. (2010). Tweets and Trades: The Information Content of Stock Microblogs. http://ssrn.com/abstract=1702854

[6] Zhang X, Fuehres H, and Gloor P. (2010). Predicting stock market indicators through Twitter – “I hope it is not as bad as I fear”. In COIN Collaborative Innovations Networks Conference, 1-8.

[7] New study finds link between social media popularity and stock prices

[8] Can Twitter Predict Stock Market Moves?

[9] Tim Loughran, Bill Mcdonald. (2011). When is a Liability not a Liability Textual Analysis, Dictionaries, and 10-Ks. The Journal of Finance. 66(1), 35–65.

[10] Twitter Hedge Fund Beat Market In Its First Month


Lithium锂  2011-09-06 20:30

今年5月,世界首家基于社交媒体的对冲基金 Derwent Capital Markets 在屡次跳票后终于上线。它会即时关注 Twitter 中的公众情绪指导投资。正如基金创始人保罗•郝汀(Paul Hawtin)表示:“长期以来,投资者已经广泛地认可金融市场由恐惧和贪婪驱使,但我们从未拥有一种技术或数据来量化人们的情感。”一直为金融市场非理性举动所困惑的投资者,终于有了一扇可以了解心灵世界的窗户——那便是 Twitter 每天浩如烟海的推文[1]。

小试牛刀,成果斐然

尽管针对公众情绪的调查耗时耗力,仍有一些研究另辟蹊径,揭示出情绪与股市关联中的冰山一角。对39个国家的调查表明,当在如世界杯、欧洲杯的国际球赛中输球时,当地的股价指数会受到显著的负面影响[2]。天气变化也会波及股市。给一点阳光,股票收益率便会和人们的心情一样灿烂[3]。

美国印第安纳大学的约翰•博伦(Johan Bollen)等人[4],则将目光投向了新兴的社交网络 Twitter。这个反映公众情绪的绝佳晴雨表,在预测电影票房、选举结果等方面,都有不俗的表现。研究者采用了两种情绪追踪工具。一种是开源工具OpinionFinder,能将推文二分为正面和负面情绪;另一种则是研究者在临床上使用的情绪状态量表(POMS)基础上,新开发出的情绪测试工具GPOMS。它能将公众的情绪分为冷静、警惕、确信、活力、友善和幸福这六个类别。

为了验证两个工具的准确性,研究者将公众情绪和社会事件对比,结果十分吻合。例如,在总统大选日(2008年11月4日)期间,Twitter 在大选日前一天开始紧张,在大选日当天变得冷静、活力、友善、幸福,总体情绪在大选日后又回归平常。在感恩节(11月28日)当天,整个 Twitter 洋溢着浓浓的幸福味道,过后又恢复正常。

而最令人激动的是,将“冷静”情绪指数后移3天,竟然和道琼斯工业平均指数惊人一致。其他情绪则没有这样的效果。另外,研究者还测试了一个称为SOFNN的股市预测模型。当仅输入股市数据时,模型已经有73.3%的准确率;加入“冷静”的情感信息后,准确率更升至86.7%。

但是,Twitter 情绪指标,仍然不可能预测出会冲击金融市场的突发事件。例如,在2008年10月13号,美国联邦储备委员会突然启动一项银行纾困计划,令道琼斯指数反弹,而3天前的Twitter冷静指数自然毫无征兆。而且,研究者自己也意识到,Twitter 用户与股市投资者并不完全重合,这样的样本代表性有待商榷。

公众情绪中的冷静指数(红线)后移3天和道琼斯工业指数(蓝线)能够很好的匹配。这种一致性在灰色区域尤其显著,而在白色区域不尽如人意。

深入挖掘,仍有收获

博伦的研究,也启发着更多研究者对于社交网络进一步地探讨。麻省理工学院的张雪(音译)等人[6],根据情绪词将推文标定为正面或负面情绪。结果发现,无论是如“希望”的正面情绪,或是“害怕”、“担心”的负面情绪,其占总推文数的比例,都预示着道琼斯指数、标准普尔500指数、纳斯达克指数的下跌。研究者据此认为,只要是情绪的突然爆发,无论希望或担忧,都反映出人们对于市场的不确定性,因此能预测股市之后的走向。

慕尼黑工业大学的两位学者对 Twitter 进行了更为细致的分析[5]。他们筛选出提到标准普尔100指数中的公司的推文(比如 $AAPL 代表苹果公司),分为 “买入”、“持有”或“卖出”三类,并算出每支股票的看涨程度。结果同样鼓舞人心。例如,推文的总数和交易量,看涨程度和标准普尔100指数之间,都有密切相关。更具操作意义的是,如果投资者采取“买入”看涨程度最高的3支股票,“卖出”最低3支的策略,半年便有高达15%的收益。

美国佩斯大学的博士生亚瑟•奥康纳(Arthur O’Connor)[7],则采用了另外一种思路。他追踪了星巴克、可口可乐和耐克三家公司在社交媒体上的受欢迎程度,同时比较它们的股价。他发现,Facebook上的粉丝数、Twitter 上的听众数和 Youtude 上的观看人数,都和股价密切相关。品牌的受欢迎程度,还能预测股价在10天、30天之后的上涨情况。

品牌在社交媒体上的受欢迎程度,能够预测它们在股市中的表现。图片来自 famecount.com

争议颇多

这样前瞻性的尝试,自然会招来反对的声音。特许财务分析师(CFA)协会创新与新兴媒体主管莱恩•科斯塔(Len Costa)虽然态度温和,但仍不赞成 Twitter 情绪指数的滥用:“对于严肃的专业投资者来说,在作出投资决定时,没有什么可以替代合理的审慎、独立的专业判断和由适当的研究与调查支持的基础。”[8]

美国圣母大学的研究者则对情绪分析的基础提出质疑。他们发现在语义分析中广泛使用的哈佛心理社会学词典中,近3/4被归为“负面”的词汇,在金融领域中并无情感判断[9]。例如vice(邪恶)、tire(疲劳)、crude(粗鲁的),可能仅仅是vice-president(副总裁)、tire(轮胎)和crude oil(原油)。

然而,这一切反对声音,似乎都无法阻止投资者对于新兴的社交网络倾注更多的热情(希望他们对果壳网也如此)。一份八月份的报道显示,利用 Twitter 的对冲基金 Derwent Capital Markets 在首月的交易中确实盈利了。它以1.85%的收益率,让平均数只有0.76%的其他对冲基金相形见绌[10]。

这是最好的时代。在5亿用户的 Facebook,2亿用户的 Twitter 构筑的社交网络帝国中,似乎一切皆有可能,每天都让人期待。这是最坏的时代。谣言共真相一色,吹捧与贬低齐飞。我们每一个人都身处于社交网络之中,当你正在阅读果壳网这篇文章时尤其如此,而我们却不知道它最终会将我们引向何方。


名词解释

【 对冲基金 (hedge fund)】是指由金融期货(financial futures)和金融期权(financial option)等金融衍生工具(financial derivatives)与金融组织结合后,高风险投机为手段而以盈利为目的的金融基金

【 跳票 】原本为金融用语,指因为支票帐户内没有钱,银行无法兑现支票,遂把此空头支票寄还给支票持有人的行为。“跳票”之后,开此空头支票的人只会受到罚款。现在也指无法在原定发售日推出的产品都可说是跳了票,有“延期发行”的意思。现在跳票通俗说就是本来公布了某天要做什么,但是一直没有做。

【 标准普尔100指数 】标准普尔指数是美国最大的证券研究机构即标准•普尔公司编制的股票价格指数。是继道•琼斯之后美国第二大股票价格指数。标普100指数是由标准普尔公司在标普500当中最强的100只成份股编写而成。

参考文献

[1] The World's First Twitter-Based Hedge Fund Is Finally Open for Business

[2] Edmans A, Garca D, Norli Ø. (2007). Sports Sentiment and Stock Returns. Journal of Finance 62, 1967–1998.

[3] Hirshleifer D, Shumway T. (2003). Good Day Sunshine: Stock Returns and the Weather. Journal of Finance 58, 1009–1032.[4]Bollen J, Mao HN, Zeng XJ. (2010). Journal of Computational Science. 2(1), 1-8.

[4] Bollen J, Mao HN, and Zeng XJ. (2010). Twitter mood predicts the stock market, Arxiv working paper, Indiana University.

[5] Sprenger, Timm O. and Welpe, Isabell M. (2010). Tweets and Trades: The Information Content of Stock Microblogs. http://ssrn.com/abstract=1702854

[6] Zhang X, Fuehres H, and Gloor P. (2010). Predicting stock market indicators through Twitter – “I hope it is not as bad as I fear”. In COIN Collaborative Innovations Networks Conference, 1-8.

[7] New study finds link between social media popularity and stock prices

[8] Can Twitter Predict Stock Market Moves?

[9] Tim Loughran, Bill Mcdonald. (2011). When is a Liability not a Liability Textual Analysis, Dictionaries, and 10-Ks. The Journal of Finance. 66(1), 35–65.

[10] Twitter Hedge Fund Beat Market In Its First Month

你可能感兴趣的:(机器学习)