数据分析实战-Kaggle-Twitter情感识别-基于Spacy的语句提取

目录

 

一、题目解析

二、开发环境

三、数据分析过程


一、题目解析

英文题目:

"My ridiculous dog is amazing." [sentiment: positive]

With all of the tweets circulating every second it is hard to tell whether the sentiment behind a specific tweet will impact a company, or a person's, brand for being viral (positive), or devastate profit because it strikes a negative tone. Capturing sentiment in language is important in these times where decisions and reactions are created and updated in seconds. But, which words actually lead to the sentiment description? In this competition you will need to pick out the part of the tweet (word or phrase) that reflects the sentiment.

中文解析:其实我一开始没弄明白这是啥意思,直到看了数据,先给大家看数据吧。

train .csv

数据分析实战-Kaggle-Twitter情感识别-基于Spacy的语句提取_第1张图片

test.csv

数据分析实战-Kaggle-Twitter情感识别-基于Spacy的语句提取_第2张图片

最后需要提交的东西呢,就是select_text。所以题目的意思就是,根据text(这个是用户真正发的内容)去提取selected_text,就是提取原文中能代表用户心情的语句。目的是方便Twitter以后做舆论分析啥的吧,这个咱管不着。下面让我们开始我们的分析之旅。

二、开发环境

Windows10 + Jupter Notebook(这个选择也让我吃了大亏,写博客的时候没有办法直接上传,只能通过先转Latex再转

PDF再转长图,我都要死了,垃圾csdn的markdown。)

需要源码的同学可以在博客下面留言,我直接发。

三、数据分析过程

你可能感兴趣的:(项目实战,kaggle,python,NLP,数据分析,spacy)