【产品分析】某红书数据采集数据分析评论分析笔记爬虫采集

伴随着购买力及消费水平的日益提高,健康养生的观念日益普及,我国居民消费者更加注重自身健康管理及生活品质的提高。提前摄取保健品提高健康水平、并减少药品治疗的健康理念得到社会广泛认同,营养保健食品消费日渐成为习惯。同时环境污染等问题日益突出,亦扩大了功能性软糖等营养保健食品行业的市场需求。随着国内消费者对功能性软糖产品认可度的提升,近年来国内外厂商积极布局功能性软糖市场。

今天就来分享下软糖的产品设计辅助分析方法

1、抓取相关关键词的大量笔记。
2、抽取关键数据,如笔记中提到的口味、使用场景、购买渠道等。
3、通过数据占比出可视化图表,辅助产品设计。

某红书数据抓取

该产品搜索没有web端口子,只能抓取APP或小程序,作者抓取了微信小程序的前五十页点赞最高的【软糖】笔记作为数据分析数据,共抓取2208条笔记数据;

数据展示:
【产品分析】某红书数据采集数据分析评论分析笔记爬虫采集_第1张图片

数据分析

通过自然语言处理从笔记中抽取了使用场景、使用人群、地域分布、成分包含、营养成分、最好不包含成分等数据维度。

图表展示

def draw_bar(keys, values, titile, subtitle='共2208条笔记'):
    bar1=(
           Bar(init_opts=opts.InitOpts(
        ))
           .add_xaxis(keys)
           .add_yaxis('数量'##系列的名称
                      ,values, 
                     ) ##系列的数值
           .set_global_opts(title_opts=opts.TitleOpts(
                    title=titile,
                    subtitle=subtitle
                    ,item_gap=10#主副标题之间的距离
                    ,title_textstyle_opts=opts.TextStyleOpts(
                                   font_size=20
                                   ,font_weight='bold'  
                    )
                    ,subtitle_textstyle_opts=opts.TextStyleOpts(
                                     font_style='normal'
                                     ,font_weight='normal'                                                                    
                                     ,font_family= 'monospace'
                                     ,font_size=15
                                     ,background_color='grey'
                                     ,border_color='black' 
                    )
                ), 
                xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=40))
        )
    )
    return bar1
def pie_base() -> Pie:
    c = (
        Pie()
        .add("", [list(z) for z in zip(list(data.keys())[:-4], list(data.values())[:-4])], center=['50%','60%'],radius=["45%", "80%"])
        .set_global_opts(title_opts=opts.TitleOpts(title="营养成分-某红书", subtitle='共2208条笔记'),
                        legend_opts=opts.LegendOpts(pos_left='right', orient='vertical',))
        .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{d}%"))
    )
    return c
pie_base().render_notebook()

使用人群:
【产品分析】某红书数据采集数据分析评论分析笔记爬虫采集_第2张图片
地域分布:
【产品分析】某红书数据采集数据分析评论分析笔记爬虫采集_第3张图片
天然成分:
【产品分析】某红书数据采集数据分析评论分析笔记爬虫采集_第4张图片
营养成分:
【产品分析】某红书数据采集数据分析评论分析笔记爬虫采集_第5张图片
最好不包含成分:
【产品分析】某红书数据采集数据分析评论分析笔记爬虫采集_第6张图片
提及口味:
【产品分析】某红书数据采集数据分析评论分析笔记爬虫采集_第7张图片

市场分析

目前来看,我国功能性软糖市场仍处于发展阶段,消费者还是对酸、甜口味的软糖情有独钟;
不希望在软糖中添加脂肪、香精等成分;
维生素、铁、益生菌等成分是消费者比较关注的消费点;

#市场分析、数据抓取、软件定制
url = "http://www.wyxnlp.cn/index"

结尾

感谢您的观看,记得点赞关注哦~

你可能感兴趣的:(爬虫(urllib),数据分析,python,数据挖掘)