2017年我参加了正大杯大学生市场调查与分析大赛,获得了国二的成绩(当时花了1200大洋参加的国赛,心疼),作为教育部认可、可以保研竞赛类加分几乎5分能加满的A类竞赛,看到网上没有比较完整的参赛经验,想起当时踩过的坑,今天给大家分享一下市调大赛的全保姆经验分享。
目录如下,总字数2W字,大约需要阅读2个小时左右,大家可以拿来做笔记,其中个人赛和问卷数据分析教程纯干货,看完保证你拿个省奖还是简简单单,打字不易,大家看完觉得有用记得点赞三连,感激不尽。
目录
1、市场调查大赛简介
2、市调大赛时间规划流程
3、个人知识赛(网考)攻略(480页题库分享)
4、团队实践赛
4.1 如何组队,分工?
4.2 确定选题与设计问卷?(28个国赛一等奖答辩视频分享)
4.3 发放收集问卷
4.4 问卷数据处理与分析(干货)
4.4.1 问卷数据分析流程
step1:用户画像分析:样本有代表性
step2:信效度检验:调查工具很稳定
step3:描述性统计:样本特征行为分析
step4:推断统计:研究核心
4.4.2 问卷数据分析4大框架
影响关系类研究框架
政策现状类研究框架
调节/中介类研究框架
实验差异类研究框架
4.5 撰写报告与PPT
4.6 比赛答辩技巧
4.7分享一个问卷数据分析神器
全国大学生市场调查与分析大赛(暨海峡两岸大学生市场调查与分析大赛大陆地区选拔赛)是由中国商业统计学会、教育部高等学校统计学类专业教学指导委员会主办。
竞赛形式:大赛设置本科组和专科组两个竞赛组别,设知识赛和实践赛两个竞赛环节。
竞赛影响力:全国赛创办于2010年。两岸赛始于2012年,正式被列为教育部对台教育交流项目。本赛历时7个月,通过校赛、省赛、全国赛等多层现场展示答辩加报告评审综合得分的比赛形式,加上学生来自不同专业等因素,能培养学生团队协作、现场展示、语言表达,以及多种信息技术的综合应用能力,多角度、多层次地提升学生的综合素养。
参赛对象:全日制在校专科、本科、硕士研究生均可报名,专业不限。
竞赛组织:市场调查与分析大赛组委会,下设秘书处、评审组和分赛区组委会。 秘书处负责专业竞赛的组织和实施工作。 竞赛评委由高校教师、政府统计部门专业人员和专业调查公司以及大型企业市场研究部门的资深人员构成。 大赛设立若干分赛区,经申请核准设立分赛区的院校,成立分赛区组会,负责本赛区本科组赛事组织工作(高职高专组不设分区赛,由各校选拔优秀团队直接参加全国总决赛)。
报名方式:以学校为单位,各学校的相关部门组织本校报名工作。
官方网址:http://www.http://china-cssc.org
第一关:个人知识赛,个人网考形式,每年11中旬至12 月 中旬,每个考生根据自身情况任选一次或二次考试。 PS:这个贼坑,当时差点没过,找答题答案充了不少钱。
第二关:校赛,团体实践赛形式,3月底前完成。个人网考通过的选手自行组队,由参赛院校组织校内选拔,推荐优秀团队参加分省选拔赛。
PS:当时临时抱佛脚,正式比赛前一周才开始分析,还好队友比较想拿奖保研,还是认真(qiangbi)完成了。
第三关:省赛, 4月底前完成,由分赛区组委会组织,按大赛组委会制定的统一竞赛规则和评分标准选择优胜团队参加全国总决赛。
PS:当时我们的评委就看题目新颖程度和PPT、报告格式,一点也不专业
第四关:全国总决赛(暨海峡两岸大学生市场调查分析大赛的大陆地区选拔赛),5月底举行,大赛选拔出6支本科队,1支专科队代表大陆地区参赛队,参加海峡两岸大学生市场调查与分析大赛总决赛。
PS:国赛参赛费1200大洋学校不给报销。。。
第五关:海峡两岸大学生市场调查分析大赛总决赛,于8月下旬在大陆和台湾依次轮流举行。
个人知识赛成绩通过60分为及格,校赛前30%选手通过机考,也就是说有没有考到60分都有可能通过机考,一定要考在前30%,所以机考一定要全力准备,大家一定要重视,不过大家无需担心,答主在后文列了题目文档,大家记得保存,答题时直接搜索即可,不然到时候答题能答到怀疑人生,当时冲了60多块钱买了各个答题网站的会员。
特别注意事项
知识赛答题大纲
知识赛不设指定参考书,以检测参赛选手掌握的基本统计知识和市场调查知识为目的。 测试分为本科测试题和高职高专测试题两类,每类测试内容均包括统计学知识和市场调查知识两部分。
具体包括内容如下:
本科统计学测试范围:
高职专科统计学测试范围:
市场调查知识范围(不区分本科专科)
调研、统计知识练习题汇总
之前考研复习统计学和市场调研的时候整理了一些题库,完整版428页,这里太多就不一一列出了,有需要的同学可以自取:
调研、统计知识练习题汇总(网考题库+答案)
过了个人知识赛后,先不急着选题,我们需要组队,一般实践赛团队可以由3~5人组成,一般分工角色有:
队长:责任心强,擅长沟通,负责统筹、跟进比赛,PPT制作能力强;
路演选手:最好是女生,要求气质佳,口若生花;
数据分析选手:数据处理,分析、建模,要求数据分析能力强;
语文建模选手:描述性统计、文书能力强,能把简单的话说的专业复杂,
美图秀秀选手:设计类专业的同学,负责封面制作,视频剪辑,图表设计。
全员实地调查分工,共同修改全文和结论,建议等。
队长很关键,队长负不负责保证你比赛能不能完整地做完,当时我们就是选了个高年级的学长做队长,但是他一直很忙,差点忘了,我临时充当了队长角色,不过大家进入状态后,学长就立刻发挥他的作用了。
路演选手决定了现场答辩的得分,正所谓台上一分钟,台下十年功,面子工程得做好,评委也是人,是人就会有审美,所以搞个好看的妹子路演是能够极大加分的,当然最重要还是文章的内容与题目的新颖度。
编程建模选手其实主要是问卷数据分析,这块主要是分析思维,后面我会讲解问卷数据分析教程,其实可以小白也可以学会,推荐工具:
SPSSPRO:免费在线数据分析平台
模型教程手把手教你操作,文字版视频版两种方向供你选择,从案例实操、模型理论等等知无不言言无不尽,小白从0学数据分析也可以看懂啦!
涵盖全部专业统计算法模型,持续更新,让您的各种算法需求都能得到一站式满足
一键生成分析与解释,关键术语自动注释,没有统计知识也能读懂分析报告
先不要急着选题! 先不要急着选题! 先不要急着选题!
重要的事情说三遍。
比选题更重要的事情,是先看看别人怎么获奖的,这里答主给大家准备了正大杯往届的优秀作品合集,以及决赛现场答辩视频。
我收集了《正大杯全国大学生市场调研与分析大赛-优秀作品》视频合集。需要的可以关注微信公众号SPSSPRO获取回复【市调大赛】获取。
首先阅读学习近年来国奖的调研报告。不要看国家层面以下的作品,很容易产生偏见,得不偿失。这些国奖作品是市调比赛的上限,具有很大的参考价值。 选题分为企业命题与自主命题:
企业命题
过了校赛后,没有省赛,直接由相关组委会选拔推国赛,注重的是调研方式更科学,结论意见更具有商业价值。相对自主命题来说,风险与竞争都比较激烈,虽然可以一步登天直接到国赛,但是名额较少,很容易被刷,除非对自己和团队的调研专业程度比较自信。
PS:接到最新消息,企业命题今年没有优势了,跟自主命题一样 要校赛 省赛 国赛。
自主命题
成功的关键就是新颖,要求有现实意义越偏门的命题、约新颖的命题就越容易拿奖,比较推荐新手第一次参加。 一般我们如果不是非常专业的调研er最好选择自主命题较为保险,做出了至少可以拿个省奖。在确定选题时,尽可能避开前人写过的调研题目,找热点或者比较新颖的题目,例如最近元宇宙很火,那么我们可以写写这方面的,然后我们选题要保证我们的调研结果最好有商业价值或者学术价值,如果调研结果没有现实意义,那么最终也很难拿到很高的奖项,尽可能符合主旋律主题的。
如何设计问卷?
确认好了选题,接下来就是设计题目。 首先必须深刻的认识到问卷的重要性,问卷在数据收集及分析中起着核心作用,影响数据质量的主要因素。设计一份合理的问卷需要多角度看待问题,设计问卷时根据研究思路研究内容设计。问卷开头说明问卷用途和填写要求,问题设计首先是基本信息,其次是与自己研究方向的认知情况调查,之后是对研究方向事件举例进行态度看法调查,结尾再次表示感谢。问卷完成后发送到群一起讨论,进一步修改得到初版后开展预调查,对预调查收集的数据处理、分析、解释,进一步修改不恰当之处,修改审查后可开展正式调查。 在开始动手编制问卷之前,我们需要先搞清楚一些更核心的问题。
目标调查对象是谁?
我们需要对目标群体有一定的了解,了解调研群体的客群画像,才能够提出合适的问题。
研究目的是什么?
列出来研究的目的与需求,例如我想知道调研群体男性或女性对某件事情的评价是否具有差异?那么我们列出来两个问题:调研群体的性别和对该事件的评价,通过分析这两个问题,才能验证我们的研究目标与假设,具体的问题设计思路可以是: 目的→假设→变量→问题 从根本目的出发,我们可以衍生出一些具体假设。如果条件允许,可以先对目标群体做个访谈,帮助我们拓展思路和形成假设。每一个具体的假设都揭示了我们应该测量哪些变量,而每个变量可能需要用多个问题去测量。“目的→假设→变量→问题”这个架构树帮助我们紧贴研究目标去思考应该提出哪些问题。 也可以通过让团队成员头脑风暴的方式来收集团队想要了解的问题(不需要写出规范的问卷题目)。但是需要注意的是,每一个问题都需要有存在的理由,即它对研究目标的贡献是什么。最终留下的问题数量尽量不要太多。30个题目的问卷大概就需要用户花费20分钟去填写,如果超过20分钟,问卷的回应率和答题质量都会有所下降。
问卷设计需要注意的是:
这里强烈推荐问卷网,因为问卷网可以收集完问卷后直接导入在线spss分析平台spsspro,还完全免费,并且有特别多的免费问卷题目设计模板,一键即可快速收集问卷。
免费模板
【免费模板】是问卷网为用户准备的快速设计工具。你可以在项目管理页的顶部找到入口,进入专区。
模板专区有多种模板查找方式:
► 关键字搜索
输入你想要查找的项目关键字,便可以获得含关键字的模板推荐,属于比较快捷的操作。
► 专题版块
另外,问卷网针对用户常用的项目场景,贴心地准备了相应的专题版块,把跟特定场景相关的模板都集中放到了一起,更方便有此需求的用户浏览。
比如,疫情期间,问卷网就特地开设了【疫情防控专题】,为社会各界的疫情防控工作提供帮助。
► 标签搜索
模板库还有一种搜索方式,是根据不同类型的标签分类进行搜索。目前,问卷网支持按照“项目类型”、“场景”以及“行业领域”进行分类检索,每个标签下都有海量模板可供选择。
当你找到心仪的模板之后,你只需要打开,并点击模板右上角的“引用该模板”,它就会出现在你的项目页面。你只需要在项目页面进行编辑发布即可。
题库
当你找好了模板,但是可能需要稍微修改或增加一些题目;又或者,你没有找到特别合适的模板,希望自己做一些题目设计又无从下手,问卷网的“题库”功能就可以大显身手了。
你可以在项目编辑页的左边找到它:
点击题库,就可以看到不同的题目类型分类,满足不同的问题创建需求:
举个例子,如果你要编写员工满意度相关问卷,可以选择“人力资源”分类,然后就可以看到题库推荐的相关题目,按照说明操作,就可以一键引用到你的问卷了。
同时这里还有一份让用户填写问卷的攻略:
吐血收集!!怎么让更多的人填写你的问卷?
4.4.1 问卷数据分析流程
step1:用户画像分析:样本有代表性
收集问卷后,我们需要验证了解样本群体的用户画像,清楚调研样本群体的特征属性,精准定位调研客群,可以通过列联表分析、频数分析、描述性统计等等进行分析
列联表分析
通过分析样本画像,我们可以通过设置一些条件筛选出更优质的、更有代表性的群体,提升问卷可信程度与效度。
例如之前做的一份关于元宇宙的认知调研数据,收集了505份问卷数据,却发现问卷的信度非常拉跨,也就是说,这个问卷的调研群体的意见五花八门,没办法形成一致的看法,例如下图所示:
用户画像分析
由图可发现男性占比50.89%,女性占49.11%,性别差异不大,年龄分布中18~40岁占比最高,其中18岁以下(0.396%)最低,调研用户是上班族居多,占比达到了82.7%,同时月收入在1~2w范围达到了39.41%,同时专科及以上学历达到了90.69%,因此调研用户白领群体居多。
组内相关系数是问卷调查中评价一组对象的评价的一致性。
通过SPSSPRO的组内相关系数进行一键分析,答主发现问卷题项的选择上,调研样本结果的相关程度只有0.224,也就是意味着非白领群体跟白领群体的的看法不尽相同,因此需要把非白领群体剔除。
因此通过SPSSPRO的筛选设置,设定筛选条件为:
年龄为18~40岁
身份为上班族
最高学历为专科及其以上
月收入1W以上
IP地点定位为北上广深杭五个一线城市
筛选后数据剩余187个样本,重新进行组内相关系数后相关程度达到了0.916,同时通过信度分析,Cronbach’s α系数值为0.951,说明白领群体的问卷信度较为优秀,调研评价一致性程度高。
而现实中大家收集的问卷调研群体肯定是五花八门的,所以问卷的调研群体用户画像分析,是进行问卷分析最重要、也是最关键的第一步。
step2:信效度检验:调查工具很稳定
信度分析:解决的问题是:分析问卷是否可信?众人的意见一致性是否统一?
示例:
测量收集到的现有的一个由12个量表题客户满意度量表,测量是否结果可靠。
Cronbach信度分析是最为常见,使用最为广泛的一种测量方法,直接使用一个指标即Cronbach信度系数值来描述信度水平情况。如果说Cronbach信度系数值大于0.6,一般就说明信度可以接受,信度系数值越大越好。
除Cronbach信度,还有一种信度叫折半信度,其原理是将分析项‘拆分’成两部分,然后查看折半系数值,如果折半系数值大于0.6以上则说明可以接受,越大越好。
除此之外,还可以使用相关分析进行信度测量,比如重测信度就可以通过相关分析进行测量,先测量一次数据,隔一段时间再测量一次数据,将两次的数据进行相关分析,相关系数越高,说明重测信度越好。
如果是实验研究或者评价者数据,一般在医学研究中,还可能会使用到ICC组内相关系数,其目的在于研究数据的相似程度,或者一致性,有时候重复测量数据,或者评价打分数据等也会使用ICC组内相关系数用于信度的测量,如果说ICC值大于0.6,一般说明数据一致性程度可接受,ICC值越大越好。
如果说数据并不适合进行统计分析,即使用分析方法,使用某个指标来测量信度水平。那么用文字进行描述,证明数据可靠可信也可以。比如说数据进行过异常值处理,针对数据进行过无效样本设置处理等,余下的数据可靠真实。除此之外,详细描述数据的收集和处理过程,也是证明数据可靠真实可信的办法。
总而言之,只要能证明数据可靠真实的手段(包括分析方法,文字描述等),均可用于论证数据的信度水平。
效度分析:设计的题目是否合理有效?
示例:
测量收集到的现有的一个由12个量表题客户满意度量表,测量其题目设计是否合
理。下图中,量表题“客户满意度(空气)”在整体的在因子2上,而其他量表题都在同一因子上,该量表题目(客户满意度(空气))不满足效度,建议剔除。
效度一般可以分为内容效度、效标效度、结构效度。其中,内容效度是指问卷设计的内容能否满足研究的假设与目的;效标效度是指问卷收集中,我们通常一个研究问题设置多个题目,而效标效度指的是这些题目是否与我们设置的效度标准题目的相关程度是否一致,一般可用皮尔逊相关分析,如下所示:
判断标准:相关系数越大,代表相关性越高,效度越高。
结构效度是指通过因子分析里的载荷系数里,同一类型的测量项是否在同一因子上,一般常用探索性因子分析、验证性因子分析。
SPSSPRO提供的两种方法
① 探索性因子分析
操作方法:使用SPSSPRO[效度分析]或[因子分析(探索性)]功能进行分析,放入量表;
② 验证性因子分析
操作方法:同一因子下的所有题项需放入同一个分析框里,以此类推,有几个维度就分别放入几个分析框。
step3:描述性统计:样本特征行为分析
前面验证完了调研的样本群体的有效性、问卷的信度与效度后,接下来就是要分析调研群体对各个选项、量表的选择情况了。
一般来说,这里主要用到的是一些假设检验以及各种交叉分析,其中最核心的是多重响应交叉分析与多重响应频率分析,说起来有点绕,简单的说:
多重响应频率分析:研究的是多选题,调研群体的选择比例情况。
多重响应交叉分析:研究的是各类题目的交叉选择情况。
多重响应频率分析【多选题分析】
多重响应频率分析【多选题分析】
这里其实就是以第一个多选题为分组项,研究第二个多选题的选择情况。
多重响应频率(交叉)分析【多选题为分组项,单选题为分析项】
多重响应频率(交叉)分析【单选题为分组项,多选题为分析项】
step4:推断统计:研究核心
推断统计是问卷分析的研究核心,因为到这里才会真正去运用一些较为深入的方法,例如回归分析,假设检验以及综合评价等等。按统计模型类型可以划分为以下6类算法:
差异性检验
单样本指的是:
比较样本数据与一个特定数值之间的差异情况
如:一家食品生产企业以生产罐装食品为主,每瓶的标准重量应该是100g。为了对装罐过程进行监测,企业质检部门要进行抽检,以分析每瓶重量是否符合要求。现从某天生产的一批食品中随机抽取了50瓶,测得每瓶重量。试检验该批次食品重量是否符合要求
配对样本指的是:
同一批样本不同时间的结果是否有差异,数学上表示就是样本数相同的连续变量X1与连续变量X2之间的差异情况。
如:检验某医院30个病人注射某药剂前后血压是否一致
独立样本指的是:
分析一个定类变量与一个或者多个定量变量之间有无明显差异,数学上表示就是样本数不一定相同的多组连续变量X1、X2、X3......之间的差异情况。
如:研究不同学校的学生(各学校学生数不一定相等)高考成绩是否存在差异性。
事后多重分析指的是:
知道多组连续变量X1、X2、X3......之间存在差异情况,想探究是哪两两变量存在差异?
如:已知不同学校的学生(各学校学生数不一定相等)高考成绩存在差异性,探究具体哪两个学校存在差异。
相关分析
相关分析是对变量两两之间的相关程度进行分析。相关分析的计算方式有三种,分别是Pearson相关系数(适用于定量数据,且数据满足正态分布)、Spearman相关系数(数据不满足正态分布时使用)。Kendall's tau -b相关系数(有序定类变量)。
示例:
人的身高和体重之间;空气中的相对湿度与降雨量之间的相关关系都是相关分析研究的问题
输入输出描述
输入:两个或者两个以上的定量变量或有序定类变量
输出:两两变量之间是否呈现显著性相似以及相似的程度
指标聚合
指标聚合指的是将多个选择题变量合并为同一类型的因子。
指标聚合后通常用于做线性回归或者中介、调节、路径分析。
回归分析
回归分析包含统计学里的线性回归,机器学校里面的树模型回归,如xgboost、决策树与随机森林等等,以及深度学校的回归,是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。如在线性回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
示例:
通过自变量(房子年龄、是否有电梯、楼层高度、房间平方)拟合预测因变量(房价)
输入输出描述
输入:自变量X至少一项或以上的定量变量或二分类定类变量,因变量Y要求为定量变量(若为定类变量,请使用逻辑回归)。
输出:模型检验优度的结果,自变量对因变量的线性关系等等
中介调节
中介作用研究是指研究自变量X影响因变量Y时,是否会通过中介变量起影响关系作用。
调节作用研究是指研究自变量X影响因变量Y时,不同的调节变量对于上述影响关系作用是否有差异。
这类模型通常基于指标聚合后,进行分析。如将多个选择题糅合为工作条件,分析公司满意度等等
4.4.2 问卷数据分析框架
影响关系类研究框架
分析步骤
首先对收集数据进行用户画像分析,通过基础算法频数分析、描述性分析,统计性别,年龄,学历的分布情况如何等;通过基础算法列联表分析(卡方分析)或者分类汇总,分析不同学历的年龄分布,不同性别的年龄分布等等,如果无法精准确定调研群体,也就意味着调研结果没法形成群体的统一认知,也就意味着问卷的信度极低。
确定了用户画像后,可以利用信度分析进行验证,信度指标多以相关系数表示,主要考察问卷的可信度 ,是数据分析的一个基础,一般来说,问卷的信度分析只针对量表,性别年龄等背景信息是存在较大的差异情况的,因此一般不纳入信度分析。
信度没问题后,接下来需要分析的是问卷的效度,也就是问卷设计的合理不合理,一般来说,我们基于研究目的,会设置多个题目收集意见,按统计学来说,这几个问题的线性相关会很高,所以通过因子分析后,是会被纳入一个因子成分(研究目的)上的,如果有这时候某一选择题不在这个因子成分上,说明该题目设计有问题;
通过效度分析后,因为我们基于研究目的,会设置多个题目收集意见,多个题目其实线性相关,表达的都是同一个看法,所以通过指标归类分析可以把这几个题目浓缩为一个整体,这时可以采用因子分析或者主成分分析进行因子归类浓缩,以便后面进行回归分析。
将冗余的题目浓缩后,我们此时无需分析多次分析多个意见相同的题目,因此可以进行这些浓缩后因子(研究目的)的分析了,这一步就是给这些数据加上样本背景,例如不同性别对该城市生活满意度的看法等等;
以上才算完成了全部数据的描述性统计,展示了问卷数据的看法,影响类问卷调研通常是通过线性回归分析影响关系,但是在这之前,我们需要验证纳入自变量的数据是否存在线性相关,有着相关的前提下,再研究回归才有意义;
线性回归是将一系列影响因素和结果进行一个拟合,拟合出一个方程(非线性回归就没有方程,人脑就类似一个非线性回归),然后通过将这个方程应用到其他同类事件中,可以进行预测,所谓回归,就是向某个理想的状态或平衡状态的趋向发展,通过回归可以找出哪些影响因素,对结果的影响规律;
最后,我们还需要尽可能地对比不同人群的看法,这需要基于第一步的用户画像,现实场景下,我们收集的问卷调研群体五花八门,我们可以通过设置条件筛选的方式去尽可能分析不同人群对影响结果的看法,分析其是否存在差异,验证自己的结果是具有普适性等等。
政策现状类研究框架
核心在于用户画像“分组”研究,探究不同人群的认知情况
分析步骤
首先对收集数据进行用户画像分析,通过基础算法频数分析、描述性分析,统计性别,年龄,学历的分布情况如何等;通过基础算法列联表分析(卡方分析)或者分类汇总,分析不同学历的年龄分布,不同性别的年龄分布等等,如果无法精准确定调研群体,也就意味着调研结果没法形成群体的统一认知,也就意味着问卷的信度极低。
确定了用户画像后,可以利用信度分析进行验证,信度指标多以相关系数表示,主要考察问卷的可信度 ,是数据分析的一个基础,一般来说,问卷的信度分析只针对量表,性别年龄等背景信息是存在较大的差异情况的,因此一般不纳入信度分析。
信度没问题后,接下来需要分析的是问卷的效度,也就是问卷设计的合理不合理,一般来说,我们基于研究目的,会设置多个题目收集意见,按统计学来说,这几个问题的线性相关会很高,所以通过因子分析后,是会被纳入一个因子成分(研究目的)上的,如果有这时候某一选择题不在这个因子成分上,说明该题目设计有问题;
通过效度分析后,因为我们基于研究目的,会设置多个题目收集意见,多个题目其实线性相关,表达的都是同一个看法,所以通过指标归类分析可以把这几个题目浓缩为一个整体,这时可以采用因子分析或者主成分分析进行因子归类浓缩,将冗余的题目浓缩后,我们此时无需分析多次分析多个意见相同的题目,因此可以进行这些浓缩后因子(研究目的)的分析了;
总体样本分析是针对收集问卷的整体认知情况进行分析,这一步就是给这些数据加上样本背景,例如不同性别对该城市生活满意度的看法等等;
分组样本分析是通过设置不同的背景条件,例如男性、本科以上学历、24岁~40岁,进行客群分组分析,探究不同人群的认知情况;
差异性检验需要用科学的方法验证不同人群的看法是否呈现差异,这需要基于第一步的用户画像,现实场景下,我们收集的问卷调研群体五花八门,我们可以通过设置条件筛选的方式去尽可能分析不同人群对影响结果的看法,分析其是否存在差异,验证自己的结果是具有普适性等等。
如果说希望研究影响关系,比如研究“认知”,“态度” 分别对于“行为”的影响关系,此时可考虑使用回归分析,线性回归是将一系列影响因素和结果进行一个拟合,拟合出一个方程(非线性回归就没有方程,人脑就类似一个非线性回归),然后通过将这个方程应用到其他同类事件中,可以进行预测,所谓回归,就是向某个理想的状态或平衡状态的趋向发展,通过回归可以找出哪些影响因素,对结果的影响规律。
调节/中介类研究框架
分析步骤:
首先对收集数据进行用户画像分析,通过基础算法频数分析、描述性分析,统计性别,年龄,学历的分布情况如何等;通过基础算法列联表分析(卡方分析)或者分类汇总,分析不同学历的年龄分布,不同性别的年龄分布等等,如果无法精准确定调研群体,也就意味着调研结果没法形成群体的统一认知,也就意味着问卷的信度极低。
确定了用户画像后,可以利用信度分析进行验证,信度指标多以相关系数表示,主要考察问卷的可信度 ,是数据分析的一个基础,一般来说,问卷的信度分析只针对量表,性别年龄等背景信息是存在较大的差异情况的,因此一般不纳入信度分析。
信度没问题后,接下来需要分析的是问卷的效度,也就是问卷设计的合理不合理,一般来说,我们基于研究目的,会设置多个题目收集意见,按统计学来说,这几个问题的线性相关会很高,所以通过因子分析后,是会被纳入一个因子成分(研究目的)上的,如果有这时候某一选择题不在这个因子成分上,说明该题目设计有问题;
通过效度分析后,因为我们基于研究目的,会设置多个题目收集意见,多个题目其实线性相关,表达的都是同一个看法,所以通过指标归类分析可以把这几个题目浓缩为一个整体,这时可以采用因子分析或者主成分分析进行因子归类浓缩,以便后面进行回归分析。
将冗余的题目浓缩后,我们此时无需分析多次分析多个意见相同的题目,因此可以进行这些浓缩后因子(研究目的)的分析了,这一步就是给这些数据加上样本背景,例如不同性别对该城市生活满意度的看法等等;
以上才算完成了全部数据的描述性统计,展示了问卷数据的看法,中介、调节模型的问卷调研通常是通过回归分析进行分析关系的,所以在这之前,我们也一样需要验证纳入自变量的数据是否存在线性相关,有着相关的前提下,再研究中介、调节才有意义;
中介作用是研究X对Y的影响过程中,是否中介变量M起着中介桥梁作用,即X->M->Y这样的关系结构。而调节作用是研究X对Y的影响过程中,不同的调节变量Z时,X对Y的影响程度是否有明显差异。中介作用和调节作用均用于假设验证,二者有着着共同点,也有着实质性区别。中介和调节作用研究需要单独进行,中介调节模型底层其实都是基于线性回归,线性回归是将一系列影响因素和结果进行一个拟合,拟合出一个方程(非线性回归就没有方程,人脑就类似一个非线性回归),然后通过将这个方程应用到其他同类事件中,可以进行预测,所谓回归,就是向某个理想的状态或平衡状态的趋向发展,通过回归可以找出哪些影响因素,对结果的影响规律;
最后,我们还需要尽可能地对比不同人群的看法,这需要基于第一步的用户画像,现实场景下,我们收集的问卷调研群体五花八门,我们可以通过设置条件筛选的方式去尽可能分析不同人群对结果的看法,分析其是否存在差异,验证自己的结果是具有普适性等等。
实验差异类研究框架
实验差异类研究指的是带有类似实验研究背景的研究方式,比如研究新型药物是否有效,一般有两种方式:
实验对照组(独立样本),将实验小白鼠分为两组,其中一组为实验组,另外一组为对照组,实验组使用新型药物注射,对照组不作任何处理。
实验前与实验后对照(样本),比如分别测量实验小白鼠新型药物注射(实验)前,和新型药物注射之后的血压对比。
分析步骤
首先对收集数据进行用户画像分析,通过基础算法频数分析、描述性分析,统计性别,年龄,学历的分布情况如何等;通过基础算法列联表分析(卡方分析)或者分类汇总,分析不同学历的年龄分布,不同性别的年龄分布等等,如果无法精准确定调研群体,也就意味着调研结果没法形成群体的统一认知,也就意味着问卷的信度极低。
确定了用户画像后,可以利用信度分析进行验证,信度指标多以相关系数表示,主要考察问卷的可信度 ,是数据分析的一个基础,一般来说,问卷的信度分析只针对量表,性别年龄等背景信息是存在较大的差异情况的,因此一般不纳入信度分析。
信度没问题后,接下来需要分析的是问卷的效度,也就是问卷设计的合理不合理,一般来说,我们基于研究目的,会设置多个题目收集意见,按统计学来说,这几个问题的线性相关会很高,所以通过因子分析后,是会被纳入一个因子成分(研究目的)上的,如果有这时候某一选择题不在这个因子成分上,说明该题目设计有问题;
通过效度分析后,因为我们基于研究目的,会设置多个题目收集意见,多个题目其实线性相关,表达的都是同一个看法,所以通过指标归类分析可以把这几个题目浓缩为一个整体,这时可以采用因子分析或者主成分分析进行因子归类浓缩,以便后面进行回归分析。
将冗余的题目浓缩后,我们此时无需分析多次分析多个意见相同的题目,因此可以进行这些浓缩后因子(研究目的)的分析了,这一步就是给这些数据加上样本背景,例如不同性别对该城市生活满意度的看法等等;
以上才算完成了全部数据的描述性统计,展示了问卷数据的看法,实验类问卷调研通常是通过差异性分析,差异性分析是常用的数据分析方法,用于检测科学实验中实验组与对照组之间是否有差异以及差异是否显著的办法。又称【差异性显著检验】,是假设检验的一种;
需要注意的是,实验性分析有时候需要注意交互作用的分析,例如同一块地,A化肥增产40KG,B化肥增产50KG,AB化肥都下增产100KG,这多出来的10KG就是交互作用;
在交互作用分析时,首先应该检验自变量X是否呈现出显著性,比如上述例子中是否加入A化肥和是否加入B化肥这两个变量是否呈现出显著性,如果自变量呈现出显著性,则说明加入化肥A、B对于产量产生影响。交互作用研究是指研究两个分类变量对于因变量Y(连续变量)的影响,两个分类变量X分别在不同水平的情况时,分类自变量X对于Y的影响幅度情况差异。比如研究加入A化肥和加入B化肥对于生产量的影响关系。此时需要考虑,在没有加入A化肥和有加入A化肥的两种情况下,研究加入B化肥对于生产量的影响是否有区别。以及在加不加入B化肥的两种情况下,研究加入A化肥对于生产量的影响是否有区别,如果两个分类自变量均没有呈现出显著性,则交互作用研究结束,因为两个自变量均不会对因变量Y产生影响,更不可能会有交互作用研究。如果两个分类自变量X中有一个,或者两个均呈现出显著性,才可能进行后续交互作用研究。当两个分类自变量X中有一个,或者两个均呈现出显著性,接着应该分析交互项的显著性,如果交互项呈现出显著性,则说明具有交互作用,如果存在交互作用则可以继续使用交互图(是否平行)进行直观分析。
最后,在上述交互作用研究后,如果自变量X呈现出显著性,研究人员可以继续深入对比自变量X在不同水平时因变量Y的具体情况,进一步挖掘细节信息。
4.5 撰写报告与PPT
报告大纲
报告格式
报告格式严格按照比赛文件要求,图表格式合理,会用三线表和图表目录;
主报告要求:
1)标题页
此项必须有。内容包括项目名称,但不得出现学校名称、团队名称、团队成员及指导教师姓名。
2)目录
此项必须有。有助于评委和读者找到所需信息。
3)表格和插图清单
此项必须有。将调查结果用图表之类可视化形式来表示,同时也便于与其他来源的数据资料进行比较,给出目录方便读者查询。
4)要点或概要
此项应当有。概要通常不超过2到3页,它揭示调查中最重要的调查结果和主要结论。对于没有时间研究主报告的所有细节而又想知道调查结果要点的人来说,这是一份简单重要的参考材料。它非常简要地描述了调查目标、调查时间、调查地点及调查包涵的主题。然后在不太长的段落中逐段描述最有价值的调查成果,从整体结果开始,到一些较为具体、需要强调的未曾预料的结果。当然,这部分的表达方式是分段文字或简单(目录式)提要,没有统一规定。
5) 引言
总报告正文开始处应当有引言。引言部分给出开展调查的背景信息,如项目来源、主办单位、研究目标、方法简述以及本报告的目的等,或许还需要给出一个项目纲要,说明已经做了什么,以及研究了什么,但这些仅需要做一般性的描述,因为详细的结果将会在随后的章节给出。引言还需对后面章节的内容及它们之间的联系作简单介绍。
6)报告主体
报告的主体需分成若干章节。 报告主体中应当包括的内容主要有,与本次调查有关的概念及重要指标的定义;对调查使用的方法的说明;调查对象基本情况数据汇总;调查数据质量的说明;调查结果等。 每个章节主题要突出,语言应尽可能简洁明了。
7)结论和建议
结论是必须要有的,而建议并不是必须的。要特别注意结论和建议要来自本队的调查数据及对数据的分析,而不是从其他文献或资料中参考得出。
8)参考书目
所有的参考文献都应该清楚地标明。
9)附录
附录要对报告主体所没有涉及的调查专题以及所用调查方法、统计软件、数据处理方法等一些在主报告中没有涉及的补充说明,以免正文过于冗长。但要注意本次大赛报告中附录也不可太长,因为附录的字数也包含在总字数中。
报告字数及排版格式要求:
1.参赛报告全文字数为1-1.5万字。
2.除标题页外,在其他页不要直接出现学校及参赛队的信息。
3.文章一律采用WORD文档,A4纸排版。
标题和正文:报告正文总标题宋体三号字加粗,单行间距,段前、段后选择自动间距;报告中一级标题采用黑体小三号字;二级标题黑体四号字;其他标题及正文均用宋体小四号字。摘要、参考文献等名称均用黑体四号字,内容为宋体小四号字。行间距1.25倍,段前间距0.5行。文中图表标题用宋体小四号字,表格内文字一般用宋体小四号或五号字,单行间距。忌用异体字、复合字及一切不规范的简化字,除非必要,不使用繁体字。
页面设置及版面要求:文章一律按A4纸排版。页边距采用WORD系统默认边距,即:上下边距为2.54厘米,左右边距为3.18厘米。
报告主体内容要简洁、明确,层次不宜过多,层次序号为:一、 ;(一) ; 1. ; (1); 1)。
数字用法:凡是公历世纪、年代、年、月、日、时刻、各种记数、计量均用阿拉伯数字;夏历和清代以前的历史纪年用汉字,并以圆括号加注公元纪年;邻近的两个数字并列连用以表示的概数,采用汉字。
文中图表等:文中的图表、附录、参考文献、公式一律采用阿拉伯数字连续编号。如图1,表1,附注1,公式(1)。图序及图题置于图的下方居中,表序及表题置于表的上方居中,图序和图题之间、表序和表题之间空两格。论文中的公式编号用圆括号括起来写在右边行末,其间不加虚线。
参考文献:对引文作者、出处、版本等详细情况的注明。格式与示例:
① 专著格式:主要责任者.题名[文献类型标识].出版地:出版者,出版年. 示例:[1] 陈朝阳,王克忠.组织行为学[M].上海:上海财经大学出版社,2001.
② 论文集格式:作者.题名[文献类型标识].编者.文集名.出版地:出版者,出版年. 示例:〔2〕刘守胜.中国历史分期之研究 [A].关鸿,魏凭.人生问题发端——斯年学术散论 [C].北京:中国发展出版社,2001.
③ 期刊文章格式:主要责任者.题名[文献类型标识].刊名,年,卷(期). 示例:[3] 吴文彦.职工民主管理与创建和谐企业之思考[J].现代企业文化, 2008,(17).
④ 报纸文章格式:主要责任者.题名[文献类型标识].报纸名,出版日期(版次). 示例:[4]丁士修.建筑工程管理 [N].建设日报,2007-08-24 (08).
⑤ 引用互联网站文章格式:作者.文章题名.网址.发布时间.
示例:[5]王金营.中国和印度人力资本投资在经济增长作用的比较.http://www.amteam.org/ docs/bpwebsite.asp.2005年8月9日发布.
◆同一专著、论文集、期刊、报纸文章,都一律只用一个序号,而且要把页码统一标注在文章中相应序号之后。
◆参考文献的不同类型用不同的大写字母标注,如专著:[M];论文集:[C];报纸文章:[N];期刊文章:[J];学位论文: [D];报告:[R];标准:[S];专刊:[P]。
注释:用于对文内某一特定内容的解释或说明,其序号为:①②③……,注释置于页脚。
PPT制作
以报告内容为模板,做一个10分钟左右的PPT,这里要注意PPT路演时,要尽可能地有创意,之前路演时,有个队伍在讲解前搞了一个30s的情节剧,给了评委和我们很大的注意力(jingxia),不出意料拿了高分,而且国赛评委也说要注意团队协作,这里并不是全部人都要上去讲,而是路演时最好每个人都参与了进去,最好的方式是路演讲解时只有一个主讲手,其他人搭配一个情景剧或者旁白、开场白。
网上PPT的教程很多了,这里就不多阐述了。
完成初稿后大家一起头脑风暴,进行商榷修改、再邀请指导老师审核,提出修改意见。最后由团队成员再次修改。
,国赛答辩的话是评委老师会一起提问,全部提问完了,选手再做回答。可能会有好几个问题。建议带一个小本子,简要记一下,方便回答捋清思路。
4.6 比赛答辩技巧
省赛答辩一般是10分钟陈述,5分钟问答,旁边会安排专人计时,到时间就会打断,国赛答辩评委老师会一起提问。
服装统一,切记切记;
不要背稿,要有感情地路演;
一个主讲手从头到位进行路演,不要分多个人;
全员参与,除路演人外,其他人可以在开头或者结果设计一个情景剧或者中间穿插旁边,提升路演表演效果;
回答问题时注意统一回答格式,例如:感谢老师您的提问,针对老师您的问题,我想做以下回答:…,以上就是我的个人观点,如有表述不当或错误的地方,还请老师批评指正,谢谢老师;
4.7 分享一个问卷数据分析神器
目前国内数据分析产品市场主要由SPSS、SAS、Matlab等几家老牌产品占据,这些软件下载使用门槛高,正版软件价格不菲,使用起来也需要储备一定的数学统计理论知识,有的软件操作起来还需要编程,对于没有相关基础知识的人来说,学习使用周期长。
以前上学时用的统计软件,操作界面都是英文的,还需要查阅各种文献资料才能搞明白统计分析步骤。 答主一直都非常希望能有一款国产的、操作便捷的数据分析产品。
在各种机缘巧合下,答主终于可以有机会实现自己梦想,答主研发的国产、免费的数据分析平台叫SPSSPRO,采用在线SAAS模式,平台将算法模型黑箱化,用户只需要数据输入和输出,就可以自动生成分析报告,简化了数据分析的学习和操作过程。
“比如,如果使用其它软件进行t检验,用户首先需要知道差异性检验有哪些方法,需要学习如何在软件上一步步操作,最后还要看懂数据结果中每个参数的具体含义。SPSSPRO列出了每个算法的应用案例,用户通过简单操作,把数据拖拽到对应的分析框中,就可以一键生成分析结果,无需学习分析原理。同时,对于分析结果,平台也提供了智能解读,提示每个参数的含义,模型是否通过检验等。使用者不用再担心看不懂跑出来的数据了”。
因此,无需学习复杂的数学公式,就可以掌握数据分析技巧,从而用数据分析来辅助决策,灵活应用到具体的场景中。
正如美图秀秀一般,你不需要懂PS基础原理就可以几秒钟完成p图。答主希望通过SPSSPRO,大众不用学习复杂的数学公式,就可以掌握数据分析技巧,从而用数据分析来辅助决策,灵活应用到具体的场景中,降低数据分析的门槛,让人人都能成为数据分析师。
SPSSPRO-免费专业的在线数据分析平台
涵盖全部专业统计算法模型,在前期研发过程中,团队积累了150多种算法模型,目前产品进行重构后,推出了30多种更加贴近用户操作习惯和需求的常用算法,可以满足高校师生、市场调研人员以及科研人员的数据清理及统计分析的需求。
系统一键生成分析和解释,关键术语自动注释,不需要专业知识也能看懂。
操作步骤简单,仅需拖拽数据到指定框,点击开始分析即可;与问卷网等主流在线调研平台无缝对接,轻松实现专业的在线 SPSS 分析
spsspro完全免费,无需付费,使用微信登录即可使用,所有算法功能免费开放;不用下载软件,不占用本地计算机资源,有网就能用。
https://www.zhihu.com/question/350505934/answer/2158184923
https://zhuanlan.zhihu.com/p/411873041
大学生市场调查与分析大赛(市调大赛)是什么赛事?如何参加? - 知乎
市场调查与分析大赛·参赛经验贴_手机搜狐网
如何设计问卷,才能收集到高质量的数据? | 人人都是产品经理