excel部分字段相同模糊匹配

excel部分字段相同模糊匹配_第1张图片

一、提出问题
你要么获取一批数据,然后根据它提问,或者先提问,然后根据问题收集数据。在这两种情况下,好的问题可以帮助你将精力集中在数据的相关部分,并帮助你得出有洞察力的分析。

二、理解数据

1、理解各字段的意思,如果有英文可修改成中文更易理解。

2、在数据清洗前复制一份保存,将CSV文件另存为xlsx类型保存。

3、Excel有四种数据了类型:

(1)文本型:中、英文、混合文本、符号和字符串形成存储的数值(123)
(2)数值型:数值、科学计数法、时间、日期和货币…
(3)逻辑性:TRUE和FALSE
(4)错误值:#NAME?、#N/A、#DIV/0、#REF!、#VALUE!、#NUM!、#NULL! 三、数据清洗 1.选择子集
不需要的列可以隐藏,不要删除。需要用到隐藏子集的操作:格式–隐藏和取消隐藏 或者选择取消隐藏的行/列,右键点取消隐藏。 2.列名重命名
双击列名字段进行修改。 3.删除重复数据项
操作:数据—删除重复项—取消全选—选择需要检查的列—确定。选择数据集中的唯一编号列。 4.缺失值处理
单击唯一编号列,右下角查看该数据集的总行数。依次点击其他列。缺失值数据 = 唯一编号

你可能感兴趣的:(excel部分字段相同模糊匹配)