【学习笔记】EXCEL数据处理--规范与方法

自用笔记,主要记知识点

目录

  • 1、表格设计的规范要求
  • 2、单元格的规范要求
  • 3、防止不过范发生
  • 4、数据预处理
  • 5、数值数据处理
  • 6、文本数据处理
  • 7、日期时间处理
  • 8、数据匹配处理
  • 9、表格转换处理
  • 10、数据整理高级工具

1、表格设计的规范要求

EXCEL常用表格类型:清单表、功能表、报表
数据处理阶段使用的是清单表。
【学习笔记】EXCEL数据处理--规范与方法_第1张图片

  1. 不要合并单元格(筛选、排序、透视等都会出现错误)

  2. 不要多余行和列(例如空隔、汇总信息等)
    在这里插入图片描述

  3. 不要多行表头
    在这里插入图片描述
    在这里插入图片描述

  4. 数据格式要统一

  5. 避免空值(尽量避免)

  6. 避免二维表(即某字段在列上展开)
    【学习笔记】EXCEL数据处理--规范与方法_第2张图片

  7. 避免过多设置格式(如填充颜色、字体颜色等会增大文件体积)

工作表交接注意事项:

  1. 冻结窗格
  2. 不要是筛选状态
  3. 删除空的sheet
  4. 定位在A1位置

2、单元格的规范要求

【学习笔记】EXCEL数据处理--规范与方法_第3张图片

  1. 不要出现数据杂糅
    【学习笔记】EXCEL数据处理--规范与方法_第4张图片
  2. 不要出现带单位的数字
    【学习笔记】EXCEL数据处理--规范与方法_第5张图片
  3. 不要出现不规范日期
  4. 不要出现无意义空格(字符前后、中间不要出现空格、二字姓名)

3、防止不过范发生

  1. 设置下拉菜单
    数据——数据验证
    【学习笔记】EXCEL数据处理--规范与方法_第6张图片

  2. 输入提示与警告
    同样使用数据验证功能的输入信息与出错警告
    【学习笔记】EXCEL数据处理--规范与方法_第7张图片

  3. 限制输入文本长度和数字范围
    同样使用数据验证功能可以实现

  4. 限制只能输入文本
    同样使用数据验证功能可以实现,使用自定义istext判断
    【学习笔记】EXCEL数据处理--规范与方法_第8张图片

  5. 限制重复内容
    同样使用数据验证功能可以实现,使用自定义判断
    【学习笔记】EXCEL数据处理--规范与方法_第9张图片

  6. 设置较复杂验证规则
    在自定义选项下借助函数做判断

  7. 设置多级下拉菜单
    首先创建名称,公式——定义名称
    【学习笔记】EXCEL数据处理--规范与方法_第10张图片
    然后再创建数据验证,用函数进行相对引用
    【学习笔记】EXCEL数据处理--规范与方法_第11张图片

4、数据预处理

【学习笔记】EXCEL数据处理--规范与方法_第12张图片

  1. 导入非excel文件
    对于csv文件,导入后需另存为xlsx。
    对于txt文件,打开时按照导入向导操作,打开后另存为xlsx。
    最终操作都要在xlsx格式下进行。

  2. 数据处理的习惯
    先备份文件,在备份上进行处理
    操作文件中具体某一个表时视情况需要在副表上进行
    具体行列也视情况需要备份
    经常保存

  3. 快速删除空行空列
    定位出目标行列后删除。
    例如选定一个合适的区域——查找——定位条件——空值——删除整行/列
    【学习笔记】EXCEL数据处理--规范与方法_第13张图片

  4. 取消单元合并
    先选定区域,取消合并居中。
    再选中全部空值单元格,以第一个单元格为例定义取值方式,即它上面一个单元格,然后ctrl+回车。
    最后全选列,粘贴为值消除公式即可。
    【学习笔记】EXCEL数据处理--规范与方法_第14张图片

  5. 处理数据杂糅
    若杂糅样式统一,可以使用分列。
    数据——分列
    【学习笔记】EXCEL数据处理--规范与方法_第15张图片
    若不统一,可以使用函数截取。

  6. 统一数据类型
    可以根据提示转换,或用分列强制转换数据类型
    文本数字转数字:文本*1

  7. 处理重复行
    查看是否有重复值:选定区域后,开始——条件格式——突出显示单元格
    【学习笔记】EXCEL数据处理--规范与方法_第16张图片
    删除重复值:数据——删除重复值
    找出重复值但不删除并进行统计操作:在辅助列上使用函数 IF(COUNTIF(区域)=1,1,0),记得锁定起始位置。则重复出现的值都显示为0。
    在这里插入图片描述

  8. 超过15为的文本型数字标记重复值
    不能直接标记重复,需使用 &"*" 转化成文本数字再做COUNTIF
    在这里插入图片描述

5、数值数据处理

运算 实现
加减乘除 + - * /
判断奇数 ISODD()
判断偶数 ISEVEN()
乘幂 POWER()
向下取整 INT()
取余 MOD()
四舍五入 ROUND()
去尾 ROUNDDOWN()
进一 ROUNDUP()
最大值 MAX()
最小值 MIN()
求和 SUM()
0-1随机数 RAND()
指定随机数 RANDBETWEEN()
排序 RANK()

中式排名(并列名次不占用后面的名次)
用COUNTIF()求不重复个数,经典办法:=SUM(1/COUNTIF(区域,区域))
在这里插入图片描述

6、文本数据处理

【学习笔记】EXCEL数据处理--规范与方法_第17张图片

  1. 文本提取函数
运算 实现
从左取指定位数文本 LEFT()
从右取指定位数文本 RIGHT()
中间截取 MID()
  1. 巧妙文本分离
    格式统一时可以使用快速填充(自动寻找提取规则进行快速填充)
    【学习笔记】EXCEL数据处理--规范与方法_第18张图片

  2. 查找指定文本
    文本提取函数结合FIND函数使用

  3. 文本替换
    直接用查找替换
    或使用SUBSTITUTE()函数
    也可以用REPLACE()函数

  4. 文本空格处理
    可以查找空格替换为空
    或使用TRIM()函数

  5. 奇怪字符处理
    常见于导入数据,导致文本中存在非打印字符,使用CLEAN()函数。

  6. 文本函数TEXT
    使用灵活,举几个例子:
    【学习笔记】EXCEL数据处理--规范与方法_第19张图片
    【学习笔记】EXCEL数据处理--规范与方法_第20张图片

  7. 逐个拆分文件信息
    结合row函数,举几个例子:
    【学习笔记】EXCEL数据处理--规范与方法_第21张图片
    【学习笔记】EXCEL数据处理--规范与方法_第22张图片

7、日期时间处理

【学习笔记】EXCEL数据处理--规范与方法_第23张图片

  1. 提取信息
    针对日期格式yyyy-mm-dd 和 00:00:00
运算 实现
提取年 YEAR()
提取月 MONTH()
提取日 DAY()
提取时 HOUR()
提取分 MINUTE()
提取秒 SECOND()
日期组合 DATE()
时间组合 TIME()
今天 TODAY()
此时 NOW()
是第几周 WEEKNUM()
是周几 WEEKDAY()
两日期差值 DATEDIF()
间隔一定月数后的日期 EDATE()

【学习笔记】EXCEL数据处理--规范与方法_第24张图片
【学习笔记】EXCEL数据处理--规范与方法_第25张图片
【学习笔记】EXCEL数据处理--规范与方法_第26张图片
*日期时间运算可以转化为数字运算

  1. 不规范日期处理
    如20200202、2020.02.02、12/03/2020这样的,均不是标准日期格式。
    处理方法有很多,比如可以用TEXT函数、分列功能、SUBSTITUTE函数、先拆再组合等。
    【学习笔记】EXCEL数据处理--规范与方法_第27张图片
    【学习笔记】EXCEL数据处理--规范与方法_第28张图片
    注意写函数时日期要放在双引号内。

8、数据匹配处理

【学习笔记】EXCEL数据处理--规范与方法_第29张图片

  1. 用IF做条件判断

  2. VLOOKUP精确匹配

  3. VLOOKUP区间匹配 (适用于数字区间)

  4. VLOOKUP文本模糊匹配(使用*符连接)
    【学习笔记】EXCEL数据处理--规范与方法_第30张图片

  5. 使用VLOOKUP需注意数据格式一致、查找列放在选定区域第一列、精确还是区间、是否要绝对引用

  6. VLOOKUP匹配多列
    连续列,借助COLUNM函数
    【学习笔记】EXCEL数据处理--规范与方法_第31张图片
    非连续列,借助MATCH函数
    【学习笔记】EXCEL数据处理--规范与方法_第32张图片

  7. 反向匹配
    因为VLOOKUP是从左向右匹配,不能从右向左查找值。
    借助IF({1,0})结构调换顺序
    【学习笔记】EXCEL数据处理--规范与方法_第33张图片
    或者用INDEX和MATCH函数组合也能实现。
    在这里插入图片描述

  8. 多条件匹配
    用VLOOKUP实现
    =VLOOKUP(查找1&查找2,IF({1,0},区域1&区域2,查找值),列位置,精确查找)
    函数写完后ctrl+shift+回车【学习笔记】EXCEL数据处理--规范与方法_第34张图片
    用LOOKUP实现
    =LOOKUP(1,0/((条件1)*(条件2)),返回值)
    【学习笔记】EXCEL数据处理--规范与方法_第35张图片

  9. 一对多匹配
    SMALL()函数,返回一组数据中第几小的数。
    【学习笔记】EXCEL数据处理--规范与方法_第36张图片

9、表格转换处理

【学习笔记】EXCEL数据处理--规范与方法_第37张图片

  1. 高级筛选
    数据——筛选——高级
    且条件写在同一行,或条件另起一行
    【学习笔记】EXCEL数据处理--规范与方法_第38张图片

  2. 一列与多列的转换
    一到多,结合COLUNM和ROW函数
    【学习笔记】EXCEL数据处理--规范与方法_第39张图片
    或者借助自动填充,手动确定第二列,然后向右拖拽即可
    【学习笔记】EXCEL数据处理--规范与方法_第40张图片
    多到一,结合ROW和ROUND函数
    【学习笔记】EXCEL数据处理--规范与方法_第41张图片

  3. 二维表转一维表
    借助数据透视表的逆操作。
    ALT+D 再按P打开数据透视表启动方式,选择“多重合并计算数据区域”
    【学习笔记】EXCEL数据处理--规范与方法_第42张图片
    下一步,再下一步,选择目标区域
    【学习笔记】EXCEL数据处理--规范与方法_第43张图片
    下一步,选择输出位置,完成。至此由原始二维表得到一个可用透视表。
    【学习笔记】EXCEL数据处理--规范与方法_第44张图片【学习笔记】EXCEL数据处理--规范与方法_第45张图片
    然后双击透视表上总计数字,如上图9098,变成清单式透视表。
    【学习笔记】EXCEL数据处理--规范与方法_第46张图片
    将这个透视表复制过来就得到了所需的一维表。
    【学习笔记】EXCEL数据处理--规范与方法_第47张图片
    注意只能二维转一维,多维要曲折一下,先选取一个合适的二维做转换,剩余维度再用函数匹配过来。

  4. 数据记录压缩
    借助数据透视表可以实现

  5. 数据扩展
    【学习笔记】EXCEL数据处理--规范与方法_第48张图片

  6. 超级表
    插入——表
    这个表中追加的数据在透视表中直接刷新就可以出现,否则还需要手动更改透视表数据选取区域。
    这个创建的表亦称超级表、智能表等。
    【学习笔记】EXCEL数据处理--规范与方法_第49张图片

  7. 多表汇总
    使用INDIRECT函数
    在这里插入图片描述
    【学习笔记】EXCEL数据处理--规范与方法_第50张图片

  8. 表格拆分
    按条件拆分生成多个xlsx文件,使用VBA代码
    【学习笔记】EXCEL数据处理--规范与方法_第51张图片
    【学习笔记】EXCEL数据处理--规范与方法_第52张图片

10、数据整理高级工具

【学习笔记】EXCEL数据处理--规范与方法_第53张图片

  1. 能记录步骤的PowerQuery(简记pq )
    数据——自表格/区域,进入pq【学习笔记】EXCEL数据处理--规范与方法_第54张图片
    在PowerQuery中处理数据,处理完后按“关闭并上载至”操作退出。
    【学习笔记】EXCEL数据处理--规范与方法_第55张图片
    紧接着选择仅创建连接
    【学习笔记】EXCEL数据处理--规范与方法_第56张图片
    然后在软件右边界面找到表,右键——加载至,选择为表
    【学习笔记】EXCEL数据处理--规范与方法_第57张图片
    【学习笔记】EXCEL数据处理--规范与方法_第58张图片
    【学习笔记】EXCEL数据处理--规范与方法_第59张图片
    左边已经变成超级表的形式了,之后若在左边列表中有新数据追加进来,在右边表中刷新一下就可以了。

  2. 能处理更大数据量的PowerQuery
    EXCEL最大只能处理行列数1048576*16384的数据,若大于这个量,则不能完全加载处理。
    在pq中打开数据,进行分析操作比如透视等,将结果输出至表即可。
    【学习笔记】EXCEL数据处理--规范与方法_第60张图片

  3. 数据处理功能更集中的PowerQuery
    pq种集中了很多常用功能,可以减轻常规办法的工作量,省去构建辅助列、编辑函数等操作。自如前面章节练习过的数据去重、去空白行列、拆分列、文本提取、格式转换等等。

  4. 合并多个工作表
    方法一:
    在一个新表中打开有多个表需要合并的excel文件,功能路径如下
    【学习笔记】EXCEL数据处理--规范与方法_第61张图片
    选中文件后,选择多项,把所有要合并的表都勾选上,进入编辑
    【学习笔记】EXCEL数据处理--规范与方法_第62张图片
    开始——追加查询——追加为新查询
    【学习笔记】EXCEL数据处理--规范与方法_第63张图片
    【学习笔记】EXCEL数据处理--规范与方法_第64张图片
    方法二:
    一样的打开文件,只不过只选择一个表进入编辑,通过拓展的方式达到合并的效果。
    只选择一个sheet打开后,在源状态下删除多余列,只保留data列
    【学习笔记】EXCEL数据处理--规范与方法_第65张图片
    然后在data右上角点击,确定展开所有列即可。
    【学习笔记】EXCEL数据处理--规范与方法_第66张图片
    然后注意下是否有多余标题行或其他内容,清理后输出结果即可。

  5. 合并多个工作簿
    首先从文件夹打开
    【学习笔记】EXCEL数据处理--规范与方法_第67张图片
    进入编辑后,删除多余列,保留Content
    在这里插入图片描述
    选择添加列——自定义列,使用函数Excel.Workbook([Content])
    【学习笔记】EXCEL数据处理--规范与方法_第68张图片
    然后将自定义的明细表展开,展开后仅删去多余列仅保留Data列
    【学习笔记】EXCEL数据处理--规范与方法_第69张图片
    【学习笔记】EXCEL数据处理--规范与方法_第70张图片
    然后再将Data展开即可。随后整理下格式就可以输出结果了。以后在目标文件夹下新增或删除excel工作簿,在表格上刷新即可完成数据更新。

  6. 大数据量的数据匹配
    小数据量可以使用VLOOKUP,但是对于大数据量可以使用pq
    使用合并查询功能
    【学习笔记】EXCEL数据处理--规范与方法_第71张图片
    将匹配结果展开,就可以输出结果了。
    (注意区别于vlookup只匹配重复项第一个,pq的匹配会把所有数据匹配进来,所以要注意重复项的问题)

  7. 中国式排名
    在pq中只需要使用合并查询,连接原始表和国际排名表即可(也就是将原始表进行国际排名,再将排名结果匹配回原始表)。

  8. 二维表转一维表
    选中区域,使用逆透视功能
    【学习笔记】EXCEL数据处理--规范与方法_第72张图片

  9. 数据扩展

你可能感兴趣的:(笔记)