数据的属性与数据集,相似度,数据的质量,OLAP

数据的属性与数据集:

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!


文章目录

  • 数据的属性与数据集:
    • @[TOC](文章目录)
  • 数据相似与相异性
  • 数据的质量
  • 数据的预处理
  • 数据变换
  • 数据ETL基础
  • 数据仓库的模型
  • ETL
  • OLAP
  • 总结

数据相似与相异性

数据的属性与数据集,相似度,数据的质量,OLAP_第1张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第2张图片
相似度是p的话,相异度p1
s是相似度的话,
数据的属性与数据集,相似度,数据的质量,OLAP_第3张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第4张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第5张图片
当xy差别不大还行
当xz差别太大不行

实际数据集中,样本差异可能很大,对象多
这样就要计算plcc皮尔森先关系数或者斯皮尔曼等级相关

数据的属性与数据集,相似度,数据的质量,OLAP_第6张图片
类似于差值构成的点积
相当于把数量级的差异抹去了
美滋滋,只要零头

预先相似度改造之后就上上面的问题
数据的属性与数据集,相似度,数据的质量,OLAP_第7张图片
目的仍然是抹掉数量级 的差异

数据的质量

数据的属性与数据集,相似度,数据的质量,OLAP_第8张图片

数据的预处理

数据的属性与数据集,相似度,数据的质量,OLAP_第9张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第10张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第11张图片

数据变换

数据的属性与数据集,相似度,数据的质量,OLAP_第12张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第13张图片

数据ETL基础

数据的属性与数据集,相似度,数据的质量,OLAP_第14张图片
OLAP
面相分析的
OLDP是面向数据好像
数据的属性与数据集,相似度,数据的质量,OLAP_第15张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第16张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第17张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第18张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第19张图片
小型快速的数据仓库
多数据源集合
及时分析
数据的属性与数据集,相似度,数据的质量,OLAP_第20张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第21张图片

数据仓库的模型

数据的属性与数据集,相似度,数据的质量,OLAP_第22张图片
人和车,就是开车的关系

实体就是抽象概念
数据的属性与数据集,相似度,数据的质量,OLAP_第23张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第24张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第25张图片
非规范化的
是因为它可能重复的
所以这个数据仓库很骚

数据的属性与数据集,相似度,数据的质量,OLAP_第26张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第27张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第28张图片
内存消耗大,查询不便捷

数据的属性与数据集,相似度,数据的质量,OLAP_第29张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第30张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第31张图片

ETL

数据的属性与数据集,相似度,数据的质量,OLAP_第32张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第33张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第34张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第35张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第36张图片

OLAP

数据的属性与数据集,相似度,数据的质量,OLAP_第37张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第38张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第39张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第40张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第41张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第42张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第43张图片
数据的属性与数据集,相似度,数据的质量,OLAP_第44张图片
数据仓库就是OLAP

这些应该也会考


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

你可能感兴趣的:(国考,数据挖掘,大数据,OLAP,国考,网警,相似度)