BI工具之—— power bi 调研学习之整体框架流程整理

本文的调研路径网址为:

1)https://zhuanlan.zhihu.com/p/64999937(power bi desktop 应用教程)2)https://docs.microsoft.com/zh-cn/power-bi/fundamentals/power-bi-overview(POWER BI 组件总览)3)https://docs.microsoft.com/zh-cn/learn/modules/explore-power-bi-service/(POWER BI 服务)4)https://docs.microsoft.com/zh-cn/power-bi/report-server/get-started(本地报表服务器)

一:认识 power bi

  • 概念:
    从各种数据源中提取数据,并对数据进行整理分析,然后生成精美的图表,并且 可以在电脑端和移动端与他人共享的一个神器;

  • 大屏:有大屏,但是需要自己设计 设计不好就没有大屏的感觉

  • 费用:PowerBI Desktop 免费

  • 组成:
    1:Power BI Desktop 的 Windows 桌面应用程序----创建

(1)应用流程:连接到数据---》 转换和清除该数据,以创建数据模型创建视觉对象---》 创建作为
			视觉对象集合的报表---》 Power BI 服务与其他人共享报表
(2) 组件
		 报表组件:创建报表和视觉对象,并花费大部分时间执行创建操作。
		 数据组件:查看与报表关联的数据模型中使用的表、度量值和其他数据,并转换数据以便
		 		  在报表的模型中充分利用。
		 模型组件:查看和管理数据模型中各表之间的关系

2: Power BI 服务的联机 SaaS(软件即服务)----共享
(1)进入机制:Power BI Desktop 工具栏中的发布按钮 或者 直接进入Power BI 服务中创建 Power BI 报表
(2)https://app.powerbi.com
3:适用于 Windows、iOS 和 Android 设备的 Power BI 移动应用 ----使用
4:Power BI 报表服务器

(Power BI Desktop 中创建 Power BI 报表后,可以将其发布到本地报表服务器)----保护管理
  • 可视:自定义可视化包,各种酷炫图表(需要去官网库下载相关免费可视化主题包,现存100多种)
  • 优点:使用 Power BI 取决于 Power BI 的哪个功能或服务是适用的最佳工具。 例如,可以使用 Power BI Desktop 来为自己团队创建有关客户参与统计信息的报表,也可以在 Power BI 服务的实时仪表板中查看库存和生产进度

二:PowerBI Desktop 的应用流程

  1:报表公开:
		数据源导入--->>>进入内嵌的查询编辑器进行**数据清洗**(Power Query是Power BI的
		一个主要模块,数据整理都在这里完成)--->>> **数据建模**(为表格之间建立关联--->>>
		 **可视化工作**(生成报表)--->>>**共享及管理**(发布到 Power BI 服务并进行共享)
		 --->>>**用户**使用报表并与之交互
  2:报表限定公司应用;
			  如果未准备好迁移到云,而且需要用公司防火墙保护报表,可使用 Power BI 报表服
		务器提供的各种现成工具和服务在本地创建、部署和管理 Power BI 移动报表和分页报表

BI工具之—— power bi 调研学习之整体框架流程整理_第1张图片

三:PowerBI 服务

1:PowerBI 服务的用处:


	作为用户或使用者,你将从创建仪表板、报表和应用的设计者处收到这些内容。 从而使用“Power BI 服务”,以查
看此类数据并与之交互,从而制定业务决策;(简单点说:就是一个专门供业务用户的界面,数据分析人员传到BI服务 然
后业务人员应用该仪表盘的(可以自己重新根据数据集修改、编辑、导出导入等各种想做的操作))

BI工具之—— power bi 调研学习之整体框架流程整理_第2张图片
2:PowerBI 服务的构建基块和相关概念:

1:总览:
		    Power BI 的 5 个主要构建基块是仪表板、报表、工作簿、数据集和数据流 。 它们都整理到工作区中,且在
		容量上进行创建 
2:容量:
	       容量是一个 Power BI 核心概念,表示用于托管和交付 Power BI 内容的一组资源(存储、处理器和内存)。 
	     容量可以是共享容量,也可以是专用容量 。 共享容量与其他 Microsoft 客户共享,专用容量则完全委派给单
	     个客户。 需要订阅才能使用专用容量,默认情况下,工作区是在共享容量上创建的。 在共享容量中,工作负载  
	     可在与其他客户共享的计算资源上运行。 由于容量必须共享资源,因此会施加限制以确保“公平竞争”,例如最大
	     模型大小 (1 GB) 和每日刷新频率上限(每天 8 次)
3:工作区:
	     工作区是基于容量创建的。 本质上,它们是 Power BI 中仪表板、报表、工作簿、数据集和数据流的容器
	1.3.1 我的工作区
		  我的工作区” 是个人工作区,供任何 Power BI 客户在其中处理自己的内容。 只有你自己才有权访问你的工
		  作区。 可以从“我的工作区”共享仪表板和报表。
	1.3.2 工作区
		  工作区用于与同事展开协作和共享内容 。 可将同事添加到工作区,然后在仪表板、报表、工作簿和数据集
		  方面进行协作。
4:数据流
	它们计划定期刷新以存储最新数据。 它们非常适合准备数据供数据集使用(可能是重复使用)
5:数据集
	数据集 是导入 或连接 到的数据集合。 通过 Power BI,你可以连接到并导入各种类型的数据集并将它们组合在一
	起。 数据集还可从数据流中获取数据。数据集与工作区相关联,单个数据集可以包含在多个工作区中。 打开某个工
	作区时,关联的数据集会列在“数据集”选项卡下面。 每个列出的数据集表示一个数据源

3:协作共享
BI工具之—— power bi 调研学习之整体框架流程整理_第3张图片
与同事协作有以下三种方法:共享、注释和打印
3.1 共享
第 1 步Power BI 设计者与 Power BI 使用者共享内容 (方法如下)

		1:共享各个仪表板或报表的链接。(设计者可能以电子邮件方式向你和其他经理发送链接)
	    2:共享 Power BI 应用。(先将仪表板和报表打包到应用中,再与你共享此应用)
 第 2 步使用者与内部和外部同事共享内容 (方法如下)

3.2 向仪表盘添加注释

       有权访问共享仪表板的每个人,都可以使用注释直接在仪表板上相互发送消息。

3.3 其他形式获得—纸质版打印、将 Power BI 报表导出到 PowerPoint等

四:PowerBI 的本地报表服务器

  • 概念:Power BI 报表服务器是一个本地报表服务器,其中包含一个可显示和管理报表和 KPI 的 Web 门户。 随之一起提供的还有创建 Power BI 报表、分页报表、移动报表和 KPI 的工具。 用户可以采用不同的方式访问这些报表:在 Web 浏览器、移动设备或在收件箱中以电子邮件的形式查看报表。
  • 其功能作用类似power bi 服务 ,与之对比如下:
    BI工具之—— power bi 调研学习之整体框架流程整理_第4张图片
    BI工具之—— power bi 调研学习之整体框架流程整理_第5张图片BI工具之—— power bi 调研学习之整体框架流程整理_第6张图片BI工具之—— power bi 调研学习之整体框架流程整理_第7张图片BI工具之—— power bi 调研学习之整体框架流程整理_第8张图片

五:PowerBI 的其他内容归类

  • 多数据源生成报表展示问题
方案1:用ETL工具(如:Informatica、odi )进行多源数据的抽取加载转换到同一数据仓的;
方案2:不用ETL工具进行多源数据整合到同一数据仓的情况下:通过Power BI Desktop 的报表分析
	   工具的页签进行区分,每个页签分析来自不同数据源的数据;
	  (官网原话:Power BI Desktop,可以使用来自多个源的数据创建复杂且视觉效果丰富的表,
	   即可与组织中的其他人共享的多合一报表)
  • 在不同文件夹中的报表直接合并问题
应用Power Query 直接可以合成一个数据报表
  • 处理数据量问题及二次更新问题
1)数据量无限制,具体多少取决于电脑配置,上亿行不是问题(不明确需持续调研)2)自动化,处理过程全记录,每次数据源更新后刷新即可,无需重复劳动(刷新操作是在我的工作区中执行数据源的刷新(可计划)
  • PowerBI Desktop 的 功能组件分类(后三个仅为同作用的 并不是POWER BI 本身的,也可以说其嵌入POWER BI)
    Power Query、Power Pivot、Power view以及Power Map等全部功能聚集到一起,就成了现在的Power BI
1)Power Query(可作为excel插件单独使用)
	1.1 底层处理语言为M函数 复杂的处理需要写M函数
	1.2 Power Query编辑器中,用户可以使用超过300种不同的数据转换,并且转换的每一个步骤的数
	  据都可以随时查看。这些数据转换功能在所有数据源中都是通用的,而不受基础数据源的限
	  制,并且数据处理以后,所有的步骤都被记录下来,源数据发生变动只需要刷新就可以自动执
	  行所有处理步骤;
	1.3 那么Power BI 中如何使用python呢?
		1.3.1 数据获取环节可以直接用Python从数据源获取数据,返回到PowerBI进一步处理。
		1.3.2 数据清洗环节,可以将PowerBI获取的数据源,用Python来进一步处理,比如调用Python的正则函数等。
		1.3.3 数据可视化环节 使用python 来绘制图表
(2)Power Pivot(可作为excel插件单独使用)
	1.1 PowerPivot是一种数据建模技术,用于创建数据模型,建立关系,以及创建计算。 可使用 
	    PowerPivot 处理大型数据集,构建广泛的关系,以及创建复杂(或简单)的计算,同powerbi
	    的建模概念和作用一样 但是 后者不可 作为插件单独使用。
    1.2 多个表格、多种来源的数据中,根据不同的维度、不同的逻辑来聚合分析数据;而提取数据的
	    前提是要将这些数据表建立关系,这个建立关系的过程就是数据建模
	1.3 操作:
	    1.3.1 维表和事实表的导入——>> powerbi 根据表单内容自动连接或者手动拖拽建立连接——>> 连接属性修改(基数和交叉筛选方向)
	    1.3.1.1基数:两个连接字段的对应关系,分为多对一、一对一和一对多,一对多和多对一
	    1.3.1.2交叉筛选方向:表示数据筛选的流向,有两种类型
					1.3.1.2.1 双向:两个表可以互相筛选
					1.3.1.2.2 单向:一个表只能对另一个表筛选,而不能反向
(3)Power view(PV就是数据可视化)
		度量值,这可以说是PowerBI数据建模的灵魂,创建度量值的公式称为DAX公式;
		度量值的逻辑以及建立度量值的DAX公式学习Power BI的重点;
(4)Power Map (PM 就是数据地图)`
        后续在本篇补充吧 ,暂且没用到! 

六:PowerBI 调研总结

1:应用方面:

  • 优点:
    1:powerbi 可以直接处理来自不同数据源的数据,一定程度上可以简化ETL的应用,甚至不需要写SQL来 做多表查询处理;
    2:PQ工具在处理来源数据的时候很直观,每个过程都非常明确的记录在编辑器的一边,而且可以对每个过程做无数次修改,一旦某一环节没考虑齐全,不用从头部署直接找到那一步进入修改就可;
    3:维表不用提前部署,用到的时候直接在PQ中立刻创建就行(后期也可以做修改处理)–仅指的是那种固定的维表 不需要从其他表中查询获取更新的;
    4:建模过程很灵活,不需要多层建模(如BIEE的 物理层、逻辑层、表现层)
    5:可以对接python/R语言直接抓取数据源,且抓取后可以用python的pandas、matplotlib、numpy、seabron等所有的扩展包处理数据,对接算法等
    6:用户可以再power bi 服务(一个组件服务器,用户和开发交互的地方)上对分析师做的仪表盘、报表做修改(该动作不会改变 原来仪表盘、报表以及数据集;只会在用户自己的工作区做修改展示存储);且报表修改的所有路径 都会存储,每个路径节点下的数据源随时可用(即:修改之前的数据源不会掉)
    7:牵一发而动全身(交叉突出显示,对用户利用仪表盘分析数据的可变因素提供很直观的展示)
    8:邮箱报警提示,移动端可用
  • 我认为的不足或者我没了解到的知识点:
    1:PQ 中想做复杂的数据处理需要用到M函数
    2:建模后 如果想要不改变数据源的同时展示并分析数据需要用到DAX公式
    3:数据保密问题上;和用户交互的两个服务
    (3.1: power bi 服务 好用灵活 但是需要微软的服务器存储)
    (3.2:本地报表服务器 应用性大不如1,感觉和BIEE的前端几乎差不多,失去了灵活性)
    4:作为敏捷BI ETL的功能较为简陋
(相较于 ‘’数据清洗—数据建模—数据分析 ‘’ 这一传统 BI流程 虽然power bi自己就可以运行这一套-----SSIS,
SSAS,SSRS分别对应Etl、分析服务、报表服务,其实就是整个数据分析的流程,从数据库取出数据,然后进行清洗转
换,建立数据模型,进而生成报表。PowerBi自己就完成了以上三者的部分功能,注意,只是部分。报表和图表基本和
SSRS持平,分析服务也就个多维分析,跟SSAS还差一些,SSAS更完善。差距最大的是在ETL环节,与SSIS相比非常简陋)

5:数据量过大问题,不太乐观
6:更加针对于个人或者小型分析范围,针对企业级的有点欠缺
PS: 此篇仅为深入学习之前调研的大体内容,后期深入学习之后会有超详细记录

你可能感兴趣的:(power,bi)