本文的调研路径网址为:
(1)https://zhuanlan.zhihu.com/p/64999937(power bi desktop 应用教程)
(2)https://docs.microsoft.com/zh-cn/power-bi/fundamentals/power-bi-overview(POWER BI 组件总览)
(3)https://docs.microsoft.com/zh-cn/learn/modules/explore-power-bi-service/(POWER BI 服务)
(4)https://docs.microsoft.com/zh-cn/power-bi/report-server/get-started(本地报表服务器)
概念:
从各种数据源中提取数据,并对数据进行整理分析,然后生成精美的图表,并且 可以在电脑端和移动端与他人共享的一个神器;
大屏:有大屏,但是需要自己设计 设计不好就没有大屏的感觉
费用:PowerBI Desktop 免费
组成:
1:Power BI Desktop 的 Windows 桌面应用程序----创建
;
(1)应用流程:连接到数据---》 转换和清除该数据,以创建数据模型创建视觉对象---》 创建作为
视觉对象集合的报表---》 Power BI 服务与其他人共享报表
(2) 组件
报表组件:创建报表和视觉对象,并花费大部分时间执行创建操作。
数据组件:查看与报表关联的数据模型中使用的表、度量值和其他数据,并转换数据以便
在报表的模型中充分利用。
模型组件:查看和管理数据模型中各表之间的关系
2: Power BI 服务的联机 SaaS(软件即服务)----共享
。
(1)进入机制:Power BI Desktop 工具栏中的发布按钮 或者 直接进入Power BI 服务中创建 Power BI 报表
(2)https://app.powerbi.com
3:适用于 Windows、iOS 和 Android 设备的 Power BI 移动应用 ----使用
4:Power BI 报表服务器
(Power BI Desktop 中创建 Power BI 报表后,可以将其发布到本地报表服务器)----保护管理
自定义可视化包,各种酷炫图表(需要去官网库下载相关免费可视化主题包,现存100多种)
使用 Power BI 取决于 Power BI 的哪个功能或服务是适用的最佳工具。 例如,可以使用 Power BI Desktop 来为自己团队创建有关客户参与统计信息的报表,也可以在 Power BI 服务的实时仪表板中查看库存和生产进度
1:报表公开:
数据源导入--->>>进入内嵌的查询编辑器进行**数据清洗**(Power Query是Power BI的
一个主要模块,数据整理都在这里完成)--->>> **数据建模**(为表格之间建立关联--->>>
**可视化工作**(生成报表)--->>>**共享及管理**(发布到 Power BI 服务并进行共享)
--->>>**用户**使用报表并与之交互
2:报表限定公司应用;
如果未准备好迁移到云,而且需要用公司防火墙保护报表,可使用 Power BI 报表服
务器提供的各种现成工具和服务在本地创建、部署和管理 Power BI 移动报表和分页报表
1:PowerBI 服务的用处:
作为用户或使用者,你将从创建仪表板、报表和应用的设计者处收到这些内容。 从而使用“Power BI 服务”,以查
看此类数据并与之交互,从而制定业务决策;(简单点说:就是一个专门供业务用户的界面,数据分析人员传到BI服务 然
后业务人员应用该仪表盘的(可以自己重新根据数据集修改、编辑、导出导入等各种想做的操作);)
1:总览:
Power BI 的 5 个主要构建基块是仪表板、报表、工作簿、数据集和数据流 。 它们都整理到工作区中,且在
容量上进行创建
2:容量:
容量是一个 Power BI 核心概念,表示用于托管和交付 Power BI 内容的一组资源(存储、处理器和内存)。
容量可以是共享容量,也可以是专用容量 。 共享容量与其他 Microsoft 客户共享,专用容量则完全委派给单
个客户。 需要订阅才能使用专用容量,默认情况下,工作区是在共享容量上创建的。 在共享容量中,工作负载
可在与其他客户共享的计算资源上运行。 由于容量必须共享资源,因此会施加限制以确保“公平竞争”,例如最大
模型大小 (1 GB) 和每日刷新频率上限(每天 8 次)
3:工作区:
工作区是基于容量创建的。 本质上,它们是 Power BI 中仪表板、报表、工作簿、数据集和数据流的容器
1.3.1 我的工作区
我的工作区” 是个人工作区,供任何 Power BI 客户在其中处理自己的内容。 只有你自己才有权访问你的工
作区。 可以从“我的工作区”共享仪表板和报表。
1.3.2 工作区
工作区用于与同事展开协作和共享内容 。 可将同事添加到工作区,然后在仪表板、报表、工作簿和数据集
方面进行协作。
4:数据流
它们计划定期刷新以存储最新数据。 它们非常适合准备数据供数据集使用(可能是重复使用)
5:数据集
数据集 是导入 或连接 到的数据集合。 通过 Power BI,你可以连接到并导入各种类型的数据集并将它们组合在一
起。 数据集还可从数据流中获取数据。数据集与工作区相关联,单个数据集可以包含在多个工作区中。 打开某个工
作区时,关联的数据集会列在“数据集”选项卡下面。 每个列出的数据集表示一个数据源
3:协作共享
与同事协作有以下三种方法:共享、注释和打印
3.1 共享
第 1 步Power BI 设计者与 Power BI 使用者共享内容 (方法如下)
1:共享各个仪表板或报表的链接。(设计者可能以电子邮件方式向你和其他经理发送链接)
2:共享 Power BI 应用。(先将仪表板和报表打包到应用中,再与你共享此应用)
第 2 步使用者与内部和外部同事共享内容 (方法如下)
3.2 向仪表盘添加注释
有权访问共享仪表板的每个人,都可以使用注释直接在仪表板上相互发送消息。
3.3 其他形式获得—纸质版打印、将 Power BI 报表导出到 PowerPoint等
方案1:用ETL工具(如:Informatica、odi )进行多源数据的抽取加载转换到同一数据仓的;
方案2:不用ETL工具进行多源数据整合到同一数据仓的情况下:通过Power BI Desktop 的报表分析
工具的页签进行区分,每个页签分析来自不同数据源的数据;
(官网原话:Power BI Desktop,可以使用来自多个源的数据创建复杂且视觉效果丰富的表,
即可与组织中的其他人共享的多合一报表)
应用Power Query 直接可以合成一个数据报表
1)数据量无限制,具体多少取决于电脑配置,上亿行不是问题(不明确需持续调研)
(2)自动化,处理过程全记录,每次数据源更新后刷新即可,无需重复劳动(刷新操作是在我的工作区中执行数据源的刷新(可计划))
(1)Power Query(可作为excel插件单独使用)
1.1 底层处理语言为M函数 复杂的处理需要写M函数
1.2 Power Query编辑器中,用户可以使用超过300种不同的数据转换,并且转换的每一个步骤的数
据都可以随时查看。这些数据转换功能在所有数据源中都是通用的,而不受基础数据源的限
制,并且数据处理以后,所有的步骤都被记录下来,源数据发生变动只需要刷新就可以自动执
行所有处理步骤;
1.3 那么Power BI 中如何使用python呢?
1.3.1 数据获取环节可以直接用Python从数据源获取数据,返回到PowerBI进一步处理。
1.3.2 数据清洗环节,可以将PowerBI获取的数据源,用Python来进一步处理,比如调用Python的正则函数等。
1.3.3 数据可视化环节 使用python 来绘制图表
(2)Power Pivot(可作为excel插件单独使用)
1.1 PowerPivot是一种数据建模技术,用于创建数据模型,建立关系,以及创建计算。 可使用
PowerPivot 处理大型数据集,构建广泛的关系,以及创建复杂(或简单)的计算,同powerbi
的建模概念和作用一样 但是 后者不可 作为插件单独使用。
1.2 多个表格、多种来源的数据中,根据不同的维度、不同的逻辑来聚合分析数据;而提取数据的
前提是要将这些数据表建立关系,这个建立关系的过程就是数据建模
1.3 操作:
1.3.1 维表和事实表的导入——>> powerbi 根据表单内容自动连接或者手动拖拽建立连接——>> 连接属性修改(基数和交叉筛选方向)
1.3.1.1基数:两个连接字段的对应关系,分为多对一、一对一和一对多,一对多和多对一
1.3.1.2交叉筛选方向:表示数据筛选的流向,有两种类型
1.3.1.2.1 双向:两个表可以互相筛选
1.3.1.2.2 单向:一个表只能对另一个表筛选,而不能反向
(3)Power view(PV就是数据可视化)
度量值,这可以说是PowerBI数据建模的灵魂,创建度量值的公式称为DAX公式;
度量值的逻辑以及建立度量值的DAX公式学习Power BI的重点;
(4)Power Map (PM 就是数据地图)`
后续在本篇补充吧 ,暂且没用到!
1:应用方面:
(相较于 ‘’数据清洗—数据建模—数据分析 ‘’ 这一传统 BI流程 虽然power bi自己就可以运行这一套-----SSIS,
SSAS,SSRS分别对应Etl、分析服务、报表服务,其实就是整个数据分析的流程,从数据库取出数据,然后进行清洗转
换,建立数据模型,进而生成报表。PowerBi自己就完成了以上三者的部分功能,注意,只是部分。报表和图表基本和
SSRS持平,分析服务也就个多维分析,跟SSAS还差一些,SSAS更完善。差距最大的是在ETL环节,与SSIS相比非常简陋)
5:数据量过大问题,不太乐观
6:更加针对于个人或者小型分析范围,针对企业级的有点欠缺
PS: 此篇仅为深入学习之前调研的大体内容,后期深入学习之后会有超详细记录