Power BI Pro 中基于云端数据集创建的报表如何跨组织迁移

使用Power Bi 可以在组织内便捷地共享数据集。在发布了一份数据集之后,你可以轻易地基于该数据集创建一份新的报表:

从PowerBiPlatformDataSet创建报表

今年,我就在一个二期项目中将该公司所有五十多个报表文件统一连接到同一个中央模型上,几乎是把PowerBi用成了SSAS。这样做的好处是大大减轻了模型维护的工作量。在过去,业务逻辑稍有变动,动辄要跟着修改十几张报表,体力活极多。而现在,我只需要付出很小的工作量即可统一修改五十多张报表中的业务逻辑、配色等。

便捷的同时,也带来了一个新问题:当我想将这种基于云端数据集创建的报表迁移到其它组织(比如,该公司的BI测试环境)时,遇到了很大麻烦。并不是想象中的换个账号切换数据源那么简单。接下来的文字中,我会把这个问题称为“无权限宕机问题”。
如果公司安全流程不是很严格,测试环境的账号与生产环境账号在同一组织中(或者购买了PowerBiPremium以跨组织共享数据集),并且可以将生产环境的数据集授权给测试账号,那么不会遇到这个所谓的“无权限宕机问题”。
这个问题的具体表现是:对于使用组织A账号基于云端数据集创建的报表,无法使用组织B账号打开。
如果你尝试这样做并且期望打开后将数据源更改为组织B中的相同结构的云端数据集,你会看到这个:

获取云端数据集错误

点击重试显然不会起任何作用;点击编辑看起来像是会强行打开报表并允许更改该报表的数据源(至少在我点击之前是这么猜测的),但事实是,点击了编辑之后,你会看到你的PowerBIDesktop死机了……

手动解决方案

经过探索,我发现决定了数据集引用的是报表文件解包后的Connections文件。因此,要想解决这个问题,只需要以下步骤:

  1. 从组织B的云端数据集创建报表样例B.pbix
  2. 将B.pbix改后缀得到B.pbix.zip
  3. 打开B.pbix.zip,提取出根目录下的Connections文件
  4. 将待转换的A组织报表anyReportA.pbix重命名为anyReportB.pbix.zip
  5. 打开anyReportB.pbix.zip,使用之前提取出的B组织的Connections文件覆盖
  6. 重命名anyReportB.pbix.zip为anyReportB.pbix

这样,我们就顺利地将A组织中基于云端数据集创建的报表anyReportA.pbix迁移到了B组织中,使用登陆了B组织账号的Power BI Desktop可以正常编辑、发布anyReportB.pbix。

自动化

考虑到源报表更新时可能需要同步更新另一个组织的报表,可以将解决方案自动化。
main.py:

from zipfile import ZipFile
import os
from shutil import make_archive,rmtree
from config import report_pairs
def replace(report_file_name:str,dataset_example_file_name:str):
    '''
        report_file_name: 等待更换的报表文件
        dataset_example_file_name: 要更换到的目标数据集
    '''
    with ZipFile(file=dataset_example_file_name,mode='r') as new_dataset_pbix:
        new_dataset_connection = new_dataset_pbix.read(name='Connections').decode('utf-8')
        # 解压
        with ZipFile(file=report_file_name,mode='r') as file_mati:
            file_path=os.path.dirname(report_file_name)
            temp_dir=os.path.join(file_path,'.temp')
            temp_extract_dir=os.path.join(temp_dir,os.path.basename(report_file_name))
            file_mati.extractall(path=temp_extract_dir)
            # 替换connections文件
            with open(os.path.join(temp_extract_dir,'connections'),mode='w') as temp_connections_file:
                temp_connections_file.write(new_dataset_connection)
            make_archive(report_file_name,root_dir=temp_extract_dir,format='zip')
            # 清空.temp文件
            rmtree(temp_dir)
        # 删除报表文件
        os.remove(report_file_name)
        # 将打包好的新报表文件重命名
        os.rename(report_file_name+'.zip',report_file_name)
if __name__=='__main__':
    for row in report_pairs.iterrows():
        replace(report_file_name=row[1]['报表文件'],dataset_example_file_name=row[1]['数据源'])

config.py:

import pandas as pd
df=pd.read_excel('config-dev.xlsx')
report_pairs=df
if __name__=='__main__':
    print(report_pairs)

你可能感兴趣的:(Power BI Pro 中基于云端数据集创建的报表如何跨组织迁移)