6月4日至5日,由中国信息通信研究院、中国通信标准化协会主办、大数据技术标准推进委员会承办、中国IDC圈协办的2019大数据产业峰会在北京国际会议中心隆重召开。
腾讯游戏孙龙君、农益辉和刘天斯作为数据资产管理和知识图谱领域专家应邀出席。 腾讯游戏数据资产管理平台从300+申报中脱颖而出,荣获“2019年度大数据星河奖”,并获颁“数据管理平台基础能力测评”证书。
同时,腾讯游戏知识图谱平台“游谱”也于现场获颁“知识图谱工具基础能力测评”证书。
由腾讯游戏孙龙君、农益辉、刘天斯、黄志、陈才和赵丽萍参与编撰的《数据资产管理实践白皮书4.0》在此大会正式发布。
腾讯游戏大数据资产管理平台“星河奖”奖杯和证书颁发
腾讯游戏数据资产管理平台从300+申报中脱颖而出,荣获“2019年度大数据星河奖”,于大会现场颁发获奖证书和奖杯。
腾讯游戏大数据资产管理平台测评证书颁发
腾讯游戏数据资产管理平台通过“数据管理平台基础能力测评” 并现场获颁证书。
腾讯游戏知识图谱平台“游谱”测评证书颁发
腾讯游戏知识图谱平台“游谱”通过“知识图谱工具基础能力测评”并现场获颁证书。
腾讯游戏参与编撰的“数据资产管理实践白皮书4.0”正式发布
由腾讯游戏孙龙君、农益辉、刘天斯、黄志、陈才和赵丽萍参与编撰的《数据资产管理实践白皮书4.0》于大会现场正式发布。
腾讯游戏数据资产管理平台介绍
腾讯游戏数据资产管理平台建设致力于为游戏项目组、研发、运维、数据管理人员提供有效、智能的数据资产管理一站式服务,确保数据交付的质量、效率、成本与安全,协助业务提高数据升值能力,助力产品成功。平台成果如下:
1、通过动态资源调度机制,优化集群计算任务执行效率提升50+%,集群资源利用率提升20+%;同时提供游戏日志的秒级实时检索服务,提升业务优化迭代的效率;
2、构建数据价值评估方案,辅助业务运营决策,同时基于数据价值优化用户数据生命周期管理;优化存储生命周期配置率提升45%,累计释放存储空间20P+;
3、通过构建数据血缘并实现全链路数据质量保障体系,保障服务质量SLA高达99.99+%,实现1min内告警并评估影响面和问题快速定位;
4、构建“事前可管、事中可控、事后可查”的数据安全防控体系,实现分钟级的数据安全实时监控和数据审计,数据安全事故0发生;
5、通过数据服务目录与元数据视图,指引用户了解:“有什么数据,长什么样,如何去用“。
腾讯游戏数据资产管理平台亮点
腾讯游戏数据资产管理平台主要功能全面覆盖元数据管理、数据质量管理、数据标准管理、数据安全管理等数据资产管理关键的核心功能,创新性地提出了数据价值评估的“三度模型”、生命周期管理模型、以及基于数据血缘建设的影响评估和快速定位数据质量保障方案等行之有效的模型与方案。
1、数据资产管理平台能力建设“三好”模型
2、数据价值评估的“三度”模型,衡量业务ROI
3、基于数据价值和重要等级的生命周期管理模型
4、基于数据血缘构建影响评估和快速定位的数据质量保障
5、完备元数据管理体系,驱动业务运营管理
6、数据安全管理实现“事前可管、事中可控、事后可查”管理机制
7、平台实践方法论被《数据资产管理实践白皮书3.0》以及4.0版本引用
腾讯游戏知识图谱平台“游谱”介绍
“游谱”是腾讯互娱基于多年在游戏精细化运营方面的经验通过解析结构化,半结构化和非结构化数据构建的多模态游戏知识图谱。目前“游谱”累计了海量的游戏数据,基本涵盖了游戏本身及运营相关的诸多信息,包括玩法,开发商,新闻,直播,发行平台等总计2000+维度,能为游戏项目组提供从新游发现,游戏及公司评估到发行运营阶段近8种AI服务, 包括游戏排名预测、用户画像、规模预估、游戏资讯推荐等,效果提升在10%~220%之间。
游谱主要分为以下四个部分:
数据层:采用基于Spark的大规模数据实时获取和解析系统,能够实时获取海量的游戏基础数据,基本涵盖游戏本身及运营相关的诸多信息。
构建层:采用分布式计算平台storm及微服务相结合的方式实时构建多模态图谱。Storm主要负责用结构化数据进行知识融合生成图谱;微服务从非结构化数据中抽取知识,如从图像中抽取画风、从音频文件中抽取音效风格、从文本中抽取知识等进行知识扩充及补全辅助多模态知识图谱的构建。
知识层:采用cos存储知识图谱多媒体文件, neo4j存储实体及关系信息, ES做信息检索引擎。
服务层:能为4个赛道提供近8种AI服务,包括游戏排名预测、用户画像、规模预估、游戏资讯推荐服务,另外也能提供基于知识图谱的内容推荐,如文章标签扩散、文章相似度计算等,以及知识图谱Embedding查询等微服务。
游谱的创新和核心优势
游戏知识图谱通过爬取采集结构化,半结构化,非结构数据化数据,到目前为止涵盖了游戏本身及运营相关的诸多信息,包括玩法,开发商,新闻,直播,发行平台等。并在此基础上抽象出一套通过知识图谱技术辅助游戏精细化运营的方法论,能为游戏项目组提供新游发现,游戏及公司评估,发行运营阶段一系列高质量的服务,助力游戏研发与运营的AI。
游谱的核心优势主要体现在:
海量的基础数据,游谱累计了海量的游戏基础数据、百万级别的新闻资讯、千万级的评论信息以及大量的游戏直播,视频信息。总计关系62.1万+、属性133.8万+。
丰富的游戏维度数据,涵盖游戏本身及运营相关的诸多信息,包括玩法,开发商,新闻,直播,发行平台等总计2000+维度。
多模态的游戏数据,内含丰富的多媒体数据,包括百万级的图片,文本和视频等数据,打破了传统知识图谱只包含文本数据的限制,能为游戏精细化运营提供更加丰富的数据支持。
数据实时在线更新,采用业务领先的分布式、高容错的实时计算系统storm,能够对结构化数据进行在线流式处理,经数据清洗、实体链接、属性融合生成实体、关系及属性等知识图谱的关键构建流程,自动化的录入图数据库。
完备的游戏知识表示体系,游谱的本体层利用24个子系统来描述游戏,包括玩法系统,画面系统,动作系统等。每个子系统包含数个标签,用来描述子系统的特性,最终有300+个标签来刻画每个游戏。
助力游戏研发与运营的AI,能为14个赛道提供近8种AI服务,包括游戏排名预测、用户画像、规模预估、游戏资讯推荐等。除了初期引进评估阶段,在游戏运营阶段也能提供多种自研的基于图谱推荐算法。
附《数据资产管理实践白皮书4.0》下载地址(pdf体积较大,请用浏览器打开):
白皮书下载地址