众多开源爱好者翘首期盼的开源盛会:第八届中国开源年会(COSCon'23)将于 10月28-29日在四川成都市高新区菁蓉汇举办。本次大会的主题是:“开源:川流不息、山海相映”!各位新老朋友们,欢迎到成都,线下相聚!
✦✦
01
论坛介绍
大数据论坛旨在促进大数据前沿技术的知识分享、交流,共同探讨大数据和 AI 的最新趋势、挑战、最佳实践和创新。论坛汇集科学家、工程师和任何对此方向感兴趣的人,更好地利用大数据和 AI 来推动创新和业务增长。
✦✦
02
论坛出品人及出品人标准
1.论坛出品人
代立冬
白鲸开源联合创始人、Apache 基金会 Member & Apache 孵化器导师、Apache DolphinScheduler PMC Chair 、Apache SeaTunnel PMC 、Apache Local Community Beijing 成员,CommunityOverCode(原 ApacheCon ) Asia 的大数据论坛出品人,致力于让开源技术走向世界,让开源文化更好的在中国开发者群体传播。
2.论坛出品标准
聚焦开源大数据和 AI 技术,欢迎分享最新技术趋势、技术原理、最佳实践应用等议题
内容质量过硬
尽量不出现商业宣传
✦✦
03
论坛讲师阵容
演讲者简介
✦
梅相如 ,openGauss 社区运营责任人,多年研发工作经验,目前持续从事社区开发者生态,技术生态,用户生态工作。
演讲时间
✦
10月28日 13:30 - 14:05
演讲议题
✦
《 openGauss 开源数据库及生态实践分享》
演讲简介
✦
openGauss 是一个开源的企业级关系型数据库,开源以来内核和架构持续创新,被广泛使用在企业核心场景。本议题将介绍 openGauss 的重要特性,以及生态实践等内容。
演讲者简介
✦
王欢明,StarRocks Committer,主要负责 StarRocks 查询引擎、物化视图等开发工作。
演讲时间
✦
10月28日 14:05 - 14:40
演讲议题
✦
《 StarRocks 湖仓一体新范式的技术演进》
演讲简介
✦
StarRocks 是面向湖仓一体的极速数据分析引擎,通过弹性存算分离架构、极速计算引擎、透明加速物化视图等创新技术,为数据湖分析提供了极速统一灵活的使用体验。本次分享主要介绍 StarRocks 在湖仓一体方面的技术演进,包括通过物化视图进行分析加速,通过弹性架构调度多种负载,以及在数据湖存储方面的优化。
演讲者简介
✦
王海林,Apache SeaTunnel PMC、Apache SkyWalking Committer,多年平台研发工作,涉及数据开发/集成、监控 APM 计算相关领域,白鲸开源高级工程师。
演讲时间
✦
10月28日 14:40 - 15:15
演讲议题
✦
《基于 Apache SeaTunnel 构建 CDC 数据同步管道》
演讲简介
✦
Apache SeaTunnel 是一个开源数据集成平台,在插件式架构下可以轻松的在各类数据存储间进行数据集成同步,并且支持批/流/ CDC 等多种数据集成同步场景,提升企业应用数据集成的效率和降低使用维护成本。本次分享将介绍 Apache SeaTunnel CDC 设计实践原理以及如何基于 Apache SeaTunnel CDC 构建数据同步管道,通过 Apache SeaTunnel CDC 可以一套方案实现多源异构数据库同步,离线同步,数据开发等。
演讲者简介
✦
赵衎衎,浪潮 KaiwuDB 高级架构师,多年数据库系统架构研究与优化经验,2020 年加入浪潮,一直从事 KaiwuDB 研发相关工作,现主要负责 KaiwuDB 开销模型、计划列举、计算环境与行为数据等模块在内的 SQL 引擎查询优化研究。
演讲时间
✦
10月28日 15:15 - 15:50
演讲议题
✦
《看见未来—— AI 技术在 IoT 数据上的应用》
演讲简介
✦
人工智能技术与数据库技术相结合使得数据库系统更加智能化,从而不断提升企业数据处理及数据库运维管理效率。AIGC 的爆火也为数据库的发展提供了新的机遇与挑战。本次分享将围绕分布式、多模、原生 AI 等数据库关键技术潮流及物联网时代的创新数据场景,分享 KaiwuDB 自研分布式多模数据库架构思路、关键技术详解,以及 AI4DB 赋能数据库自治及数据价值挖掘在 IoT 重点场景下的技术实践。
演讲者简介
✦
陈政羽,Apache Flink/Streampark Contributor ,长期从事游戏行业数据开发、数据管道相关等开发工作,目前在公司负责云原生的 Flink 大数据部署作业平台构建与作业研发,从0到1为公司数据平台构建部署、提交作业的一站式 Flink 智能作业平台、反外挂平台、数据集成平台等相关工作。
演讲时间
✦
10月28日 15:50 - 16:25
演讲议题
✦
《开源湖仓管理系统-Amoro》
演讲简介
✦
Amoro 是一个开放式架构下的湖仓管理系统,在开放的数据湖格式之上,提供更多面向流和更新场景的优化,以及一套可插拔的数据自优化机制和管理服务。本次演讲将系统的介绍 Amoro 产品功能以及重要特性,以及在最近发布的0.5.0一些重磅功能,最后介绍社区未来推进的一些工作方向。
演讲者简介
✦
王蕴博,字节开源首席技术布道师、字节开源基础设施负责人。中国计算机学会( CCF )开源发展委员会副秘书长,CCF GitLink 社区负责人,CCF GLCC 发起人兼组委会主席。前腾讯开源联盟常务委员,前滴滴开源办公室负责人。长期专注于 DevOps、云原生等技术方向,负责 ByConity 的技术布道,是 ByConity 开源社区的 Maintainer 之一。
演讲时间
✦
10月28日 16:25 - 17:00
演讲议题
✦
《 ByConity 在面向海量数据的用户分析系统上的实践》
演讲简介
✦
ByConity 是一个字节开源的数仓引擎,主要介绍下 ByConity 的技术架构和重要特性,并举例在用户多维度行为分析平台从 ClickHouse 集群遇到的问题和挑战,和通过迁移 ByConity 后如何解决这些问题并给业务带来的收益。
演讲者简介
✦
何涛,来自阿里巴巴达摩院,拥有丰富的开发能够处理工业规模数据的分布式分析引擎,和部署实际数据分析应用到大型 Kubernetes 集群的经验。何涛多年来一直致力于开源社区,是 PyData 和 AI 生态系统中许多项目的贡献者,是开源一站式图计算平台 GraphScope,以及 CNCF 沙箱项目 Vineyard 的维护者。
演讲时间
✦
10月29日 13:30 - 14:05
演讲议题
✦
《 Vineyard:加速大数据分析工作流中的跨引擎数据共享》
演讲简介
✦
现代数据分析和人工智能应用变得越来越复杂,涉及在专用系统上执行多个任务。当部署到 Kubernetes 时,不同计算引擎之间使用外部存储(例如 S3 )共享中间数据往往成为一个重要的瓶颈。
我们开发了一个名为 Vineyard(CNCF 沙箱项目)的开源内存不可变数据管理器,以便使用内存映射高效地共享复杂的分布式对象。通过与 Kubernetes 的调度器框架集成,Vineyard 实现了对使用 Vineyard Daemonset 在 Kubernetes 上部署的任务进行数据本地性感知调度。在真实工作负载中,Vineyard 最多可以带来数倍的端到端性能提升。
Vineyard 的愿景与 CNCF 的领域保持一致,并与 Cloud Native Batch System Initiative(BSI)工作组共享许多动机和目标。在本次讲座中,我们将介绍 Vineyard 的驱动场景和架构,然后分享一些使用案例以及 Vineyard 的发展方向。
这次分享的内容将会包括:
- 讨论 Vineyard 的想要解决的实际生产中碰到的痛点问题
- 介绍 Vineyard 的特性以及如何实现设计目标
- 剖析内外部用户使用 Vineyard 的应用实践和场景分析,包括踩坑经验以及使用建议
- 分享 Vineyard 与类似解决方案的对比,以及未来在持续优化大数据分析工作流的研究方向。
演讲者简介
✦
刘澎,字节跳动数据平台研发工程师。
演讲时间
✦
10月29日 14:05 - 14:40
演讲议题
✦
《数据集成引擎 BitSail 自动化测试框架解析》
演讲简介
✦
数据集成场景涉及多种多样的数据源。针对这些数据源构建出相应的自动测试方案来覆盖任意数据源两两组合的通道,能够有效的提升工程开发、测试等效率。
演讲者简介
✦
李国豪,神策数据分布式存储研发工程师,Apache Pegasus committer。
演讲时间
✦
10月29日 14:40 - 15:15
演讲议题
✦
《 Apache Pegasus 在神策数据的应用》
演讲简介
✦
此分享主要介绍 Apache 孵化器项目分布式 kv 存储系统 Apache Pegasus 的架构原理,历史迭代以及它在"神策数据"是如何开发维护,为上千家客户提供稳定的数据服务。
演讲者简介
✦
徐静波,博士,阿里巴巴达摩院智能计算实验室高级技术专家。博士毕业于爱丁堡大学,研究方向为图计算、图数据管理和分布式系统,研究成果多次发表在 VLDB, SIGMOD, TODS 等顶尖国际会议/期刊上,曾获得 SIGMOD2017最佳论文奖,VLDB2017最佳演示奖和 SIGMOD 研究热点奖。加入阿里巴巴前为七桥科技联合创始人,当前主要在阿里巴巴负责 GraphScope 项目相关工作。
演讲时间
✦
10月29日 15:15 - 15:50
演讲议题
✦
《GraphScope Flex: 像乐高一样搭建场景化的图计算》
演讲简介
✦
此分享将介绍阿里巴巴开源的大规模图计算系统 GraphScope 的下一代技术架构 Flex。GraphScope 项目在之前一站式处理图遍历、图分析、图学习的基础上,向下一代 Flex 架构演进。通过灵活的组件化设计,用户可以在 GraphScope Flex 像搭建乐高积木一样组装适合自己场景的图计算系统,灵活、高效、易用的处理图计算需求。
志愿者
邝曾珍
2022/2023 COSCon’23 核心志愿者,成都市龙泉驿区新青年志愿者协会活动部副部长。
蒋炯垚
2023COSCon'23志愿者。
扫描下方二维码,添加小源机器人微信,即可加入COSCon'23专属年会互动群,及时获取年会相关信息。我们在成都等你!
ps:已添加小源机器人微信的开源人,可在对话中回复关键词“加群”,获取社群链接。
出品丨COSCon'23 组委会
编辑丨储黄蕾
设计丨朱亿钦、赵玭月
✦
✦
开源社/KAIYUANSHE
开源社(英文名称为“KAIYUANSHE”)成立于 2014 年,是由志愿贡献于开源事业的个人志愿者,依 “贡献、共识、共治” 原则所组成的开源社区。开源社始终维持 “厂商中立、公益、非营利” 的理念,以 “立足中国、贡献全球,推动开源成为新时代的生活方式” 为愿景,以 “开源治理、国际接轨、社区发展、项目孵化” 为使命,旨在共创健康可持续发展的开源生态体系。
开源社积极与支持开源的社区、高校、企业以及政府相关单位紧密合作,同时也是全球开源协议认证组织 - OSI 在中国的首个成员。
自2016年起连续举办中国开源年会(COSCon),持续发布《中国开源年度报告》,联合发起了“中国开源先锋榜”、“中国开源码力榜”等,在海内外产生了广泛的影响力。
点击下方阅读原文,进入大会官网,点击 “参会注册”