Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。
探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。
在全新的 Filter 执行框架中,Databend 引入了一个开创性的概念 —— “不可变索引”。
不可变索引使我们能够在遇到 AND 和 OR 操作时避免生成临时选择缓冲区。这不仅减少了内存碎片化,还消除了从临时选择到最终选择的循环复制。
根据测试,此优化可以将原本需要 14.5s 的查询优化至 9.7s 。
如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。
一起来探索 Databend 和周边生态中的代码片段或项目。
Databend 通过提供聚合索引、聚类键和虚拟列,使得用户能够根据特定的查询场景来优化查询性能。
通过合理应用这些工具,Databend 能够显著提高数据检索的速度和效率,为用户提供快速、灵活的查询性能优化选项。
以下是一些值得注意的事件,也许您可以找到感兴趣的内容。
MISSING_FIELD_AS
定义默认行为。我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。
目前,Databend 服务的最大 单表 包含数十万个数据段、几千万个数据块和 数万亿条 记录。这些数据涵盖了 7PB 的原始数据和超过 300TB 的索引数据。
2024 年的口号是:Compute Where Data Lives: Swift, Smart, Seamless 。欢迎加入我们,一起探索 Databend 的持续研发之旅和未来计划。参与讨论并贡献您的想法!
任务 | 状态 | 评论 |
---|---|---|
并发性和调度器的增强 | 计划中 | 旨在实现更快、更高效的任务处理并改善系统响应能力。 |
GEOMETRY 数据类型 | 计划中 | |
TPC-DS 性能 | 进行中 | 持续优化以获得更好的性能基准。 |
多语句事务 | 未指定 | |
存储过程(Python) | 未指定 | 添加对 Python 的支持,以便与 SQL 协同进行多样化的数据分析。 |
统一存储、数据仓库和计算 | 未指定 | 为 AI 和云计算提供一体化数据平台,调度 CPU & GPU 资源。 |
Issue #14167 | Databend Roadmap for 2024 (Discussion)
如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 https://link.databend.rs/i-m-feeling-lucky 来挑选一个随机问题,祝好运!
前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。
地址:https://github.com/datafuselabs/databend/releases
非常感谢贡献者们在本周的卓越工作。
Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。