最近想要充个电
飞桨邀你开启开源贡献之旅
寻找那个最“会”的你
顶级开源项目、资深研发指导
高阶开发者合作交流
Buff 叠满!
技能提升、丰富简历、高额奖金
你还不心动?
赛事简介
中国软件开源创新大赛已成功举办五届,大赛面向国家“十四五”开源生态发展战略布局,聚焦 “卡脖子”软件领域以及人工智能、大数据、芯片设计、物联网等前沿技术领域的开源软件,旨在为国内开源社区提供展示、交流、合作的平台,激发开源创新活力,培养开源实践人才,助力开源生态建设的高质量发展。
第六届“中国软件开源创新大赛”在国家自然科学基金委信息科学部的指导下,由中国计算机学会( CCF )主办,西北工业大学、绿色计算产业联盟、CCF 开源发展委员会联合承办。联合百度飞桨、清华大学等企业单位以及多所高校共同设置赛题,大赛分为“开源项目贡献赛” “开源任务挑战赛” “开源案例教学赛”和“开源代码评注赛”四个赛道。
开源任务挑战赛赛道——飞桨框架任务挑战赛全新上线,通过比赛机制,鼓励选手了解与参与深度学习开源项目,为中国开源生态建设贡献力量。
赛题介绍
本次中国软件开源创新大赛联合飞桨开源社区,开放了实现飞桨框架的 python level jit compiler 、改进 CINN 日志和报错系统、实现飞桨框架动态图反向图的可视化等相关的共计15+道赛题,面向全球开发者开放报名,目前下半场的比赛已经开启。
以线上比赛的形式进行,参赛选手在规定时间内自由组队(最多三人)选择合适的开发任务,以 Pull Requests 的形式完成贡献,根据项目的难易程度和完成情况,获得相应奖金、礼品和证书,快来组队参赛吧!
比赛报名和参赛的入口为 AI Studio 平台:
https://aistudio.baidu.com/aistudio/competition/detail/911/0/...
今天将从赛题八为大家展开介绍。
赛题八:paddleviz能力扩展——Tensor信息展示
飞桨深度学习框架提供了动态图编程的模式来开发深度学习模型(方便开发与调试),但动态图的反向图调试能力仍存在不足。@qiuwenbogdut 和 @Tomoko-hjf 两位社区开发者为Paddle开发了反向图可视化工具 paddleviz,很大程度上提升了反向图的调试能力。但我们还希望,在现有 paddleviz 基础上,扩展 paddleviz 的能力,进一步提升反向图的调试能力。
赛题九:优化飞桨开源模型Mask R-CNN训练性能
飞桨深度学习框架已经发布了很多涵盖多个领域的开源模型,本赛题旨在通过对飞桨深度学习框架支持的开源模型进行优化,提高模型的训练性能,探索飞桨在模型上的性能优化最佳实践。欢迎对深度学习框架和模型优化感兴趣的开发者,展示在模型优化领域的经验和创新性。
赛题十:为 PaddleSOT 项目添加 Python3.11 版本支持
PaddleSOT 是一个 Opcode-Based 的动转静孵化项目,借助 Symbolic Opcode Translator(简称:SOT)在运行时将 PaddlePaddle 动态图组网代码转换为静态图组网代码,具体设计参见:PaddleSOT 项目介绍PaddleSOT 从一开始是基于 Python 3.8 开发的,并分别在 PaddlePaddle/PaddleSOT#109 和 PaddlePaddle/PaddleSOT#112 支持了 3.9 和 3.10,但 3.11 还是不支持的。因为 3.11 的字节码和 3.8-3.10 的字节码有较大的差异,而 PaddleSOT 是依赖于字节码进行模拟执行的,因此 3.11 的支持需要对 PaddleSOT 进行较多的改动。本赛题要求为 PaddleSOT 增加 Python 3.11 的支持,使 PaddleSOT 能够正确地进行模拟执行、CodeGen 等流程。并在 PaddleSOT 添加 Python 3.11 流水线,使其能够在 CI 中进行测试。
赛题十一:新 IR 组件及 API Python 端适配
随着新IR底层核心逻辑已经成熟,需要进一步推广验证。当前新IR仅限于在C++底层进行操作,为了能够尽快让新 IR 替代现有的 IR 体系,需要打通 Python 端到C++端的新IR链路。其中有一项重要工作是需要在C++端开发新IR的组网用API ,并且暴露到 Python 端,从而为大规模验证新 IR 体系奠定基础。
赛题十二:新ir模型结构的可视化工具建设
飞桨深度学习框架近期在重构底层的中间表示(下称:IR),替换原来的 ProgramDesc 为新的 MLIR。具体技术设计详见:IR Dialect。此项目处于高效迭代期,为了加速开发者们对模型、子图级别下新 IR 表示的熟悉,降低功能开发中的调试成本,希望能够给 IR Dialect 添加「可视化」功能。
赛题十三:复数kernel调研与实现
现有的深度学习框架主要是基于对实数函数的优化设计的,在主流的深度学习应用场景中,网络的输入变量,中间变量,输出变量都是实数,与此相关的基础设施,比如数组,优化器等组件也都是适用于实数类型。
但随着深度学习应用的扩展,也出现对复数支持的需求,比如图像,语音等领域的傅里叶变换,量子物理领域,其理论体系都是基于复数建立的。虽然并非不能用实数表示复数运算,但稍显繁琐,深度学习框架有原生的复数支持,可以使建模更接近其理论。
赛题十四&十五:PaddleScience 领域经典论文复现
PaddleScience作为开源科学计算套件,希望通过复现各类领域内的相关论文,提高该套件的领域覆盖度,验证套件和框架 API 的正确性和完备性,最终提升用户体验,助力科学计算开发者的开发实验。
时间安排
本次活动分为三个阶段,第一阶段与第二阶段分别选出10位优秀开发者进入半决赛,通过预答辩,进行阶段性礼品发放,20位开发者有机会参与决赛答辩并获得最高5万元现金奖励。
比赛成绩优秀者,还可以获得百度绿色通道或其他便利,可提升简历曝光度及面试发起率。