近日,InfoWorld 公布了 2021 Bossie Awards 榜单。该榜单对当前软件开发、devops、数据分析和机器学习领域的开源项目进行了排行,选出了年度最佳开源软件 Top29,里面有不少是大家眼熟的,一起来看看吧!
1、Svelte and SvelteKit
在创新、开源、前端 JavaScript 框架领域,Svelte 及其全栈对应 SvelteKit 可能是所有产品中最雄心勃勃、最有远见的,斯维尔特一开始通过采用编译时策略打破现状,现在凭借卓越的表现、持续的发展和卓越的开发人员经验。SvelteKit 目前正通过公测,继续进行测试通过采用最新的工具和制造技术实现飞跃的苗条传统,部署到无服务器环境是一项内置功能。
2、Minikube
顾名思义,Minikube 是一个缩影在桌面上运行的 Kubernetes 群集。无需虚拟机,使用本机容器或裸机即可。Minikube 支持跨平台工作,不需要 MacOS 或 Windows 用户安装Linux发行版就可以运行。
3、Pixie
Pixie 是 Kubernetes 应用程序的可观察性工具,可查看高层数据集群的状态,如服务映射、集群资源和应用程序流量,同时也可以深入查看更详细的视图,例如pod状态、火焰图和单个视图应用程序请求。
4、FastAPI
FastAPI 是一款高性能 Web 框架,用于构建 API,拥有快速高性能、快速编码、更少的错误、直观简易、稳健等特点,基于并完全兼容 API 的开放标准 OpenAPI 和 JSON Schema。
5、Crystal
Crystal 是一款兼顾 C 语言的速度和 Ruby 语言的表现力的编程语言项目。经过多年开发,今年年初 Crystal 1.0 正式发布,使用静态类型和 LLVM 编译器来实现高速度,可用于一般工作负载。
6、Windows Terminal
Windows Terminal 是一款功能强大的命令行终端工具,具备不少流行特性,如多 Tab 支持、多语言支持、可配置、主题和样式以及支持 emoji 和基于 GPU 运算的文本渲染等。
7、OBS Studio
OBS Studio 是当前视频捕获和流媒体直播大趋势下推出的商业显示捕捉和摄像套件。用户可以创建多个捕获源定义(实时摄像机、完整桌面、特定窗口),将捕获保存到磁盘上的文件,或将其实时流式传输到提供商。
8、Shotcut
Shotcut 是一款跨平台的视频编辑工具,允许用户在应用效果和分层及对音频和视频轨道进行所有的标准修正。Shotcut 可在 Mac、Linux、BSD 和 Windows 上跨平台运行,交互界面灵活,操作也非常简单。
9、Weave GitOps Core
Weave GitOps 是一款基于领先的 GitOps 引擎 CNCF Flux,支持有效的 GitOps 工作流,可将应用程序持续交付到 Kubernetes 集群中。
10、Apache Solr
Apache Solr 是基于 Lucene 的全文搜索服务器及当下较流行的企业级搜索引擎。Apache Solr 是可集群的、可在云端部署,且支持建立云端级的搜索服务。
11、MLflow
MLflow 是一款Databricks 创建并由Linux 基金会托管的 MLOps 平台,可让人跟踪、管理和维护各种机器学习模型、实验及其部署。
12、Orange
Orange 能为数据挖掘变得"富有成效且有趣",它允许用户创建一个数据分析工作流程,以执行各种机器学习和分析功能以及可视化。
13、Flutter
Flutter 是一款由 Google 工程师团队打造的用于创建高性能、跨平台的移动应用。Flutter 针对当下以及未来的移动设备进行优化,专注于 Android and iOS 低延迟的输入和高帧率。
14、Apache Superset
Apache Superset 是 Airbnb 开源的数据探查与可视化平台(曾用名 Panoramix、Caravel ),也是一款企业级商业智能 Web 应用程序。该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析。
15、Presto
Presto 是一款开源分布式 SQL 引擎,用于在线分析处理、集群运行, 可查询各种各样的数据源,并将结果返回到商业智能和分析环境。
16、Apache Arrow
Apache Arrow 库可用于 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust,为平面和分层数据定义了一种独立于语言的柱状内存格式,为现代 CPU 和 GPU 上的高效分析操作而组织。
17、InterpretML
InterpretML 是一款开源 Explainable AI(XAI)包,内置先进机器学习可解释性技术,可用来训练可解释的 glassbox 模型并解释黑盒系统。
18、Lime
Lime(全称为 local interpretable model-agnostic explanations )是一种 post-hoc 技术,可通过扰动输入的特征并检查预测结果来解释任何机器学习分类器的预测。
19、Dask
Dask 是一款用于并行计算的开源库,可将 Python 包扩展到多台机器上。Dask 可以将数据和计算分布在多个 GPU 上。
20、BlazingSQL
BlazingSQL 是一款基于 RAPIDS 生态系统构建的 GPU 加速 SQL 引擎,基于 Apache Arrow 柱状内存格式,具有支持大规模数据科学工作流和企业数据集的各种功能。
21、Rapids
Rapids 是 Nvidia 的开源软件库和 API 套件,可让用户有能力完全在 GPU 上执行端到端的数据科学和分析管道。它采用 Nvidia CUDA 基元进行底层计算优化,并通过用户友好的 Python 接口暴露了 GPU 的并行性和高带宽内存速度。
22、PostHog
PostHog 是一款为开发人员构建的开源产品分析平台,可在不向第三方发送数据的情况下自动收集用户网站或应用程序上的每个事件,无需手动推送也能自动捕获点击次数和综合浏览量,以分析用户在做什么。
23、LakeFS
LakeFS 提供了一种"以管理代码的方式管理你的数据湖"的方法,为对象存储增加了一层类似于 Git 的版本控制,通过 LakeFS,管理和保护代码库的熟悉技术可扩展到现代数据库。
24、Meltano
Meltano 是今年从 GitLab 中分离出来的一款免费开源 DataOps 替代传统 ELT(提取、加载、转换)工具链其数据仓库框架可让用户的项目建模、提取和转换数据变得容易,并通过内置的分析工具和简化报告的仪表盘来补充集成和转换管道。
25、Trino
Trino(原名 PrestoSQL)是一款分布式 SQL 分析引擎,可对大型分布式数据源运行极快的查询。Trino 允许用户同时对数据湖、关系型存储或多个不同来源执行查询,而不需要复制或移动数据进行处理。
26、StreamNative
StreamNative 是一家高度可扩展的信息和事件流平台,该平台将 Apache Pulsar 强大的分布式流处理架构与 Kubernetes 和混合云支持等企业额外功能、大型数据连接器库、简易认证和授权以及用于健康和性能监控的专用工具相结合,极大简化了实时报告和分析工具以及企业应用流的数据管道铺设。
27、Hugging Face
Hugging Face 提供了最重要的开源深度学习资源库,其目标是扩展到文本之外,支持图像、音频、视频、物体检测等。
28、EleutherAI
EleutherAI 是一个由机器学习研究人员组成的分布式小组,致力于将 GPT-3 带给所有人。
29、Colab notebooks for generative art
不同于往年,Bossie 的赢家传统上是库、框架、平台和应用程序及操作系统——以开源为主。但今年,开源引发艺术“爆炸”的因素也值得关注。
目前,GitHub 上生长着全球最有价值和最复杂的开源项目以及免费软件,极大地为全球很多企业及公司降低了信息技术成本。如果你也在寻找软件的前沿技术,可以看看以上 2021 InfoWorld Bossie Awards 中提到的开源项目。
关于InfoWorld
InfoWorld 是一家信息技术媒体公司,成立于 1978 年目前隶属于 IDG。每年 InfoWorld 都会根据软件对开源界的贡献,以及在业界的影响力评选出当年的“最佳开源软件” (BOSSIE),该奖项评选已经延续了十多。