碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」_第1张图片

这周有个让人眼前一亮的图像识别模型 segment-anything,它能精细地框出所有可见物体,它标记出的物体边界线清晰可见。如此出色的模型,自然获得了不少人的赞赏,开源没几天,就拿下了 18k+ 的 star,而上周开源不到 48 小时获得 35k+ star 的推特推荐算法,本周也成功突破 50k+ 关卡。

依旧是 AI 热度不减的一周,本周的 AI 专场收录了一个离线生图工具,以及一个自托管 AI 编程助手。此外,还有 Meta 开源出来的重构版构建系统 buck2 也是大受欢迎,还有随着各类 AI 工具火起来的向量数据库,weaviate 也小小地展露了下头角。

还有比较少见的工具类应用,一款极简的输入法 rime-ice 也值得一看。

以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布 | 实用 | 有趣,根据项目 release 时间分类,发布时间不超过 14 day 的项目会标注 New,无该标志则说明项目 release 超过半月。由于本文篇幅有限,还有部分项目未能在本文展示,望周知

  • 本文目录
    • 1. 本周特推
      • 1.1 AI 专场
      • 1.2 Meta 开源构建系统:buck2
    • 2. GitHub Trending 周榜
      • 2.1 嵌入式数据库:chroma
      • 2.2 万物皆可分:segment-anything
      • 2.3 流处理:arroyo
      • 2.4 极简输入法:rime-ice
      • 2.5 向量数据库:weaviate
    • 3. HelloGitHub 热评
      • 3.1 GIF 录屏工具:ScreenToGif
      • 3.2 Nginx 可视化管理平台:nginx-proxy-manager
    • 4. 往期回顾

1. 本周特推

1.1 AI 专场

在这波 AI 热度消退之前,热点趋势的特推部分会增加一个模块来分享新的 AI 应用。

macOS 跑 SD:MochiDiffusion

主语言:Swift

New MochiDiffusion 内置 Apple 的 Core ML Stable Diffusion 框架,以实现在搭载 Apple 芯片上用极低的内存占用发挥出模型最优性能。部分特性:

  • 可离线生图
  • 高性能,极低的内存占用
  • 图转图,Image2Image
  • 自定义 Stable Diffusion Core ML 模型
  • 无需担心损坏模型

GitHub 地址→GitHub - godly-devotion/MochiDiffusion: Run Stable Diffusion on Mac natively

自托管 AI 编程助手:tabby

主语言:Python、TypeScript

New 自托管的 AI 编程助手,可作为 Copilot 的替代品。特性:

  • 无需数据库和云服务;
  • 具有可视化、配置模型和 MLOps 的 Web 界面;
  • 接入 OpenAPI;
  • 消费级别的 GPU 支持(用不同方法优化的 FP-16 权重加载)

GitHub 地址→GitHub - TabbyML/tabby: Self-hosted AI coding assistant

1.2 Meta 开源构建系统:buck2

主语言:Rust

Meta 开源的大规模构建系统 buck2 继承于 buck1,但是不同于 buck1 采用 Java 编写,buck2 由 Rust 编写而成。重构 buck1 的想法源自想要提供更快速、更高效的构建服务,buck2 有以下特性:

  • 解耦特定语言规则,buck2 的核心构建系统没有任何特定的语言规则,这意味着它有更好的可扩展性。buck2 核心部分用 Rust 编写,语言规则部分(例如:如何构建 C++)由 Starklark 编写;
  • 构建系统由单一增量依赖图提供支持,由此消减多类 bug 并增加并发性;
  • 规则 API 的设计主要为提供先进的性能特性,以及动态依赖特征;
  • 集成远程执行,能在远程机器执行操作,它采用了同 Bazel 一样的 API,并已经用 Buildbarn 和 EngFlow 进行远程执行测试;
  • 集成虚拟文件系统,不用整仓检测,按需获取文件即可;

GitHub 地址→GitHub - facebook/buck2: Build system, successor to Buck

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」_第2张图片

2.1 嵌入式数据库:chroma

本周 star 增长数:1,200+主语言:Python、TypeScript

Chroma 是一个用于 Python / JavaScript LLM 应用程序的嵌入式数据库,它具有内存快速访问的优势。它只有 4 个核心函数:

import chromadb
# setup Chroma in-memory, for easy prototyping. Can add persistence easily!
client = chromadb.Client()

# Create collection. get_collection, get_or_create_collection, delete_collection also available!
collection = client.create_collection("all-my-documents") 

# Add docs to the collection. Can also update and delete. Row-based API coming soon!
collection.add(
    documents=["This is document1", "This is document2"], # we handle tokenization, embedding, and indexing automatically. You can skip that and add your own embeddings as well
    metadatas=[{"source": "notion"}, {"source": "google-docs"}], # filter on these!
    ids=["doc1", "doc2"], # unique for each doc 
)

# Query/search 2 most similar results. You can also .get by id
results = collection.query(
    query_texts=["This is a query document"],
    n_results=2,
    # where={"metadata_field": "is_equal_to_this"}, # optional filter
    # where_document={"$contains":"search_string"}  # optional filter
)

GitHub 地址→GitHub - chroma-core/chroma: the AI-native open-source embedding database

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」_第3张图片

2.2 万物皆可分:segment-anything

本周 star 增长数:18,000+主语言:Jupyter Notebook

New 这个代码库提供了使用 SegmentAnything 模型(SAM)进行推理的代码,SAM 是一种输入诸如点、框等 prompt 生成高质量目标 mask 的模型,它有非常出彩的标记效果。btw,项目开源不到一周已经有 18k+ star。

GitHub 地址→GitHub - facebookresearch/segment-anything: The repository provides code for running inference with the SegmentAnything Model (SAM), links for downloading the trained model checkpoints, and example notebooks that show how to use the model.

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」_第4张图片

2.3 流处理:arroyo

本周 star 增长数:700+主语言:Rust、TypeScript

New arroyo 是一个 Rust 编写的分布式流处理引擎,旨在高效地对流数据进行状态计算。与传统的批处理不同,流处理引擎可以处理有界和无界数据源,一旦结果可用就立即输出。

GitHub 地址→GitHub - ArroyoSystems/arroyo: Distributed stream processing engine in Rust

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」_第5张图片

2.4 极简输入法:rime-ice

本周 star 增长数 1,850+主语言:Go、Lua

雾凇拼音一个极简风的输入法,支持简体、全拼、双拼。值得一提的事,作者自己维护了一个词库:

  • 8105 字表
  • base 基础词库
  • sogou 搜狗流行词
  • ext 扩展词库,小词库
  • tencent 扩展词库,大词库
  • Emoji

GitHub 地址→GitHub - iDvel/rime-ice: Rime 配置:雾凇拼音 | 长期维护的简体词库

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」_第6张图片

2.5 向量数据库:weaviate

本周 star 增长数:500+主语言:Go

Weaviate 是一个开源的向量数据库,可以存储对象和向量,允许将向量搜索与结构化过滤相结合,并具有云原生数据库的容错性和可扩展性,可通过 GraphQL、REST 和各种语言客户端进行访问。

GitHub 地址→GitHub - weaviate/weaviate: Weaviate is an open source vector database that stores both objects and vectors, allowing for combining vector search with structured filtering with the fault-tolerance and scalability of a cloud-native database, all accessible through GraphQL, REST, and various language clients.

3. HelloGitHub 热评

在这个章节,我们将会分享下本周 HelloGitHub 网站上的热评项目,HG 开源项目评价体系刚上线不久,期待你的评价

3.1 GIF 录屏工具:ScreenToGif

主语言:C#

一款 Windows 上的免费 GIF 录屏工具,易安装、好上手,支持录制指定区域画面,且可以将视频导出为 gif 等文件格式。

HG 评价地址→HelloGitHub|详情

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」_第7张图片

3.2 Nginx 可视化管理平台:nginx-proxy-manager

主语言:JavaScript

它开箱即用,支持 Docker 一键部署,可以让用户通过 Web 界面在线配置、管理 Nginx 服务,支持转发、重定向、SSL 证书、高级配置等功能。

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」_第8张图片

你可能感兴趣的:(github)