这周有个让人眼前一亮的图像识别模型 segment-anything,它能精细地框出所有可见物体,它标记出的物体边界线清晰可见。如此出色的模型,自然获得了不少人的赞赏,开源没几天,就拿下了 18k+ 的 star,而上周开源不到 48 小时获得 35k+ star 的推特推荐算法,本周也成功突破 50k+ 关卡。
依旧是 AI 热度不减的一周,本周的 AI 专场收录了一个离线生图工具,以及一个自托管 AI 编程助手。此外,还有 Meta 开源出来的重构版构建系统 buck2 也是大受欢迎,还有随着各类 AI 工具火起来的向量数据库,weaviate 也小小地展露了下头角。
还有比较少见的工具类应用,一款极简的输入法 rime-ice 也值得一看。
以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布
| 实用
| 有趣
,根据项目 release 时间分类,发布时间不超过 14 day 的项目会标注 New
,无该标志则说明项目 release 超过半月。由于本文篇幅有限,还有部分项目未能在本文展示,望周知
在这波 AI 热度消退之前,热点趋势的特推部分会增加一个模块来分享新的 AI 应用。
主语言:Swift
New
MochiDiffusion 内置 Apple 的 Core ML Stable Diffusion 框架,以实现在搭载 Apple 芯片上用极低的内存占用发挥出模型最优性能。部分特性:
GitHub 地址→GitHub - godly-devotion/MochiDiffusion: Run Stable Diffusion on Mac natively
主语言:Python、TypeScript
New
自托管的 AI 编程助手,可作为 Copilot 的替代品。特性:
GitHub 地址→GitHub - TabbyML/tabby: Self-hosted AI coding assistant
主语言:Rust
Meta 开源的大规模构建系统 buck2 继承于 buck1,但是不同于 buck1 采用 Java 编写,buck2 由 Rust 编写而成。重构 buck1 的想法源自想要提供更快速、更高效的构建服务,buck2 有以下特性:
GitHub 地址→GitHub - facebook/buck2: Build system, successor to Buck
本周 star 增长数:1,200+,主语言:Python、TypeScript
Chroma 是一个用于 Python / JavaScript LLM 应用程序的嵌入式数据库,它具有内存快速访问的优势。它只有 4 个核心函数:
import chromadb
# setup Chroma in-memory, for easy prototyping. Can add persistence easily!
client = chromadb.Client()
# Create collection. get_collection, get_or_create_collection, delete_collection also available!
collection = client.create_collection("all-my-documents")
# Add docs to the collection. Can also update and delete. Row-based API coming soon!
collection.add(
documents=["This is document1", "This is document2"], # we handle tokenization, embedding, and indexing automatically. You can skip that and add your own embeddings as well
metadatas=[{"source": "notion"}, {"source": "google-docs"}], # filter on these!
ids=["doc1", "doc2"], # unique for each doc
)
# Query/search 2 most similar results. You can also .get by id
results = collection.query(
query_texts=["This is a query document"],
n_results=2,
# where={"metadata_field": "is_equal_to_this"}, # optional filter
# where_document={"$contains":"search_string"} # optional filter
)
GitHub 地址→GitHub - chroma-core/chroma: the AI-native open-source embedding database
本周 star 增长数:18,000+,主语言:Jupyter Notebook
New
这个代码库提供了使用 SegmentAnything 模型(SAM)进行推理的代码,SAM 是一种输入诸如点、框等 prompt 生成高质量目标 mask 的模型,它有非常出彩的标记效果。btw,项目开源不到一周已经有 18k+ star。
GitHub 地址→GitHub - facebookresearch/segment-anything: The repository provides code for running inference with the SegmentAnything Model (SAM), links for downloading the trained model checkpoints, and example notebooks that show how to use the model.
本周 star 增长数:700+,主语言:Rust、TypeScript
New
arroyo 是一个 Rust 编写的分布式流处理引擎,旨在高效地对流数据进行状态计算。与传统的批处理不同,流处理引擎可以处理有界和无界数据源,一旦结果可用就立即输出。
GitHub 地址→GitHub - ArroyoSystems/arroyo: Distributed stream processing engine in Rust
本周 star 增长数 1,850+,主语言:Go、Lua
雾凇拼音一个极简风的输入法,支持简体、全拼、双拼。值得一提的事,作者自己维护了一个词库:
8105
字表base
基础词库sogou
搜狗流行词ext
扩展词库,小词库tencent
扩展词库,大词库Emoji
GitHub 地址→GitHub - iDvel/rime-ice: Rime 配置:雾凇拼音 | 长期维护的简体词库
本周 star 增长数:500+,主语言:Go
Weaviate 是一个开源的向量数据库,可以存储对象和向量,允许将向量搜索与结构化过滤相结合,并具有云原生数据库的容错性和可扩展性,可通过 GraphQL、REST 和各种语言客户端进行访问。
GitHub 地址→GitHub - weaviate/weaviate: Weaviate is an open source vector database that stores both objects and vectors, allowing for combining vector search with structured filtering with the fault-tolerance and scalability of a cloud-native database, all accessible through GraphQL, REST, and various language clients.
在这个章节,我们将会分享下本周 HelloGitHub 网站上的热评项目,HG 开源项目评价体系刚上线不久,期待你的评价
主语言:C#
一款 Windows 上的免费 GIF 录屏工具,易安装、好上手,支持录制指定区域画面,且可以将视频导出为 gif 等文件格式。
HG 评价地址→HelloGitHub|详情
主语言:JavaScript
它开箱即用,支持 Docker 一键部署,可以让用户通过 Web 界面在线配置、管理 Nginx 服务,支持转发、重定向、SSL 证书、高级配置等功能。