机器学习库

机器学习

一個很棒的機器學習框架、庫和軟件的精選列表(按語言)。靈感來自於 awesome-php。

计算机视觉
Scikit-Image - Python 中图像处理算法的集合。

Scikit-Opt - Python 中的群智能(Python 中的遗传算法、粒子群优化、模拟退火、蚁群算法、免疫算法、人工鱼群算法)

SimpleCV - 一个开源计算机视觉框架,可以访问多个高性能计算机视觉库,例如 OpenCV。用 Python 编写,可在 Mac、Windows 和 Ubuntu Linux 上运行。

Vigranumpy - VIGRA C++ 计算机视觉库的 Python 绑定。

OpenFace - 使用深度神经网络进行免费和开源的人脸识别。

face_recognition - 从 Python 或命令行识别和操作人脸的人脸识别库。

dockerface - 易于安装和使用的对于 docker 容器中的图像和视频深度学习 Faster R-CNN 人脸检测.

detectron2 - FAIR 用于目标检测和分割的下一代研究平台。它是对之前版本 Detectron 的彻底重写,由 PyTorch 深度学习框架提供支持。

albumentations - 一个快速且框架不可知的图像增强库,它实现了多种增强技术。支持开箱即用( out of the box)的分类、分割、检测。曾在 Kaggle、Topcoder 和那些作为 CVPR 研讨会一部分的深度学习竞赛中获胜。

pytessarct - Python-tesseract 是 Python 的光学字符识别(OCR)工具。也就是说,它将识别并“读取”嵌入在图像中的文本。 Python-tesseract 是 Google 的 Tesseract-OCR 引擎的包装器。

imutils - 一个包含Convenience functions的库,可以使用 OpenCV 和 Python 使基本的图像处理操作(如平移、旋转、调整大小、骨架化和显示 Matplotlib 图像更容易)。

PyTorchCV - 基于 PyTorch 的计算机视觉深度学习框架。

Neuro-style-pt - Justin Johnson 的神经风格(神经风格转移)的 PyTorch 实现。

Detecto - 用 5-10 行代码训练和运行计算机视觉模型。

Neuro-dream - DeepDream 的 PyTorch 实现。

Openpose - 用于身体、面部、手和脚估计的实时多人关键点检测库

Deep High-Resolution-Net - CVPR2019 论文“Deep High-Resolution Representation Learning for Human Pose Estimation”的 PyTorch 实现

Dream-creator - DeepDream 的 PyTorch 实现。允许个人使用 DeepDream 的自定义数据集快速轻松地训练他们自己的自定义 GoogleNet 模型。

Lucent - Tensorflow 和 OpenAI Clarity 的 Lucid 适用于 PyTorch.

lightly - Lightly 是一种用于自监督学习的计算机视觉框架。

Learnergy - 基于 PyTorch 的基于能量的机器学习模型。

OpenVisionAPI - 基于开源模型的开源计算机视觉 API。

Natural Language Processing(自然语言处理)
pkuseg-python - 更好的jieba版本,由北京大学开发。

NLTK - 用于构建 Python 程序以处理人类语言数据的领先平台。

Pattern - Python 编程语言的 Web 挖掘模块。它具有用于自然语言处理、机器学习等的工具。

Quepy - 将自然语言问题转换为数据库查询语言查询的 Python 框架。

TextBlob - 为深入研究常见的自然语言处理 (NLP) 任务提供一致的 API。站在 NLTK 和 Pattern 的巨大肩膀上,并与两者配合得很好。

YAlign - 一个句子对齐器,一个友好的工具,用于从可比较的语料库中提取平行句子。 [已弃用]

jieba - 中文分词实用程序。

SnowNLP - 处理中文文本的库。

spammy - 基于 nltk 构建的用于电子邮件垃圾邮件过滤的库

loso - 另一个中文分割库。 [已弃用]

genius - 基于条件随机场的中文段。Genius是一个开源的python中文分词组件,采用 CRF(Conditional Random Field)条件随机场算法。

KoNLPy - 用于韩语自然语言处理的 Python 包。

nut - 自然语言理解工具包。 [已弃用]

Rosetta - 文本处理工具和包装器(例如 Vowpal Wabbit)

BLLIP Parser - BLLIP 自然语言解析器(也称为 Charniak-Johnson 解析器)的 Python 绑定。 [已弃用]

PyNPl - Python 自然语言处理库。 Python 的通用 NLP 库。还包含一些用于解析常见 NLP 格式的特定模块,最显着的是 FoLiA,还有 ARPA 语言模型、Moses 短语表、GIZA++ 对齐。

PySS3 - Python 包,它实现了一种用于文本分类的新型白盒机器学习模型,称为 SS3。由于 SS3 能够直观地解释其基本原理,因此该软件包还附带易于使用的交互式可视化工具(在线演示)。

python-ucto - Python 绑定到 ucto(用于各种语言的基于 unicode 的规则标记器)。

python-frog - Python 绑定到 Frog,荷兰语的 NLP 套件。 (pos 标记、词形还原、依赖解析、NER)

python-zpar - ZPar 的 Python 绑定,一种统计词性标注器、选区解析器和英语依赖解析器。

colibri-core - Python 绑定到 C ++ 库,用于以快速且节省内存的方式提取和处理基本语言结构,例如 n-gram 和 skipgram。

spaCy - 具有 Python 和 Cython 的工业强度 NLP。

PyStanfordDependencies - 用于将 Penn Treebank 树转换为 Stanford Dependencies 的 Python 接口。

距离 - Levenshtein 和 Hamming 距离计算。 [已弃用]

Fuzzy Wuzzy - Python 中的模糊字符串匹配。

jellyfish - 用于对字符串进行近似和语音匹配的 Python 库。

editdistance - 编辑距离的快速实现。

textacy - 基于 Spacy 的更高级别的 NLP。

stanford-corenlp-python - 斯坦福 CoreNLP 的 Python 包装器 [已弃用]

CLTK - 经典语言工具包。

Rasa - 一个“机器学习框架,用于自动化基于文本和语音的对话。”

yase - 将句子(或其他序列)转码为词向量列表。

Polyglot - 多语言文本 (NLP) 处理工具包。

DrQA - 阅读维基百科来回答开放领域的问题。

Dedupe - 用于准确和可扩展的模糊匹配、记录重复数据删除和实体解析的 Python 库。

Snips NLU - 用于意图分类和实体提取的自然语言理解库

NeuroNER - 使用神经网络进行命名实体识别,提供最先进的结果

DeepPavlov - 具有许多预训练的俄罗斯 NLP 模型的对话 AI 库。

BigARTM - 主题建模平台。

NALP - 基于 Tensorflow 构建的自然对抗性语言处理框架。

DL Translate - 一个基于深度学习的 50 种语言之间的翻译库,使用转换器构建。

General-Purpose machine learning (多用途的机器学习)(通用机器学习)
Microsoft ML for Apache Spark -> 分布式机器学习框架 Apache Spark

Shapley -> 一个数据驱动的框架,用于量化机器学习集成中分类器的价值。

igel -> 一个令人愉快的机器学习工具,允许您在不编写代码的情况下训练/拟合、测试和使用模型

ML 模型构建 -> 包含分类、聚类、回归、推荐笔记本的存储库,并带有插图来制作它们。

ML/DL 项目模板

PyTorch Geometric Temporal -> 用于动态图表示学习的 PyTorch Geometric 的时间扩展。

Little Ball of Fur -> NetworkX 的图形采样扩展库,具有类似 Scikit-Learn 的 API。

空手道俱乐部 -> 一个用于 NetworkX 的无监督机器学

你可能感兴趣的:(笔记)