机器学习
一個很棒的機器學習框架、庫和軟件的精選列表(按語言)。靈感來自於 awesome-php。
计算机视觉
Scikit-Image - Python 中图像处理算法的集合。
Scikit-Opt - Python 中的群智能(Python 中的遗传算法、粒子群优化、模拟退火、蚁群算法、免疫算法、人工鱼群算法)
SimpleCV - 一个开源计算机视觉框架,可以访问多个高性能计算机视觉库,例如 OpenCV。用 Python 编写,可在 Mac、Windows 和 Ubuntu Linux 上运行。
Vigranumpy - VIGRA C++ 计算机视觉库的 Python 绑定。
OpenFace - 使用深度神经网络进行免费和开源的人脸识别。
face_recognition - 从 Python 或命令行识别和操作人脸的人脸识别库。
dockerface - 易于安装和使用的对于 docker 容器中的图像和视频深度学习 Faster R-CNN 人脸检测.
detectron2 - FAIR 用于目标检测和分割的下一代研究平台。它是对之前版本 Detectron 的彻底重写,由 PyTorch 深度学习框架提供支持。
albumentations - 一个快速且框架不可知的图像增强库,它实现了多种增强技术。支持开箱即用( out of the box)的分类、分割、检测。曾在 Kaggle、Topcoder 和那些作为 CVPR 研讨会一部分的深度学习竞赛中获胜。
pytessarct - Python-tesseract 是 Python 的光学字符识别(OCR)工具。也就是说,它将识别并“读取”嵌入在图像中的文本。 Python-tesseract 是 Google 的 Tesseract-OCR 引擎的包装器。
imutils - 一个包含Convenience functions的库,可以使用 OpenCV 和 Python 使基本的图像处理操作(如平移、旋转、调整大小、骨架化和显示 Matplotlib 图像更容易)。
PyTorchCV - 基于 PyTorch 的计算机视觉深度学习框架。
Neuro-style-pt - Justin Johnson 的神经风格(神经风格转移)的 PyTorch 实现。
Detecto - 用 5-10 行代码训练和运行计算机视觉模型。
Neuro-dream - DeepDream 的 PyTorch 实现。
Openpose - 用于身体、面部、手和脚估计的实时多人关键点检测库
Deep High-Resolution-Net - CVPR2019 论文“Deep High-Resolution Representation Learning for Human Pose Estimation”的 PyTorch 实现
Dream-creator - DeepDream 的 PyTorch 实现。允许个人使用 DeepDream 的自定义数据集快速轻松地训练他们自己的自定义 GoogleNet 模型。
Lucent - Tensorflow 和 OpenAI Clarity 的 Lucid 适用于 PyTorch.
lightly - Lightly 是一种用于自监督学习的计算机视觉框架。
Learnergy - 基于 PyTorch 的基于能量的机器学习模型。
OpenVisionAPI - 基于开源模型的开源计算机视觉 API。
Natural Language Processing(自然语言处理)
pkuseg-python - 更好的jieba版本,由北京大学开发。
NLTK - 用于构建 Python 程序以处理人类语言数据的领先平台。
Pattern - Python 编程语言的 Web 挖掘模块。它具有用于自然语言处理、机器学习等的工具。
Quepy - 将自然语言问题转换为数据库查询语言查询的 Python 框架。
TextBlob - 为深入研究常见的自然语言处理 (NLP) 任务提供一致的 API。站在 NLTK 和 Pattern 的巨大肩膀上,并与两者配合得很好。
YAlign - 一个句子对齐器,一个友好的工具,用于从可比较的语料库中提取平行句子。 [已弃用]
jieba - 中文分词实用程序。
SnowNLP - 处理中文文本的库。
spammy - 基于 nltk 构建的用于电子邮件垃圾邮件过滤的库
loso - 另一个中文分割库。 [已弃用]
genius - 基于条件随机场的中文段。Genius是一个开源的python中文分词组件,采用 CRF(Conditional Random Field)条件随机场算法。
KoNLPy - 用于韩语自然语言处理的 Python 包。
nut - 自然语言理解工具包。 [已弃用]
Rosetta - 文本处理工具和包装器(例如 Vowpal Wabbit)
BLLIP Parser - BLLIP 自然语言解析器(也称为 Charniak-Johnson 解析器)的 Python 绑定。 [已弃用]
PyNPl - Python 自然语言处理库。 Python 的通用 NLP 库。还包含一些用于解析常见 NLP 格式的特定模块,最显着的是 FoLiA,还有 ARPA 语言模型、Moses 短语表、GIZA++ 对齐。
PySS3 - Python 包,它实现了一种用于文本分类的新型白盒机器学习模型,称为 SS3。由于 SS3 能够直观地解释其基本原理,因此该软件包还附带易于使用的交互式可视化工具(在线演示)。
python-ucto - Python 绑定到 ucto(用于各种语言的基于 unicode 的规则标记器)。
python-frog - Python 绑定到 Frog,荷兰语的 NLP 套件。 (pos 标记、词形还原、依赖解析、NER)
python-zpar - ZPar 的 Python 绑定,一种统计词性标注器、选区解析器和英语依赖解析器。
colibri-core - Python 绑定到 C ++ 库,用于以快速且节省内存的方式提取和处理基本语言结构,例如 n-gram 和 skipgram。
spaCy - 具有 Python 和 Cython 的工业强度 NLP。
PyStanfordDependencies - 用于将 Penn Treebank 树转换为 Stanford Dependencies 的 Python 接口。
距离 - Levenshtein 和 Hamming 距离计算。 [已弃用]
Fuzzy Wuzzy - Python 中的模糊字符串匹配。
jellyfish - 用于对字符串进行近似和语音匹配的 Python 库。
editdistance - 编辑距离的快速实现。
textacy - 基于 Spacy 的更高级别的 NLP。
stanford-corenlp-python - 斯坦福 CoreNLP 的 Python 包装器 [已弃用]
CLTK - 经典语言工具包。
Rasa - 一个“机器学习框架,用于自动化基于文本和语音的对话。”
yase - 将句子(或其他序列)转码为词向量列表。
Polyglot - 多语言文本 (NLP) 处理工具包。
DrQA - 阅读维基百科来回答开放领域的问题。
Dedupe - 用于准确和可扩展的模糊匹配、记录重复数据删除和实体解析的 Python 库。
Snips NLU - 用于意图分类和实体提取的自然语言理解库
NeuroNER - 使用神经网络进行命名实体识别,提供最先进的结果
DeepPavlov - 具有许多预训练的俄罗斯 NLP 模型的对话 AI 库。
BigARTM - 主题建模平台。
NALP - 基于 Tensorflow 构建的自然对抗性语言处理框架。
DL Translate - 一个基于深度学习的 50 种语言之间的翻译库,使用转换器构建。
General-Purpose machine learning (多用途的机器学习)(通用机器学习)
Microsoft ML for Apache Spark -> 分布式机器学习框架 Apache Spark
Shapley -> 一个数据驱动的框架,用于量化机器学习集成中分类器的价值。
igel -> 一个令人愉快的机器学习工具,允许您在不编写代码的情况下训练/拟合、测试和使用模型
ML 模型构建 -> 包含分类、聚类、回归、推荐笔记本的存储库,并带有插图来制作它们。
ML/DL 项目模板
PyTorch Geometric Temporal -> 用于动态图表示学习的 PyTorch Geometric 的时间扩展。
Little Ball of Fur -> NetworkX 的图形采样扩展库,具有类似 Scikit-Learn 的 API。
空手道俱乐部 -> 一个用于 NetworkX 的无监督机器学