深度学习、自然语言处理、机器视觉相关python库汇总

深度学习

  1. TensorFlow(https://github.com/tensorflow/tensorflow)
    TensorFlow 是一个用于机器学习的端到端的开源平台。它具备着全面综合的、灵活的工具、库和社区资源生态系统,可以帮助研究人员去推动机器学习先进的技术的发展,并让开发人员可以轻松地构建和部署基于机器学习的应用程序。

  2. Keras(https://github.com/keras-team/keras)
    Keras 是一个用 Python 编写的深度学习 API,其运行于机器学习的顶级平台 TensorFlow 之上。

  3. PyTorch(https://github.com/pytorch/pytorch)
    具有强大 GPU 加速,和使用 Python 实现的张量和动态神经网络。

  4. fastai(https://github.com/fastai/fastai)
    通过利用当下最佳的技术实践,fastai 极快地简化了训练过程,并加速了神经网络。

  5. PyTorch Lightning(https://github.com/PyTorchLightning/pytorch-lightning)
    针对于高性能人工智能研究的封装轻量级 PyTorch。可以缩小你的模型,而不是提供小的样板。

  6. JAX(https://github.com/google/jax)
    Python+NumPy 程序的可组合转换:区分,向量化,在 GPU/TPU 上的 JIT,等等。

  7. MXNet(https://github.com/apache/incubator-mxnet)
    带有动态和突变感知的数据流管理调度程序的轻量、便捷、灵活的分布式 / 移动机器学习库:支持 Python、R、Julia、Scala、Go、JavaScript 等等。

  8. Ignite(https://github.com/pytorch/ignite)
    高级库,可以帮助培训和评估神经网络在 PyTorch 中实现灵活和透明的使用。

自然语言处理

  1. FastText(https://github.com/facebookresearch/fastText)
    fastText 是一个可以用来高效学习单词表意和句子分类的库。

  2. spaCy(https://github.com/explosion/spaCy)
    用来实现工业级自然语言处理 (NLP),通过使用 Python 和 Cython。

  3. gensim(https://github.com/RaRe-Technologies/gensim)
    Gensim 是一个 Python 库,用于主题建模、文档索引和相似度检索,具有大型语料库。目标受众是自然语言处理 (NLP) 和信息检索 (IR) 社区。

  4. NLTK(https://github.com/nltk/nltk)
    NLTK—— 自然语言工具箱 —— 是一套开源 Python 模块、数据集和教程,用于针对支持自然语言处理方面的研究和开发。

  5. Datasets (Huggingface)(https://github.com/huggingface/datasets)
    用于自然语言处理的,使用 PyTorch, TensorFlow, NumPy 和 Pandas 的工具,具有快速,高效,开放访问的数据集和自然语言处理评估指标。

  6. Tokenizers (Huggingface)(https://github.com/huggingface/tokenizers)
    为研究和生产优化的快速、顶级的分词器。

  7. Transformers (Huggingface)(https://github.com/huggingface/transformers)
    transformer: 针对 Pytorch 和 TensorFlow 2.0 的最顶级的自然语言处理库。

  8. Stanza(https://github.com/stanfordnlp/stanza/)
    针对许多人类语言的正式标准 NLP Python 库。

  9. TextBlob(https://github.com/sloria/textblob)
    简单、python 风格、文本处理 —— 情感分析、词性标记、名词短语提取、翻译等等。

  10. PyTorch-NLP(https://github.com/PetrochukM/PyTorch-NLP)
    PyTorch 自然语言处理 (NLP) 的基本工具。

  11. Textacy(https://github.com/chartbeat-labs/textacy)
    一个 Python 库,用于执行各种自然语言处理 (NLP) 任务,构建在一个高性能 spaCy 库之上。

  12. Finetune(https://github.com/IndicoDataSolutions/finetune)
    Finetune 是一个库,它允许用户利用最先进的预训练的 NLP 模型来执行广泛的下游任务。

  13. TextHero(https://github.com/jbesomi/texthero)
    文本预处理,表示和可视化,从零到精通。

  14. Spark NLP(https://github.com/JohnSnowLabs/spark-nlp)
    Spark NLP 是一个构建在 Apache Spark ML 之上的自然语言处理库。

  15. GluonNLP(https://github.com/dmlc/gluon-nlp)
    GluonNLP 是一个工具包,它支持简单的文本预处理、数据集加载和神经模型构建,以帮助您加快自然语言处理 (NLP) 研究。

编程爱好者参考

计算机视觉

  1. Pillow(https://github.com/python-pillow/Pillow)
    Pillow 是对用户十分友好的 PIL 分支。PIL 是 Python 的图像库。

  2. OpenCV(https://github.com/opencv/opencv)
    开源计算机视觉库。

  3. scikit-image(https://github.com/scikit-image/scikit-image)
    python 中的图像处理。

  4. Mahotas(https://github.com/luispedro/mahotas)
    Mahotas 是个包含了最快的计算机视觉算法(所有算法用 C++ 实现保证运行速度)的库,针对 numpy 数组运行。

  5. Simple-CV(https://github.com/sightmachine/simplecv)
    SimpleCV 是一个开源机器视觉框架,使用 OpenCV 和 Python 编程语言。

  6. GluonCV(https://github.com/dmlc/gluon-cv)
    GluonCV 提供了计算机视觉中最先进 (SOTA) 深度学习模型的实现。

  7. Torchvision(https://github.com/pytorch/vision)
    torchvision 包由流行的数据集、模型架构和用于计算机视觉中常见的图像转换方法组成。

查看原文

你可能感兴趣的:(机器学习,深度学习,python,自然语言处理)