数据科学家常用的24个Python库

BeautifulSoup

BeautifulSoup是一个HTML和XML解析器,它为解析的页面创建解析树,用于从网页中提取数据。

Scrapy

Scrapy是另一个用于Web抓取的超级有用的Python库。它是一个开源和协作框架,用于从网站中提取您需要的数据。

Selenium

Selenium是一种用于自动化浏览器的流行工具。它主要用于行业测试,但对于网络抓取也非常方便。 

Pandas

Pandas是用Python语言编写的,特别适用于操作和分析任务。

PyOD

PyOD是一个全面且可扩展的Python工具包,用于检测异常对象。异常检测是识别与大多数数据显着不同的稀有项目或观察值。

NumPy

NumPy引入了支持大型多维数组和矩阵的函数。它还引入了高级数学函数来处理这些数组和矩阵。

SpaCy

SpaCy是一个超级有用且灵活的自然语言处理(NLP)库和框架,用于清理文本文档以进行模型创建。

Matplotlib

Matplotlib是Python的数据可视化库。它允许我们生成和构建各种图表。它可以与Seaborn一起在视觉上探索数据。

Seaborn

Seaborn是另一个基于matplotlib的绘图库。它在提供高级界面来绘制有吸引力的图形。Seaborn比matplotlib更具视觉吸引力。

Bokeh

Bokeh是一个交互式可视化库,面向现代Web浏览器进行演示。Bokeh可用于创建交互式图表,仪表板和数据应用程序。

Scikit-Learn

Scikit-learn是构建模型的Python库。事实上,scikit-learn建立在NumPy,SciPy和matplotlib之上。

TensorFlow

TensorFlow由Google开发,是一个流行的深度学习库,可帮助您构建和训练不同的模型。

PyTorch

PyTorch是一个基于Python的科学计算包,可以用作:NumPy的替代品,可以使用GPU的强大功能,深度学习研究平台。

LIME

LIME是一种算法(和库),可以解释任何分类器或回归量的预测。

H2O

H2O的无人驾驶AI提供简单的数据可视化技术,用于表示高度特征交互和非线性模型行为。它通过可视化提供机器学习可解释性(MLI),阐明建模结果和模型中特征的影响。

LibROSA

LibROSA是一个用于音乐和音频分析的Python库。它提供了创建音乐信息检索系统所需的构建块。

Madmom

Madmom是一个非常漂亮的音频数据分析Python库。它是一个用Python编写的音频信号处理库,主要关注音乐信息检索(MIR)任务。

pyAudioAnalysis

pyAudioAnalysis是一个用于音频特征提取,分类和分段的Python库。

OpenCV-Python

OpenCV-Python是用于图像处理的PythonAPI,它结合了OpenCVC++API和Python语言的最佳特性。主要用于解决计算机视觉问题。

Scikit-image

Scikit-image是用于执行多个和不同图像处理任务的算法集合。可以执行图像分割,几何变换,色彩空间操作,分析,过滤,形态学,特征检测等等。

Pillow

Pillow是PIL(PythonImagingLibrary)的新版本。它是从PIL派生出来的,在Ubuntu等一些Linux发行版中已被用作原始PIL的替代品。

Psycopg

Psycopg是最受欢迎的PostgreSQL(一种用于Python编程语言的高级开源关系数据库)适配器。Psycopg的核心是完全实现PythonDBAPI2.0规范。

SQLAlchemy

SQLAlchemy是一个PythonSQL工具包和ObjectRelationalMapper,它为应用程序开发人员提供了SQL的全部功能和灵活性。

Flask

Flask是一个用Python编写的Web框架,通常用于部署数据科学模型。

你可能感兴趣的:(数据科学家常用的24个Python库)