BeautifulSoup
BeautifulSoup是一个HTML和XML解析器,它为解析的页面创建解析树,用于从网页中提取数据。
Scrapy
Scrapy是另一个用于Web抓取的超级有用的Python库。它是一个开源和协作框架,用于从网站中提取您需要的数据。
Selenium
Selenium是一种用于自动化浏览器的流行工具。它主要用于行业测试,但对于网络抓取也非常方便。
Pandas
Pandas是用Python语言编写的,特别适用于操作和分析任务。
PyOD
PyOD是一个全面且可扩展的Python工具包,用于检测异常对象。异常检测是识别与大多数数据显着不同的稀有项目或观察值。
NumPy
NumPy引入了支持大型多维数组和矩阵的函数。它还引入了高级数学函数来处理这些数组和矩阵。
SpaCy
SpaCy是一个超级有用且灵活的自然语言处理(NLP)库和框架,用于清理文本文档以进行模型创建。
Matplotlib
Matplotlib是Python的数据可视化库。它允许我们生成和构建各种图表。它可以与Seaborn一起在视觉上探索数据。
Seaborn
Seaborn是另一个基于matplotlib的绘图库。它在提供高级界面来绘制有吸引力的图形。Seaborn比matplotlib更具视觉吸引力。
Bokeh
Bokeh是一个交互式可视化库,面向现代Web浏览器进行演示。Bokeh可用于创建交互式图表,仪表板和数据应用程序。
Scikit-Learn
Scikit-learn是构建模型的Python库。事实上,scikit-learn建立在NumPy,SciPy和matplotlib之上。
TensorFlow
TensorFlow由Google开发,是一个流行的深度学习库,可帮助您构建和训练不同的模型。
PyTorch
PyTorch是一个基于Python的科学计算包,可以用作:NumPy的替代品,可以使用GPU的强大功能,深度学习研究平台。
LIME
LIME是一种算法(和库),可以解释任何分类器或回归量的预测。
H2O
H2O的无人驾驶AI提供简单的数据可视化技术,用于表示高度特征交互和非线性模型行为。它通过可视化提供机器学习可解释性(MLI),阐明建模结果和模型中特征的影响。
LibROSA
LibROSA是一个用于音乐和音频分析的Python库。它提供了创建音乐信息检索系统所需的构建块。
Madmom
Madmom是一个非常漂亮的音频数据分析Python库。它是一个用Python编写的音频信号处理库,主要关注音乐信息检索(MIR)任务。
pyAudioAnalysis
pyAudioAnalysis是一个用于音频特征提取,分类和分段的Python库。
OpenCV-Python
OpenCV-Python是用于图像处理的PythonAPI,它结合了OpenCVC++API和Python语言的最佳特性。主要用于解决计算机视觉问题。
Scikit-image
Scikit-image是用于执行多个和不同图像处理任务的算法集合。可以执行图像分割,几何变换,色彩空间操作,分析,过滤,形态学,特征检测等等。
Pillow
Pillow是PIL(PythonImagingLibrary)的新版本。它是从PIL派生出来的,在Ubuntu等一些Linux发行版中已被用作原始PIL的替代品。
Psycopg
Psycopg是最受欢迎的PostgreSQL(一种用于Python编程语言的高级开源关系数据库)适配器。Psycopg的核心是完全实现PythonDBAPI2.0规范。
SQLAlchemy
SQLAlchemy是一个PythonSQL工具包和ObjectRelationalMapper,它为应用程序开发人员提供了SQL的全部功能和灵活性。
Flask
Flask是一个用Python编写的Web框架,通常用于部署数据科学模型。