7个非常实用但被低估的Python工具包!分享给大家

Python 拥有海量的包,无论是普通任务还是复杂任务,我们经常在应用程序中使用大量的工具包。本文将讨论一些常被低估的数据科学包,包括:数据清理、应用程序开发和调试方面。


image.png

1、Faker

生产环境通常具有实时数据。把它放到测试环境中并不容易。我们必须对从生产到测试环境的数据进行标记化,这通常会将数据转换为乱码。

此外,在欺诈行业,我们需要找出欺诈身份。为了生成假PII(个人可识别信息),这里使用了一个名为Faker的包,这是一个很酷的软件包,可以让你创建一个带有地址、名字等的假PII。

image.png

以上是一些虚假数据的例子。带有 GAN 假图像的假数据可以给出一个真实的人。

2、Pywebio

我们知道 Flask 适用于 Python 端的表单、UI 和 restapi。然而,如果想要一个简单的表单,Flask就不太适用了。通常用 Pywebio 来创建,它会创建了一个简单、干净的UI。所有的代码都是用普通的python编写的,并且我们不用额外学新东西!


image.png
image.png

在几秒钟内,它转换为一个前端 UI 网页。我们还可以编写一些会话并处理输入和输出,查看他们的文档以获取详细信息。

3、Airflow

Airflow 它是一种工作流管理工具,在 MLOPS 中经常被低估和较少使用,它还可以用于特定的执行间隔、重新训练模型、批处理、网站抓取、投资组合跟踪、自定义新闻提要等。

在工作流程方面,选项是无限的,它还可以连接到特定服务的云服务商。代码可以用 python 写,在 UI 上可以看到执行,非常棒。工作流也可以按特定时间间隔进行安排。

4、 Loguru

Logger 是调试应用程序的最佳方法之一。但是,logger 里面的日志太多了,让人比较烦。而 Loguru 在某种程度上就比较友好,它虽不能解决所有挑战,但是它很容易添加日志语句并为其添加更多调试。


image.png

它还有助于拆分文件并执行清理,因此我们不需要查看所有历史日志。

image.png

你还可以使用参数 backtrace 来回溯执行。

简而言之,在生产环境中使用这个包来调试应用程序或 AI 模型训练是值得的。

5、Pydash

通常在数据清洗或处理中,我们要处理大量的数据清洗。这些是一些较小的项目,需要时间。例如,如何展平列表?当然,你可以写一个清单,但是如果有一个快速功能来执行这些操作呢?

这就是Pydash闪耀的地方,它成为了我的快速转到库,其中包含一系列python实用程序。

image.png

以上只是一个小例子,它包含很多功能,绝对值得一看。

6、Weights & Biases

WANDB是跟踪和可视化机器学习管道最有用的包之一,其中最喜欢的是central dashboard,它类似于记录器,但可以做更多的事情。


image.png
image.png

它易于使用,并集成了最流行的库,如 Tensorflow、PyTorch、fastai、huggingface 等。但是,在商业领域使用它时有一些限制,必须付费订阅。除此之外,它是一个很棒的库。

7、PyCaret

PyCaret 包可以简化许多编码,当想快速做某件事情时可以使用。这个包有很多关于默认参数的选项,可以用不同的度量点运行不同的模型。

image.png

总结

以上这些这不是一份详尽的清单,如果大家有使用其他经常未低估的软件包,可以在评论区一起分享交流哦!

如果文章对你有用的话,欢迎关注、点赞和收藏!

你可能感兴趣的:(7个非常实用但被低估的Python工具包!分享给大家)