目录
一、Pendulum
二、FTFY
三、更多资源
在过去的两年里,一直在广泛使用Python,过程中寻找到令人惊叹的库,明显提高效率,增强在数据工程和商业智能项目中的表现。
Python 中有许多库可用于日期时间,但我发现 Pendulum 在日期的任何操作上都易于使用。
Pendulum扩展了内置的 Python 日期时间模块,添加了更直观的 API,用于处理时区并对日期和时间执行操作:
例如添加时间间隔、减去日期和在时区之间转换。它提供了一个简单、人性化的 API 来格式化日期和时间。
1、安装
pip install pendulum
2、实例化时区和时区换算:
# 导入库
# import library
import pendulum
dt = pendulum.datetime(2023, 6, 8)
print(dt)
输出:
2023-06-08T00:00:00+00:00
您是否遇到过数据中存在的外语无法正确显示的情况?
这被称为:Mojibake
术语用于描述编码或解码问题而发生的乱码或乱码文本。
当使用一种字符编码编写的文本使用不同的编码错误解码时,通常会发生这种情况。
ftfy python库将帮助您修复Mojibake,这在NLP用例中非常有用。
1.安装
pip install ftfy
例:
print(ftfy.fix_text('Correct the sentence using “ftfyâ€\x9d.'))
print(ftfy.fix_text('✔ No problems with text'))
print(ftfy.fix_text('à perturber la réflexion'))
输出:
除了Mojibake,ftfy将修复不正确的编码,不正确的行尾和不正确的引号。可以理解解码为以下任何编码的文本:
拉丁语-1 (ISO-8859–1)
Windows-1252 (cp1252 — 用于微软产品)
Windows-1251 (cp1251 — cp1252的俄语版本)
Windows-1250 (cp1250 — cp1252的东欧版本)
ISO-8859–2(与Windows-1250不完全相同)
MacRoman(在 Mac OS 9 及更早版本上使用)
cp437(用于 MS-DOS 和某些版本的 Windows 命令提示符)
✨还可以关注宫纵号《编程乐学》,菜单栏有很多优质的开源项目以及更多的编程资料等你来学习。