python logging模块
用Python写代码的时候,在想看的地方写个print xx 就能在控制台上显示打印信息,这样子就能知道它是什么了,但是当我需要看大量的地方或者在一个文件中查看的时候,这时候print就不大方便了,所以Python引入了logging模块来记录我想要的信息。
print也可以输入日志,logging相对print来说更好控制输出在哪个地方,怎么输出及控制消息级别来过滤掉那些不需要的信息。
multiprocessing包是Python中的多进程管理包。
与threading.Thread类似,它可以利用multiprocessing.Process对象来创建一个进程。
该进程可以运行在Python程序内部编写的函数。
该Process对象与Thread对象的用法相同,也有start(), run(), join()的方法。
使用pprint模块
pprint模块(pretty printer):用于打印python数据结构,当你在命令行下打印特定数据结构时,你会发现它很有用(输出格式比较整齐,便于阅读)。
**NLTK(Python自然语言工具包)**用于诸如标记化、词形还原、词干化、解析、POS标注等任务。该库具有几乎所有NLP任务的工具。
**manifold learning:**对高维数据的非线性降维。
尝试基于 sklearn 的 tSNE 实现方法
from sklearn.manifold importTSNE。
matplotlib.pyplot 是常见的可视化工具之一,风格与MATLAB类似,可以方便的绘制图像、展示结果。
用 matplotlib能够完成一些基本的图表操作,而 Seaborn 库可以让这些图的表现更加丰富。
import seaborn as sns :用于导入 seaborn 库,并取别名为 sns ,后续介绍都用 sns 代表 seaborn。
参考链接:https://www.cnblogs.com/xiaoliyustyle/p/9588715.html
将txt文件转换为csv文件的经历(Python实现)
情况描述:需要将一个txt文件转换为csv文件,其中txt文件中数据以空格分隔,txt文件以GB2312编码。
参考链接:https://www.cnblogs.com/Keynman/p/11722974.html
python: 删除csv文件中的某几列
我们先用pandas库中的read_csv()函数读取出csv文件中的内容:
df=pd.read_csv(‘1.csv’, header=None)
假设我们要删除的列的名称是’two’ , ‘three’ :
df=df.drop([‘two’,‘three’],axis=1),即可删除那两列。
参考链接:https://blog.csdn.net/weixin_43790560/article/details/89178029