用python读取某文件夹里所有文件的内容,然后用正则表达式匹配提取文件中需要的内容,用jieba分词后按比例划分数据集(包含读取json文件,存储、读取csv文件)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档解决的问题1、用python读取某文件夹里所有文件的内容。2、用正则表达式匹配提取文件中需要的内容。3、用jieba进行分词。4、按比例划分数据集。5、读取json文件,存储、读取csv文件。1、引入库,设置路径importosimportjsonimportreimportpandasaspdpath='./da'#path='./