文本内容
_1kb8k8sj 挺好挺好星期再评价大陆国行全新丰发货隔天收收拍开箱视频马上转移数提示定数转完新手机软件下好进去再抹前旧手机数 已利安全下车位友友入手游戏挺好毕竟官网平台便宜百块 安全下车力奥力都说14挤牙膏觉很好毕竟6sp跳 拼百亿补贴买开始还担心不翻新机次核发现正儿八新机官网门店便宜百良心卖家 很不错 拍清晰 不发热 电池系统流畅界面美观 色彩饱度不错查序列号正品未激活 安全下车 抱五十五十决定拼买百亿补贴省百全新没激活买放心三天收货卖家好力不资源机不高仿全新机 安全下车前小担心真没必10月2号下单3号发货5号收拆箱查询全新未激活外观完美无瑕疵河北南京发货天机时间长拍清晰系统流畅
代码
import os
classes_path = os.path.expanduser('out_pdd_remove_stop_word.txt')
with open(classes_path, 'r', encoding='UTF-8') as f:
class_names = f.readlines()
class_names = [c.strip() for c in class_names]
print(class_names)
结果
['_1kb8k8sj', '挺好挺好星期再评价大陆国行全新丰发货隔天收收拍开箱视频马上转移数提示定数转完新手机软件下好进去再抹前旧手机数 已利安全下车位友友入手游戏挺好毕竟官网平台便宜百块', '安全下车力奥力都说14挤牙膏觉很好毕竟6sp跳', '拼百亿补贴买开始还担心不翻新机次核发现正儿八新机官网门店便宜百良心卖家', '很不错 拍清晰 不发热 电池系统流畅界面美观 色彩饱度不错查序列号正品未激活 安全下车', '抱五十五十决定拼买百亿补贴省百全新没激活买放心三天收货卖家好力不资源机不高仿全新机', '安全下车前小担心真没必10月2号下单3号发货5号收拆箱查询全新未激活外观完美无瑕疵河北南京发货天机时间长拍清晰系统流畅']