import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
corolla1=pd.read_csv("D:\\2018_BigData\\Python\\Python_files_Notebook\\Decision on buying cars COROLLA or LEVIN\\corolla_1st_deal.csv",encoding="ANSI")
corolla1.head(1)
|
Unnamed: 0 |
name-text |
车型 |
购买地点 |
购车经销商 |
购买时间 |
nakedprice |
driven-distance |
发表时间 |
空间 |
... |
reviews |
购车目的1 |
购车目的2 |
购车目的3 |
购车目的4 |
购车裸车价 |
行驶里程 |
支持人数 |
阅览人数 |
评论人数 |
0 |
1 |
八号零陈 |
2018款 双擎 1.8L E-CVT智尚版 |
北京 |
北京中业丰田 |
2018年12月 |
14.18 |
2500 |
2019/1/13 |
4 |
... |
29 |
购物 |
接送小孩 |
无 |
无 |
14.18?万元 |
2500?公里 |
有36人支持该口碑 |
有82222人看过 |
评论(29) |
1 rows × 31 columns
corolla2=corolla1.drop(["Unnamed: 0","购车裸车价","行驶里程","支持人数","阅览人数","评论人数"],axis=1)
corolla2.head(1)
|
name-text |
车型 |
购买地点 |
购车经销商 |
购买时间 |
nakedprice |
driven-distance |
发表时间 |
空间 |
动力 |
... |
内饰 |
性价比 |
购买车型 |
support |
read |
reviews |
购车目的1 |
购车目的2 |
购车目的3 |
购车目的4 |
0 |
八号零陈 |
2018款 双擎 1.8L E-CVT智尚版 |
北京 |
北京中业丰田 |
2018年12月 |
14.18 |
2500 |
2019/1/13 |
4 |
3 |
... |
4 |
4 |
卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>> |
36 |
82222 |
29 |
购物 |
接送小孩 |
无 |
无 |
1 rows × 25 columns
levin1=pd.read_csv("D:\\2018_BigData\\Python\\Python_files_Notebook\\Decision on buying cars COROLLA or LEVIN\\levin_1st_deal.csv",encoding="ANSI")
levin2=levin1.drop(["Unnamed: 0","购车裸车价","行驶里程","支持人数","阅览人数","评论人数"],axis=1)
levin2.head(1)
|
name-text |
车型 |
购买地点 |
购车经销商 |
购买时间 |
nakedprice |
driven-distance |
发表时间 |
空间 |
text-cont |
... |
内饰 |
性价比 |
购买车型 |
support |
read |
reviews |
购车目的1 |
购车目的2 |
购车目的3 |
购车目的4 |
0 |
VOLVO110 |
2018款 双擎 1.8H GS-V CVT尊贵版 国V |
广州 |
广汽丰田天河店 |
2018年11月 |
13.18 |
3300 |
2018/11/29 |
4 |
【最满意的一点】最满意当然是油耗,还有就是能在广州摇节能号,广州人都知道摇号不是一般的难啊,... |
... |
3 |
3 |
雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>> |
26 |
47833 |
25 |
上下班 |
自驾游 |
泡妞 |
跑长途 |
1 rows × 25 columns
corolla2.shape
(405, 25)
levin2.shape
(340, 25)
plt.hist(corolla2['nakedprice'],bins=18)
plt.xlabel("购车裸车价",fontproperties="SimHei",fontsize=18)
plt.ylabel("数量",fontproperties="SimHei",fontsize=18)
plt.title("Nakedprice Distribution",fontsize=20)
plt.show()
price=corolla2["nakedprice"]
price.head(5)
0 14.18
1 11.28
2 14.43
3 14.18
4 14.28
Name: nakedprice, dtype: float64
area_price=corolla2[["nakedprice","购买地点"]]
area_price.head(5)
|
nakedprice |
购买地点 |
0 |
14.18 |
北京 |
1 |
11.28 |
泉州 |
2 |
14.43 |
郑州 |
3 |
14.18 |
沈阳 |
4 |
14.28 |
上海 |
plt.figure(figsize=(16,4))
sns.boxplot(y="nakedprice",x="购买地点",data=area_price)
corolla_cityhead=corolla2.groupby(["购买地点"])["nakedprice"].agg(["mean","count"])
corolla_cityhead=corolla_cityhead.sort_values(by="count",ascending=False)
corolla_cityhead=corolla_cityhead.iloc[:20].reset_index()
corolla_cityhead
|
购买地点 |
mean |
count |
0 |
西安 |
12.803333 |
36 |
1 |
长沙 |
13.228571 |
21 |
2 |
濮阳 |
13.604211 |
19 |
3 |
郑州 |
12.942000 |
15 |
4 |
武汉 |
12.318571 |
14 |
5 |
南昌 |
13.770769 |
13 |
6 |
武威 |
12.412727 |
11 |
7 |
铜陵 |
13.483636 |
11 |
8 |
西宁 |
12.216364 |
11 |
9 |
昌吉 |
13.911111 |
9 |
10 |
乌鲁木齐 |
12.095556 |
9 |
11 |
宜春 |
13.001250 |
8 |
12 |
哈尔滨 |
12.366250 |
8 |
13 |
北京 |
12.642500 |
8 |
14 |
天津 |
12.600000 |
8 |
15 |
威海 |
11.750000 |
8 |
16 |
青岛 |
12.322500 |
8 |
17 |
盘锦 |
11.320000 |
7 |
18 |
亳州 |
12.480000 |
7 |
19 |
沈阳 |
12.641429 |
7 |
city=corolla_cityhead["购买地点"]
corolla_city=corolla2[["购买地点","nakedprice"]][corolla2["购买地点"].isin(city)]
print(corolla_city.shape)
print()
print(corolla_city.head(10))
(238, 2)
购买地点 nakedprice
1 北京 14.18
3 郑州 14.43
4 沈阳 14.18
12 西安 12.48
13 北京 10.70
15 长沙 14.98
18 濮阳 12.70
19 威海 14.78
25 青岛 14.38
26 西安 14.60
plt.figure(figsize=(16,4))
sns.boxplot(x="购买地点",y="nakedprice",data=corolla_city)
plt.show()
corolla2.columns
Index(['车型', '购买地点', '购车经销商', '购买时间', 'nakedprice', 'driven-distance', '发表时间',
'空间', '动力', '操控', '油耗', '舒适性', 'text-cont', '外观', '内饰', '性价比', '购买车型',
'support', 'read', 'reviews', '购车目的1', '购车目的2', '购车目的3', '购车目的4'],
dtype='object')
corolla2.index
Index(['八号零陈', '辛亦', '张某某9390', 'Hy_Bird', 'terebi', '初始化記憶', 'an2m9wtr8',
'yychong', '买车套路深我要回农村', 'YY殇夏',
...
'桂昌承', '周姐卡罗拉', '蛮蛮大哥', '_花开划落', '巫巫巫巫', '6666666_6', '千里sss', 'cllhtt',
'淡定的小老虎不咬人', 'Smilence_Li'],
dtype='object', name='name-text', length=405)
corolla2.index = range(1,len(corolla2)+1)
corolla2.head(3)
|
name-text |
车型 |
购买地点 |
购车经销商 |
购买时间 |
nakedprice |
driven-distance |
发表时间 |
空间 |
动力 |
... |
内饰 |
性价比 |
购买车型 |
support |
read |
reviews |
购车目的1 |
购车目的2 |
购车目的3 |
购车目的4 |
1 |
八号零陈 |
2018款 双擎 1.8L E-CVT智尚版 |
北京 |
北京中业丰田 |
2018年12月 |
14.18 |
2500 |
2019/1/13 |
4 |
3 |
... |
4 |
4 |
卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>> |
36 |
82222 |
29 |
购物 |
接送小孩 |
无 |
无 |
2 |
辛亦 |
2018款 1.2T S-CVT GL智享版 |
泉州 |
泉州宾联# |
2019年1月 |
11.28 |
4361 |
2019/3/25 |
4 |
3 |
... |
4 |
5 |
卡罗拉 2018款 1.2T S-CVT GL智享版?>> |
5 |
9570 |
9 |
接送小孩 |
接送小孩 |
无 |
无 |
3 |
张某某9390 |
2018款 双擎 1.8L E-CVT智尚版 |
郑州 |
郑州裕华丰田 |
2018年9月 |
14.43 |
5339 |
2018/9/13 |
4 |
5 |
... |
1 |
4 |
卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>> |
101 |
200279 |
51 |
自驾游 |
接送小孩 |
无 |
无 |
3 rows × 25 columns
corolla2.index
RangeIndex(start=1, stop=406, step=1)
corolla2['车型']
1 2018款 双擎 1.8L E-CVT智尚版
2 2018款 1.2T S-CVT GL智享版
3 2018款 双擎 1.8L E-CVT智尚版
4 2018款 双擎 1.8L E-CVT智尚版
5 2018款 双擎 1.8L E-CVT智尚版
6 2018款 1.2T S-CVT GL智享版
7 2018款 1.2T S-CVT GL智享版
8 2018款 双擎 1.8L E-CVT智尚版
9 2018款 1.2T S-CVT GL-i智辉版
10 2018款 1.2T S-CVT GL-i智辉版
11 2018款 1.2T S-CVT GL智享版
12 2018款 1.2T S-CVT GL-i智辉版
13 2018款 1.2T S-CVT GL智享版
14 2018款 1.2T S-CVT GL智享版
15 2018款 双擎 1.8L E-CVT智尚版
16 2018款 1.2T S-CVT GL智享版
17 2018款 双擎 1.8L E-CVT智尚版
18 2018款 1.2T S-CVT GL-i智辉版
19 2018款 双擎 1.8L E-CVT智尚版
20 2018款 1.2T S-CVT GL-i智辉版
21 2018款 1.2T S-CVT GL-i智辉版
22 2018款 双擎 1.8L E-CVT智尚版
23 2018款 1.2T S-CVT GL-i智辉版
24 2018款 1.2T S-CVT GL智享版
25 2018款 双擎 1.8L E-CVT智尚版
26 2018款 双擎 1.8L E-CVT智尚版
27 2018款 双擎 1.8L E-CVT智尚版
28 2018款 双擎 1.8L E-CVT智尚版
29 2018款 双擎 1.8L E-CVT智尚版
30 2018款 双擎 1.8L E-CVT智尚版
...
376 2018款 1.2T S-CVT GL智享版
377 2018款 1.2T S-CVT GL-i智辉版
378 2018款 1.2T S-CVT GL-i智辉版
379 2018款 1.2T S-CVT GL-i智辉版
380 2018款 双擎 1.8L E-CVT智尚版
381 2018款 1.2T S-CVT GL-i智辉版
382 2018款 1.2T S-CVT GL智享版
383 2018款 双擎 1.8L E-CVT智尚版
384 2018款 1.2T S-CVT GL-i智辉版
385 2018款 双擎 1.8L E-CVT智尚版
386 2018款 1.2T S-CVT GL智享版
387 2018款 1.2T S-CVT GL-i智辉版
388 2018款 1.2T S-CVT GL智享版
389 2018款 1.2T S-CVT GL智享版
390 2018款 1.2T S-CVT GL-i智辉版
391 2018款 1.2T S-CVT GL智享版
392 2018款 双擎 1.8L E-CVT智尚版
393 2018款 双擎 1.8L E-CVT智尚版
394 2018款 1.2T S-CVT GL-i智辉版
395 2018款 1.2T S-CVT GL智享版
396 2018款 1.2T S-CVT GL智享版
397 2018款 1.2T S-CVT GL智享版
398 2018款 1.2T S-CVT GL-i智辉版
399 2018款 双擎 1.8L E-CVT智尚版
400 2018款 1.2T S-CVT GL-i智辉版
401 2018款 1.2T S-CVT GL智享版
402 2018款 双擎 1.8L E-CVT智尚版
403 2018款 1.2T S-CVT GL智享版
404 2018款 1.2T S-CVT GL-i智辉版
405 2018款 1.2T S-CVT GL-i智辉版
Name: 车型, Length: 405, dtype: object
corolla2['车型'].unique()
array(['2018款 双擎 1.8L E-CVT智尚版', '2018款 1.2T S-CVT GL智享版',
'2018款 1.2T S-CVT GL-i智辉版'], dtype=object)
corolla2['车型'].value_counts()
2018款 1.2T S-CVT GL智享版 166
2018款 双擎 1.8L E-CVT智尚版 120
2018款 1.2T S-CVT GL-i智辉版 119
Name: 车型, dtype: int64
cartype=corolla2['车型'].unique()
cartpye
array(['2018款 双擎 1.8L E-CVT智尚版', '2018款 1.2T S-CVT GL智享版',
'2018款 1.2T S-CVT GL-i智辉版'], dtype=object)
i=0
for cartype in corolla2['车型']:
i+=1
print(i)
405
count_cartype = corolla2["车型"].value_counts()
count_cartype
2018款 1.2T S-CVT GL智享版 166
2018款 双擎 1.8L E-CVT智尚版 120
2018款 1.2T S-CVT GL-i智辉版 119
Name: 车型, dtype: int64
count_cartype[1]
120
count_cartype2=np.array(count_cartype)
count_cartype2
array([166, 120, 119], dtype=int64)
cartype2=np.array(cartype)
cartype2
array('2018款 1.2T S-CVT GL-i智辉版', dtype='
labels=['2018款 双擎 1.8L E-CVT智尚版','2018款 1.2T S-CVT GL智享版','2018款 1.2T S-CVT GL-i智辉版']
sizes=[120,166,119]
explode=(0,0.1,0)
plt.axis("equal")
plt.pie(sizes,explode=explode,labels=labels,autopct="%1.1f%%",shadow=False,startangle=90)
plt.show()
from pylab import mpl
# 指定默认字体:解决plot不能显示中文问题*
mpl.rcParams['font.sans-serif'] = ['SimHei']
plt.axis("equal")
plt.pie(sizes,explode=explode,labels=labels,autopct="%1.1f%%",shadow=False,startangle=90)
plt.show()
corolla2.head(1)
|
name-text |
车型 |
购买地点 |
购车经销商 |
购买时间 |
nakedprice |
driven-distance |
发表时间 |
空间 |
动力 |
... |
内饰 |
性价比 |
购买车型 |
support |
read |
reviews |
购车目的1 |
购车目的2 |
购车目的3 |
购车目的4 |
1 |
八号零陈 |
2018款 双擎 1.8L E-CVT智尚版 |
北京 |
北京中业丰田 |
2018年12月 |
14.18 |
2500 |
2019/1/13 |
4 |
3 |
... |
4 |
4 |
卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>> |
36 |
82222 |
29 |
购物 |
接送小孩 |
无 |
无 |
1 rows × 25 columns
col = ["购车目的1","购车目的2","购车目的3","购车目的4"]
purchasegoal_col=pd.DataFrame(corolla2,columns=col)
purchasegoal_col=purchasegoal.replace("无","")
purchasegoal_col.head()
|
购车目的1 |
购车目的2 |
购车目的3 |
购车目的4 |
1 |
购物 |
接送小孩 |
|
|
2 |
接送小孩 |
接送小孩 |
|
|
3 |
自驾游 |
接送小孩 |
|
|
4 |
自驾游 |
自驾游 |
|
|
5 |
购物 |
自驾游 |
|
|
purchasegoal_col.to_csv(r"D:/2018_BigData/Python/Python_files_Notebook/Theme_Practice/Decision on buying cars COROLLA or LEVIN/purchasegoal_col.txt",index=False)
import jieba
filename = "D:/2018_BigData/Python/Python_files_Notebook/Theme_Practice/Decision on buying cars COROLLA or LEVIN/purchasegoal_col.txt"
with open(filename, 'r', encoding="utf-8") as f:
text = " ".join(jieba.cut(f.read()))
text
'购车 目的 1 , 购车 目的 2 , 购车 目的 3 , 购车 目的 4 \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 自驾游 , 跑 长途 , , \n 上下班 , 跑 长途 , , \n 上下班 , 跑 长途 , , \n 上下班 , 跑 长途 , , \n 上下班 , 跑 长途 , , \n 上下班 , 跑 长途 , , \n 上下班 , 跑 长途 , , \n 自驾游 , 跑 长途 , , \n 自驾游 , 跑 长途 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 自驾游 , 跑 长途 , , \n 购物 , 自驾游 , , \n 接送 小孩 , 跑 长途 , , \n 购物 , 跑 长途 , , \n 购物 , 跑 长途 , , \n 购物 , 跑 长途 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 上下班 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 自驾游 , 泡妞 , , \n 自驾游 , 泡妞 , , \n 自驾游 , 泡妞 , , \n 自驾游 , 泡妞 , , \n 自驾游 , 泡妞 , , \n 自驾游 , 泡妞 , , \n 自驾游 , 泡妞 , , \n 自驾游 , 泡妞 , , \n 接送 小孩 , 购物 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 自驾游 , 商务 接送 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 上下班 , 接送 小孩 , , \n 上下班 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 购物 , 自驾游 , , \n 跑 长途 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 自驾游 , , \n 自驾游 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 上下班 , 自驾游 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 自驾游 , 跑 长途 , , \n 购物 , 商务 接送 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 商务 接送 , , \n 自驾游 , 商务 接送 , , \n 自驾游 , 商务 接送 , , \n 接送 小孩 , 商务 接送 , , \n 接送 小孩 , 商务 接送 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 跑 长途 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 上下班 , 接送 小孩 , , \n 上下班 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 自驾游 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 自驾游 , 跑 长途 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 跑 长途 , , \n 接送 小孩 , 跑 长途 , , \n 购物 , 接送 小孩 , , \n 自驾游 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 上下班 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 购物 , , \n 接送 小孩 , 购物 , , \n 自驾游 , 购物 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 自驾游 , 跑 长途 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 上下班 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 泡妞 , , \n 接送 小孩 , 泡妞 , , \n 接送 小孩 , 泡妞 , , \n 接送 小孩 , 泡妞 , , \n 接送 小孩 , 泡妞 , , \n 自驾游 , 泡妞 , , \n 购物 , 自驾游 , , \n 拉货 , 接送 小孩 , , \n 拉货 , 接送 小孩 , , \n 拉货 , 接送 小孩 , , \n 拉货 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 上下班 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 自驾游 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 购物 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 接送 小孩 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 越野 , , \n 购物 , 越野 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 自驾游 , , \n 跑 长途 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 自驾游 , 自驾游 , , \n 接送 小孩 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 自驾游 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n 购物 , 接送 小孩 , , \n'
from wordcloud import WordCloud
wordcloud = WordCloud().generate(text)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
from os import path
d = path.dirname("D:/2018_BigData/Python/Python_files_Notebook/Theme_Practice/Decision on buying cars COROLLA or LEVIN/")
text = open(path.join(d, 'purchasegoal_col.txt'), "rb").read()
mytext = " ".join(jieba.cut(text))
from PIL import Image
alice_mask = np.array(Image.open(path.join(d, "car3.jpg")))
wc = WordCloud(font_path="C:\Windows\Fonts\simfang.ttf", background_color="white", mask=alice_mask,
contour_width=3, contour_color="steelblue").generate(mytext)
wc.to_file(path.join(d, "purchasegoal_col.png"))
plt.imshow(wc, interpolation='bilinear')
plt.axis("off")
plt.show()
col = ["购车目的1","购车目的2","购车目的3","购车目的4"]
purchasegoal_levin=pd.DataFrame(levin2,columns=col)
purchasegoal_levin=purchasegoal.replace("无","")
purchasegoal_levin.head()
purchasegoal_levin.to_csv(r"D:/2018_BigData/Python/Python_files_Notebook/Theme_Practice/Decision on buying cars COROLLA or LEVIN/purchasegoal_levin.txt",index=False)
text = open(path.join(d, 'purchasegoal_levin.txt'), "rb").read()
mytext = " ".join(jieba.cut(text))
from PIL import Image
alice_mask = np.array(Image.open(path.join(d, "car3.jpg")))
wc = WordCloud(font_path="C:\Windows\Fonts\simfang.ttf", background_color="white", mask=alice_mask,
contour_width=3, contour_color="steelblue").generate(mytext)
wc.to_file(path.join(d, "purchasegoal_levin.png"))
plt.imshow(wc, interpolation='bilinear')
plt.axis("off")
plt.show()