pandas学习(四)

pandas学习四

import pandas as pd
import numpy as np
#读取csv文件
data=pd.read_csv(r'D:\python\untitled\shanghai.csv',encoding='utf-8')
data
0 1 感觉就是小鲜肉跟三四十岁的人在谈恋爱一样 3
0 1 5 确实如大家说的,剧情简单,没有看点,毁了! 4
1 0 1 听说下架了,里面情节都是抄的,连大炮造型都是抄的。 1
2 2 10 我觉得挺不错演员都很优秀 2
3 1 1 。。。。侮辱智商 1
4 0 10 虽然我挺喜欢小鹿的,但依然不妨碍我认为它是部烂片 2
5 0 9 这个电影太搞笑了 2
6 1 2 科幻片来说,他基本上是把所有中国科幻片能犯的错都集齐了。做爱情片来说,他倒是有连七夕档都不敢... 3
7 1 1 我没看。但是一部科幻巨制 请这种**鲜肉主演 已经没了丁点兴趣 用屁股想都知道它终将是最烂的片 3
8 1 1 今天上午想去看看这部片有多烂,然后还有36分钟不到的时候出来了,有这时间我不如在宿舍打游戏 2
9 1 1 没什么感觉。 2
10 1 1 烂,,,,,,毁在鹿晗身上,什么破演员,除了演小鲜肉,小白脸。其他都不行。 3
11 1 2 。。。。。。。 3
12 1 10 主要就是冲着舒淇去的,\n舒淇:5,鹿晗:3,特效:2,剧情:0 3
13 0 10 鹿晗演的很棒 2
14 0 3 就这样吧一般般 2
15 0 10 好好看真的好看啊! 3
16 2 10 好看,好看,好看,我都泪目了! 2
17 1 10 1KKK啊巨大 4
18 0 6 剧情不紧凑,拍摄手法也不好。 2
19 2 2 对鹿没什么影响,演员们的片酬已经到荷包里了,亏的是导演,用他的导演也是话该,再一次证明没实力... 3
20 1 10 呵呵,怎么说呢 2
21 1 6 整体感觉不太好。 3
22 1 9 棒极了,大家快去看,女主晗晗太美了 1
23 1 6 没有批评的那么烂,勉强及格。 4
24 1 2 流水账,逻辑混乱 3
25 1 1 垃圾电影真的难看 3
26 1 3 主要靠演员颜值拉分啊 2
27 0 1 鹿晗都没有我帅 2
28 2 5 好好当个小鲜肉不好吗。。。非想改变戏路?? 3
29 0 10 国产科幻片越来越好了 3
... ... ... ... ...
974 0 1 鹿晗拍戏一点伤都没有,那英俊的小脸蛋上连一点灰都没有哦 2
975 1 2 不好看,浪费时间浪费钱 3
976 0 1 反正原著党落下无助的泪水 2
977 0 1 浪费钱 垃圾片子 2
978 0 1 前面有多烂我就不说了,我就想知道,最后江洋怎么活下来的 3
979 1 1 不好看,太烂了 1
980 2 1 烂片,没头绪。 1
981 0 1 不好意思,睡着了 3
982 0 10 一般,太年轻演员,太乱 2
983 0 1 首先客观来说特效还可以,但人物选择方面也是醉了,一个灾难战争片,来选鹿晗当主演合适吗?难道大... 3
984 1 1 因为本来就是抱着去欣赏烂片的心情去看的电影,所以一开始也没觉得电影有多烂,特效马马虎虎,演技... 2
985 0 0 我觉得路依依演的最好。 2
986 1 1 额…………男主 2
987 2 9 不错,儿子喜欢看的 2
988 0 1 不推荐看…… 2
989 0 7 一般般吧。。 4
990 0 2 看不到,看不明白 2
991 2 2 节奏不紧凑。真的事被宣传片忽悠去的。。不好看。。反倒看过的哪吒还想再去看一遍。意犹未尽。而这... 3
992 0 10 很好很好很好 2
993 0 2 对不起原著粉 2
994 0 5 刚开始看的时候看到是江南的小说改编的就先入为主觉得应该还不错,结果越往后看越不对劲,主线剧情... 4
995 0 2 只能说是国产科幻电影的一次尝试。画面还可以,特效也还凑合。剧情的话,漏洞太多了一个后勤人员去... 1
996 1 2 超烂,没一点剧情 2
997 1 1 这破电影浪费钱 1
998 1 1 垃圾、垃圾、垃圾,重要的事情要说三遍 2
999 2 1 烂片一个,我还以为有多感人,搞到最后还是科幻烂片 2
1000 1 1 真**烂,全程都在打瞌睡。老牌影星和新秀的合作,新秀完全拉低了整个电影,跑综艺的就跑综艺,拍... 3
1001 0 1 太烂了,刷新了烂片的新高度 1
1002 0 1 垃圾,一块钱都不值 2
1003 2 1 鹿晗除了**,无他 1

1004 rows × 4 columns

df1=pd.DataFrame(np.ones((3,4))*0,columns=[1,2,3,4])
df1
1 2 3 4
0 0.0 0.0 0.0 0.0
1 0.0 0.0 0.0 0.0
2 0.0 0.0 0.0 0.0
df2=pd.DataFrame(np.ones((3,4))*1,columns=[1,2,3,4])
df2
1 2 3 4
0 1.0 1.0 1.0 1.0
1 1.0 1.0 1.0 1.0
2 1.0 1.0 1.0 1.0
df3=pd.DataFrame(np.ones((3,4))*2,columns=[1,2,3,4])
df3
1 2 3 4
0 2.0 2.0 2.0 2.0
1 2.0 2.0 2.0 2.0
2 2.0 2.0 2.0 2.0

合并数据

#axis 0是竖着合并,1是横着合并 ignore_index表示忽略行索引
res=pd.concat([df1,df2,df3],axis=0,ignore_index=True)
res
1 2 3 4
0 0.0 0.0 0.0 0.0
1 0.0 0.0 0.0 0.0
2 0.0 0.0 0.0 0.0
3 1.0 1.0 1.0 1.0
4 1.0 1.0 1.0 1.0
5 1.0 1.0 1.0 1.0
6 2.0 2.0 2.0 2.0
7 2.0 2.0 2.0 2.0
8 2.0 2.0 2.0 2.0

join的用法

df4=pd.DataFrame(np.ones((3,4))*2,columns=[2,3,4,5])
#若用concat合并会出现nan
pd.concat([df1,df4],axis=0,ignore_index=True)
1 2 3 4 5
0 0.0 0.0 0.0 0.0 NaN
1 0.0 0.0 0.0 0.0 NaN
2 0.0 0.0 0.0 0.0 NaN
3 NaN 2.0 2.0 2.0 2.0
4 NaN 2.0 2.0 2.0 2.0
5 NaN 2.0 2.0 2.0 2.0
#join inner则会选择交集进行连接
pd.concat([df1,df4],join='inner',axis=0,ignore_index=True)
2 3 4
0 0.0 0.0 0.0
1 0.0 0.0 0.0
2 0.0 0.0 0.0
3 2.0 2.0 2.0
4 2.0 2.0 2.0
5 2.0 2.0 2.0
#索引重叠合并
pd.concat([df1,df4],join_axes=[df1.index],axis=1)
1 2 3 4 2 3 4 5
0 0.0 0.0 0.0 0.0 2.0 2.0 2.0 2.0
1 0.0 0.0 0.0 0.0 2.0 2.0 2.0 2.0
2 0.0 0.0 0.0 0.0 2.0 2.0 2.0 2.0
#append 合并
s=pd.Series([1,2,3,4],index=[1,2,3,4])
df1.append(s,ignore_index=True)
1 2 3 4
0 0.0 0.0 0.0 0.0
1 0.0 0.0 0.0 0.0
2 0.0 0.0 0.0 0.0
3 1.0 2.0 3.0 4.0

你可能感兴趣的:(数据分析,机器学习,Python)