kaggle ----泰坦尼克号学习知识点总结(1)

1.python set()函数
描述:set() 函数创建一个无序不重复元素集
举例:

x=set('runoobl')
x
{'b', 'l', 'n', 'o', 'r', 'u'}

2.python map()
语法:

map(function, iterable, ...)

描述:第一个参数 function 以参数序列iterable中的每一个元素调用 function 函数
举例:

(1)def square(x) :            # 计算平方数
     return x ** 2
(2)map(square, [1,2,3,4,5])   # 计算列表各个元素的平方
[1, 4, 9, 16, 25]
(3) map(lambda x: x ** 2, [1, 2, 3, 4, 5])  # 使用 lambda 匿名函数
[1, 4, 9, 16, 25]
(4)map(lambda x, y: x + y, [1, 3, 5, 7, 9], [2, 4, 6, 8, 10])   #提供了两个列表,对相同位置的列表数据进行相加
[3, 7, 11, 15, 19]

3.pandas之get_dummies
语法:

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False)

常用参数:


 1. data : array-like, Series, or DataFrame 
输入的数据
 2. prefix : string, list of strings, or dict of strings, default None 
get_dummies转换后,列名的前缀
 3. columns : list-like, default None 
指定需要实现类别转换的列名
 4. dummy_na : bool, default False 
增加一列表示空缺值,如果False就忽略空缺值
 5. drop_first : bool, default False 
获得k中的k-1个类别值,去除第一个

添加链接描述

4.pandas之contact
描述:数据合并
语法:

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
       keys=None, levels=None, names=None, verify_integrity=False)

参数:

objs: series,dataframe或者是panel构成的序列lsit 
axis: 需要合并链接的轴,0是行,1是列 
join:连接的方式 inner,或者outer【 inner表是交集,outer表示并集】
join_axes: 指定根据那个轴来对齐数据

添加链接描述

5.pandas之loc
描述:选取指定列进行操作
语法:

df.loc[行标签,列标签]
df.loc['a':'b']#选取ab两行数据
df.loc[:,'one']#选取one列的数据

举例:

df.loc[ (df.Cabin.notnull()), 'Cabin' ] = "Yes"
#选取Cabin列中不为空的位置替换为“Yes”
df.loc[(df.Cabin.isnull()), 'Cabin'] = "No"
#选取Cabin列中为空的位置替换为“No”

6.python filter()函数
描述:filter() 函数用于过滤序列,过滤掉不符合条件的元素,返回由符合条件元素组成的新列表。
语法:

filter(function, iterable)

参数:

function -- 判断函数。
iterable -- 可迭代对象。
该接收两个参数,第一个为函数,第二个为序列,序列的每个元素作为参数传递给函数进行判,然后返回 True 或 False,最后将返回 True 的元素放到新列表中。

实例:

def is_odd(n):
    return n % 2 == 1
 
newlist = filter(is_odd, [1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print(newlist)
输出结果 :
[1, 3, 5, 7, 9]

7.python format()函数
实例:

>>>"{} {}".format("hello", "world")    # 不设置指定位置,按默认顺序
'hello world'
 
>>> "{0} {1}".format("hello", "world")  # 设置指定位置
'hello world'
 
>>> "{1} {0} {1}".format("hello", "world")  # 设置指定位置
'world hello world'

你可能感兴趣的:(kaggle ----泰坦尼克号学习知识点总结(1))