python study tips

pip3 install --upgrade pip --user 升级pip到最新版本
pip配置清华源

参考: https://www.cnblogs.com/sky-ai/p/9800036.html

pandas判断是否是空项要使用pd.isnan()而绝对不能使用np.NaN == xx,

参考https://blog.csdn.net/weixin_41712499/article/details/82719987

print(np.NaN == np.NaN)
#结果为False!!!
pandas显示不完整问题/科学计数法问题(python3.7.3)
import pandas as pd
#设置显示的最多行数(这里设置为200)
pd.set_option('display.max_rows', 200)
#显示的所有行
pd.set_option('display.max_rows', None)

#设置显示的最多列数
pd.set_option('display.max_columns', 200)
#显示所有列
pd.set_option('display.max_columns', None)

#(每)一列(的每一项)显示的最大字符数
pd.set_option('max_colwidth',200)
pandas.Series.where方法和pandas.Series.mask方法
def where(
        self,
        cond,
        other=np.nan,
        inplace=False,
        axis=None,
        level=None,
        errors="raise",
        try_cast=False,
    ):
    ...
#如果 cond 为真,保持原来的值,否则替换为other
def mask(
        self,
        cond,
        other=np.nan,
        inplace=False,
        axis=None,
        level=None,
        errors="raise",
        try_cast=False,
    ):
    ...
    return self.where(
        self,
        cond,
        other=np.nan,
        inplace=False,
        axis=None,
        level=None,
        errors="raise",
        try_cast=False,
    )

@classmethod 是一个函数修饰符,它表示接下来的是一个类方法,而对于平常我们见到的则叫做实例方法。 类方法的第一个参数cls,而实例方法的第一个参数是self,表示该类的一个实例。
普通对象方法至少需要一个self参数,代表类对象实例
类方法有类变量cls传入,从而可以用cls做一些相关的处理。并且有子类继承时,调用该类方法时,传入的类变量cls是子类,而非父类。 对于类方法,可以通过类来调用,就像C.f(),有点类似C++中的静态方法, 也可以通过类的一个实例来调用,就像C().f(),这里C(),写成这样之后它就是类的一个实例了。
静态方法则没有,它基本上跟一个全局函数相同,一般来说用的很少

python 定义类
class A:
    def __init__(self, arg=1):
        A.arg = arg
        # self.arg = arg


class B:
    def __init__(self, arg=2):
        B.arg = arg
        # self.arg = arg

# 基本的定义方式 class + 类名 + :
# class ClsName:
# 没有参数的话,括号可加可不加
# class ClsName():
# class ClsName(object):
# 如果是继承的话, 括号里跟的是父类,默认的父类都是object,可以省略
# !!!! 注意: 继承的话,如果没有__init__函数,那么会依次从左到右执行父类的__init__函数
# pass关键词:使用pass关键字,表示一个占位符,在程序运行时,此处不会执行任何操作,也能保证程序逻辑的正确性
class ClsName(A, B):
    def __init__(self, arg=3):
        # self.arg = arg
        pass

    # 符号*前面的参数可以带args=也可以不带, *后面的参数必须要带key=
    def f1(self, args='a1', *, key='1'):
        self.args = args
        self.key = key
        return A.arg


if __name__ == '__main__':
    A() # 初始化A,类变量A.arg赋值完成,如果没有这行代码,print(a.f1())会报错
    a = ClsName()
    a.f1('a2', key='2')
    # 类的方法__mro__可以查看继承,所有类的最终父类都是
    print(ClsName.__mro__)
    # 输出: (, , , )
    print(a.f1())
    # 输出: 1

     
scikit-learn数据预处理fit_transform()与transform()的区别

参考(https://me.csdn.net/capecape)

无论是scikit-learn提供的转换器,或是Pipeline,或是FeatureUnion中,
我们使用fit_transform处理完数据后,想要沿用刚刚处理结果中的各项指标,则继续使用transform来处理新的数据即可.
但是如果此时我们调用fit_transform来处理新的数据,则各种指标会在新数据中重新获取,旧的指标清零.
那么会出现:对于新的数据,fit_transform得到的结果跟transform不同,也不符合我们的要求.

未调用过fit_transform直接调用transform会报错.

准确率(查准率),召回率(查全率),真正例率,假正例率区别

https://www.jianshu.com/p/1afbda3a04ab

对于二分类问题:

真正例(TP):实际上是正例的数据点被标记为正例
假正例(FP):实际上是反例的数据点被标记为正例
真反例(TN):实际上是反例的数据点被标记为反例
假反例(FN):实际上是正例的数据点被标记为反例

axis=0和1的理解

https://www.cnblogs.com/rrttp/p/8028421.html

你可能感兴趣的:(python study tips)