《利用Python进行数据分析》读书笔记(一)Python Basic

这一系列博客是看《Python for Data Analysis》的读书笔记,只截取了大部分自己认为重要的知识点,不少例子也是来自于书中。本机安装的是python 3.6版本,并使用anaconda安装了jupyter notebook和一些常用模块。

Python Interpreter

在终端命令行输入python指令后调出python交互界面,使用exit()或者Ctrl+D退出python交互界面。在命令行通过python 文件名.py的方式执行python脚本。

$ python hello_world.py
Hello world

IPython Basic

  1. 在命令行输入ipython命令调出ipython交互界面。ipython界面与python界面的区别自己尝试过就能感觉到。

  2. 在命令行输入jupyter notebook命令调出jupyter notebook,当然前提是已经安装了jupyter notebook,jupyter notebook可以很好地将文字与代码合并在一起,是一个很好的工具。

  3. Tab用来在写代码的时候提供提示,起到了代码补全的作用。

    In [1]: an_apple = 27
    
    In [2]: an_example = 42
    
    In [3]: an
    an_apple and an_example any
    

    这里定义了两个an开头的变量,引用变量时输入an后按下tab键会提示出两个可能的选项,如果没有多个选项那么按下tab可以直接补全变量名。能提示的不仅是变量名,还有可能的函数,函数的参数等等,与在开发环境中写代码时软件自带的代码提示功能类似。

  4. 用来显示某个函数或变量的详细信息,相当于文档的功能。

    In [1]: a=[1,2,3]
    
    In [2]: a?
    Type:        list
    String form: [1, 2, 3]
    Length:      3
    Docstring:  
    list() -> new empty list
    list(iterable) -> new list initialized from iterable's items
    
    In [10]: print?
    Docstring:
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file: a file-like object (stream); defaults to the current sys.stdout. sep: stringinsertedbetweenvalues,defaultaspace.
    end: stringappendedafterthelastvalue,defaultanewline.
    flush: whether to forcibly flush the stream.
    Type: builtin_function_or_method
    

    a?会显示出列表的种类、长度等所有详细属性,print?则会显示出函数的一些用法和说明。

  5. ??用来显示自定义函数的源码,用法:函数名??

Python Language Basic

  1. Python相对于C语言或者java语言来说,一个特点就是使用空格取代括号,例如for循环和if语句写法如下:

    for x in array: 
         if x < pivot:
              less.append(x) 
         else:
             greater.append(x)
    
  1. python在每行语句结束时不需要分号结尾

  2. python中的数字、字符串、数据结构、函数、类都是一个python object,有其内部的type和属性。

  3. 使用# 注释内容进行注释。

  4. 在python中,对一个变量赋值即创造了一个引用指向等号右边的元素。例如:

    In [3]: a
    Out[3]: [1, 2, 3]
    
    In [4]: b=a
    
    In [5]: a.append(4)
    
    In [6]: b
    Out[6]: [1, 2, 3, 4]
    

    将a赋值给b时,此时a和b都是指向列表的引用,a和b任意一方对列表进行修改后,另一方的值也会被修改,因为两者的指向是相同的。

a、b都是指向list的一个引用
  1. 对于大多数语言来说,'5'+5的结果可能是10(将'5'转换成int类型的5),也可能是55(将5转换成str类型的'5'),原因是这些语言支持对不同类型变量操作时的自动转换类型。上述情况在python中会直接报错,因为操作的两者数据类型不同。但是在一些很明显的情况下,也是可以执行的,比如4.5/2,一个是float,一个是int,但是得出的结果仍然是float类型的2.25。

  2. isinstance(变量,数据类型)方法可以判断变量是否是某个类型,返回值为TrueFalse。其中数据类型的位置可以为一个元组,意思是判断某个变量是否为多个数据类型中的某个类型。

    In[21]:a=5
    In [22]: isinstance(a, int)
    Out[22]: True
        
    In[23]:a=5;b=4.5
    In [24]: isinstance(a, (int, float))
    Out[24]: True
    In [25]: isinstance(b, (int, float))
    Out[25]: True
    
  3. 对于一个python object,它有很多属性与方法,getattr()方法可以获取这些方法与属性的反射。例如:字符串a有一个split方法,要获取这个方法本身,可以使用如下代码:

     In [27]: getattr(a, 'split')
     Out[27]: 
    
  4. 使用import 模块的方式导入模块,这个不说了。

  5. 运算符操作,即‘+’、‘-’、‘*’、‘/’等等运算符的操作。

  6. is is not ,用法为a is/is not b,用于判断a、b两者的引用是否指向相同元素,常用于判断变量是否为空,需要注意与==的区别,后者是判断两者的内容是否相同。

  7. 大部分Python Object是可变的,也就是说它们的值可以在定义后被修改。

  8. python中,int类型可以存任意位数的整数,float类型默认是64位的浮点数。

  9. 如果想实现c风格整型除法的效果,可以使用 //符号。例如:

    In[52]:3/2 
    Out[52]: 1.5
    
    In[53]:3//2 
    Out[53]: 1
    
  10. 使用单引号双引号表示字符串,多行字符串使用三个双引号。

    a = 'one way of writing a string'
    b = "another way"
    c="""
    This is a longer string that 
    spans multiple lines
    """
    

    Python字符串是不可修改的,字符串定义后就不能使用赋值语句再对其内部字符重新修改。但是可以通过函数修改。

    In [56]: a = 'this is a string'
    In [57]: a[10] = 'f' 
    ----------------------------------------------TypeError Traceback (most recent call last)  in ()
    ----> 1 a[10] = 'f'
    TypeError: 'str' object does not support item assignment
        
    In [58]: b = a.replace('string', 'longer string')
    In [59]: b
    Out[59]: 'this is a longer string'
    
  11. 使用str(value)函数可以将value转成字符串(str)类型。

  12. 在定义字符串的时候,如果不想使用转义字符,那么可以在字符串之前加上r(由raw单词而来)。例如:

    In [69]: s = r'this\has\no\special\characters'
    
    In [70]: s
    Out[70]: 'this\\has\\no\\special\\characters'
    

    如果想表明定义的字符串是byte类型,那么可以在字符串之前加上b(由单词byte而来)。例如:

    In [85]: bytes_val = b'this is bytes'
    In [86]: bytes_val
    Out[86]: b'this is bytes'
    
  13. 字符串的格式化format(),用法为模板.format(参数...)。例如:

    In [74]: template = '{0:.2f} {1:s} are worth US${2:d}'
    In [75]: template.format(4.5560, 'Argentine Pesos', 1)
    Out[75]: '4.56 Argentine Pesos are worth US$1'
    

    模板中的3个{}内容意思如下:

    • {0:.2f}表示将第一个参数格式化为两位小数的浮点数。
    • {1:s}表示将第二个参数格式化为一个字符串。
    • {2:d}表示将第三个参数格式化为一个整数。

    format的参数分别对应模板中的三个参数。

  14. 格式转换函数,float(value)value转成float类型; int(value)value转成int类型,其他类似的函数如byte()bool()同理。

15 . 复合条件语句。使用一个简短的语句来代表一个判断的逻辑操作。复合条件语句的格式如下:

value = true-expr if condition else false-expr

翻译成常规语句就是:

if condition:
     value = true-expr
else:
     value = false-expr

举个例子:

In[126]:x=5
In [127]: 'Non-negative' if x >= 0 else 'Negative' 
Out[127]: 'Non-negative'

翻译过来就是:

if x >= 0:
    print('Non-negative')
else:
    print('Negative')

补充材料

  1. 《利用Python进行数据分析》(http://vdisk.weibo.com/s/CRSj_HCw6WR6)
  2. https://www.jianshu.com/c/52882df3377a?order_by=top

你可能感兴趣的:(《利用Python进行数据分析》读书笔记(一)Python Basic)