36大数据 -Python专栏
Python 是一种高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python 由 Guido van Rossum 于 1989 年底在荷兰国家数学和计算机科学研究所发明,第一个公开发行版发行于 1991 年。
易于学习:Python 有相对较少的关键字,结构简单,和一个明确定义的语法,学习起来更加简单。
易于阅读:Python 代码定义的更清晰。
易于维护:Python 的成功在于它的源代码是相当容易维护的。
一个广泛的标准库:Python 的最大的优势之一是丰富的库,跨平台的,在 UNIX,Windows 和 macOS 兼容很好。
互动模式:互动模式的支持,您可以从终端输入执行代码并获得结果的语言,互动的测试和调试代码片断。
可移植:基于其开放源代码的特性,Python 已经被移植(也就是使其工作)到许多平台。
可扩展:如果你需要一段运行很快的关键代码,或者是想要编写一些不愿开放的算法,你可以使用 C 或 C++ 完成那部分程序,然后从你的 Python 程序中调用。
数据库:Python 提供所有主要的商业数据库的接口。
GUI 编程:Python 支持 GUI 可以创建和移植到许多系统调用。
可嵌入:你可以将 Python 嵌入到 C/C++ 程序,让你的程序的用户获得”脚本化”的能力。
面向对象:Python 是强面向对象的语言,程序中任何内容统称为对象,包括数字、字符串、函数等。
在命令行窗口执行python
后,进入 Python 的交互式解释器。exit()
或 Ctrl + D
组合键退出交互式解释器。
在命令行窗口执行python script-file.py
,以执行 Python 脚本文件。
如果在 Python 脚本文件首行输入#!/usr/bin/env python
,那么可以在命令行窗口中执行/path/to/script-file.py
以执行该脚本文件。
注:该方法不支持 Windows 环境。
默认情况下,3.x 源码文件都是 UTF-8 编码,字符串都是 Unicode 字符。也可以手动指定文件编码:
1
|
-*- coding: utf-8 -*-
|
或者
1
|
encoding: utf-8
|
注意: 该行标注必须位于文件第一行
第一个字符必须是英文字母或下划线 _
。
标识符的其他的部分由字母、数字和下划线组成。
标识符对大小写敏感。
注:从 3.x 开始,非 ASCII 标识符也是允许的,但不建议。
保留字即关键字,我们不能把它们用作任何标识符名称。Python 的标准库提供了一个 keyword 模块,可以输出当前版本的所有关键字:
1
2
3
|
import keyword
[
'False',
'None',
'True',
'and',
'as',
'assert',
'break',
'class',
'continue',
'def',
'del',
'elif',
'else',
'except',
'finally',
'for',
'from',
'global',
'if',
'import',
'in',
'is',
'lambda',
'nonlocal',
'not',
'or',
'pass',
'raise',
'return',
'try',
'while',
'with',
'yield']
|
单行注释采用#
,多行注释采用'''
或"""
。
1
2
3
4
5
6
7
8
9
10
11
12
13
|
# 这是单行注释
'''
这是多行注释
这是多行注释
'''
"""
这也是多行注释
这也是多行注释
"""
|
Python 最具特色的就是使用缩进来表示代码块,不需要使用大括号 {}
。 缩进的空格数是可变的,但是同一个代码块的语句必须包含相同的缩进空格数。缩进不一致,会导致运行错误。
Python 通常是一行写完一条语句,但如果语句很长,我们可以使用反斜杠\
来实现多行语句。
1
2
3
|
total = item_one + \
item_two + \
item_three
|
在 []
, {}
, 或 ()
中的多行语句,不需要使用反斜杠\
。
函数之间或类的方法之间用空行分隔,表示一段新的代码的开始。类和函数入口之间也用一行空行分隔,以突出函数入口的开始。
空行与代码缩进不同,空行并不是 Python 语法的一部分。书写时不插入空行,Python 解释器运行也不会出错。但是空行的作用在于分隔两段不同功能或含义的代码,便于日后代码的维护或重构。
记住:空行也是程序代码的一部分。
input
函数可以实现等待并接收命令行中的用户输入。
1
2
|
content = input(
"\n\n请输入点东西并按 Enter 键\n")
print(content)
|
Python 可以在同一行中使用多条语句,语句之间使用分号;
分割。
1
|
import sys; x =
'hello world'; sys.stdout.write(x +
'\n')
|
缩进相同的一组语句构成一个代码块,我们称之代码组。
像if
、while
、def
和class
这样的复合语句,首行以关键字开始,以冒号:
结束,该行之后的一行或多行代码构成代码组。
我们将首行及后面的代码组称为一个子句(clause)。
print 默认输出是换行的,如果要实现不换行需要在变量末尾加上end=""
或别的非换行符字符串:
1
2
|
print(
'123')
# 默认换行
print(
'123', end =
"")
# 不换行
|
在 Python 用 import
或者 from...import
来导入相应的模块。
将整个模块导入,格式为:import module_name
从某个模块中导入某个函数,格式为:from module_name import func1
从某个模块中导入多个函数,格式为:from module_name import func1, func2, func3
将某个模块中的全部函数导入,格式为:from module_name import *
函数(Functions)是指可重复使用的程序片段。它们允许你为某个代码块赋予名字,允许你通过这一特殊的名字在你的程序任何地方来运行代码块,并可重复任何次数。这就是所谓的调用(Calling)函数。
函数代码块以 def
关键词开头,后接函数标识符名称和圆括号 ()
。
任何传入参数和自变量必须放在圆括号中间,圆括号之间可以用于定义参数。
函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。
函数内容以冒号起始,并且缩进。
return [表达式]
结束函数,选择性地返回一个值给调用方。不带表达式的 return 相当于返回 None。
return
可以返回多个值,此时返回的数据未元组类型。
定义参数时,带默认值的参数必须在无默认值参数的后面。
1
2
|
def 函数名(参数列表):
函数体
|
在 Python 中,类型属于对象,变量是没有类型的:
1
2
3
|
a = [
1,
2,
3]
a =
"Runoob"
|
以上代码中,[1,2,3] 是 List 类型,”Runoob” 是 String 类型,而变量 a 是没有类型,她仅仅是一个对象的引用(一个指针),可以是指向 List 类型对象,也可以是指向 String 类型对象。
在 Python 中,字符串,数字和元组是不可更改的对象,而列表、字典等则是可以修改的对象。
不可变类型:变量赋值 a=5 后再赋值 a=10,这里实际是新生成一个 int 值对象 10,再让 a 指向它,而 5 被丢弃,不是改变a的值,相当于新生成了a。
可变类型:变量赋值 la=[1,2,3,4] 后再赋值 la[2]=5 则是将 list la 的第三个元素值更改,本身la没有动,只是其内部的一部分值被修改了。
Python 函数的参数传递:
不可变类型:类似 c++ 的值传递,如 整数、字符串、元组。如fun(a),传递的只是a的值,没有影响a对象本身。比如在 fun(a)内部修改 a 的值,只是修改另一个复制的对象,不会影响 a 本身。
可变类型:类似 c++ 的引用传递,如 列表,字典。如 fun(la),则是将 la 真正的传过去,修改后fun外部的la也会受影响
Python 中一切都是对象,严格意义我们不能说值传递还是引用传递,我们应该说传不可变对象和传可变对象。
必需参数须以正确的顺序传入函数。调用时的数量必须和声明时的一样。
关键字参数和函数调用关系紧密,函数调用使用关键字参数来确定传入的参数值。 使用关键字参数允许函数调用时参数的顺序与声明时不一致,因为 Python 解释器能够用参数名匹配参数值。
1
2
3
4
5
6
7
|
def print_info(name, age):
"打印任何传入的字符串"
print(
"名字: ", name)
print(
"年龄: ", age)
return
print_info(age=
50, name=
"john")
|
调用函数时,如果没有传递参数,则会使用默认参数。
1
2
3
4
5
6
7
8
|
def print_info(name, age=35):
print (
"名字: ", name)
print (
"年龄: ", age)
return
print_info(age=
50, name=
"john")
print(
"------------------------")
print_info(name=
"john")
|
加了星号 *
的参数会以元组的形式导入,存放所有未命名的变量参数。
如果在函数调用时没有指定参数,它就是一个空元组。我们也可以不向函数传递未命名的变量。
1
2
3
4
5
6
7
8
9
|
def print_info(arg1, *vartuple):
print(
"输出: ")
print(arg1)
for var
in vartuple:
print (var)
return
print_info(
10)
print_info(
70,
60,
50)
|
加了两个星号 **
的参数会以字典的形式导入。变量名为键,变量值为字典元素值。
1
2
3
4
5
6
|
def print_info(arg1, **vardict):
print(
"输出: ")
print(arg1)
print(vardict)
print_info(
1, a=
2, b=
3)
|
Python 使用 lambda 来创建匿名函数。
所谓匿名,意即不再使用 def
语句这样标准的形式定义一个函数。
lambda 只是一个表达式,函数体比 def 简单很多。 lambda 的主体是一个表达式,而不是一个代码块。仅仅能在 lambda 表达式中封装有限的逻辑进去。
lambda 函数拥有自己的命名空间,且不能访问自己参数列表之外或全局命名空间里的参数。 虽然 lambda 函数看起来只能写一行,却不等同于 C 或 C++ 的内联函数,后者的目的是调用小函数时不占用栈内存从而增加运行效率。
1
2
|
# 语法格式
lambda [arg1 [,arg2,.....argn]]:expression
|
未完待续……我们将于近期继续更新关于Python的入门知识,敬请关注。
文章来自博客格物,作者韭白,熟悉 PHP、Go 等后端技术,爱学习、爱分享、爱交流
END“新年新气象,36大数据社群(大数据交流、AI技术学习群、机器人研究、AI+行业、企业合作群)火热招募中,对大数据和AI感兴趣的小伙伴们。增加AI小秘书微信号:a769996688,说明身份即可加入。
欢迎投稿,投稿/合作:[email protected]
如果您觉得文章不错,那就分享到朋友圈~