持续修正
analytical method 分析法
analytic 学问
analytics 工具合集
python 解释性语言 写一批翻译一批 Java 写一行翻译一行
解释器/翻译器 C编译的CPython Java编译的JPython
包的管理器(package installer for Python) pip conda 两者都是服务器 conda上面的包的来源更多。pip服务器在国外,下载过程中可能会掉。 包的下载 安装删除更新
scipad->pandas->numpy相互之间的关系是逐步基于前者进行开发的。
门户 所有资源的集成
anaconda可以一站式安装完 编辑器 解释器 模块/包 包管理器 门户 minconda比较小,不含有包.
IPython是jupyter的核,前身。默认情况下x和y同时输出只会输出一个,要改设置。
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = ‘all’
PEP8 八荣八耻
python其实是需要定义的,说不需要定义的都是耍流氓
python里面有一些特殊命令符号,比如#注释,%魔术命令,@装饰器,pip命令,!的conda命令。 %whos
是搜索路径下已经定义的所有变量。
关于赋值: 同一个赋值语言,a = ‘hello’
,python是将a和’hello’分别存储在两个空间,a存放’hello’的地址。但是在c语言里面是开辟一个a的空间,里面存储’hello’。java的8以后也沿用了这种类似指针的存储方法。
Python是一个动态的语言。其实是静态的,只不过,a里面永远都是存了一个地址。因此也会说Python是一个引用型的语言。
如果有对a的第二次定义,那么第一次定义的内容就被迫放在回收站了,再也找不到了。
Python是一个函数问题,没有函数的语句不存在,没有运算符的概念。常见的‘+’只是把函数变成了运算符的样式。小问题找函数,大问题找包。包里也是函数。
help() #dosStrinng
print? #这是jupyter的语法,不是python的语法。
句式、在后面添加文本:print(x,end = ‘wangjing’)
Pyhton的数据类型比较隐晦。比如加上单引号或者双引号就是字符串。
汇编语言讨好计算机,Python讨好人,一切都是对象。Python运算比较慢。Python绝大多数的内置函数是C语言或者Java写出来的。
Python的容器。列表元组序列迭代器装饰器。其中可变数组叫列表List 不可变的数组叫元组Tuple[ˈtʌpəl],这两个是Python中有序的。字典和集合是无序的。
元组:(1,2,3)
列表:[1,2,3]
集合{1,2,3}
字典dic:{’‘a’’:1,’‘b’’:2,’‘c’’:3}(字典的本质是集合,键值对,无顺序要求,无下标概念)键的值必须加引号,否则显示未定义。
Python数据类型
int(整数)不可变(无序)
float(实数)不可变(无序)
str(字符串)不可变(有序)/序列类型sequence
list(列表)可变(有序)/序列类型
tuple(元组)不可变(有序)/序列类型
set(集合)可变(无序)/重复过滤
dict(字典)可变(无序)/重复过滤
1.’关于有序和无序的运行区别:
首先, 这里的顺序是指下标。
当对无序的组进行序号上的赋值时,会报错type error
2.所谓元素可变和不可变,是说不能改变其中的一个元素,但是可以整体重新赋值进行改变。frozenset可进行冻结。
3.重复过滤。由于集合的互异性,无序性。重复的元素不会进行输出。而且在jupyter notebook的作用下,会按照大小顺序进行输出。实际上还是没有顺序。可以利用set函数对数据进行过滤。其中key相同才过滤。
4.字典,如想定位就找其中的键定位到其中的一个值。直接给出dic = {‘a’}时,a可能是键,也可能是下标。这里涉及到隐式索引和显示索引的知识,下次细说。
缩进的第一行从冒号开始,jupyter回车自动空格。
一个程序由多个模块(py文件)组成,每个模块由语句组成,语句由函数和符号组成。
在大数据分析中,内存很重要。如果没有作用的话就不会运行。因此惰性运算是有利的。与此相对应的概念是急性运算。
比如随机函数。输入range(a,b,c)(a,b,c都是数值,从a开始,小于数值b,间隔为c)(取值参考左开右闭)(a可以省略,默认从0开始,c可以省略,默认是1),直接运行这句话之后直接输出range(0,12)。Spark也是这样。
取消惰性的技巧,比如加个*可以进行拆包
print(range(0,12,10))
print(*range(0,12,10))
list(range(0,11,1))