Jupyter Notebook 是一款 Web 应用,它能让用户将上面说的各种窗口里的东西,全部组合到一个可读性好,易于共享,且对新手友好的文档中。这个文档里可以包括:
- live code (e.g. Python code)
可执行的代码,比如我们需要的 Python 代码 - visualizations
可视化的数据库图表,或者代码执行之后生成的可视化效果,比如 matplotlib 输出的图像等 - explanatory text (written in markdown syntax)
各种解释性文字,例如用 markdown 语法写的格式化说明文本,Latex写的数学方程等
因此,你可以方便地一边写代码,一边写许多带格式的注释文本,还能让运行结果实时在页面内显示出来。所以,Jupyter Notebook 很适合以下一些用途使用:
学习并尝试运行 Python 代码,观察其效果
数据处理和转换
数值模拟分析
统计建模
-
机器学习
打开JupyterNoteBook,如下图打开anaconda navigator 菜单选择JupyterNoteBook的launch
JupyterNoteBook使用方法
- 快捷键--->help--->Keyboard Shortcuts
1+1
2
- 下面这个例子range里数字改一下运行
for _ in range(4):
print('Hello ! 让我一起来数据分析吧')
Hello ! 让我一起来数据分析吧
Hello ! 让我一起来数据分析吧
Hello ! 让我一起来数据分析吧
Hello ! 让我一起来数据分析吧
5+2
7
2 通过快捷键来运行
- help 下的keyboard shortcut
- run cell, select below // shift + enter
5 + 5*2
15
- run selected cells // control + enter
9 + 9
18
- run cell and insert below // option +enter
VIEW ---> toggle TOOLBAR 和 toggle header 隐藏 toggle line_number 显示行数
in 和 out 代表运行的顺序
3 插入单元格
下面插入是 B 上面是A 单元格绿色是 输入 蓝色是非编辑
markdown 的快捷键是 M
Y是变成代码状态
jp notebook的优点 存储我们之前代码写的变量 然后以交互的形式进行展现
data = [i*2 for i in range(100)]
len(data)
100
data[:10]
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
- data 一直在内存中 我们要加载一个很大的数据,只需要一个加载一次就可以
- 在前面可以使用未声明的变量 (特点) data[-1] 插入到上面的某一行演示
Kernel 有重启运行 重新运行上面的会报错
Jupyter NOTEBOOK高级 :魔法命令
%run 后面跟一个地址
- 调用自己写的代码 比如用pycharm 写的
def hello(name):
print('Hello', name, '!')
hello("neuedu")
hello.py存在myscript/文件夹中,我们使用 %run来运行
%run myscript/hello.py
Hello neuedu !
这是hello()函数也加载到内存中
hello('刘强东')
Hello 刘强东 !
- 加载模块
在工程中新建mymodule包然后在包中新建FirstDemo.py文件
def predict(x):
print('听说班长今晚请吃饭')
import mymodule.FirstDemo
mymodule.FirstDemo.predict('x')
听说班长今晚请吃饭
也可以这样引入
from mymodule import FirstDemo as fd
fd.predict(1)
听说班长今晚请吃饭
- 函数的注释
print? # 会显示print函数的信息
print??# 会显示print函数的详细信息
%timeit测试时间
%timeit 只能接一句话
- 执行了1000次 由jupterNotebook 决定次数
%timeit L = [i**2 for i in range(1000)]
307 µs ± 15 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
时间复杂度 O(n) 级别 线性的
%timeit L = [i**2 for i in range(1000000)]
362 ms ± 19.6 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
%timeit L = [i**2 for i in range(10)]
3.34 µs ± 264 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
- 接多行的写法
%%timeit
L = []
for n in range(1000):
L.append(n ** 2)
352 µs ± 5.21 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
列表生成式要比 for循环快
%time
%time L = [i**2 for i in range(1000)]
CPU times: user 329 µs, sys: 0 ns, total: 329 µs
Wall time: 333 µs
cpu时间 usertime systime totaltime walltime是人类真正感知到的时间 多线程 cpu < wall
比上面的时间长是因为之前的是去7次最快的 跟当前操作系统的调度任务有关系
%time 区域
%%time
L = []
for n in range(1000):
L.append(n ** 2)
CPU times: user 835 µs, sys: 1 µs, total: 836 µs
Wall time: 844 µs
陷阱
import random
L = [random.random() for i in range(100000)]
%timeit L.sort()
2.09 ms ± 150 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
L = [random.random() for i in range(100000)]
%time L.sort()
CPU times: user 33.1 ms, sys: 678 µs, total: 33.8 ms
Wall time: 33.7 ms
%time L.sort()
CPU times: user 2.58 ms, sys: 19 µs, total: 2.6 ms
Wall time: 2.62 ms
为什么会产生这么大的差距呢 python对已经排好序的有优化 乱序的数组有相应复杂的操作
三路快排算法 归并排序算法 加入优化算法以后 对于已经有序的数组的是 O(n) 对于乱序是On (log n)
其他魔法命令
%lsmagic
Available line magics:
%alias %alias_magic %autocall %automagic %autosave %bookmark %cat %cd %clear %colors %config %connect_info %cp %debug %dhist %dirs %doctest_mode %ed %edit %env %gui %hist %history %killbgscripts %ldir %less %lf %lk %ll %load %load_ext %loadpy %logoff %logon %logstart %logstate %logstop %ls %lsmagic %lx %macro %magic %man %matplotlib %mkdir %more %mv %notebook %page %pastebin %pdb %pdef %pdoc %pfile %pinfo %pinfo2 %popd %pprint %precision %profile %prun %psearch %psource %pushd %pwd %pycat %pylab %qtconsole %quickref %recall %rehashx %reload_ext %rep %rerun %reset %reset_selective %rm %rmdir %run %save %sc %set_env %store %sx %system %tb %time %timeit %unalias %unload_ext %who %who_ls %whos %xdel %xmode
Available cell magics:
%%! %%HTML %%SVG %%bash %%capture %%debug %%file %%html %%javascript %%js %%latex %%markdown %%perl %%prun %%pypy %%python %%python2 %%python3 %%ruby %%script %%sh %%svg %%sx %%system %%time %%timeit %%writefile
Automagic is ON, % prefix IS NOT needed for line magics.
魔法命令的详细描述
%run?
%pwd
'/Users/ericli/Desktop/JupyterBase'
%matplotlib
Using matplotlib backend: MacOSX
很重要 有可能图不会出现或者无法控制绘画
Unix shell命令
# !ls