2019-06-12

Jupyter Notebook 是一款 Web 应用,它能让用户将上面说的各种窗口里的东西,全部组合到一个可读性好,易于共享,且对新手友好的文档中。这个文档里可以包括:

  • live code (e.g. Python code)
    可执行的代码,比如我们需要的 Python 代码
  • visualizations
    可视化的数据库图表,或者代码执行之后生成的可视化效果,比如 matplotlib 输出的图像等
  • explanatory text (written in markdown syntax)
    各种解释性文字,例如用 markdown 语法写的格式化说明文本,Latex写的数学方程等

因此,你可以方便地一边写代码,一边写许多带格式的注释文本,还能让运行结果实时在页面内显示出来。所以,Jupyter Notebook 很适合以下一些用途使用:

  • 学习并尝试运行 Python 代码,观察其效果

  • 数据处理和转换

  • 数值模拟分析

  • 统计建模

  • 机器学习


    2019-06-12_第1张图片

打开JupyterNoteBook,如下图打开anaconda navigator 菜单选择JupyterNoteBook的launch

2019-06-12_第2张图片

JupyterNoteBook使用方法

  • 快捷键--->help--->Keyboard Shortcuts
1+1
2
  • 下面这个例子range里数字改一下运行
for _ in range(4):
    print('Hello ! 让我一起来数据分析吧')
Hello ! 让我一起来数据分析吧
Hello ! 让我一起来数据分析吧
Hello ! 让我一起来数据分析吧
Hello ! 让我一起来数据分析吧
5+2
7

2 通过快捷键来运行

  • help 下的keyboard shortcut
  1. run cell, select below // shift + enter
5 + 5*2
15
  1. run selected cells // control + enter
9 + 9
18
  1. run cell and insert below // option +enter

VIEW ---> toggle TOOLBAR 和 toggle header 隐藏 toggle line_number 显示行数

in 和 out 代表运行的顺序

3 插入单元格

下面插入是 B 上面是A 单元格绿色是 输入 蓝色是非编辑

markdown 的快捷键是 M
Y是变成代码状态

jp notebook的优点 存储我们之前代码写的变量 然后以交互的形式进行展现

data = [i*2 for i in range(100)]
len(data)
100
data[:10]
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
  • data 一直在内存中 我们要加载一个很大的数据,只需要一个加载一次就可以
  • 在前面可以使用未声明的变量 (特点) data[-1] 插入到上面的某一行演示

Kernel 有重启运行 重新运行上面的会报错

Jupyter NOTEBOOK高级 :魔法命令

%run 后面跟一个地址

  • 调用自己写的代码 比如用pycharm 写的
def hello(name):
    print('Hello', name, '!')

hello("neuedu")

hello.py存在myscript/文件夹中,我们使用 %run来运行
%run myscript/hello.py
Hello neuedu !
这是hello()函数也加载到内存中
hello('刘强东')
Hello 刘强东 !
  • 加载模块
    在工程中新建mymodule包然后在包中新建FirstDemo.py文件
def predict(x):
    print('听说班长今晚请吃饭')
import mymodule.FirstDemo 
mymodule.FirstDemo.predict('x')
听说班长今晚请吃饭

也可以这样引入

from mymodule import FirstDemo as fd
fd.predict(1)
听说班长今晚请吃饭
  • 函数的注释
print? # 会显示print函数的信息
print??# 会显示print函数的详细信息

%timeit测试时间

%timeit 只能接一句话

  • 执行了1000次 由jupterNotebook 决定次数
%timeit L = [i**2 for i in range(1000)]
307 µs ± 15 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

时间复杂度 O(n) 级别 线性的

%timeit L = [i**2 for i in range(1000000)]
362 ms ± 19.6 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
%timeit L = [i**2 for i in range(10)]
3.34 µs ± 264 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
  • 接多行的写法
%%timeit
L = []
for n in range(1000):
    L.append(n ** 2)
352 µs ± 5.21 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

列表生成式要比 for循环快

%time

%time L = [i**2 for i in range(1000)]
CPU times: user 329 µs, sys: 0 ns, total: 329 µs
Wall time: 333 µs

cpu时间 usertime systime totaltime walltime是人类真正感知到的时间 多线程 cpu < wall

比上面的时间长是因为之前的是去7次最快的 跟当前操作系统的调度任务有关系

%time 区域

%%time
L = []
for n in range(1000):
    L.append(n ** 2)
CPU times: user 835 µs, sys: 1 µs, total: 836 µs
Wall time: 844 µs

陷阱

import random
L = [random.random() for i in range(100000)]
%timeit L.sort()
2.09 ms ± 150 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
L = [random.random() for i in range(100000)]
%time L.sort()
CPU times: user 33.1 ms, sys: 678 µs, total: 33.8 ms
Wall time: 33.7 ms
%time L.sort()
CPU times: user 2.58 ms, sys: 19 µs, total: 2.6 ms
Wall time: 2.62 ms

为什么会产生这么大的差距呢 python对已经排好序的有优化 乱序的数组有相应复杂的操作
三路快排算法 归并排序算法 加入优化算法以后 对于已经有序的数组的是 O(n) 对于乱序是On (log n)

其他魔法命令

%lsmagic
Available line magics:
%alias  %alias_magic  %autocall  %automagic  %autosave  %bookmark  %cat  %cd  %clear  %colors  %config  %connect_info  %cp  %debug  %dhist  %dirs  %doctest_mode  %ed  %edit  %env  %gui  %hist  %history  %killbgscripts  %ldir  %less  %lf  %lk  %ll  %load  %load_ext  %loadpy  %logoff  %logon  %logstart  %logstate  %logstop  %ls  %lsmagic  %lx  %macro  %magic  %man  %matplotlib  %mkdir  %more  %mv  %notebook  %page  %pastebin  %pdb  %pdef  %pdoc  %pfile  %pinfo  %pinfo2  %popd  %pprint  %precision  %profile  %prun  %psearch  %psource  %pushd  %pwd  %pycat  %pylab  %qtconsole  %quickref  %recall  %rehashx  %reload_ext  %rep  %rerun  %reset  %reset_selective  %rm  %rmdir  %run  %save  %sc  %set_env  %store  %sx  %system  %tb  %time  %timeit  %unalias  %unload_ext  %who  %who_ls  %whos  %xdel  %xmode

Available cell magics:
%%!  %%HTML  %%SVG  %%bash  %%capture  %%debug  %%file  %%html  %%javascript  %%js  %%latex  %%markdown  %%perl  %%prun  %%pypy  %%python  %%python2  %%python3  %%ruby  %%script  %%sh  %%svg  %%sx  %%system  %%time  %%timeit  %%writefile

Automagic is ON, % prefix IS NOT needed for line magics.

魔法命令的详细描述

%run?
%pwd
'/Users/ericli/Desktop/JupyterBase'
%matplotlib
Using matplotlib backend: MacOSX

很重要 有可能图不会出现或者无法控制绘画

Unix shell命令

# !ls

你可能感兴趣的:(2019-06-12)