数据挖掘会用到 Matplotlib、Numpy、Pandas、Ta-Lib等许多库,我们可以使用 pip 来安装各种库,但是这样并不便于库的管理和下载,推荐使用 Anaconda 软件进行库的下载, Anaconda 下载后带有Python解释器
Anaconda 是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。 其包含了大量的科学包,应且易于管理和下载
鉴于国外网站下载速度较慢,可以通过下方清华大学的软件镜像来进行安装
选择合适自己操作系统和位数的版本下载即可,可以找到最新版进行下载
在安装过程中推荐增加环境变量安装,否则后续自己进行环境变量的增加会很麻烦
安装完后在开始菜单找到快捷方式使用即可
Anaconda 中集成了许多有用的库,另外可以通过 all——库名搜索 来下载其他库
在 Home 中还有其他已安装的可用的工具,如:Jupyter Notebook 可供使用
这样,我们想要下载库的时候可以直接在 Anaconda 中下载,而不需要 pip 来下载了
在 PyCharm 中新建项目,选择如下设置:
即可完成关联到 Anaconda 的库,可以在 main.py 中尝试导入
在后续的数据挖掘中,我们需要用到的库有:
import matplotlib
import numpy
import pandas
import talib
import tables
import jupyter
其中,作者本人在 Anaconda 中找了一下,除了 talib 库,其他库都已经有了(没有的在 Anaconda 中下载即可)
并且 talib 库在 Anaconda 中还找不到…可能可以通过更换下载源来安装,但作者本人没有尝试过,所以可以通过 pip 来进行手动安装
这个时候就需要用 pip 来手动安装 TA_Lib 了
首先通过下面的网址把 TA_Lib 下载下来
推荐把下载后的文件放到 Anaconda 统一的库里面
随后要通过 Anaconda Prompt 来进行安装, Anaconda Prompt 是 Anaconda 下载后的附加程序,在开始菜单里可以找到
在 Anaconda Prompt 中输入以下命令,进入 TA-Lib 文件所在的目录:
D:
D:\Anaconda3-2020.11-Windows-x86_64\Lib\site-packages
pip install TA_Lib-0.4.19-cp38-cp38-win_amd64.whl
import talib
Jupyter Notebook 源于2014年的 IPython 项目,并逐渐发展成为支持跨所有编程语言的交互式数据科学计算的工具
打开 Jupyter Notebook :
(1)方法一:在下载 Anaconda 后,在开始菜单种会有一个 Jupyter Notebook (Anaconda3…) 的应用,点击即可打开 Jupyter Notebook
(2)方法二:打开 Anaconda ,在 Home 界面中找到 Jupyter Notebook 点击 Launch 打开即可
修改 Jupyter Notebook 默认打开浏览器方法:
用 Win + R 快捷键打开 cmd 终端,输入如下的指令,查看 jupyter_notebook_config.py 文件的路径
jupyter notebook --generate-config
使用 PyCharm 打开该文件,找到 # c.NotebookApp.browser = ''
字句,这段就是用来配置默认打开方式的,在这句话的正下方增加代码:
# c.NotebookApp.browser = ''
import webbrowser
webbrowser.register("chrome",None,webbrowser.GenericBrowser(u"C:\\Program Files (x86)\\Google\\Chrome\\Application\\chrome.exe"))
c.NotebookApp.browser = 'chrome'
由于 Jupyter Notebook 是从 IPython 发展而来的,因此其基本的代码编辑跟 IPython 是很相似的
选项 | 含义 |
---|---|
File→Download as | 另存为其他格式的文件 |
Kernel→Interrupt | 中断代码的执行 |
Kernel→Restart | 重启Python内核(执行速度过慢时重置全部资源) |
Kernel→Restart & Clear Output | 重启并清除所有输出 |
Kernel→Restart & Run All | 重启并重新运行所有代码 |
cell——一对 In Out 会话被视作一个代码单元,称为 cell
Jupyter Notebook 支持两种模式:
快捷键 | 模式切换 |
---|---|
Enter | 命令模式→编辑模式 |
Esc | 编辑模式→命令模式 |
快捷键 | 含义 |
---|---|
Shift + Enter | 编译运行本单元代码,并跳转到下一单元 |
Ctrl + Enter | 编译运行本单元代码,留在本单元 |
Enter | 换行 |
命令模式:
快捷键 | 含义 |
---|---|
A | 在当前cell上添加cell |
B | 在当前cell下添加cell |
D + D(按两下D) | 删除当前cell |
Z | 撤回上一次操作 |
Y | cell切换到 Code 模式 |
M | cell切换到 Markdown 模式 |
编辑模式:
快捷键 | 含义 |
---|---|
Ctrl + 鼠标左击 | 多光标模式 |
Ctrl + Z | 撤回上一步输入 |
Ctrl + Y | 重做 |
Tab | 补全代码 |
Ctrl + / | 添加/取消单行注释 |
进入 Markdown 模式——在 CSDN 上写过博文的小伙伴应该对 Markdown 不陌生了
Shift + Enter 运行后,出来的结果如图:
除此之外,更多更复杂的 Markdown 编辑可以参考 CSDN→个人主页→管理博客 左上方的 Markdown编辑器 进行参考