gongyouliu01

「Python数据挖掘系列」1. Python 库入门

来源 | Python Data Analysis 3rd Edition

作者 | Navlani，et al.

翻译 | Harper

校对 | gongyouliu

编辑 | auroral-L

全文共9691字，预计阅读时间45分钟。

第一章 Python 库入门

1. 了解数据分析

2. 数据分析的标准流程

3. KDD流程

4. SEMMA

5. CRISP-DM

6. 比较数据分析和数据科学

6.1 数据分析师和数据科学家的角色

7. 数据分析师和数据科学家的技能

8. 安装 Python 3

8.1 Windows 上的 Python 安装和设置

8.2 在 Linux 上安装和设置 Python

8.3 使用 GUI 安装程序在 Mac OS X 上进行 Python 安装和设置

8.4 使用 brew 在 Mac OS X 上进行 Python 安装和设置

9. 本书中使用的软件

10. 使用 IPython 作为 shell

10.1 阅读手册页

10.2 在哪里可以找到对 Python 数据分析库的帮助和参考呢？

11. 使用 JupyterLab

12. 使用 Jupyter 笔记本

13. Jupyter 笔记本的高级功能

13.1 键盘快捷键

13.2 安装其他内核

13.3 运行 shell 命令

13.4 Notebook 扩展

14. 总结

众所周知，Python已成为最受欢迎的标准语言之一，并且是基于数据科学的操作的完整软件包。Python提供了许多库，例如NumPy，Pandas，SciPy，Scikit-Learn，Matplotlib，Seaborn和Plotly。这些库提供了一个完整的数据分析生态系统，供数据分析师，数据科学家和业务分析师使用。Python还提供了其他功能，例如灵活性，易于学习，开发速度快，活跃的社区以及在复杂的数字，科学和研究应用程序上工作的能力。所有这些功能使其成为数据分析的首选。

在本章中，我们将重点介绍各种数据分析过程，例如KDD，SEMMA和CRISP-DM。之后，我们将对数据分析和数据科学进行比较，以及对于数据分析师和数据科学家的角色和不同技能进行比较。最后，我们将转移工作重点，并开始安装各种Python库，IPython，Jupyter Lab和Jupyter笔记本。我们还将介绍Jupyter Notebook的各种高级功能。

1. 了解数据分析

我们生活在21世纪这个信息时代，这意味着我们日常生活的几乎每个方面都在生成数据。不仅如此，企业运营，政府运营和社会岗位也在生成大量数据。由于业务，政府，科学，工程，健康，社会，气候和环境等方面在不断产生数据，因此数据在日复一日地积累。在这所有的领域中，我们需要一个系统的、通用的、有效的和灵活的系统来进行分析和研究，以便我们能够洞悉正在生成的数据。

在当今的智能世界中，数据分析为企业和政府运营提供了有效的决策流程。数据分析是检查，预处理，探索，描述和可视化给定数据集的活动。数据分析过程的主要目标是发现决策所需的信息。数据分析提供了多种方法，工具和技术。所有这些方法都可以应用于各个领域，例如商业，社会科学和基础科学。

接下来让我们看一下Python生态系统的一些核心基础数据分析库：

NumPy：这是数字Python的简写形式。它是Python中最强大的科学库，用于处理多维数组，矩阵和方法，以便有效地计算数学问题。

SciPy：这也是一个功能强大的科学计算库，用于执行科学，数学和工程运算。

Pandas：这是一个数据探索和操作库，提供表格格式的数据结构，例如DataFrames以及用于数据分析和操作的各种方法。

Scikit-learn：代表“机器学习的科学工具包”。它是一个机器学习库，提供了各种有监督和无监督的算法，例如回归，分类，降维，聚类分析和异常检测。

Matplotlib：这是一个核心的数据可视化库，并且是Python中所有其他可视化库的基础库。它提供2D和3D绘图，图形，图表以及用于数据浏览的图形。它在NumPy和SciPy之上运行。

Seaborn：这是基于Matplotlib的，提供了易于绘制，高层次，互动性和更有条理的平面图。

Plotly：Plotly是一个数据可视化库。它提供了高质量的交互式图表，例如散点图，折线图，条形图，直方图，箱形图，热图和子图。

必要时，本书将提供所需库和软件的安装说明。同时，我们将讨论各种数据分析过程，例如标准过程，KDD，SEMMA和CRISP-DM。

2. 数据分析的标准流程

数据分析是指调查数据，从中寻找有意义的见解，并得出结论。此过程的主要目标是收集，过滤，清理，转换，探索，描述，可视化和交流来自这些数据的见解，以发现决策信息。通常，数据分析过程包含以下内容：

〇收集数据：从多个来源收集和聚合数据。

〇预处理数据：过滤，清理数据并将其转换为所需的格式。

〇分析和发现见解：探索，描述和可视化数据，并找到见解和结论。

〇见解解释：了解见解并找到每个变量对系统的影响。

〇讲故事：以故事的形式传达你的结果，以便外行可以理解它们。

我们可以通过以下流程图总结数据分析过程的这些步骤：

在本节中，我们介绍了标准的数据分析过程，该过程强调寻找可解释的见解并将其转换为用户故事。在下一节中，我们将讨论KDD流程。

3. KDD流程

KDD是一个缩写，代表从数据中发现知识或在数据库中发现知识。许多人将KDD视为数据挖掘的代名词。数据挖掘被称为有趣模式的知识发现过程。KDD的主要目标是从大型数据库，数据仓库以及其他Web和信息存储库中提取或发现隐藏的有趣模式。KDD流程分为七个主要阶段：

〇数据清理：在此第一阶段，对数据进行预处理。此处，消除了噪声，处理了缺失值，并检测了异常值。

〇数据集成：在此阶段，使用数据迁移和ETL工具将来自不同来源的数据合并和集成在一起。

〇数据选择：在此阶段，将收集与分析任务相关的数据。

〇数据转换：在此阶段，将以所需的适当形式设计数据以进行分析。

〇数据挖掘：在此阶段，数据挖掘技术用于发现有用和未知的模式。

〇模式评估：在此阶段，对提取的模式进行评估。

〇知识呈现：在模式评估之后，需要对提取的知识进行可视化处理，并呈现给业务人员以用于决策。

下图显示了完整的KDD过程：

KDD是提高数据质量，集成和转换以获得更完善系统的迭代过程。接下来，我们来讨论SEMMA流程。

4. SEMMA

SEMMA首字母缩略词的完整格式为“采样”，“浏览”，“修改”，“模型”和“评估”。按此顺序的数据挖掘过程是由SAS开发的。SEMMA流程分为五个主要阶段：

〇采样：在此阶段，我们将识别不同的数据库并将其合并。之后，我们选择用于建模过程的数据样本。

〇探索：在此阶段，我们了解数据，发现变量之间的关系，将数据可视化，并获得初步的解释。

〇修改：在此阶段，准备数据进行建模。此阶段涉及处理缺失值，检测异常值，转换要素以及创建新的附加要素。

〇模型：在此阶段，主要关注的是选择和应用不同的建模技术，例如线性和逻辑回归，反向传播网络，KNN，支持向量机，决策树和随机森林。

〇评估：在最后一个阶段，使用绩效评估方法对已开发的预测模型进行评估。

下图显示了SEMMA过程：

上图显示了SEMMA过程中涉及的步骤。SEMMA强调模型的建立和评估。现在，让我们讨论一下CRISP-DM的过程。

5. CRISP-DM

CRISP-DM的完整格式是CRoss-InduStry Process for Data Mining。CRISP-DM是一个定义明确，结构合理且经过验证的流程，用于机器学习，数据挖掘和商业智能项目。它是一种健壮，灵活，循环，有用和实用的方法，用来解决业务问题。该过程从各个数据库发现隐藏的有价值的信息或模式。CRISP-DM流程分为六个主要阶段：

〇业务了解：在此第一阶段，主要目标是了解业务场景和设计分析目标和初始行动计划的要求。

〇数据理解：在此阶段，主要目标是了解数据及其收集过程，执行数据质量检查并获得初步见解。

〇数据准备：在此阶段，主要目标是准备可用于分析的数据。这涉及处理缺失值，离群值检测和处理，数据归一化以及特征工程。对于数据科学家/分析人员而言，此阶段最耗时。

〇建模：这是整个过程中最令人兴奋的阶段，因为在此阶段中，你出于预测目的设计模型。首先，分析人员需要确定建模技术并根据数据开发模型。

〇评估：模型开发完成后，就可以使用模型评估措施（例如MSE，RMSE，R-Square回归和准确性，精度，召回率和F1措施）在验证和测试数据上评估和测试模型的性能。

〇部署：在此最后阶段，将在上一步中选择的模型部署到生产环境中。这需要数据科学家，软件开发人员，DevOps专家和业务专业人员的团队合作。

下图显示了CRISP-DM过程的完整周期：

标准过程侧重于发现见解并以故事形式进行解释，而KDD侧重于数据驱动的模式发现并对其进行可视化。SEMMA主要专注于模型构建任务，而CRISP-DM专注于业务理解和部署。现在我们了解了数据分析的一些过程，下面我们比较一下数据分析和数据科学，以发现它们之间的关系以及使它们彼此不同的原因。

6. 比较数据分析和数据科学

数据分析是探索数据，以发现有助于我们做出业务决策的模式的过程。它是数据科学的子领域之一。数据分析方法和工具已被业务分析师，数据科学家和研究人员广泛用于多个业务领域。其主要目标是提高生产力和利润。数据分析从不同来源提取和查询数据，进行探索性数据分析，可视化数据，准备报告，并将其提供给业务决策机构。另一方面，数据科学是一个跨学科领域，它使用科学方法从结构化和非结构化数据中提取见解。数据科学是所有术语的结合，包括数据分析，数据挖掘，机器学习和其他相关领域。数据科学不仅限于探索性数据分析，还用于开发模型和预测算法，例如股票价格，天气，疾病，欺诈预测以及诸如电影，书籍和音乐推荐之类的推荐。

6.1 数据分析师和数据科学家的角色

数据分析师收集，过滤，处理和应用所需的统计知识以从数据中捕获模式，趋势和见解，并准备用于决策的报告。数据分析师的主要目标是使用发现的模式和趋势来帮助公司解决业务问题。数据分析师还评估数据的质量并处理与数据获取有关的问题。数据分析师应精通编写SQL查询，发现模式，使用可视化工具和使用报告工具，例如Microsoft Power BI，IBM Cognos，Tableau，QlikView，Oracle BI等。

数据科学家比数据分析师更具技术性和数学能力。数据科学家以研究和学术为导向，而数据分析师则以应用程序为导向。数据科学家会预测未来的事件，而数据分析师则从数据中提取重要的见解。数据科学家会提出自己的问题，而数据分析师会找到给定问题的答案。最后，数据科学家专注于将要发生的事情，而数据分析师则专注于迄今为止发生的事情。我们可以使用下表总结这两个角色：

特点	数据科学家	数据分析师
背景	根据数据预测未来事件和场景	从数据中发现有意义的见解。
角色作用	提出可以使企业受益的问题	解决业务问题以做出决策。
数据类型	处理结构化和非结构化数据	仅适用于结构化数据
编程方式	高级编程	基础编程
技能	统计知识，机器学习算法，NLP和深度学习	统计，SQL和数据可视化方面的知识
工具	R，Python，SAS，Hadoop，Spark，TensorFlow和Keras	Excel，SQL，R，Tableau和QlikView

既然我们知道了数据分析师和数据科学家的定义，以及它们之间的区别，那么让我们来看看你要成为其中之一需要具备的各种技能。

7. 数据分析师和数据科学家的技能

数据分析师是从数据中发现见解并从中创造价值的人。这有助于决策者了解企业的经营状况。数据分析师必须具备以下技能：

〇探索性数据分析（EDA）：EDA是数据分析人员的一项必不可少的技能。它有助于检查数据以发现模式，检验假设并确定假设。

〇关系数据库：必须至少了解一种关系数据库工具，例如MySQL或PostgreSQL是处理关系数据库所必需的。

〇可视化和BI工具：图片胜于言语。视觉对人类的影响更大，视觉是代表见解的一种简单明了的选择。可视化和BI工具（例如Tableau，QlikView，MS Power BI和IBM Cognos）可以帮助分析师可视化和准备报告。

〇电子表格：必须具备MS Excel，WPS，Libra或Google表格的知识，才能以表格形式存储和管理数据。

〇讲故事和演示技能：讲故事的艺术是另一项必要技能。数据分析师应该是将数据事实与想法或事件联系起来并将其转化为故事的专家。

另一方面，数据科学家的主要工作是使用数据解决问题。为此，他们需要了解客户的要求，他们的领域，他们的问题空间，并确保他们得到真正想要的东西。数据科学家承担的任务因公司而异。一些公司使用数据分析师并提供数据科学家的头衔，这只是为了美化职位。有些将数据分析师的任务与数据工程师结合在一起，并指定为数据科学家。其他的则赋予他们在计算机上执行密集数据可视化的任务。

数据科学家必须精通各行各业，要“多戴帽子”，包括数据分析师，统计学家，数学家，程序员，ML或NLP工程师的帽子。大多数人在所有这些行业中都不足够熟练或不是专家。另外，要想变得足够熟练，就需要大量的努力和耐心。这就是为什么在3到6个月内无法学习数据科学的原因。学习数据科学是一段旅程。数据科学家应具有多种技能，例如：

〇数学和统计学：大多数机器学习算法都基于数学和统计学。数学知识可帮助数据科学家开发定制解决方案。

〇数据库：SQL知识使数据科学家可以与数据库进行交互并收集数据以进行预测和推荐。

〇机器学习：对有监督的机器学习技术（例如回归分析，分类技术）和无监督的机器学习技术（例如聚类分析，离群值检测和降维）的了解。

〇编程技巧：编程知识可帮助数据科学家自动化其建议的解决方案。建议了解Python和R。

〇讲故事和演示技巧：通过PowerPoint演示以讲故事的形式交流结果。

〇大数据技术：对Hadoop和Spark等大数据平台的了解有助于数据科学家为大型企业开发大数据解决方案。

〇深度学习工具：TensorFlow和Keras等深度学习工具用于NLP和图像分析。

除了这些技能之外，还需要具备用于从各种来源提取数据的Web抓取程序包/工具的知识，以及用于设计原型解决方案的Web应用程序框架（例如Flask或Django）的知识。一切都与数据科学专业人员的技能有关。

既然我们已经介绍了数据分析和数据科学的基础知识，那么让我们深入了解开始进行数据分析所需的基本设置。在下一节中，我们将学习如何安装Python。

8. 安装Python 3

可以从官方网站轻松下载用于安装Python 3的安装程序文件（https://www.python.org/downloads/）适用于Windows，Linux和Mac 32位或64位系统。双击安装程序即可安装。此安装程序还具有一个名为“ IDLE”的IDE，可用于开发。在接下来的几节中，我们将更深入地研究每个操作系统。

8.1 Windows上的Python安装和设置

本书基于最新的Python 3版本。本书中将使用的所有代码都是用Python 3编写的，因此，在开始编码之前，我们需要安装Python 3。Python是一种开源，分布式且可免费使用的语言。它也被可用于商业用途。Python有许多种版本的实现，包括商业实现和发行版。在本书中，我们将重点介绍标准的Python实现，该实现可保证与NumPy兼容。

你可以从Python官方网站https://www.python.org/downloads/下载Python3.9.x。在这里，你可以找到Windows，Linux，Mac OS X和其他OS平台的安装文件。你可以在https://docs.python.org/3.7/using/index.html上找到有关在各种操作系统上安装和使用Python的说明。

你需要在系统上安装Python 3.5.x或更高版本。Python 2.7的停止维护日期已从2015年移至2020年，但在撰写本文时，Python社区将不支持和维护Python 2.7。

在撰写本书时，我们已在Windows 10虚拟机上安装了Python 3.8.3作为必备软件：

https://www.python.org/ftp/python/3.8.3/python-3.8.3.exe

8.2 在Linux上安装和设置Python

与其他操作系统相比，在Linux上安装Python要容易得多。要安装基础库，请运行以下命令行指令：

$ pip3 install numpy scipy pandas matplotlib jupyter notebook

如果你在使用的计算机上没有足够的权限，则可能必须在之前的命令之前运行sudo命令。

8.3 使用GUI安装程序在Mac OS X上进行Python安装和设置

可以通过Python官方网站上的安装文件来安装Python。可以从mac OS的官方网页（https://www.python.org/downloads/mac osx /）下载安装程序文件。此安装程序还具有一个名为“ IDLE”的IDE，可用于开发。

8.4 使用brew在Mac OS X上进行Python安装和设置

对于Mac系统，你可以使用Homebrew软件包管理器来安装Python。它可以简化开发人员，研究人员和科学家所需的应用程序的安装。brew install命令用于安装另一个应用程序，例如安装python3或任何其他Python软件包，例如NLTK或SpaCy。

要安装最新版本的Python，你需要在终端中执行以下命令：

$ brew install python3

安装后，你可以通过运行以下命令来确认已安装的Python版本：

$ python3 --version 
Python 3.7.4

你还可以通过运行以下命令从命令行打开Python Shell：

$ python3

现在我们知道了如何在系统上安装Python，让我们深入研究开始数据分析所需的实际工具。

9. 本书中使用的软件

让我们讨论将在本书中使用的软件。在本书中，我们将使用Anaconda IDE来分析数据。在安装它之前，让我们了解什么是Anaconda。

Python程序可以轻松地在安装了该程序的任何系统上运行。我们可以在记事本上编写程序，然后在命令提示符下运行它。我们还可以在不同的IDE（例如Jupyter Notebook，Spyder和PyCharm）上编写和运行Python程序。

Anaconda是可免费获得的开源软件包，其中包含各种数据处理IDE和数个用于数据分析目的的软件包，例如NumPy，SciPy，Pandas，Scikit-learn等。Anaconda可以轻松下载和安装，如下所示：

〇从https://www.anaconda.com/distribution/下载安装程序。

〇选择你正在使用的操作系统。

〇在“ Python 3.7”部分中，选择32位或64位安装程序选项，然后开始下载。

〇双击运行安装程序。

〇安装完成后，在“开始”菜单中检查程序，或在“开始”菜单中搜索Anaconda。

Anaconda还具有Anaconda Navigator，这是一个桌面GUI应用程序，可用于启动Jupyter Notebook，Spyder，Rstudio，Visual Studio Code和JupyterLab等应用程序：

现在，我们来看一下IPython，这是一种用于数据分析的基于shell的计算环境。

10. 使用IPython作为shell

IPython是一个交互式shell，等效于诸如Matlab或Mathematica的交互式计算环境。创建此交互式shell是为了进行快速实验。对于正在执行小型实验的数据专业人员来说，这是一个非常有用的工具。

IPython Shell提供以下功能：

〇轻松访问系统命令。

〇轻松编辑内联命令。

〇制表符补全，可帮助你查找命令并加快任务执行速度。

〇命令历史记录，可帮助你查看以前使用的命令。

〇轻松执行外部Python脚本。

〇使用Python调试器轻松调试。

现在，让我们在IPython上执行一些命令。要启动IPython，请在命令行上使用以下命令：

$ ipython3

当你运行前面的命令时，将出现以下窗口：

现在，让我们了解并执行IPython Shell提供的一些命令：

〇历史记录命令：历史记录命令用于检查以前使用的命令列表。以下屏幕截图显示了如何在IPython中使用history命令：

〇系统命令：我们也可以使用感叹号在IPython Shell中，我们可以使用help命令打开可用命令列表。不必写功能的全名。你只需输入一些初始字符，然后按Tab键，它将找到你要查找的单词。例如，让我们使用ranging()函数。我们可以通过两种方式找到有关功能的帮助：(!)从IPython运行系统命令。在此，将感叹号后的输入命令视为系统命令。例如:！date将显示系统的当前日期，而！pwd将显示当前工作目录：

〇编写函数：我们可以像在任何IDE中编写函数那样编写函数，例如Jupyter Notebook，Python IDLE，PyCharm或Spyder。让我们看一个函数的例子：

〇退出IPython Shell：你可以使用quit()或exit()或CTRL + D退出IPython Shell：

〇你还可以使用quit()命令退出IPython Shell：

在本小节中，我们研究了可以在IPython Shell上使用的一些基本命令。现在，让我们讨论如何在IPython Shell中使用help命令。

10.1 阅读手册页

在IPython Shell中，我们可以使用help命令打开可用命令列表。不必写功能的全名。你只需输入一些初始字符，然后按Tab键，它将找到你要查找的单词。例如，我们使用ranging()函数。我们可以通过两种方式找到有关功能的帮助：

〇使用帮助功能：让我们键入help并写一些该功能的初始字符。之后，按Tab键，使用箭头键选择一个功能，然后按Enter键：

〇使用问号：我们也可以在函数名称后使用问号。以下屏幕截图显示了此示例：

在本小节中，我们研究了为模块功能提供的帮助和问号支持。我们还可以从库文档中获取帮助。接下来我们讨论如何在Python库中获取用于数据分析的文档。

10.2 在哪里可以找到对Python数据分析库的帮助和参考呢？

下表列出了我们在本章中讨论过的Python数据分析库的文档网站：

Packages/Software	Description
NumPy	https://numpy.org/doc/
SciPy	https://docs.scipy.org/doc/
Pandas	https://pandas.pydata.org/docs/
Matplotlib	https://matplotlib.org/3.2.1/contents.html
Seaborn	https://seaborn.pydata.org/
Scikit-learn	https://scikit-learn.org/stable/
Anaconda	https://www.anaconda.com/distribution/

你还可以在StackOverflow平台上找到与NumPy，SciPy，Pandas，Matplotlib，Seaborn和Scikit-learn相关的各种Python编程问题的答案。你还可以在GitHub上提出与上述库有关的问题。

11. 使用JupyterLab

JupyterLab是下一代基于Web的用户界面。它结合了数据分析和机器学习产品开发工具，例如文本编辑器，笔记本，代码控制台和终端。这是一个灵活而强大的工具，应该成为数据分析师工具包的一部分：

你可以使用conda，pip或pipenv安装JupyterLab。

要使用conda进行安装，我们可以使用以下命令：

$ conda install -c conda-forge jupyterlab

要使用pip进行安装，我们可以使用以下命令：

$ pip install jupyterlab

要使用pipenv进行安装，我们可以使用以下命令：

$ pipenv安装jupyterlab

在本节中，我们学习了如何安装Jupyter Lab。在下一节中，我们将重点介绍Jupyter Notebooks。

12. 使用Jupyter Notebooks

Jupyter Notebook是一个Web应用程序，用于创建包含代码，文本，图形，链接，数学方程式和图表的数据分析笔记本。最近，社区推出了名为JupyterLab的下一代基于Web的Jupyter笔记本。你可以通过以下链接查看这些笔记本系列：

〇https://github.com/jupyter/jupyter/wiki/A-gallery-of-interestingJupyter-Notebooks

〇https://nbviewer.jupyter.org/

通常，这些笔记本用作教育工具或演示Python软件。

我们可以从纯Python代码或特殊笔记本格式导入或导出笔记本。这些笔记本可以在本地运行，或者我们可以通过运行专用的笔记本服务器使它们联机可用。某些Wakari，PiCloud和Google Colaboratory等云计算解决方案允许你在云中运行笔记本。

“ Jupyter”是Julia，Python和R的首字母缩写。最初，开发人员为这三种语言实现了它，但现在，它被用于其他各种语言，包括C，C ++，Scala，Perl，Go，PySpark和Haskell：

Jupyter Notebook提供以下功能：

〇它具有在浏览器中编辑代码的能力,并使用适当的缩进。

〇它具有从浏览器执行代码的能力。

〇它具有在浏览器中显示输出的功能。

〇它可以在单元格输出中呈现图形，图像和视频。

〇它具有导出PDF，HTML，Python文件和LaTex格式的代码的功能。

通过在Anaconda提示符下运行以下命令，我们还可以在Jupyter Notebook中同时使用Python 2和Python 3：

# For Python 2.7
conda create -n py27 python=2.7 ipykernel
# For Python 3.5
conda create -n py35 python=3.5 ipykernel

现在，我们介绍了各种工具和库，并且已经安装了Python，接下来我们继续使用最常用的工具Jupyter Notebooks中的一些高级功能。

13. Jupyter Notebooks的高级功能

Jupyter Notebook提供了各种高级功能，例如键盘快捷键，安装其他内核，执行Shell命令以及使用各种扩展名进行更快的数据分析操作。让我们开始并逐一了解这些功能。

13.1 键盘快捷键

通过在“帮助”菜单中选择“键盘快捷方式”选项或使用Cmd + Shift + P快捷键，用户可以找到Jupyter Notebook内部可以使用的所有快捷键命令。这将使快速选择栏出现，其中包含所有快捷键命令以及每个快捷键的简要说明。该栏很容易使用，并且用户在忘记某些东西时可以使用它：

13.2 安装其他内核

Jupyter能够为不同的语言运行多个内核。在Anaconda中为特定语言设置环境非常容易。例如，可以在Anaconda中使用以下命令来设置R内核：

$ conda install -c r r-essentials

然后应显示R内核，如以下屏幕截图所示：

13.3 运行shell命令

在Jupyter Notebook中，用户可以在Unix和Windows上运行shell命令。该shell提供了用于与计算机对话的通信接口。用户需要在运行任何命令之前放（！）。

13.4 Notebook扩展

与基本的Jupyter笔记本相比，Notebook扩展（或nbextensions）增加了更多功能。这些扩展改善了用户的体验和界面。用户可以通过选择NBextensions选项卡轻松选择任何扩展名。

要使用conda在Jupyter Notebook中安装nbextension，请运行以下命令：

conda install -c conda-forge jupyter_nbextensions_configurator

要使用pip在Jupyter Notebook中安装nbextension，请运行以下命令：

pip install jupyter_contrib_nbextensions && jupyter contrib nbextension install

如果你在macOS上遇到权限错误，只需运行以下命令：

pip install jupyter_contrib_nbextensions && jupyter contrib nbextension install --user

所有可配置的nbextensions将显示在不同的选项卡中，如以下屏幕快照所示：

现在，让我们看一看Notebook扩展的一些有用的功能：

Hinterland：这为在单元格中进行的每个按键提供了一个自动完成菜单，其行为类似于PyCharm：

目录：此扩展显示侧边栏或导航菜单中的所有标题。它是可调整大小，可拖动，可折叠和可停靠的。

执行时间：此扩展显示执行单元的时间以及完成单元代码所需的时间：

拼写检查器：拼写检查器检查并验证每个单元格中所写的拼写，并突出显示所有写错的单词。

变量选择器：此扩展跟踪用户的工作区。它显示了用户创建的所有变量的名称，以及它们的类型，大小，形状和值。

幻灯片：笔记本结果可以通过幻灯片进行传达。这是一个讲述故事的好工具。用户可以轻松地将Jupyter Notebooks转换为幻灯片，而无需使用PowerPoint。如以下屏幕截图所示，幻灯片可以使用视图菜单的单元格工具栏中的“幻灯片放映”选项启动：

Jupyter Notebook还允许你显示或隐藏幻灯片放映中的任何单元格。将“幻灯片显示”选项添加到视图菜单的单元格工具栏后，你可以在每个单元格中使用“幻灯片类型”下拉列表并选择各种选项，如以下屏幕截图所示：

嵌入PDF文档：Jupyter Notebook用户可以轻松添加PDF文档。PDF文档需要运行以下语法：

from IPython.display import IFrame
IFrame('https://arxiv.org/pdf/1811.02141.pdf',width=700,height=400)

结果为以下输出：

嵌入YouTube视频：Jupyter Notebook用户可以轻松添加YouTube视频。要添加YouTube视频，需要运行以下语法：

from IPython.display import YouTubeVideo
YouTubeVideo('ukzFI9rgwfU', width=700, height=400)

结果为以下输出：

这样，你现在就可以了解数据分析，它所进行的过程以及它所扮演的角色。你还学习了如何安装Python以及如何使用Jupyter Lab和Jupyter Notebook。在接下来的章节中，你将了解有关各种Python库和数据分析技术的更多信息。

14. 总结

在本章中，我们讨论了各种数据分析过程，包括KDD，SEMMA和CRISP-DM。然后，我们讨论了数据分析师和数据科学家的角色和技能。之后，我们安装了NumPy，SciPy，Pandas，Matplotlib，IPython，Jupyter Notebook，Anaconda和Jupyter Lab，所有这些我们都将在本书中使用。你可以安装内置了NumPy，Pandas，SciPy和Scikit-learn的Anaconda或Jupyter Lab，而不是安装所有这些模块。然后，我们启动了向量加法程序，并了解了NumPy与其他库相比如何提供卓越的性能。我们探索了可用的文档和在线资源。此外，我们讨论了Jupyter Lab，Jupyter Notebook及其功能。

在下一章，即第二章“NumPy和Pandas”中，我们将深入研究NumPy和Pandas，并探讨围绕数组和DataFrames的一些基本概念。

你可能感兴趣的:(可视化,数据挖掘,大数据,编程语言,python)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f