数据与智能

大数据分析工程师入门11-Hue&Zeppelin

日常数据分析工作中，很多时候都在处理临时性的需求，这种需求要求快速响应和很快得出结果，如果每一个需求都需要写在代码文件中，然后编译打包上传再执行，就会非常浪费时间，尤其是写出来的查询语句频繁出错，需要不断改正再重复打包上传的时候。

所以继上一篇Linux常用命令工具篇讲解完成以后，本文讲解另外两个非常重要的数据分析工作中会使用到的工具：Hue和Zeppelin。

它们都提供了非常方便的数据查询UI界面，能够很方便的进行多次查询并且能够很快地查询出结果。

那么，为什么要将两种工具都跟大家介绍一下呢？

那是因为它们都有着属于自己的特性和优势，小伙伴们需要根据不同使用场景择优选择。考虑到有的小伙伴对这两种工具目前还没有很丰富的使用经验，在本文开头不对它们的异同之处介绍说明，待大家阅读完本文正文，在文章的最后跟大家一起来总结对比一下它们的差别，这样大家理解起来会更容易一些。

(本文分为上下两段，分别由本人撰写Hue部分，同组小伙伴凯凯连撰写Zeppelin部分，所以阅读起来会感觉行文风格和知识输出方式略有差异，先就此提前说明一下。)

0 1

Hue

为什么要讲Hue？

Hue是一个Web应用，设计初衷是简化用户和Hadoop集群间的交互。

大数据的框架很多，通常在解决一个问题的时候，会用到多种框架，这个时候有一个统一的web UI界面去管理各个大数据常用框架是非常方便的。Hue几乎可以支持所有大数据框架，包含有HDFS文件系统的页面(调用HDFSAPI，进行增删改查的操作)，有HIVE UI界面(使用HiveServer2，JDBC方式连接，可以在页面上编写HiveQL语句，进行数据分析查询)，YARN监控及Oozie工作流任务调度页面等等。

Hue通过把这些大数据技术栈整合在一起，通过统一的Web UI来访问和管理，极大地提高了大数据用户和管理员的工作效率。

日常数据分析工作中，Hue几乎每天都会用到，所以需要熟练掌握Hue的常用功能。

主要讲解目标

围绕日常数据分析工作中使用HiveQL在Hue上查询数据用到的功能点，写一篇类似使用手册的Hue工具操作指南。

主要讲解思路

简单来说，就以一个用户第一次进入Hue来进行一个简单的HiveQL查询为例，逐步讲解日常最常使用到的功能点。

1.1首先进入的主界面功能模块简介

通过已经开通了权限的用户名密码登陆Hue，首先进入的主界面如下：

如图展示的三块红框功能区，功能区1后续会在实际使用中结合使用场景介绍，功能区2和3说明如下：

功能区2从左到右依次是搜索文件夹或Notebook、新建Hive Query或Notebook、新建文件夹、重命名文件夹、将选中的文件夹或者Notebook移到回收站、将选中文件夹或Notebook分享给其他用户或用户组、下载选中的文件夹或Notebook（下载下来是个json文件）、上传文件（要求是指定格式的json文件）、进入回收站。功能区3罗列了目前该用户权限下看到的所有文件夹和Notebook，可以点击进入目标文件夹或Notebook页面。

主界面简单介绍完以后，下一步就是如何进入库表查看和HiveQL编辑界面了，入口在功能区1，共有两种进入方式。

第一种：点击Query Editors出现下拉框

点击Hive，进入页面如下

第二种：点击Notebooks

新建一个Notebook（红框1）或者进入自己已建的Notebook（红框2），如选择新建Notebook，进入页面如下：

标记1处是给该Notebook命名，标记2是该Notebook的详细说明，标记3处可选择某种语言进入代码编辑页面，如选择Hive编写HiveQL。

这两种方式的区别是：

后者建Notebook可以将一次完整需求的所有查询语句归整保存，便于复用。下次只要在上文所讲的主界面通过搜索该Notebook或上文所讲能够进入HiveQL编辑界面的第二个入口处，点击菜单栏Notebooks弹出下拉框后，下滑滚动找到该Notebook，点击进入，就可以再次查看这次所写的查询语句，进行复用或回顾，并且可以将该Notebook分享给他人使用。

在数据分析日常工作中，有时候需要提供给业务方某个需求的多个查询语句，以供他们需要时使用，这时候就可以建一个Notebook，帮业务方把查询语句依次写好保存，然后将Notebook分享给业务方即可。HiveQL编辑界面中点击上图中的+号可以依次添加新的查询编辑区，且新添加的查询编辑区可重新选择执行语言。

1.2查看目标库表的基本信息

通过上面的讲解，现在我们已经可以着手进行数据查询了，首先进入上文所建的Notebook（文章输出示例Notebook）。

1.2.1 搜索目标表

假设现在需要统计的信息在test库中，且只记得表名包含active字段，直接搜索关键字即可，搜索支持模糊匹配。

1.2.2 查看字段信息

如果想要知道目标表中有哪些字段，每个字段的含义和数据类型是什么，只需点击一下查找到的目标表就可以看到字段名和字段类型，将鼠标悬停在想要查看的字段上，就可以看到字段注释。

1.2.3 查看样本值

如果想要知道表里面的字段值大概是什么样子的，有两种方式，第一种可以写HiveQL limit 几条出来看看结果。

另一种可以不用写查询语句那么麻烦，通过点击上图目标表或者每个字段右侧的像柱状图一样的那个图标，就会弹出样本值浮框。

1.2.4 查看分区字段

之前系列课程Hive基础中有提到过，进行表数据查询时，尤其是一张数据量非常庞大的表的时候，一定要记得加上分区字段进行条件限制，否则极可能因查询数据量过大而造成集群崩溃。想要查看目标表的分区字段是哪些，方式有两种，除了通过show create table 语句查看，还有一种方式如下，点击DataBrowsers 下的Metastore Tables：

进入test库的详情页，如下：

点击目标表红框处的向右箭头，进入该表的详情页，该页面可以看到表的基本信息、表的字段信息、分区信息、样本数据等。

点击标记1处，查看分区字段信息如下：

点击标记2处，可查看目前的分区字段信息（比如日期信息）所有值的情况（至于页面上其他功能按钮，小伙伴们可以自己实践操作查看了解一下）。

点击标记1处可删除所选中分区，点击标记2处可跳转到HDFS查看具体HDFS路径。

1.3标题编写HiveQL

字段、字段值、分区都明确了以后，可以写第一个HiveQL了，以需要查询某段时间目标表中每天所有明细数据为例。

1.3.1 传参

如果这个需求需要不定时查询，那么day_p的时间区间可以采用参数的方式传入，使用者只需要在传参输入框输入想要查询的日期即可，start_time和end_time字段可依据实际需要命名为别的名称。要点是，在SQL中使用类似${argName}的形式，下面就会多一个输入框。

1.3.2 切换语言环境

目前编辑框的语言环境是HiveQL，如何想用SparkSql或者执行别的语言，可进行切换，切换语言环境的同时也会切换执行引擎。操作见下图，点击标记处就可以进行选择啦：

1.3.3 语句格式化&执行

如果所编写的HiveQL包含了很多层关联或嵌套，整个语句结构不清晰，查看起来很不方便，那么可以使用Hue的Format功能，使整个语句的结构进行标准格式化。点击下图标记2处，下拉框中选择Format，即可将语句结构格式化。

标记1处是语句执行按钮，点击即开始执行。如果查询数据量非常大，已经查询了很长一段时间或者突然发现查询语句有问题，想要终止查询，那么同样可点击标记1处进行终止。

Format下方还有一个Clear选项，该选项可以将当前编辑框中的查询语句和查询结果清空。

1.3.4 查看查询结果

接下来将教大家在查询结果数据字段非常多的情况下如何选择性的筛选查看部分数据。

1.3.4.1 查看所有结果字段及其类型

点击下图标记处。

弹出如下标记处的查询结果字段值和字段类型信息。

1.3.4.2 搜索查询结果指定字段

查询出来的结果字段非常多的情况下，可使用搜索功能，如查找all_user字段。

1.3.4.3 选择显示部分查询结果字段

如果只想显示部分字段查看其结果值，可针对复选框进行选择性勾选。

1.3.5 查询结果可视化

Hue上可对查询结果进行简单的可视化，点击下图标记处弹出的下拉选项中可选择性的进行不同类型可视化，读者可自行实践操作下，这里就不一一操作展示效果啦。

1.3.6 查询结果下载

通常情况下，在Hue上直接进行可视化操作不会太多，一般会将整个查询结果下载下来在Excel里进行结果的初步分析和查看工作。下载按钮如下图标记处，下拉框中提供不同的下载选项。需要注意的是，如果查询的是数据量非常庞大的明细数据，很可能出现结果不能完全下载下来的情况，因此建议结果数据超过1000条时，优先下载csv格式。

1.3.7 命名查询主题

可以给每一条查询语句命名，以便提高辨识度，方便日后查阅。

如命名以上查询语句为“查询一段时间内的明细数据”，记住命名完成以后，点击下图标记1处的保存按钮进行保存，最好养成时时保存的习惯，以免意外情况发生导致页面重新刷新，所有操作信息丢失，又得重新开始的情况。

1.3.8 清空Notebook里的所有查询结果

整个Notebook页面查询结果展示过多的话，有可能出现每次进入该Notebook页面需要刷新很久的情况，如无必要，可将所有查询结果清空。

1.3.10 其他

Hue还有很多其他功能点，感兴趣的小伙伴可基于本文所介绍之基础自行查看了解，作为入门课程，这里就不继续深入介绍了，比如HDFS相关信息查看页面（通过标记1处进入）和Job信息查看页面（通过标记2处进入）等。

0 2

Zeppelin

2.1 zeppelin简介

zeppelin是一个非常流行的开源数据探索分析平台。zeppelin集成了非常多的数据处理和分析相关的组件，其核心组织概念是notebook，所有的操作都可以在notebook中完成，官网的原话是“The Notebook is the place for all yourneeds”。

它主要拥有以下优秀的功能特性：

1）非常易用的操作界面，界面上提供了非常好用的各式工具，帮助你完成各种数据处理操作。

2）支持多种编程语言，zeppelin通过interpreter实现了将多种语言和数据处理框架以插件的形式集成进来。官方默认集成了spark组件，几乎是开箱即用的，非常方便。

3）有着强大的数据可视化组件，除了支持基础图形（折线图、柱状图、饼图等）外，zeppelin还支持数据透视功能，而且是通过拖拽就可以完成可视化操作，非常强大。

4）支持动态表单，允许在你的SQL语句或者代码中嵌入变量，在执行前输入不同的参数值给变量赋值。

5）支持将zeppelin页面或段落嵌入到其他网页中，并能够实时更新数据。

那么对于大数据分析师来说，zeppelin能够帮我们做什么呢？

首先，zeppelin支持运行sparksql，我们可以在zeppelin上运行我们编写的SQL语句，通过比对运行后的结果，验证我们的SQL是否编写正确；

其次，zeppelin支持运行scala代码，那我们可以利用它来试探性地使用spark的相关api，或者在zeppelin上编写并运行spark的udf，避免反复打包上传，提高开发效率；

然后，zeppelin拥有非常强大的可视化功能，我们可以对数据进行探索分析，通过可视化直观地发现问题，快速验证构想，并深入地分析和挖掘数据价值。

最后，zeppelin的运行结果可以非常方便的导出，可以使用它来完成临时需求，提供数据结果给业务方。并且可以把相关代码或SQL保存起来，下次如有相似需求，直接修改下相关条件运行下就可以了。

官网上有非常详细的zeppelin安装步骤，大家可以依照文档来完成安装和配置，这里就不占用篇幅来讲了。在大致了解了zeppelin之后，我们来看下它的核心概念和具体的使用方法。

2.1 zeppelin简介

2.2.1 Interpreter

Interpreter是zeppelin最核心的概念，zeppelin允许任何语言和数据处理框架以interpreter的方式集成进来，这构建了zeppelin强大功能的基础。

zeppelin提供了大量的各种语言和框架的可以直接使用的interpreter，在安装zeppelin时可以选择安装包含所有interpreter的安装包，或者在安装后通过./bin/install-interpreter.sh脚本安装指定名称的interpreter。另外，你也可以参照官网上的文档，编写自己的interpreter，扩展zeppelin的功能。

在使用interpreter之前需要进行一些设定，如对于spark interpreter来说，需要设置spark的安装目录、提交作业的地址、driver和excutor的内存等信息。具体如何设置，在官网文档中都有给出详细说明。

在使用具体的interpreter时，只需要在代码的首行添加%加上具体的interpreter名称即可（首行不能有其他内容）。如使用spark时，在首行添加%spark，使用sparksql时，在首行添加%sql即可，使用pyspark，在首行添加%pyspark。如果设置了默认使用spark，则可以省略不写。

2.2.2 Note&Paragraph

Note页面是zeppelin使用频率最高的页面，这个页面是用户的主要操作界面，它有非常多的功能，我们在下一章节页面介绍时会详细介绍。note页面包含多个paragraph，每个paragraph内可以写代码。上面我们提到的interpreter标识就是写在paragraph的首行的，每个paragraph内只能使用一种interpreter，但是不同的paragraph可以使用不同的interpreter，即一个note内可以同时存在多个使用不同interpreter的paragraph。

zeppelin是以paragraph为最小运行单位的。对于spark interpreter来说，同一个用户同一时间，只能有一个paragraph处于运行状态（running），如果这时运行了其他的写了spark代码的paragraph，那么它将处于等待状态（pending），直到第一个paragraph运行结束后，它才会开始运行。当然，运行状态是可以被中断的。

2.2.3 Dynamic forms

动态表单（dynamic form）是zeppelin提供的一项非常实用的功能，允许你在代码或者SQL中使用变量，在运行前通过手动输入变量值，然后运行时动态替换代码或者SQL中的变量，避免了反复修改代码或SQL的麻烦。具体示例如下：

如果只有图中条件的值发生变化时，只需要在下方的输入框中输入新的值，直接运行就可以了，非常的方便。只要你在代码或SQL中使用类似${argName}的形式，那么就会被识别为动态表单，如果下方没有出现输入框，可以先运行一下，输入框就会出现了。

动态表单还有其他一些用法，更多详细信息可以查阅官方文档（https://zeppelin.apache.org/docs/0.8.1/usage/dynamic_form/intro.html）。

2.3 zeppelin页面介绍

zeppelin的功能是很强大的，因此页面也比较多，这里我们只介绍最常用的几个页面。

2.3.1 主页

顶部导航栏上标记1的位置，点击后会展开现有note的列表，与标记5区域展示的内容一致，主要作用是为了方便你处在某个note页面中时，可以不用回到首页而方便地切换到其他note。

点击标记2的位置，会跳转到job页面，这个页面你可以查看note各paragraph的最后一次运行状态，并可通过点击图标跳转到指定的note中的paragraph位置，我们通常可以利用这个页面查看定时调度任务的执行状态。

标记3位置展示的是与ZeppelinServer的连接状态，绿色表示正常，当连接出现异常时，这里会变成红色。点击标记4的位置，可以跳转到interpreter的配置页面，我们在2.3.4小节会再详细讲。

点击标记6位置的按钮可以创建一个全新的note，这个按钮在上述提到的标记1展开的列表中也有。当你把鼠标悬停在标记5区域的某个note名字上时，后面会出现三个小按钮，如标记7位置所示，分别对应重命名、清空输出和移到回收站操作。

在标记3的左边有个搜索框，这里可以进行全局搜索，例如你只记得代码中的某个片段，但是不记得具体写在哪个note中，就可以通过这里搜索出对应的note，点击note的名称便可以直接跳转进去。如下所示：

2.3.2 note页

顶部导航栏和首页的导航栏作用完全相同，这里就不再重复讲了。标记1的位置展示的是note的名字，建议大家要起一个辨识度比较高的名字，不要太随意，不然后续查找代码时非常费劲。标记1右侧为工具栏，我们来逐个介绍下。标记2区域中的按钮是针对所有paragraph生效的，从左至右依次为，运行所有paragraph、显示或隐藏代码、显示或隐藏输出结果、清空所有输出结果、克隆当前note页、导出当前note页、切换为私有模式。标记3区域提供了版本控制功能。标记4区域内按钮，分别是将当前note移动到回收站和对当前note做定时调度。标记5区域的功能依次为，展示快捷键、interpreter绑定、note权限管理和主题模式选择。

这里我们简单讲下interpreter绑定界面，点击下图中箭头位置可以打开绑定界面。界面中展示的是所有你安装的interpreter组，蓝色表示在本note中可以使用，点击蓝色方框后会变成白色，表示和当前note解绑，在当前note中不可使用。另外，可以通过拖拽改变他们的顺序，处于最顶上的那个方框里的第一个解释器就是默认解释器，当你在paragraph中不指定解释器时，就会使用这个默认解释器。点击方框前面的刷新按钮，会重启对应的interpreter。

在note页面的下方所有区域为paragraph区，我们在下一小节单独来讲下。

2.3.3 paragraph

标记1区域为代码编辑区，你在paragraph的代码编辑区中的所有编辑操作都是自动保存的，而且zeppelin还提供了针对不同语言的语法高亮，非常的好用。标记2为命令区，从左只有依次为运行按钮、隐藏编辑区、隐藏输出、设置。点击运行按钮后，编辑区的代码会被运行，在运行结束前，如果再点击一次，则会中止代码的运行。点击设置按钮后会弹出下面展示的设置选项界面，这里重点关注下标记4选项，可以展示title，这样我们就可以给我们的每个paragraph起一个名字或写一句描述，提高辨识度。标记5的区域展示的是上次运行花费的时间，以及代码的最后更新时间等信息。

标记3的区域为结果展示区，在红框上面的一排按钮为可视化操作相关的按钮，大家可以尝试地去用一下，用zeppelin可以完成常用基本图形的可视化。如果你的代码有报错，错误信息也会在这个区域展示。

paragraph是我们工作的核心区域，它的功能简洁而强大，新增paragraph也是非常方便的，你可以点击任意paragraph的顶部或底部间隙来插入一个新的paragraph，如下图所示：

标记6位置即新增一个paragraph的按钮，默认是隐藏的，鼠标悬停在这里就会显示。标记7位置演示了展示错误信息的功能。

2.3.4 interpreter页

通过2.3.1小节中讲到的点击标记4的位置，可以跳转到interpreter页，当然啦，前提是你有这个页面的访问权限，具体页面的形式如下所示。

标记1区域为功能按钮，从左到右依次为跳到SparkUI界面、编辑spark interpreter的相关属性、重启spark interpreter（该动作同时会重启Spark client端，即SparkSubmit进程）、移除spark interpreter。标记2区域为设置spark interpreter实例化SparkSubmit进程的方式，图中设置结果的含义为每个用户都拥有独立的SparkSubmit进程，他们是互相隔离的。标记3区域的作用为设置spark的相关属性，如master地址、driver和executor内存等，修改设置后需要重启spark interpreter才能生效。

0 3

Hue&Zeppelin异同点

通过正文对Hue和Zeppelin的使用说明，相信大家对它们已经有了一定的了解，如开篇跟大家说的，它们都是很好的能够快速响应临时需求和很快得到查询结果的Web UI工具。

那么，它们有什么异同点呢？分以下几个方面跟大家总结一下。

1功能

（1）Zeppelin和Hue都能提供一定的数据查询和可视化的功能，都提供了多种图形化数据表示形式。

（2）Zeppelin支持的后端数据查询程序较多。

（3）Zeppelin只提供了单一的数据处理功能，包括上文提到的数据提取、数据发现、数据分析、数据可视化等都属于数据处理的范畴。而Hue的功能相对丰富的多，除了类似的数据处理，还有元数据管理、Oozie工作流管理、作业管理、用户管理、Sqoop集成等很多管理功能。从这点看，Zeppelin只是一个数据处理工具，而Hue更像是一个综合管理工具。

2架构

（1）Zeppelin采用插件式的解释器，通过插件开发，可以添加任何后端语言和数据处理程序。相对来说更独立和开放。

（2）Hue与Hadoop生态圈的其它组件密切相关，一般都与CDH（Cloudera发行版（Cloudera’s DistributionIncluding Apache Hadoop，简称 CDH ））一同部署。

3使用场景

（1）Zeppelin适合单一数据处理、但后端处理语言繁多的场景，尤其适合Spark。

（2）Hue适合与Hadoop集群的多个组件交互、如Oozie工作流、Sqoop等联合处理数据的场景，尤其适合与Impala协同工作。

小结

本文主要给大家介绍了两种日常数据分析工作中用来快速处理临时需求的Web UI工具-Hue&Zeppelin。

希望阅读完本文的小伙伴对于这两个工具的使用能够快速上手哦。

-end-

参考文献：

[1]《基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化》

作者 wzy0623

https://blog.csdn.net/wzy0623/article/details/52370045

[2] zeppelin官网，http://zeppelin.apache.org

你可能感兴趣的:(大数据分析工程师入门11-Hue&Zeppelin)

第四天旅游线路预览——从换乘中心到喀纳斯湖陟彼高冈yu 基于Google earth studio 的旅游规划和预览旅游
第四天：从贾登峪到喀纳斯风景区入口，晚上住宿贾登峪；换乘中心有4路车，喀纳斯①号车，去喀纳斯湖，路程时长约5分钟；将上面的的行程安排进行动态展示，具体步骤见”Googleearthstudio进行动态轨迹显示制作过程“、“Googleearthstudio入门教程”和“Googleearthstudio进阶教程“相关内容，得到行程如下所示：Day4-2-480p
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
STM32中的计时与延时 lupinjia STM32 stm32 单片机
前言在裸机开发中，延时作为一种规定循环周期的方式经常被使用，其中尤以HAL库官方提供的HAL_Delay为甚。刚入门的小白可能会觉得既然有官方提供的延时函数，而且精度也还挺好，为什么不用呢？实际上HAL_Delay中有不少坑，而这些也只是HAL库中无数坑的其中一些。想从坑里跳出来还是得加强外设原理的学习和理解，切不可只依赖HAL库。除了延时之外，我们在开发中有时也会想要确定某段程序的耗时，这就需要
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
esp32开发快速入门 8 : MQTT 的快速入门，基于esp32实现MQTT通信 z755924843 ESP32开发快速入门服务器网络运维
MQTT介绍简介MQTT（MessageQueuingTelemetryTransport，消息队列遥测传输协议），是一种基于发布/订阅（publish/subscribe）模式的"轻量级"通讯协议，该协议构建于TCP/IP协议上，由IBM在1999年发布。MQTT最大优点在于，可以以极少的代码和有限的带宽，为连接远程设备提供实时可靠的消息服务。作为一种低开销、低带宽占用的即时通讯协议，使其在物联
Armv8.3 体系结构扩展--原文版代码改变世界ctw ARM-TEE-Android armv8 嵌入式 arm架构安全架构芯片 Trustzone Secureboot
快速链接:.ARMv8/ARMv9架构入门到精通-[目录]付费专栏-付费课程【购买须知】:个人博客笔记导读目录(全部)TheArmv8.3architectureextensionTheArmv8.3architectureextensionisanextensiontoArmv8.2.Itaddsmandatoryandoptionalarchitecturalfeatures.Somefeat
Python入门之Lesson2:Python基础语法小熊同学哦 Python入门课程 python 开发语言算法数据结构青少年编程
目录前言一.介绍1.变量和数据类型2.常见运算符3.输入输出4.条件语句5.循环结构二.练习三.总结前言欢迎来到《Python入门》系列博客的第二课。在上一课中，我们了解了Python的安装及运行环境的配置。在这一课中，我们将深入学习Python的基础语法，这是编写Python代码的根基。通过本节内容的学习，你将掌握变量、数据类型、运算符、输入输出、条件语句等Python编程的基础知识。一.介绍1
摄影小白，怎么才能拍出高大上产品图片？是波妞唉
很多人以为文案只要会码字，会排版就OK了！说实话，没接触到这一行的时候，我的想法更简单，以为只要会写字就行！可是真做了文案才发现，码字只是入门级的基本功。一篇文章离不开排版、配图，说起来很简单！从头做到尾你就会发现，写文章用两个小时，找合适的配图居然要花掉半天的时间，甚至更久！图片能找到合适的就不怕，还有找不到的，比如产品图，只能亲自拍。拿着摆弄了半天，就是拍不出想要的效果，光线不好、搭出来丑破天
2021 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级C++语言试题（第三大题：完善程序代码） mmz1207 c++csp
最近有一段时间没更新了，在准备CSP考试，请大家见谅。（1）有n个人围成一个圈，依次标号0到n-1。从0号开始，依次0，1，0，1...交替报数，报到一的人离开，直至圈中剩最后一个人。求最后剩下的人的编号。#includeusingnamespacestd;intf[1000010];intmain(){intn;cin>>n;inti=0,cnt=0,p=0;while(cnt#includeu
Vue( ElementUI入门、vue-cli安装) m0_l5z elementui vue.js
一.ElementUI入门目录：1.ElementUI入门1.1ElementUI简介1.2Vue+ElementUI安装1.3开发示例2.搭建nodejs环境2.1nodejs介绍2.2npm是什么2.3nodejs环境搭建2.3.1下载2.3.2解压2.3.3配置环境变量2.3.4配置npm全局模块路径和cache默认安装位置2.3.5修改npm镜像提高下载速度2.3.6验证安装结果3.运行n
Spring MVC 全面指南：从入门到精通的详细解析一杯梅子酱技术栈学习 spring mvc java
引言：SpringMVC，作为Spring框架的一个重要模块，为构建Web应用提供了强大的功能和灵活性。无论是初学者还是有一定经验的开发者，掌握SpringMVC都将显著提升你的Web开发技能。本文旨在为初学者提供一个全面且易于理解的学习路径，通过详细的知识点分析和实际案例，帮助你快速上手SpringMVC，让学习过程既深刻又高效。一、SpringMVC简介1.1什么是SpringMVC？Spri
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
ESP32-C3入门教程网络篇⑩——基于esp_https_ota和MQTT实现开机主动升级和被动触发升级的OTA功能小康师兄 ESP32-C3入门教程 https 服务器 esp32 OTA MQTT
文章目录一、前言二、软件流程三、部分源码四、运行演示一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读ESP32-C3入门教程网络篇⑨——基于esp_https_ota实现史上最简单的ESP32OTA远程固件升级功能二、软件流程
2023最详细的Python安装教程（Windows版本）程序员林哥 Python python windows 开发语言
python安装是学习pyhon第一步，很多刚入门小白不清楚如何安装python，今天我来带大家完成python安装与配置，跟着我一步步来，很简单，你肯定能完成。第一部分：python安装（一）准备工作1、下载和安装python(认准官方网站)当然你不想去下载的话也可以分享给你，还有入门学习教程，点击下方卡片跳转进群领取（二）开始安装对于Windows操作系统，可以下载“executableins
【2022 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级 C++语言试题及解析】汉子萌萌哒 CCF noi 算法数据结构 c++
一、单项选择题(共15题，每题2分，共计30分；每题有且仅有一个正确选项)1.以下哪种功能没有涉及C++语言的面向对象特性支持：()。A.C++中调用printf函数B.C++中调用用户定义的类成员函数C.C++中构造一个class或structD.C++中构造来源于同一基类的多个派生类题目解析【解析】正确答案:AC++基础知识，面向对象和类有关，类又涉及父类、子类、继承、派生等关系，printf
现金贷“租系统”产业崛起：租金3000，本金10万，一月回本 Dayon
最近，地下现金贷的全面崛起，已成了不可阻挡的趋势。大量民间资本开始涌入，民间高利贷、炒房团、土豪的钱，都裹挟其中。而地下现金贷的入门门槛正在不断降低，一条新的产业链开始崛起：租现金贷系统。现在，只需要10万本金，花3000元租个系统，两个人的团队，一个月就能回本。大量的小本金玩家进场了，为了急速获利，他们甚至将利率调到1600%以上。业内人士称，真实的现金贷用户，现在大概只有200多万。整个行业几
【树一线性代数】005入门 Owlet_woodBird 算法
Index本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376分析实现总结本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376已知非空二叉树T的结点值均为正整数，采用顺序存储方式保存，数据结构定义如下:t
如何自学软件编程？零基础自学编程入门指南 _pangzi
前言零基础自学编程的动力是什么?在开启学习编程之路的时候必须搞清楚自己为什么要学编程?是因为工资高?还是对编程有浓厚的兴趣？还有自己有一定的编程基础想要继续提升自己？其实对于这个问题需要具体分析，如果是单纯看到程序员工资高，而自己本身并没有什么兴趣，那我不建议自学，可以选择参加培训或者不要进入编程领域不然自己学不会没有获得高薪，反而浪费了大把的时间，如果方法不对，反而会打击自信心。下面小编针对学习
2023-4-6晨间日记百里清风柏年醉
今天是什么日子起床：7:00就寝：10:30天气：阳光明媚心情：沉闷，忧心忡忡纪念日：无任务清单昨日完成的任务，最重要的三件事：看咨询工程师的书锻炼身体记75个单词改进：自己做饭习惯养成：看纸质书籍不刷抖音每天日更周目标·完成进度学习·信息·阅读健康·饮食·锻炼人际·家人·朋友保持与朋友交流，多认识、结交新的朋友工作·思考怎么做好向上管理该学习什么新的技能怎么与同事更好相处，更好地开展工作最美好的
2021-09-10 彧瑛
[cp]九月果香，九月菊黄，九月忽然想起，是谁在播撒着希望？九月我们收集阳光，九月我们深情歌唱，一个感动的季节，被求知的眼睛珍藏。一寸一寸的粉笔，染白您的头发，腾然而起点燃成烛，照亮别人，让后来者攀上崖顶，让后来者踏着你的双肩，送一批批学子上路。黑发积霜织日月，粉笔无言写春秋。这就是老师的一生一一人类灵魂工程师的真实写照。粉笔里飞舞着您的万千情丝，书写着您的青春岁月；教室里定格着您的音容笑貌，记录
Linux CTF逆向入门蚁景网络安全 linux 运维 CTF
1.ELF格式我们先来看看ELF文件头，如果想详细了解，可以查看ELF的manpage文档。关于ELF更详细的说明：e_shoff：节头表的文件偏移量（字节）。如果文件没有节头表，则此成员值为零。sh_offset：表示了该section（节）离开文件头部位置的距离+-------------------+|ELFheader|---++--------->+-------------------
python简单好玩的编程代码,python有哪些好玩的代码 2301_81900439 pygame python 开发语言
大家好，小编来为大家解答以下问题，20行python代码的入门级小游戏，python有什么好玩的代码嘛，今天让我们一起来看看吧！哈喽铁子们表弟最近在学Python，总是跟我抱怨很枯燥无味，其实，他有没有认真想过，可能是自己学习姿势不对？比方说，可以通过打游戏来学编程！今天给大家分享100个Python小游戏，一定要收藏！1、简易飞机大战飞机大战相信大家都玩过吧，非常简单有意思的游戏，咱们通过Pyt
思考成长丁昆朋
这篇文章是加紧赶出来“应付”日更，一方面不想要再晚睡了；另一方面不想失去日更达人的称号，只能坐下来匆忙写下一点文字。既然标题是成长，先来总结一下这段时间的收获：1、整理箱子站着可以看电脑，坐着反而是一种享受，减少了坐着腰酸背痛的现象；2、使用讯飞输入法大大增加自己的输出量；3、Anaconda+“pythontutor.com"+Google算是简单入门python；4、英语的阅读文章能力、听力提
字节二面 Redstone Monstrosity 前端面试
1.假设你是正在面试前端开发工程师的候选人，面试官让你详细说出你上一段实习过程的收获和感悟。在上一段实习过程中，我获得了宝贵的实践经验和深刻的行业洞察，以下是我的主要收获和感悟：一、专业技能提升框架应用熟练度：通过实际项目，我深入掌握了React、Vue等前端框架的使用，不仅提升了编码效率，还学会了如何根据项目需求选择合适的框架。问题解决能力：在实习期间，我遇到了许多预料之外的技术难题。通过查阅文
HarmonyOS开发实战（ Beta5.0）搜索框热搜词自动切换让开，我要吃人了 OpenHarmony HarmonyOS 鸿蒙开发 harmonyos 华为鸿蒙移动开发鸿蒙系统前端开发语言
鸿蒙HarmonyOS开发往期必看：HarmonyOSNEXT应用开发性能实践总结最新版！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）介绍本示例介绍使用TextInput组件与Swiper组件实现搜索框内热搜词自动切换。效果图预览使用说明页面顶部搜索框内热搜词条自动切换，编辑搜索框时自动隐藏。实现思路使用TextInput实现搜索框TextInput({te
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。