追梦小猿

CentOS 7安装Hadoop

CentOS 7安装Hadoop

一、启动两台虚拟客户机

1.打开VMware Workstation14

2.打开之前已经安装好的虚拟机：HadoopMaster和HadoopSlave

二、Linux系统配置

以下操作步骤需要在HadoopMaster和HadoopSlave节点上分别完整操作，都使用root用户，从当前用户切换root用户的命令如下：

[lyu@master ~]$ su root

输入密码：lyu

本节所有的命令操作都在终端环境，打开终端的过程如下图的Terminal菜单：

鼠标右击选中Open Terminal

终端打开后如下图中命令行窗口所示。

CentOS 7安装Hadoop_第5张图片

设置网络

在windos下设置虚拟网卡

在VMware软件中设置网络

虚拟机中设置网络（图形界面中的设置或命令行设置，二选一）

图形界面中设置网络

master：

slave：除了IP地址其它一样

命令行设置

vi /etc/sysconfig/network-scripts/ifcfg-ens33    （注：其他低版本的系统默认的可能是ifcf-eth0）

TYPE=Ethernet

PROXY_METHOD=none

BROWSER_ONLY=no

BOOTPROTO= none

DEFROUTE=yes

IPV4_FAILURE_FATAL=no

IPV6INIT=yes

IPV6_AUTOCONF=yes

IPV6_DEFROUTE=yes

IPV6_FAILURE_FATAL=no

IPV6_ADDR_GEN_MODE=stable-privacy

NAME=ens33

UUID=d3e21db1-9594-417d-87c7-109c2a367f90

DEVICE=ens33

ONBOOT= yes

IPADDR= 192.168.6.100

PREFIX=24

GATEWAY= 192.168.6.2

DNS1= 114.114.114.114

（注：IP地址master填192.168.6.100 slave填192.168.6.101）

service network restart

测试是否配置成功 ping baidu.com

可能出现的问题：由于slave是直接克隆过去的，MAC地址一样，可能不能同时上网

解决方法：slave中删除相关文件

rm –f /etc/udev/rules.d/70-persistent-net.rules

VMware中虚拟机-设置—网络适配器（nat）--高级（重新生成并复制MAC地址）

CentOS 7安装Hadoop_第14张图片

重启后

vi /etc/sysconfig/network-scripts/ifcfg-ens33

将HWADDR=改成刚才随机生成的MAC地址（不存在就不改）

配置主机名

Master 节点: master

Slave 节点: Slave

*自定义：

使用gedit编辑主机名，如果不可以使用gedit，请直接使用vi编辑器（后面用到gedit的地方也同此处处理一致）。

# gedit /etc/hostname

配置信息如下，如果已经存在则不修改，将HadoopMaster节点的主机名改为master，即下面代码的第2行所示。

master

确实修改生效命令：

# hostname master

检测主机名是否修改成功命令如下，在操作之前需要关闭当前终端，重新打开一个终端：

# hostname

* Slave 节点，类同。

配置时钟同步

1、配置自动时钟同步

该项同时需要在HadoopSlave节点配置。

使用Linux命令配置

[root@master lyu]# crontab -e

该命令是vi编辑命令，按i进入插入模式，按Esc，然后键入:wq保存退出键入下面的一行代码，输入i，进入插入模式（星号之间和前后都有空格）

0 1 * * * /usr/sbin/ntpdate cn.pool.ntp.org

2、手动同步时间

直接在Terminal运行下面的命令：

[root@master lyu]# /usr/sbin/ntpdate cn.pool.ntp.org

关闭防火墙

在终端中执行下面命令：

[root@master ~]# systemctl stop firewalld.service

[root@master ~]# systemctl disable firewalld.service

配置hosts列表

该项也需要在HadoopSlave节点配置。

需要在root用户下（使用su命令），编辑主机名列表的命令：

[root@master lyu]# vi /etc/hosts

将下面两行添加到/etc/hosts文件中：

192.168.21.128 master

192.168.21.129 slave

注意：这里master节点对应IP地址是192.168.6.100，slave对应的IP是192.168.6.101，而自己在做配置时，需要将这两个IP地址改为你的master和slave对应的IP地址。

[lyu@master ~]$ ping master

[lyu@master ~]$ ping slave

如果能ping通表示配置成功

安装JDK

该项也需要在HadoopSlave节点配置。

首先查询系统自带的jdk

[root@master ~]$ rpm -qa | grep java

[root@master lyu]# rpm -qa|grep java
java-1.8.0-openjdk-headless-1.8.0.131-11.b12.el7.x86_64
javapackages-tools-3.4.1-11.el7.noarch
python-javapackages-3.4.1-11.el7.noarch
tzdata-java-2017b-1.el7.noarch
java-1.8.0-openjdk-1.8.0.131-11.b12.el7.x86_64
java-1.7.0-openjdk-headless-1.7.0.141-2.6.10.5.el7.x86_64
java-1.7.0-openjdk-1.7.0.141-2.6.10.5.el7.x86_64
[root@master lyu]#

然后移除系统自带的jdk

[root@master lyu]# yum remove java-1.*

利用xftp将下载的jdk上传到指定文件夹

将JDK文件解压，放到/usr/java目录下

[lyu@master ~]su root

[root@master ~]# cd /home/lyu/resources/software/jdk

[root@master jdk]# mkdir /usr/java

[root@master jdk]# mv jdk-8u131-linux-x64.tar.gz /usr/java/

[root@master jdk]# cd /usr/java

[root@master java]# tar -xvf /usr/java/jdk-8u131-linux-x64.tar.gz

[root@master java]# chmod +x /usr/java/jdk1.8.0_131/bin/*

使用vi配置环境变量

[lyu@master java]$ vi /home/lyu/.bash_profile

复制粘贴以下内容添加到到上面vi打开的文件中：

export JAVA_HOME=/usr/java/jdk1.8.0_131/

export PATH=$JAVA_HOME/bin:$PATH

使改动生效命令：

[lyu@master java]$ source /home/lyu/.bash_profile

测试配置：

[lyu@master ~]$ java -version

java version "1.8.0_131"
Java(TM) SE Runtime Environment (build 1.8.0_131-b11)

Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)

免密钥登录配置

该部分所有的操作都要在lyu用户下，切换回lyu的命令是：

su -lyu

1、HadoopMaster节点

在终端生成密钥，命令如下（一路点击回车生成密钥）

[lyu@master ~]$ ssh-keygen -t rsa

复制公钥文件

[lyu@master .ssh]$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

执行ls -l命令后会看到下图的文件列表

[lyu@master .ssh]$ ll
total 16
-rw-------. 1 lyu lyu 392 Feb 24 19:47 authorized_keys
-rw-------. 1 lyu lyu 1675 Feb 24 19:46 id_rsa
-rw-r--r--. 1 lyu lyu 392 Feb 24 19:46 id_rsa.pub

-rw-r--r--. 1 lyu lyu 181 Feb 24 19:49 known_hosts

修改authorized_keys文件的权限，命令如下：

[lyu@master .ssh]$ chmod 600 ~/.ssh/authorized_keys

将authorized_keys文件复制到slave节点，命令如下：

[lyu@master .ssh]$ scp ~/.ssh/authorized_keys lyu@slave:~/

如果提示输入yes/no的时候，输入yes，回车

密码是：lyu

2、HadoopSlave节点

在终端生成密钥，命令如下（一路点击回车生成密钥）

[lyu@slave ~]$ ssh-keygen -t rsa

将authorized_keys文件移动到.ssh目录

[lyu@slave ~]$ mv authorized_keys ~/.ssh/

3、验证免密钥登陆

在HadoopMaster机器上执行下面的命令：

[lyu@master ~]$ ssh slave

如果出现下图的内容表示免密钥配置成功：

[lyu@master .ssh]$ ssh slave
Last login: Sun Feb 25 03:24:41 2018 from 192.168.6.100
[lyu@slave ~]$

Hadoop配置部署

每个节点上的Hadoop配置基本相同，在HadoopMaster节点操作，然后完成复制到另一个节点。

下面所有的操作都使用lyu用户，切换lyu用户的命令是：

[root@master lyu]$ su - lyu

密码是：lyu

1 Hadoop安装包解压

进入Hadoop软件包，命令如下：

[lyu@master ~]$ cd /home/lyu/resources/software/hadoop

复制并解压Hadoop安装包命令如下：

[lyu@master ~]$ cp hadoop-2.7.5.tar.gz ~/

[lyu@master ~]$ cd

[lyu@master ~]$ tar -xvf ~/hadoop-2.7.5.tar.gz

[lyu@master ~]$ cd ~/hadoop-2.7.5

2 配置环境变量hadoop-env.sh

环境变量文件中，只需要配置JDK的路径。

[lyu@master hadoop-2.7.5]$ vi /home/lyu/hadoop-2.7.5/etc/hadoop/hadoop-env.sh

在文件的靠前的部分找到下面的一行代码：

export JAVA_HOME=${JAVA_HOME}

将这行代码修改为下面的代码：

export JAVA_HOME=/usr/java/jdk1.8.0_131/

然后保存文件。

3 配置环境变量yarn-env.sh

环境变量文件中，只需要配置JDK的路径。

[lyu@master hadoop-2.7.5]$ vi ~/hadoop-2.7.5/etc/hadoop/yarn-env.sh

在文件的靠前的部分找到下面的一行代码：

# export JAVA_HOME=/home/y/libexec/jdk1.6.0/

将这行代码修改为下面的代码（将#号去掉）：

export JAVA_HOME=/usr/java/jdk1.8.0_131/

然后保存文件。

4 配置核心组件core-site.xml

使用vi编辑：

[lyu@master hadoop-2.7.5]$ vi ~/hadoop-2.7.5/etc/hadoop/core-site.xml

用下面的代码替换core-site.xml中的内容：

fs.defaultFS

hdfs://master:9000

hadoop.tmp.dir

/home/lyu/hadoopdata

5 配置文件系统hdfs-site.xml

使用vi编辑：

[lyu@master hadoop-2.7.5]$ vi ~/hadoop-2.7.5/etc/hadoop/hdfs-site.xml

用下面的代码替换hdfs-site.xml中的内容：

dfs.replication

1

6 配置文件系统yarn-site.xml

使用vi编辑：

[lyu@master hadoop-2.7.5]$ vi ~/hadoop-2.7.5/etc/hadoop/yarn-site.xml

用下面的代码替换yarn-site.xml中的内容：

yarn.nodemanager.aux-services
mapreduce_shuffle

yarn.resourcemanager.address
master:18040

yarn.resourcemanager.scheduler.address
master:18030

yarn.resourcemanager.resource-tracker.address
master:18025

yarn.resourcemanager.admin.address
master:18141

yarn.resourcemanager.webapp.address
master:18088

7 配置计算框架mapred-site.xml

复制mapred-site-template.xml文件：

[lyu@master hadoop-2.7.5]$ cp ~/hadoop-2.7.5/etc/hadoop/mapred-site.xml.template ~/hadoop-2.7.5/etc/hadoop/mapred-site.xml

使用vi编辑：

[lyu@master ~]$ vi ~/hadoop-2.7.5/etc/hadoop/mapred-site.xml

用下面的代码替换mapred-site.xml中的内容

mapreduce.framework.name

yarn

8 在master节点配置slaves文件

使用vi编辑：

[lyu@master hadoop-2.7.5]$ vi ~/hadoop-2.7.5/etc/hadoop/slaves

用下面的代码替换slaves中的内容：

slave

9 复制到从节点

使用下面的命令将已经配置完成的Hadoop复制到从节点HadoopSlave上：

lyu@master hadoop-2.7.5]$ cd

[lyu@master ~]$ scp -r hadoop-2.7.5 lyu@slave:~/

注意：因为之前已经配置了免密钥登录，这里可以直接远程复制。

启动Hadoop集群

下面所有的操作都使用lyu用户，切换lyu用户的命令是：

su - lyu

密码是：lyu

1 配置Hadoop启动的系统环境变量

该节的配置需要同时在两个节点（HadoopMaster和HadoopSlave）上进行操作，操作命令如下：

[lyu@master hadoop-2.7.5]$ cd

[lyu@master ~]$ vi ~/.bash_profile

将下面的代码追加到.bash_profile末尾：

#HADOOP

export HADOOP_HOME=/home/lyu/hadoop-2.7.5

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

然后执行命令：

[lyu@master ~]$ source ~/.bash_profile

2 创建数据目录

该节的配置需要同时在两个节点（HadoopMaster和HadoopSlave）上进行操作。

在lyu的用户主目录下，创建数据目录，命令如下：

[lyu@master ~]$ mkdir /home/lyu/hadoopdata

3 启动Hadoop集群

3.1、格式化文件系统

格式化命令如下，该操作需要在HadoopMaster节点上执行：

[lyu@master ~]$ hdfs namenode -format

. . . . . .

3.2、启动Hadoop

使用start-all.sh启动Hadoop集群，首先进入Hadoop安装主目录，然后执行启动命令：

[lyu@master ~]$ cd ~/hadoop-2.7.5

[lyu@master hadoop-2.7.5]$ sbin/start-all.sh

执行命令后，提示出入yes/no时，输入yes。

3.3、查看进程是否启动

在HadoopMaster的终端执行jps命令，在打印结果中会看到4个进程，分别是ResourceManager、Jps、NameNode和SecondaryNameNode，如下图所示。如果出现了这4个进程表示主节点进程启动成功。

[lyu@master hadoop-2.7.5]$ jps
3588 Jps
3333 ResourceManager
2984 NameNode
3176 SecondaryNameNode

[lyu@master hadoop-2.7.5]$

在HadoopSlave的终端执行jps命令，在打印结果中会看到3个进程，分别是NodeManager、DataNode和Jps，如下图所示。如果出现了这3个进程表示从节点进程启动成功。

[lyu@slave ~]$ jps
2520 DataNode
2763 Jps
2638 NodeManager

[lyu@slave ~]$

3.4、Web UI查看集群是否成功启动

在HadoopMaster上启动Firefox浏览器，在浏览器地址栏中输入输入http://master:50070/，检查 namenode 和 datanode 是否正常。UI页面如下图所示。

在HadoopMaster上启动Firefox浏览器，在浏览器地址栏中输入输入http://master:18088/，检查 Yarn是否正常，页面如下图所示。

3.5、运行PI实例检查集群是否成功

进入Hadoop安装主目录，执行下面的命令：

[lyu@master~]$ hadoop jar ~/hadoop-2.7.5/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.5.jar pi 10 10

会看到如下的执行结果：

最后输出：
Estimated value of Pi is 3.20000000000000000000
如果以上的3个验证步骤都没有问题，说明集群正常启动。

你可能感兴趣的:(大数据整理)

深度学习-图像数据标注工具使用（LabelImg和BBox） AI研习图书馆方法教程 LabelImg BBox 图像标注工具
文章与视频资源多平台更新微信公众号|知乎|B站|头条：AI研习图书馆深度学习、大数据、IT编程知识与资源分享，欢迎关注，共同进步~图像数据标注工具的使用教程1.LabelImgLabelImg下载地址：https://github.com/tzutalin/labelImg（下载源码，需要编译）Windows和Linux系统可运行软件：http://tzutalin.github.io/label
python 根据元素值获取span 大紫菜 python java android javascript 数据库
我整理的一些关于【网页内容,HTML,python】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/eDOcp1用Python根据元素值获取在实际的网页开发与数据抓取中，我们经常需要根据元素的值来获取对应的HTML标签，比如。本文将教你如何用Python实现这一功能。本文将详细阐述整个处理的流程，并展示具体的代码示例。流程概览下面是根据元素值获取的主要
[系统安全] 六十一.恶意软件分析 (12)LLM赋能Lark工具提取XLM代码的抽象语法树（初探） Eastmount 系统安全与恶意代码分析系统安全抽象语法树 Lark 大模型 XLM
您可能之前看到过我写的类似文章，为什么还要重复撰写呢？只是想更好地帮助初学者了解病毒逆向分析和系统安全，更加成体系且不破坏之前的系列。因此，我重新开设了这个专栏，准备系统整理和深入学习系统安全、逆向分析和恶意代码检测，“系统安全”系列文章会更加聚焦，更加系统，更加深入，也是作者的慢慢成长史。换专业确实挺难的，逆向分析也是块硬骨头，但我也试试，看看自己未来四年究竟能将它学到什么程度，漫漫长征路，偏向
Spark 任务与 Spark Streaming 任务的差异详解 goTsHgo spark-streaming 分布式大数据 spark streaming 大数据分布式
Spark任务与SparkStreaming任务的主要差异源自于两者的应用场景不同：Spark主要处理静态的大数据集，而SparkStreaming处理的是实时流数据。这些差异体现在任务的调度、执行、容错、数据处理模式等方面。接下来，我们将从底层原理和源代码的角度详细解析Spark任务和SparkStreaming任务的差别。1.任务调度模型差异1.1Spark任务的调度模型Spark的任务调度基
Python大数据之PySpark(三)使用Python语言开发Spark程序代码_windows spark python 2401_84181704 程序员大数据 python spark
算子：rdd的api的操作，就是算子，flatMap扁平化算子，map转换算子Transformation算子Action算子步骤：1-首先创建SparkContext上下文环境2-从外部文件数据源读取数据3-执行flatmap执行扁平化操作4-执行map转化操作，得到(word,1)5-reduceByKey将相同Key的Value数据累加操作6-将结果输出到文件系统或打印代码：#-*-codi
《大数据时代“快刀”：Flink实时数据处理框架优势全解析》程序猿阿伟大数据 flink
在数字化浪潮中，数据呈爆发式增长，实时数据处理的重要性愈发凸显。从金融交易的实时风险监控，到电商平台的用户行为分析，各行业都急需能快速处理海量数据的工具。Flink作为一款开源的分布式流处理框架，在这一领域崭露头角，备受瞩目。一、真正实时，毫秒级响应与部分将流处理模拟为微批处理的框架不同，Flink是专为实时流处理打造的“原生”引擎。它直接处理持续不断的事件流，无需将数据攒成批次再处理，这种设计赋
大模型开发流程及项目实战辣椒种子机器学习人工智能
一、大模型开发整理流程1.1、什么是大模型开发我们将开发以大语言模型为功能核心、通过大语言模型的强大理解能力和生成能力、结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。开发大模型相关应用，其技术核心点虽然在大语言模型上，但一般通过调用API或开源模型来实现核心的理解与生成，通过PromptEnginnering来实现大语言模型的控制，因此，虽然大模型是深度学习领域的集大成之作，大模型开
pandas与data.table比较和常用操作整理 kekefen01
在对数据表进行日常操作时，有一些操作是经常用到的，记录如下：1.输入：从文件读取数据/从头创建一个dataframepd.DataFrame(data,index=[list],columns=[list])2.修改列名、索引列a.columns=[yourlisthere]DataFrame可以通过set_index方法，可以设置单索引和复合索引。3.切片操作df可以[]直接切片，不过规则比较混
园区智能化系统实现管理与服务的智能化转型与创新进阶快鲸智慧楼宇管理系统其他
内容概要园区智能化系统的出现，标志着管理与服务向智能化转型的重要一步。这一系统不仅仅是一个技术解决方案，更是一个全面提升园区运营效率与安全性的独特工具。通过集成大数据分析、物联网和人工智能，园区智能化系统能够为各类园区如工业园、产业园、物流园、写字楼与公寓等提供切实可行的解决方案。“智能化管理不仅是未来的发展趋势，更是提升竞争力的必要手段。”在资产管理方面，智能化系统能够实时监控并优化资源的配置，
松灵机器人SCOUT的ROS代码架构鱼尾sama ROS c++自动驾驶
++++++++++++++++++++++++++++++++++++松灵机器人感觉可能还是比较小众吧。明明官方的github，但是star之类的完全没有关注度，也没有issue。这个SCOUT_ROS主要是解决SCOUT底盘与上位机的通信方式，截止目前，已经开放了RS232和CAN两种通信方式。而且CSDN上只有寥寥几篇的相关博客，参考价值不高。故整理此篇，以供后日快速上手。代码地址：http
CDH_6.3.2的搭建我的K8409 Flink linux 大数据分布式
一站式搭建大数据的应用1、前提条件和准备工作hostnamectlset-hostnamecdh01hostnamectlset-hostnamecdh02hostnamectlset-hostnamecdh032、修改IP和Host映射关系（所有节点）在window中也配置一下vim/etc/hosts192.168.92.201cdh01192.168.92.202cdh02192.168.9
大数据笔记之 Flink1.17 算子凡许真大数据 flink1.17 算子
文章目录前言一、Partition分区（物理分区）1.1随机分区shuffle1.2轮询分区rebalance1.3重缩放分区rescale1.4广播分区broadcast1.5全局分区global1.6keyby1.7自定义分区Custom二、transform2.1flatMap2.2filter2.3RichFunction2.4map三、Aggregate聚合3.1keyBy()3.2ma
机器学习强基计划7-6：图文详解层次聚类AGNES算法(附Python实现)_agnes聚类算法python代码软件开发Java 2024年程序员学习机器学习算法聚类
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
LLM-预训练：深入理解 Megatron-LM（2）原理介绍 u013250861 #LLM/训练人工智能
最近在基于Megatron-LM的代码来训练大语言模型，本人觉得Megatron的代码很具有学习意义，于是大量参考了网上很多对Megatron代码的解读文章和NVIDAMegatron团队公开发布的2篇论文，并结合最近Megatron-LM代码库的更新，整理成了这几篇系列文章。Megatron-LM代码版本：23.06https://github.com/NVIDIA/Megatron-LM/tr
2022年SQL经典面试题总结（带解析） m0_66557301 面试学习路线阿里巴巴 android 前端后端
吐血整理了一周SQL面试题，包括了选择题、问答题、实战题。每道题都给大家加了详细的解析。几乎每个知识点都涉及到了。刷完这套题，关于SQL的面试妥妥的。题目来源：各大厂面试题、牛客网文章目录一、选择题（1）基础题（2）进阶题二、问答题三、实战题一、选择题（1）基础题1、要求删除商品表中价格大于3000的商品，下列SQL语句正确的是（）A、DELETEFROM商品WHERE价格>3000B、DELET
01.双Android容器解决方案高桐@BILL 容器 Android
目录写在前面一，容器1.1容器的原理1.1.1Namespace1.1.2Cgroups（ControlGroups）1.1.3联合文件系统（UnionFileSystem）1.2容器的应用1.2.1微服务架构1.2.2持续集成和持续部署（CI/CD）1.2.3多租户环境1.2.4混合云和多云环境1.2.5大数据和机器学习1.2.6android应用场景1.3容器方案选型1.3.1Docker1.
监控易：智慧高校一体化综合运维解决方案 MXsoft618 运维信息安全物联网监控类
新冠疫情发生以来，线上线下教育模式的初探，促使学校、家长和社会对于教育信息化认识产生巨大的转变。伴随着云计算和物联网的发展，教育已经开启了一个全新的时代。自“十三五”规划中明确提出“支持各级各类学校建设智慧校园，综合利用互联网、大数据、人工智能和虚拟现实技术探索未来教育教学新模式”以来，政策春风也不断加码教育信息化进程，《教育信息化2.0行动计划》以及《智慧校园总体框架》的相继发布，全国各地都在积
docker安装nacos2.2.4详解（含：nacos容器启动参数、环境变量、常见问题整理）飞火流星02027 docker SpringCloud Alibaba 分布式 docker 容器运维 docker安装nacos nacos容器环境变量 docker启动nacos参数 nacos镜像下载
一、镜像下载1、在线下载在一台能连外网的linux上执行docker镜像拉取命令dockerpullnacos:2.2.42、离线包下载两种方式：方式一：-）在一台能连外网的linux上安装docker执行第一步的命令下载镜像-）导出#导出镜像到本地当前目录dockersave-onacos-2.2.4.tarnacos:2.2.4方式二：-）Window桌面程序：DockerDesktop-）下
TDengine 做为 FLINK 数据源技术参考手册 TDengine （老段） tdengine flink 大数据涛思数据时序数据库数据库
ApacheFlink是一款由Apache软件基金会支持的开源分布式流批一体化处理框架，可用于流处理、批处理、复杂事件处理、实时数据仓库构建及为机器学习提供实时数据支持等诸多大数据处理场景。与此同时，Flink拥有丰富的连接器与各类工具，可对接众多不同类型的数据源实现数据的读取与写入。在数据处理的过程中，Flink还提供了一系列可靠的容错机制，有力保障任务即便遭遇意外状况，依然能稳定、持续运行。借
Hadoop HA 架构 weixin_30569033 shell 大数据
为什么要用集群?企业里面,多台机器伪分布式每一个角色都是一个进程HDFS:NNSNNDNYARN:RMNM大数据所有组件,都是主从架构master-slaveHDFS读写请求都是先到NN节点,但是,HBase读写请求不是经过master,建表和删除表是需要经过masterNN节点挂了,就不能提供对外服务(-put,-get)需要配置两个NN节点(实时的,任何时刻只有一台active对外,另外一台是
守护每一比特的安全——探索基于差分隐私的MySQL数据脱敏之道墨夶数据库学习资料2 安全 mysql 数据库
在当今数字化时代，随着互联网和大数据技术的发展，数据的价值愈发凸显。然而，随之而来的个人隐私泄露风险也日益增加，成为社会广泛关注的问题之一。特别是在医疗、金融等领域，如何既能充分利用海量数据资源推动行业发展，又能有效保护用户隐私不被侵犯，成为了亟待解决的重要课题。本文将深入探讨一种创新的数据安全共享方案——基于差分隐私（DifferentialPrivacy,DP）的MySQL数据库实现方法，旨在
半导体制造工艺流程 Stestack 制造
半导体制造工艺过程非常多，据说有几百甚至几千个步骤。一个百亿投资的工厂做的可能也只是其中的一小部分工艺过程。对于这么复杂的工艺，可分为五个大类进行解说：晶圆制造、光刻蚀刻、离子注入、薄膜沉积、封装测试。另一种划分：每个半导体元件产品的制造都需要数百道工序。经过整理，整个制造过程分为八个步骤：晶圆加工、氧化、照相、蚀刻、薄膜沉积、互连、测试、封装一、半导体生产工艺（1）晶圆制造(WaferManuf
软考-软件设计师(8)-系统开发与软件工程:UML、网络计划技术、软件过程模型、系统开发方法论、设计模式、敏捷开发、软件测试、软件质量保证、项目管理、开发工具、环路复杂性、数据库设计等高频考点霸道流氓气质软考软件工程设计模式软考软件设计师
场景软考-软件设计师-系统开发与软件工程模块高频考点整理。以下为高频考点、知识点汇总。软件设计师上午选择题知识点、高频考点、口诀记忆技巧、经典题型汇总：软考-软件设计师(1)-计算机基础知识点:进制转换、数据编码、内存编址、串并联可靠性、海明校验码、吞吐率、多媒体等：软考-软件设计师(1)-计算机基础知识点:进制转换、数据编码、内存编址、串并联可靠性、海明校验码、吞吐率、多媒体等-CSDN博客软考
阿里最全面试116题整理数据存储张程序人生数据库使用与原理解析零基础linux入门到精通 C\C++入门到精通面试题 java 阿里
阿里天猫、蚂蚁金服、阿里巴巴面试题整理，可以作为参考。1.junit用法，before,beforeClass,after,afterClass的执行顺序2.分布式锁3.nginx的请求转发算法，如何配置根据权重转发4.用hashmap实现redis有什么问题（死锁，死循环，可用ConcurrentHashmap）5.线程的状态5.线程的阻塞的方式6.sleep和wait的区别7.hashmap的
12.udp 就很对 udp 网络协议网络
12.udp**1.UDP特性****2.UDP编程框架（C/S模式）****3.UDP发送接收函数****4.UDP编程练习**1.UDP特性连接特性：无链接，通信前无需像TCP那样建立连接。可靠性：不可靠，不保证数据按序到达、不保证数据无丢失或重复。数据传输：适合传输大数据，但实际传输受网络MTU等因素限制。2.UDP编程框架（C/S模式）服务器端流程：创建套接字：调用socket()函数，参
【1】阿里面试题整理独自破碎E Java面经 c#java kafka mybatis hash
[1].Kafka如何保证数据一致性？Kafka主要通过副本机制、ISR机制、持久化机制以及事务机制等多种方式共同保证了数据的一致性。副本机制是Kafka确保数据一致性的基础，使用ISR(In-SyncReplica)机制来处理副本之间的同步，将消息持久化到硬盘中，以确保消息在发生故障时不会丢失。引入事务机制来支持事务性消息，确保消息的原子性、一致性、隔离性和持久性，从而保证数据在生产和消费过程中
【2】阿里面试题整理独自破碎E Java面经网络 java 网络协议 http tcp/ip
[1].说一下Java与C++的区别。Java和C++是两种在软件开发领域应用非常广泛的语言，但它们的设计理念和应用场景有所不同。Java是一种基于JVM的解释型语言，具有跨平台性，使用自动垃圾回收机制，这使得开发者可以更专注于业务逻辑，而不需要处理底层的内存管理细节。C++则是一种编译型语言，直接编译成机器码，因此在性能方面具有显著优势。C++支持指针和手动内存管理，开发者可以更精细地控制硬件资
从0开始使用面对对象C语言搭建一个基于OLED的图形显示框架（OLED设备层封装） charlie114514191 OLED驱动开发记录 c语言教程 OLED 单片机 stm32 嵌入式软件
目录OLED设备层驱动开发如何抽象一个OLED完成OLED的功能初始化OLED清空屏幕刷新屏幕与光标设置1刷新屏幕与光标设置2刷新屏幕与光标设置3绘制一个点反色区域化操作区域置位区域反色区域更新区域清空测试我们的抽象整理一下，我们应该如何使用？在上一篇博客：从0开始使用面对对象C语言搭建一个基于OLED的图形显示框架2-CSDN博客中，我们完成了协议层的抽象，现在让我们更近一步，完成对设备层的抽象
R语言安装zip包毕崇亮 r语言开发语言
我整理的一些关于【管理】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/eDOcp1如何在R语言中安装zip包作为一名刚入行的开发者，你可能对R语言中的包管理有些困惑。今天，我将带你一步步了解如何在R语言中安装zip包，并通过简单的示例帮助你掌握这一技能。安装包可以让你使用更丰富的功能与工具，所以这是一项非常重要的基础技能。安装zip包的流程在开始之前
【大数据入门核心技术-Hive】（十一）HiveSQL数据分区 forest_long 大数据技术入门到21天通关大数据 hive hadoop 数据仓库 hdfs
目录一、分区的概念二、创建分区1）静态分区1、单分区测试2、多分区测试2)动态分区3、动态分区和静态分区混合使用三、分区的其它操作1、恢复分区2、归档分区3、交换分区四、分区数据查询1、单分区数据查询2、多分区数据查询方法1：通过union方法2：通过or一、分区的概念数据分区的概念以及存在很久了，通常使用分区来水平分散压力，将数据从物理上移到和使用最频繁的用户更近的地方，以及实现其目的。hive
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他