0x8g1T9E

使用 Docker 搭建 Hadoop + Hive + Spark 集群

本文探讨了使用 Docker 搭建 Hadoop + Hive + Spark 集群的方法，项目地址在此。在阅读本文前，建议先对 Docker 以及 Docker Compose 有基本的了解。

准备工作

本项目基于 Docker 和 Docker Compose，搭建的集群包含以下部分：

Hadoop
Hive
Spark

本项目参考了 Big Data Europe 的一些工作。项目中所使用的 Docker 镜像可能会被更新，可以参看他们的 Docker Hub 以获取最新镜像。

本项目所依赖的版本号如下：

Client:
 Version:           20.10.2
Server: Docker Engine - Community
 Engine:
  Version:          20.10.6
docker-compose version 1.29.1, build c34c88b2

快速开始

直接克隆我的项目并运行集群：

1
2
3

git clone https://gitee.com/horysk/docker-hadoop-workbench.git
cd docker-hadoop-workbench
./start_demo.sh

也可以使用 docker-compose-v2.yml，该集群包含我简单修改的 spark-master 镜像，以及额外添加的 spark-history-server 镜像。

1	./start_demo_v2.sh

使用 ./stop_demo.sh 或 ./stop_demo_v2.sh 关闭集群。你可以修改 start_demo.sh 与 stop_demo.sh 文件里的 DOCKER_COMPOSE_FILE 变量以使用其他版本的 YAML 文件。

集群内容

本集群包含以下 Container：

namenode
datanode
resourcemanager
nodemanager
historyserver
hive-server
hive-metastore
hive-metastore-postgresql
presto-coordinator
spark-master
spark-worker
spark-history-server (使用 v2 版本)

同时本集群需要用到名为 hadoop 的 network，以及以下 volume：

hadoop_namenode
hadoop_datanode
hadoop_historyserver
hive_metastore

这些都需要特别注意以避免冲突。

可交互的端口列表

综述

namenode: 9000, 9870
datanode: 9864
resourcemanager: 8088
nodemanager: 8042
historyserver: 8188
hive-server: 10000, 10002
hive-metastore: 9083
presto-coordinator: 8090
spark-master: 4040, 7077, 8080, 18080 (v2 版本 18080 接口由 spark-history-server 提供)
spark-worker: 8081

如有冲突，可以在 docker-compose.yml 里更改暴露的端口。

UI 列表

Namenode: http://localhost:9870/dfshealth.html#tab-overview
Datanode: http://localhost:9864/
ResourceManager: http://localhost:8088/cluster
NodeManager: http://localhost:8042/node
HistoryServer: http://localhost:8188/applicationhistory
HiveServer2: http://localhost:10002/
Spark Master: http://localhost:8080/
Spark Worker: http://localhost:8081/
Spark Job WebUI: http://localhost:4040/ (当 Spark 任务在 spark-master 运行时才可访问)
Presto WebUI: http://localhost:8090/
Spark History Server：http://localhost:18080/

HDFS

可以使用 hdfs dfs 连接到 hdfs://localhost:9000/ (请先在本机安装 Hadoop):

1	hdfs dfs -ls hdfs://localhost:9000/

Hive

可以使用 Beeline 连接到 HiveServer2 (请先在本机安装 Hive):

1	beeline -u jdbc:hive2://localhost:10000/default -n hive -p hive

Spark

可以使用 spark-shell 通过 thrift 协议连接到 Hive Metastore (请先在本机安装 Spark):

$ spark-shell

Welcome to
      ____              __
     / __/__  ___ _____/ /__
    _\ \/ _ \/ _ `/ __/  '_/
   /___/ .__/\_,_/_/ /_/\_\   version 3.1.2
      /_/

Using Scala version 2.12.10 (OpenJDK 64-Bit Server VM, Java 11.0.11)

scala> :paste
// Entering paste mode (ctrl-D to finish)

import org.apache.spark.sql.SparkSession

val spark = SparkSession.builder.master("local")
              .config("hive.metastore.uris", "thrift://localhost:9083")
              .enableHiveSupport.appName("thrift-test").getOrCreate

spark.sql("show databases").show


// Exiting paste mode, now interpreting.

+---------+
|namespace|
+---------+
|  default|
+---------+

import org.apache.spark.sql.SparkSession
spark: org.apache.spark.sql.SparkSession = org.apache.spark.sql.SparkSession@1223467f

Presto

可以使用 Presto CLI 连接 Presto 并且读取 Hive 的数据：

wget https://repo1.maven.org/maven2/com/facebook/presto/presto-cli/0.255/presto-cli-0.255-executable.jar
mv presto-cli-0.255-executable.jar presto
chmod +x presto
./presto --server localhost:8090 --catalog hive --schema default

设置列表

以下列举了容器内部的一些设置所在的位置。后面的以 CONF 结尾的是它们在 hadoop.env 中的代号。你可以参考 hadoop.env 文件做额外的设置。

namenode:
- /etc/hadoop/core-site.xml CORE_CONF
- /etc/hadoop/hdfs-site.xml HDFS_CONF
- /etc/hadoop/yarn-site.xml YARN_CONF
- /etc/hadoop/httpfs-site.xml HTTPFS_CONF
- /etc/hadoop/kms-site.xml KMS_CONF
- /etc/hadoop/mapred-site.xml MAPRED_CONF
hive-server:
- /opt/hive/hive-site.xml HIVE_CONF

很可惜 Spark 的设置不在这个列表里。在 spark-master 的 /spark/conf 文件夹下可以存放 Spark 的设置，我准备了 scripts/spark-defaults.conf 与 scripts/spark-hive-site.xml 两个文件，它们已经在启动脚本里自动上传。

运行示例任务

运行 MapReduce `WordCount`

这部分基于 Big Data Europe’s Hadoop Docker 的项目里的运行示例。

首先我们运行一个辅助容器 hadoop-base：

1	docker run -d --network hadoop --env-file hadoop.env --name hadoop-base bde2020/hadoop-base:2.0.0-hadoop3.2.1-java8 tail -f /dev/null

接下来运行以下命令以准备数据并启动 MapReduce 任务：

docker exec -it hadoop-base hdfs dfs -mkdir -p /input/
docker exec -it hadoop-base hdfs dfs -copyFromLocal -f /opt/hadoop-3.2.1/README.txt /input/
docker exec -it hadoop-base mkdir jars
docker cp jars/WordCount.jar hadoop-base:jars/WordCount.jar
docker exec -it hadoop-base /bin/bash 
hadoop jar jars/WordCount.jar WordCount /input /output

接下来，你可以通过以下链接看到任务状态：

http://localhost:8088/cluster/apps
http://localhost:8188/applicationhistory (运行结束后)

当任务运行完成，运行以下命令查看结果：

1	hdfs dfs -cat /output/*

最后你可以使用 exit 退出该容器。

运行 Hive 任务

请首先确定 hadoop-base 正在运行中。关于如何启动此辅助容器，请参看上一节。接下来准备数据：

docker exec -it hadoop-base hdfs dfs -mkdir -p /test/
docker exec -it hadoop-base mkdir test
docker cp data hadoop-base:test/data
docker exec -it hadoop-base /bin/bash
hdfs dfs -put test/data/* /test/
hdfs dfs -ls /test
exit

然后新建 Hive 表：

docker cp scripts/hive-beers.q hive-server:hive-beers.q
docker exec -it hive-server /bin/bash
cd /
hive -f hive-beers.q
exit

接下来你就可以使用 Beeline 访问到这些数据了：

1
2
3

beeline -u jdbc:hive2://localhost:10000/test -n hive -p hive

0: jdbc:hive2://localhost:10000/test> select count(*) from beers;

同样，你可以通过以下链接看到任务状态：

http://localhost:8088/cluster/apps
http://localhost:8188/applicationhistory (运行结束后)

运行 Spark Shell

在进行这一步前，请先参看前面两个章节以准备 Hive 数据并创建表格。然后运行以下命令：

1	docker exec -it spark-master spark/bin/spark-shell

进入 Spark Shell 后，你可以直接通过先前创建的 Hive 表进行操作：

scala> spark.sql("show databases").show
+---------+
|namespace|
+---------+
|  default|
|     test|
+---------+

scala> val df = spark.sql("select * from test.beers")
df: org.apache.spark.sql.DataFrame = [id: int, brewery_id: int ... 11 more fields]

scala> df.count
res0: Long = 7822

你可以在以下两个地址看到你的 Spark Shell 会话：

http://localhost:8080/
http://localhost:4040/jobs/ (运行时)

如果你在运行 spark-shell 的时候遇到了以下警告：

1	WARN TaskSchedulerImpl: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources

该警告显示没有资源可以去运行你的任务，并提醒你去检查 worker 是否都已经被注册，而且拥有足够多的资源。此时你需要使用 docker logs -f spark-master 检查一下 spark-master 的日志。不出意外的话，你会看到下面的内容：

1	WARN Master: Got heartbeat from unregistered worker worker-20210622022950-xxx.xx.xx.xx-xxxxx. This worker was never registered, so ignoring the heartbeat.

这是在提示你有一个 worker 没有被注册，所以忽略了它的心跳。该 worker 没有被注册的原因很多，很可能是之前电脑被休眠过，导致 worker 掉线。这时你可以使用 docker-compose restart spark-worker 重启 spark-worker，重启完成后，该 worker 就会被自动注册。

同样，如果要运行 spark-sql，可以使用这个命令：docker exec -it spark-master spark/bin/spark-sql。

运行 Spark Submit 任务

我们直接运行 Spark 内置的示例任务 Spark Pi：

1	docker exec -it spark-master /spark/bin/spark-submit --class org.apache.spark.examples.SparkPi /spark/examples/jars/spark-examples_2.12-3.1.1.jar 100

你可以在以下两个地址看到你的 Spark Pi 任务：

http://localhost:8080/
http://localhost:4040/jobs/ (运行时)

本教程的集群搭建与使用方法就介绍到这里。以后可能会增加一些别的组件，会另外写文章来说明。

使用Docker搭建Hadoop + Hive + Spark集群（下） | Bambrow's Blog

你可能感兴趣的:(k8s,hadoop,spark,hadoop,docker)

Docker 学习（一）酥暮沐 docker 容器运维
一、Docker核心概念Docker是一个开源的容器化平台，允许开发者将应用及其所有依赖（代码、运行时、系统工具、库等）打包成一个轻量级、可移植的“容器”，实现“一次构建，随处运行”。1、容器（Container）轻量级、可执行的软件包，包含应用及其所有依赖（代码、运行时、系统工具、库等）。基于镜像运行，独立于宿主机操作系统，共享宿主内核。2、镜像（Image）只读模板，用于创建容器。由多层文件系
【实战 ES】实战 Elasticsearch：快速上手与深度实践-1.3.1单节点安装（Docker与手动部署）言析数智实战 elasticsearch docker 大数据
点击关注不迷路点击关注不迷路点击关注不迷路文章大纲10分钟快速部署`Elasticsearch`单节点环境1.系统环境要求1.1硬件配置推荐1.2软件依赖2.`Docker`部署方案2.1部署流程2.2参数说明2.3性能优化建议3.手动部署方案3.1安装步骤3.2核心配置项3.3启动服务4.部署方式对比5.验证安装结果5.1基础健康检查5.2性能测试6.常见问题排查6.1启动失败问题6.2性能优化
IoT安全软件：CyberX二次开发_CyberX二次开发入门 chenlz2007 物联网物联网安全网络协议网络 java
CyberX二次开发入门1.环境搭建1.1安装CyberX开发环境在开始CyberX二次开发之前，首先需要搭建一个合适的开发环境。CyberX支持多种开发语言和平台，但为了简化开发流程，建议使用Python和Docker。以下是一些基本步骤：1.1.1安装Python确保您的系统中已经安装了Python3.7以上版本。您可以使用以下命令检查Python版本：python--version如果未安装
3.8 Docker最新入门教程-Docker入门-使用 Docker Compose eyes-star docker docker 容器运维
3.8使用DockerComposeDockerCompose是一种旨在帮助定义和共享多容器应用程序的工具。使用Compose，我们可以创建一个YAML文件来定义服务，并使用一个命令，可以启动所有内容或将其全部拆除。使用Compose的一大优势是您可以在文件中定义您的应用程序堆栈，将其保存在项目存储库的根目录中（它现在是版本控制的），并且可以轻松地让其他人为您的项目做出贡献。有人只需要克隆您的存储
anolis 8.9安装k8s lwprain kubernetes 容器云原生
关闭防火墙systemctldisablefirewalld--now关闭selinuxsetenforce0sudosed-i's/^SELINUX=.*/SELINUX=disabled/g'/etc/selinux/config关闭swapsudoswapoff-asudosed-ri's/.*swap.*/#&/'/etc/fstab配置内核参数sudotee/etc/sysctl.d/k
anolis-8.9通过docker导入WSL yolo_guo docker
1.起因之前一直使用VMware的方式安装虚拟机，但是其实只是用来充当编译服务而已。vmware虚拟机造成了大量的磁盘空间浪费。docker容器化的方式，可以轻量化的运行，存储空间需求少、分发部署。WSL+vscode可以在本机windows上就可以建立linux开发环境，代码编辑，编译、版本管理集成度高。环境：版本Windows11家庭中文版版本号23H2安装日期‎2023/‎7/‎19操作系统
hadoop集群启动问题总结 @飞往你的山 hadoop hdfs 大数据
首先，我们来尝试启动hadoop集群：start-all.sh然后，我遇到了下面的问题：Warning:Permanentlyadded'hadoop'(RSA)tothelistofknownhosts.其实解决问题的办法也很简单，只需要在每台机器上面通过下面的命令修改文件就可以解决：vi/etc/ssh/ssh_config找到#StrictHostKeyCheckingask去掉注释，并把a
如何修改已有容器的端口号九月 linux docker linux
如何修改已有容器的端口号问题：工作中很多人会遇到容器打开的时候报错，端口号被占用的情况，那这个端口号该怎么修改，去哪里修改想法：docker在创建容器的时候，会自动生成容易的配置文件，所以可以采取这个方式找到并修改容器的端口号思路：关服务，找配置文件改端口号，开服务，检查是否修改成功1-关闭服务systemctlstopdocker[root@localhost~]#systemctlstopdo
hive-staging文件问题——DataX同步数据重复 Aldebaran α Hive sql hive 大数据 hdfs spark
1.产生原因1.使用Hue的界面工具执行Hive-sql。Hue会自动保存sql执行结果方便用户能够查看历史执行记录，所以会在相应目录下生成hive-staging文件；2.Hive-sql任务执行过程中出现异常，导致hive-staging文件未删除，未出现异常时，hive会自行删除hive-staging文件；3.使用spark-sqlonyarn跑sql程序生成的hive-staging文件
避免Hive和Spark生成HDFS小文件穷目楼数据库大数据大数据 spark hive hadoop
HDFS是为大数据设计的分布式文件系统，对大数据做了存储做了针对性的优化，但却不适合存储海量小文件。Hive和spark-sql是两个在常用的大数据计算分析引擎，用户直接以SQL进行大数据操作，底层的数据存储则多由HDFS提供。对小数据表的操作如果没做合适的处理则很容易导致大量的小文件在HDFS上生成，常见的一个情景是数据处理流程只有map过程，而流入map的原始数据数量较多，导致整个数据处理结束
Linux 下Hive 安装(Remote Metastore Database 单节点) A6-母婴小店-第6分店 HIVE hadoop
1、Linux下安装好mysql：Linux下Mysql安装2、启动hadoop集群：1、zk启动[root@node02~]#zkServer.shstartZooKeeperJMXenabledbydefaultUsingconfig:/opt/software/apache-zookeeper-3.6.2-bin/bin/../conf/zoo.cfgStartingzookeeper...
知识分享之Golang——Bleve中的Token filters各种标记过滤器 caihuayuan4 面试题汇总与解析 spring sql java 大数据课程设计
知识分享之Golang——Bleve中的Tokenfilters各种标记过滤器背景知识分享之Golang篇是我在日常使用Golang时学习到的各种各样的知识的记录，将其整理出来以文章的形式分享给大家，来进行共同学习。欢迎大家进行持续关注。知识分享系列目前包含Java、Golang、Linux、Docker等等。开发环境系统：windows10语言：Golang组件库：Blevegolang版本：1
Zookeeper - Docker安装，单机安装，单机三节点安装瑾析编程 zookeeper3.5.5 docker 一台服务器三个节点
该博客所有的文章都是自己的学习记录，方便后续复习，达到快速回顾知识点的作用。文章目录这篇文章主要记录Zookeeper的3.5.5版本下载，安装，启动。Docker-单机启动Linux(CentOS7.7)-单机启动Linux(CentOS7.7)-一台机器三节点启动Docker-单机启动下载dockerpullzookeeper:3.5.5注意事项image的版本对docker的版本也是有要求的
保姆级教程手把手教你如何快速部署一个属于你自己的微信AI机器人-支持群聊阿木木AEcru Docker容器化部署系列微信人工智能机器人
‍个人主页：阿木木AEcru(更多精彩内容可进入主页观看)系列专栏：《Docker容器化部署系列》《Java每日面筋》每一次技术突破，都是对自我能力的挑战和超越。目录一、前言二、部署方式选择三、申请讯飞星火大模型（免费）四、Docker部署机器人4.1获取部署文件4.2修改部署文件4.3启动脚本4.4绑定作为机器人的微信4.5测试五、结尾一、前言自从AI火了之后，相信大家也在不断的关注AI，从20
Ubuntu Docker 安装 Mr_One_Zhang 学习Docker ubuntu docker linux
DockerEngine-Community支持以下的Ubuntu版本：Xenial16.04(LTS)Bionic18.04(LTS)Cosmic18.10Disco19.04其他更新的版本……DockerEngine-Community支持上x86_64（或amd64）armhf，arm64，s390x（IBMZ），和ppc64le（IBM的Power）架构。使用官方安装脚本自动安装安装命令如
DeepSeek架构革命：动态异构计算伏羲栈人工智能架构
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
模块一：Docker基础入门（一） GODLIKENESS Docker docker 容器深度学习运维
Docker革命：为什么容器化是云时代的基石？被依赖地狱折磨的开发者们“在我机器上是好的啊！”——这句开发者的经典辩解，背后暴露的是环境差异带来的致命问题。想象这样的场景：运维人员部署Python应用时发现，测试环境的requests2.25.1在生产环境变成了requests3.0.0团队新人花一整天配置RubyonRails环境，却因macOS与Linux的文件系统差异导致bundleinst
机器学习_PySpark-3.0.3随机森林回归(RandomForestRegressor)实例 Mostcow 数据分析 Python 机器学习随机森林回归大数据
机器学习_PySpark-3.0.3随机森林回归(RandomForestRegressor)实例随机森林回归(RandomForestRegression):任务类型:随机森林回归主要用于回归任务。在回归任务中,算法试图预测一个连续的数值输出,而不是一个离散的类别。输出:随机森林回归的输出是一个连续的数值,表示输入数据的预测结果。算法原理:随机森林回归同样基于决策树,但在回归任务中,每个决策树的
强者联盟——Python语言结合Spark框架博文视点全栈工程师全栈全栈数据 Spark Python PySpark
引言：Spark由AMPLab实验室开发，其本质是基于内存的快速迭代框架，“迭代”是机器学习最大的特点，因此非常适合做机器学习。得益于在数据科学中强大的表现，Python语言的粉丝遍布天下，如今又遇上强大的分布式内存计算框架Spark，两个领域的强者走到一起，自然能碰出更加强大的火花（Spark可以翻译为火花），因此本文主要讲述了PySpark。本文选自《全栈数据之门》。全栈框架Spark由AMP
Spark技术系列（三）：Spark算子全解析——从基础使用到高阶优化数据大包哥 #Spark spark 大数据分布式
Spark技术系列（三）：Spark算子全解析——从基础使用到高阶优化1.算子核心概念与分类体系1.1算子本质解析延迟执行机制：转换算子构建DAG，行动算子触发Job执行任务并行度：由RDD分区数决定（可通过spark.default.parallelism全局配置）执行位置优化：基于数据本地性的任务调度策略1.2官方分类标准
在 MacBook 上设置 DeepSeek R1 (8B) 的 3 个步骤知识大胖 NVIDIA GPU和大语言模型开发教程 deepseek ollama openwebui
简介DeepSeek最近发布了R1模型，该模型在本地AI推理方面表现出色。如果您希望在MacBook上运行它，Ollama提供了一种无缝的方式来下载和管理模型。此外，使用Docker，您可以设置WebUI以方便地与其交互。本指南将引导您逐步完成启动和运行所有操作的过程。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《
【随笔笔记】将mysql数据迁移到群晖NAS QTEASY量化交易随笔笔记笔记 mysql 数据库
将mysql数据迁移到群晖NAS情况和问题前提条件方法1，使用管道方式传递数据方法2，导出数据为文件，复制到NAS上再导入情况和问题原本大量的金融数据保存在电脑本地硬盘的mysql数据库中，随着数据量越来越大，电脑的硬盘吃紧，正好把我的群晖NAS升级到了DS923+并且增加了4T的存储空间，可以使用Docker安装mysql并且存储空间不再是个问题，因此打算将电脑中的数据全部迁移到群晖NAS中。这
大数据经典技术解析：Hadoop+Spark大数据分析原理与实践 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介大数据时代已经来临。随着互联网、移动互联网、物联网等新兴技术的出现，海量数据开始涌现。而在这些海量数据的基础上进行有效的处理，成为迫切需要解决的问题之一。ApacheHadoop和ApacheSpark是目前主流开源大数据框架。由于其易于部署、高容错性、并行计算能力强、适应数据量大、可编程、社区支持广泛等特点，大大提升了大数据应用的效率和效果。本文通过对Hado
在 Windows 上安装 Docker 雄哥007 docker 容器运维 windows
1前言要开始使用Docker，您首先需要在开发计算机上安装它。安装类型取决于您的操作系统。Windows10计算机上的安装与WindowsServer计算机上的安装不同。最低系统要求为进行了周年纪念更新的Windows10专业版或企业版（版本1607）、WindowsServer2016或WindowsServer2019。Docker上的Windows容器可以在两种不同的运行时隔离模式下运行：（
Spark核心之06：知识点梳理小技工丨大数据技术学习 SparkSQL spark 大数据
spark知识点梳理spark_〇一1、spark是什么spark是针对于大规模数据处理的统一分析引擎，它是基于内存计算框架，计算速度非常之快，但是它仅仅只是涉及到计算，并没有涉及到数据的存储，后期需要使用spark对接外部的数据源，比如hdfs。2、spark四大特性1、速度快spark比mapreduce快的2个主要原因1、基于内存（1）mapreduce任务后期再计算的时候，每一个job的输
Hadoop基础知识及部署模式 2301_82242502 hadoop 大数据分布式
一、Hadoop是什么Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力，解决海量数据的存储及海量数据的分析计算问题。广义上的Hadoop是指Hadoop的整个技术生态圈；狭义上的Hadoop指的是其核心三大组件，包括HDFS、YARN及MapReduce.二、Hadoop的发展史Hadoop起源于Lucen
探讨Hadoop的基础架构及其核心特点 xx155802862xx hadoop 大数据分布式
Hadoop是一个开源软件框架，用于存储和处理大规模数据集。它是Apache软件基金会下的一个项目，灵感来源于Google的两篇论文：一篇关于Google文件系统（GFS），另一篇关于MapReduce。Hadoop设计用于从单台服务器扩展到数千台机器，每台机器提供局部计算和存储。而不仅仅是处理大数据，Hadoop的真正价值在于其对于数据的高容错性、可扩展性以及相对低成本的存储和处理能力。以下是探
Hadoop毕业设计:计算机毕业设计选题汇总(建议收藏) 会写代码的羊毕设选题 hadoop 课程设计大数据毕设选题毕设题目数据分析
文章目录前言基于Hadoop的毕业设计选题毕设作品展示前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。精彩专栏推荐订阅计算机毕业设计精品项目案例-500套基于JavaSpringBoot的微信校园二手交易小程序平台开发系列（一）基于校园二手物品交易小程序系统设计与实现系列（二）基于云开发微信小程序二手闲置商城校园跳
windows环境下，使用docker搭建redis集群一醉千秋 shell docker WebGIS web docker redis 容器
参考：https://blog.csdn.net/weixin_46594796/article/details/137864842https://www.cnblogs.com/niceyoo/p/14118146.html史上最详细Docker搭建RedisCluster集群环境值得收藏每步都有图，不用担心学不会-腾讯云开发者社区-腾讯云一、基础环境描述宿主机：192.168.8.209red
k8s面试题总结（七） a_j58 kubernetes 容器云原生
1.K8s中镜像下载策略有哪几种？Always,Never,IfNotPresent2.K8s中pod故障重启策略有哪几种？Always,Never,OnFailure3.什么是HeadlessService？HeadlessService是通过在Service的定义中设置clusterIP:None来实现的。它的核心特性是：没有ClusterIP：普通Service会分配一个虚拟的Cluster
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他