diggerTT

平台搭建---大数据框架---大数据组件的安装及部署

大数据组件图解

所有组件的安装最好都在自己操作的用户下，以免影响root用户下的文件，因为安装如果出错，可能无法还原这些文件,而且存在安全隐患；但有些组件如mysql必须用root用户来安装，因为涉及到修改root用户权限的问题，root用户安装可以避免因一些权限问题导致中间的安装不完全，root用户安装的软件其他用户可读可执行但无法修改。
如果安装的软件涉及到写文件，比如第一次开机，会在配置的某个目录里自动生成一些文件，此时应该给该用户设置读写该目录的权限，或者将文件的拥有都更改为自己的操作用户（需要root用户来更改），否则软件可能运行不成功。

如果不是root用户，会拥有哪些权限?对任意一个目录，可以使用ls -l查看对其的权限。会看到(d|-)rwxrwxrwx这样的权限说明，其中d代表这是一个目录,-则表示是文件，rwx分别对应读写和执行。一般的目录都有r和x权限，正常情况下非root用户只对 主目录和/tmp创建的目录有写的权限。当然/tmp指明了其属性，里面都应该只能放临时性的东西，重要的东西都不应该放里面，说不定什么时候就被清走了，或者系统一重启就清除了。综上所述：用户可以执行很多目录下的程序，但是其工作目录（一般程序都有输出）应该只限于用户的home目录。
再回过头来看为什么安装软件一般都需要root权限。软件默认的安装路径是 /usr/bin，普通用户对这个目录是没有写权限的。安装的时候需要将文件copy到该目录下，所以会提示无权限而操作失败。如果不使用root权限，只能而且应该将软件安装在自己的目录下。为了方便，可以将执行程序所在目录加入到path环境变量里。如果不更新path变量，则运行程序的时候需要指明路径。

因为各组件都运行在集群环境，涉及到不同节点的通信、数据传输问题。所以需要确保集群之间的任意主机都能实现免密码登陆其他主机（为了省事就不区分哪些需要登陆哪些不需要），具体网络配置方法可参考ubuntu16.04下hadoop-2.7.4搭建。
为了方便部署，可以在一个节点先将环境和各组件安装配置，然后重新将这些文件打包，发送到其他节点。这样其他节点就只剩下修改与节点名称有关或类似相关的部分了。
因为在过渡时期可能需要在软件的不同版本间切换，那么我们会同时装几个版本，这时可以通过软链接的方式临时将软件指向某个特定的版本。如ln -s hadoop-2.6.5 hadoop

HDFS的安装与配置

具体参考另一篇文章。这里做一些补充说明。
core-site.xml 核心内容

namenode一个是在core-site.xml里有指明，另一个是在哪个节点启动bin/dfs.sh start 则该节点为namenode，后者的效力大于前者。
secondaryNameNode一是通过masters文件指明，另一个则是hdfs-site.xml里指明


        dfs.namenode.secondary.http-address
        bigdata-client:50090
		设置SecondaryNameNode

master文件
bigdata-client
**slaves文件 **
这样系统知道哪个节点是slave节点，扮演datanode角色

slave1
slave2
slave3
slave4
slave5

hdfs-site.xml 核心内容

mapred-site.xml 核心内容
核心是设置historyServer,另一个mapreduce角色是client,在哪个节点提交任务哪个节点就是client。但一般建议在连接外网和集群的机器上提交任务。


	        mapreduce.jobhistory.address
	        bigdata-master:10020
			设置 bigdata-master为mapreduce HistoryServer

yarn-site.xml 核心内容
下面的配置指明了resourceManager,而nodeManager则会与slaves文件的配置的一致。


        yarn.resourcemanager.hostname
        master

让hadoop知道Java路径
把hadoop-env.sh、mapred-env.sh、yarn-env.sh中的JAVA_HOME改为我们自己安装的JAVA_HOME

source /data/bigdata/soft/env/bigdata

启动hadoop最好使用start-dfs.sh和start-yarn.sh分别启动；第一次启动hadoop前要前格式式namenode
否则namenode启动后又会自动死掉，而且通过50070网页端也访问不了。查看namenode的日志文件会有如下提示。

org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Encountered exception loading fsimage
java.io.IOException: NameNode is not formatted.

spark的安装与配置

spark-env.sh文件核心内容配置环境变量

source /data/bigdata/soft/env/bigdata

如果spark-submit时只是在yarn模型下，则不需要进行其他配置，在哪个节点启动spark哪个节点就扮演historyServer角色，在哪个节点提交程序哪个节点就失控client角色。
如果是在独立模式，则还需要配置slaves文件。
配置spark与hive的连接
如果需要通过spark操作hive则需要配置该文件，只需将该文件简单的指向hive安装目录同名的配置文件，这样spark就能与hive同步了。
hive-site.xml文件核心内容

zookeeper 分布式集群的安装与配置

来源
也可参考官网的安装配置方法
概述
Zookeeper 集群是分布式集群的协调者，也就是任意的分布式集群都能配置Zookeeper集群作为管理者、协调者，Zookeeper 集群在配置时一般采用的是奇数个节点配置的策略。
环境准备
在配置Zookeeper集群时，请确保集群之间的任意主机都能实现免密码登陆其他主机（整个大数据组件基本上都是这个要求）。
免密码登录的实现：

第一，你要确定是谁要登陆谁，比如A要实现免密码登陆B
第二，将A的id_rsa.pub加入到B的authorized_keys文件中

下载并解压安装包至目标路径
在官网上下载Zookeeper，下载地址：https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/ 下载其中的stable版本，稳定版一般不会出现问题。
下载完成之后在一个节点上解压。我将Zookeeper安装在/usr/local路径下。
配置Zookeeper分布式集群

1、进入Zookeeper的配置文件夹conf（整个大数据开源组件的配置文件都在对应软件的conf目录下），做以下的操作：

$ cp ./zoo_sample.cfg zoo.cfg  #复制模板文件，并修改
$ vim zoo.cfg  #打开文件，并修改写入下面的内容

以下是独立模式一个配置样例

# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial 
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between 
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just 
# example sakes.
dataDir=/data/bigdata/data/zookeeper
# the port at which the clients will connect
clientPort=2181
#
# Be sure to read the maintenance section of the 
# administrator guide before turning on autopurge.
#
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
#autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
#autopurge.purgeInterval=1

上面的配置中最重要的是指定dataDir。
其他的都不需要操作，zookeeper运行时会在dataDir指定的目录下生成version-2文件夹和 zookeeper_server.pid
以下是集群模式一个配置样例

# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial 
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between 
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just 
# example sakes.
dataDir=/data/bigdata/data/zookeeper
# the port at which the clients will connect
clientPort=2181
#
# Be sure to read the maintenance section of the 
# administrator guide before turning on autopurge.
#
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
#autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
#autopurge.purgeInterval=1

server.1=master:2888:3888
server.2=slave4:2888:3888
server.3=slave5:2888:3888

上面配置的重点也是dataDir和server.n(如server.1=master:2888:3888，server.1表示zookeeper服务器第1服务，master为对应节点主机名称)。同样会在dataDir生成 version-2文件夹和 zookeeper_server.pid。同时注意在对应节点中dataDir目录新建文件myid,内部内容和数字与server.n相对应（第2点中会具体讲解）。
完成之后将整个Zookeeper分发到其他的Zookeeper节点，分发采用scp命令。

2、修改各个节点的id值，需要注意，每个节点都是需要做下面操作的

$ cd /data/bigdata/data/zookeeper
$ vim myid

分别在各个节点上写入对应的id，从1开始，每个节点只写一个数字，比如在Master上写1，在Slave1上写2，以此类推。与zoo.cfg中的配置相应一致。其实对于使用zookeeper的应用来说，它们看zookeeper各节点的功能是一样的，只不过zookeeper自己会有一个zookeeper_server.pid

3、在各个节点上配置环境变量(我更喜欢在/etc/profile中添加)

$ vim ~/.bash_profile  #修改环境变量

在其中写入下面的内容

$ export ZOOKEEPER_HOME=/usr/local/zookeeper-3.4.8
$ PATH=$PATH:$ZOOKEEPER_HOME/bin:$ZOOKEEPER_HOME/conf
$ source ~/.bash_profile

由于各组件都涉及增加环境变量，为了管理和配置的方便，可以将这些环境变量统一配置
比如新建一个文件/env/bigdata

if [ "${BIGDATA_ENV}" != "1" ]; then

export BIGDATA_ENV=1

export JAVA_HOME=/data/bigdata/soft/java
export HADOOP_HOME=/data/bigdata/soft/hadoop
export HIVE_HOME=/data/bigdata/soft/hive
export SPARK_HOME=/data/bigdata/soft/spark
export HBASE_HOME=/data/bigdata/soft/hbase
export KAFKA_HOME=/data/bigdata/soft/kafka
export ZOOKEEPER_HOME=/data/bigdata/soft/zookeeper
export FLUME_HOME=/data/bigdata/soft/flume

PATH=${JAVA_HOME}/bin:${PATH}
PATH=${HADOOP_HOME}/bin:${PATH}
PATH=${HIVE_HOME}/bin:${PATH}
PATH=${SPARK_HOME}/bin:${PATH}
PATH=${HBASE_HOME}/bin:${PATH}
PATH=${KAFKA_HOME}/bin:${PATH}
PATH=${ZOOKEEPER_HOME}/bin:${PATH}
PATH=${FLUME_HOME}/bin:${PATH}
export PATH

export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export HADOOP_USER_CLASSPATH_FIRST=true
export HADOOP_HEAPSIZE=1024
export YARN_HEAPSIZE=1024
export HADOOP_LOG_DIR=${HADOOP_HOME}/logs
export YARN_LOG_DIR=${HADOOP_HOME}/logs
export HADOOP_PID_DIR=${HADOOP_HOME}/pids

export HBASE_MANAGES_ZK=false

fi

然后在/etc/profile文件中添加以下命令

source /data/bigdata/soft/env/bigdata

启动zookeeper服务器
要注意，按照上述配置的顺序依次启动，并且在各个节点上都要启动Zookeeper，在shell中输入

$ zkServer.sh start  #启动Zookeeper服务，正确启动只有，使用jps命令会看到QuorumPeerMain，如果该进程启动说明Zookeeper服务成功的启动
$ zkServer.sh status #查看Zookeeper服务的状态，你会看到哪个节点是Leader节点，哪个节点是Follower节点，并且只有一个Zookeeper节点
$ zkServer.sh stop  #停止Zookeeper服务，每个节点都要停止

Kafka分布式集群的安装与配置

来源1、来源2
也可参考官网文档
概述
Kafka是一种高吞吐量的分布式发布订阅的消息队列系统，原本开发自LinkedIn，用作LinkedIn的活动流（ActivityStream）和运营数据处理管道（Pipeline）的基础。现在它已被多家不同类型的公司作为多种类型的数据管道和消息系统使用。
环境准备
同上
下载并解压安装包至目标路径
在官网上下载Kafka，下载地址：http://kafka.apache.org/downloads。
下载完成之后在一个节点上解压。我将kafka安装在/usr/local路径下。
配置kafka分布式集群
Kafka目录介绍

/bin 操作kafka的可执行脚本，还包含windows下脚本
/config 配置文件所在目录
/libs 依赖库目录
/logs 日志数据目录，目录kafka把server端日志分为5种类型，分为:server,request,state，log-cleaner，controller

进入kafka的配置文件夹conf（整个大数据开源组件的配置文件都在对应软件的conf目录下），做以下的操作：

配置zookeeper
kafka有内置的zookeeper，但一般我们会使用自己安装的，提高可用性和可靠性。安装配置参考zookeeper相关内容。
进入kafka安装工程根目录编辑config/server.properties
kafka最为重要三个配置依次为：broker.id、log.dir、zookeeper.connect
下面是kafka只有一个broker时的配置样例

...
broker.id=0
log.dirs=/tmp/kafka-logs
zookeeper.connect=localhost:2181
...

下面是kafka有两个broker时的配置样例

#slave4的配置文件
...
broker.id=1
listeners=PLAINTEXT://slave4:9092
log.dirs=/data/bigdata/data/kafka
zookeeper.connect=master:2181,slave4:2181,slave5:2181
...

#slave5的配置文件
...
broker.id=2
listeners=PLAINTEXT://slave5:9092
log.dirs=/data/bigdata/data/kafka
zookeeper.connect=master:2181,slave4:2181,slave5:2181
...
以上就是配置文件关键要修改或添加的部分，其中zookeeper.connect即zookeeper中配置的zookeeper服务器，共3个。

完成之后将整个kafka 分发到其他的kafka 节点，分发采用scp命令。

在各个节点上配置环境变量

kafka server端config/server.properties参数说明和解释如下:
server.properties配置属性说明：

参数	说明(解释)
broker.id =0	每一个broker在集群中的唯一表示，要求是正数。当该服务器的IP地址发生改变时，broker.id没有变化，则不会影响consumers的消息情况
log.dirs=/data/kafka-logs	kafka数据的存放地址，多个地址的话用逗号分割,多个目录分布在不同磁盘上可以提高读写性能 /data/kafka-logs-1，/data/kafka-logs-2
port =9092	broker server服务端口
message.max.bytes =6525000	表示消息体的最大大小，单位是字节
num.network.threads =4	broker处理消息的最大线程数，一般情况下数量为cpu核数
num.io.threads =8	broker处理磁盘IO的线程数，数值为cpu核数2倍
background.threads =4	一些后台任务处理的线程数，例如过期消息文件的删除等，一般情况下不需要去做修改
queued.max.requests =500	等待IO线程处理的请求队列最大数，若是等待IO的请求超过这个数值，那么会停止接受外部消息，应该是一种自我保护机制。
host.name	broker的主机地址，若是设置了，那么会绑定到这个地址上，若是没有，会绑定到所有的接口上，并将其中之一发送到ZK，一般不设置
socket.send.buffer.bytes=100*1024	socket的发送缓冲区，socket的调优参数SO_SNDBUFF
socket.receive.buffer.bytes =100*1024	socket的接受缓冲区，socket的调优参数SO_RCVBUFF
socket.request.max.bytes =10010241024	socket请求的最大数值，防止serverOOM，message.max.bytes必然要小于socket.request.max.bytes，会被topic创建时的指定参数覆盖
log.segment.bytes =102410241024	topic的分区是以一堆segment文件存储的，这个控制每个segment的大小，会被topic创建时的指定参数覆盖
log.roll.hours =24*7	这个参数会在日志segment没有达到log.segment.bytes设置的大小，也会强制新建一个segment会被 topic创建时的指定参数覆盖
log.cleanup.policy = delete	日志清理策略选择有：delete和compact主要针对过期数据的处理，或是日志文件达到限制的额度，会被 topic创建时的指定参数覆盖
log.retention.minutes=300或log.retention.hours=24	数据文件保留多长时间，存储的最大时间超过这个时间会根据log.cleanup.policy设置数据清除策略 log.retention.bytes和log.retention.minutes或log.retention.hours任意一个达到要求，都会执行删除有2删除数据文件方式：按照文件大小删除：log.retention.bytes 按照2中不同时间粒度删除：分别为分钟，小时
log.retention.bytes=-1	topic每个分区的最大文件大小，一个topic的大小限制 = 分区数*log.retention.bytes。-1没有大小限log.retention.bytes和log.retention.minutes任意一个达到要求，都会执行删除，会被topic创建时的指定参数覆盖
log.retention.check.interval.ms=5minutes	文件大小检查的周期时间，是否处罚 log.cleanup.policy中设置的策略
log.cleaner.enable=false	是否开启日志清理
log.cleaner.threads = 2	日志清理运行的线程数
log.cleaner.io.max.bytes.per.second=None	日志清理时候处理的最大大小
log.cleaner.dedupe.buffer.size=50010241024	日志清理去重时候的缓存空间，在空间允许的情况下，越大越好
log.cleaner.io.buffer.size=512*1024	日志清理时候用到的IO块大小一般不需要修改
log.cleaner.io.buffer.load.factor =0.9	日志清理中hash表的扩大因子一般不需要修改
log.cleaner.backoff.ms =15000	检查是否处罚日志清理的间隔
log.cleaner.min.cleanable.ratio=0.5	日志清理的频率控制，越大意味着更高效的清理，同时会存在一些空间上的浪费，会被topic创建时的指定参数覆盖
log.cleaner.delete.retention.ms =1day	对于压缩的日志保留的最长时间，也是客户端消费消息的最长时间，同log.retention.minutes的区别在于一个控制未压缩数据，一个控制压缩后的数据。会被topic创建时的指定参数覆盖
log.index.size.max.bytes =1010241024	对于segment日志的索引文件大小限制，会被topic创建时的指定参数覆盖
log.index.interval.bytes =4096	当执行一个fetch操作后，需要一定的空间来扫描最近的offset大小，设置越大，代表扫描速度越快，但是也更好内存，一般情况下不需要搭理这个参数
log.flush.interval.messages=None 例如log.flush.interval.messages=1000 表示每当消息记录数达到1000时flush一次数据到磁盘	log文件”sync”到磁盘之前累积的消息条数,因为磁盘IO操作是一个慢操作,但又是一个”数据可靠性"的必要手段,所以此参数的设置,需要在"数据可靠性"与"性能"之间做必要的权衡.如果此值过大,将会导致每次"fsync"的时间较长(IO阻塞),如果此值过小,将会导致"fsync"的次数较多,这也意味着整体的client请求有一定的延迟.物理server故障,将会导致没有fsync的消息丢失.
log.flush.scheduler.interval.ms =3000	检查是否需要固化到硬盘的时间间隔
log.flush.interval.ms = None 例如：log.flush.interval.ms=1000 表示每间隔1000毫秒flush一次数据到磁盘	仅仅通过interval来控制消息的磁盘写入时机,是不足的.此参数用于控制"fsync"的时间间隔,如果消息量始终没有达到阀值,但是离上一次磁盘同步的时间间隔达到阀值,也将触发.
log.delete.delay.ms =60000	文件在索引中清除后保留的时间一般不需要去修改
log.flush.offset.checkpoint.interval.ms =60000	控制上次固化硬盘的时间点，以便于数据恢复一般不需要去修改
auto.create.topics.enable =true	是否允许自动创建topic，若是false，就需要通过命令创建topic
default.replication.factor =1	是否允许自动创建topic，若是false，就需要通过命令创建topic
num.partitions =1	每个topic的分区个数，若是在topic创建时候没有指定的话会被topic创建时的指定参数覆盖
以下是kafka中Leader,replicas配置参数
controller.socket.timeout.ms =30000	partition leader与replicas之间通讯时,socket的超时时间
controller.message.queue.size=10	partition leader与replicas数据同步时,消息的队列尺寸
replica.lag.time.max.ms =10000	replicas响应partition leader的最长等待时间，若是超过这个时间，就将replicas列入ISR(in-sync replicas)，并认为它是死的，不会再加入管理中
replica.lag.max.messages =4000	如果follower落后与leader太多,将会认为此follower[或者说partition relicas]已经失效 ##通常,在follower与leader通讯时,因为网络延迟或者链接断开,总会导致replicas中消息同步滞后 ##如果消息之后太多,leader将认为此follower网络延迟较大或者消息吞吐能力有限,将会把此replicas迁移 ##到其他follower中. ##在broker数量较少,或者网络不足的环境中,建议提高此值.
replica.socket.timeout.ms=30*1000	follower与leader之间的socket超时时间
replica.socket.receive.buffer.bytes=64*1024	leader复制时候的socket缓存大小
replica.fetch.max.bytes =1024*1024	replicas每次获取数据的最大大小
replica.fetch.wait.max.ms =500	replicas同leader之间通信的最大等待时间，失败了会重试
replica.fetch.min.bytes =1	fetch的最小数据尺寸,如果leader中尚未同步的数据不足此值,将会阻塞,直到满足条件
num.replica.fetchers=1	leader进行复制的线程数，增大这个数值会增加follower的IO
replica.high.watermark.checkpoint.interval.ms =5000	每个replica检查是否将最高水位进行固化的频率
controlled.shutdown.enable =false	是否允许控制器关闭broker ,若是设置为true,会关闭所有在这个broker上的leader，并转移到其他broker
controlled.shutdown.max.retries =3	控制器关闭的尝试次数
controlled.shutdown.retry.backoff.ms =5000	每次关闭尝试的时间间隔
leader.imbalance.per.broker.percentage =10	leader的不平衡比例，若是超过这个数值，会对分区进行重新的平衡
leader.imbalance.check.interval.seconds =300	检查leader是否不平衡的时间间隔
offset.metadata.max.bytes	客户端保留offset信息的最大空间大小
kafka中zookeeper参数配置
zookeeper.connect = localhost:2181	zookeeper集群的地址，可以是多个，多个之间用逗号分割 hostname1:port1,hostname2:port2,hostname3:port3
zookeeper.session.timeout.ms=6000	ZooKeeper的最大超时时间，就是心跳的间隔，若是没有反映，那么认为已经死了，不易过大
zookeeper.connection.timeout.ms =6000	ZooKeeper的连接超时时间
zookeeper.sync.time.ms =2000	ZooKeeper集群中leader和follower之间的同步实际那

启动Kafka服务器
启动kafka之前先启动zookeeper，启动kafka如下：
启动： bin/kafka-server-start.sh config/server.properties，生产环境最好以守护程序启动：nohup &
结束： bin/kafka-server-stop.sh
启动后可以进行一些测试，具体可参考官网的使用说明。
**单机连通性测试 **
运行producer：
Shell代码收藏代码

bin/kafka-console-producer.sh --broker-list master:9092 --topic test

运行consumer：

bin/kafka-console-consumer.sh --zookeeper master:2181 --topic test --from-beginning

在producer端输入字符串并回车，查看consumer端是否显示。
分布式连通性测试
Zookeeper Server, Kafka Server, Producer都放在服务器server1上，ip地址为192.168.1.10
Consumer放在服务器server2上，ip地址为192.168.1.12。
分别运行server1的producer和server2的consumer，

bin/kafka-console-producer.sh --broker-list master:9092 --topic test

bin/kafka-console-consumer.sh --zookeeper master:2181 --topic test --from-beginning

flume的安装与配置

可参考官网
来源

Flume 各种坑
单节点 Flume 配置、多 agent 汇聚写入 HDFS
安装与简单使用

flume的配置可以将环境变量加入flume-env.sh文件中，但也可以不配置。
更常见的是使用flume的程序中传入相关参数。将与程序相关的agent配置与程序打包在一块，一来这样安装目录比较清洁，安装程序迁移比较方便；另一方面，这种与程序相关的配置是特异性，与程序在一起，如果程序的功能改变，配置文件需要改变的话，改起来就比较方便。

Flume简介

Flume是Cloudera提供的一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统。Flume支持在日志系统中定制各类数据发送方用于收集数据，同时Flume提供对数据的简单处理，并将数据处理结果写入各种数据接收方的能力。
Flume作为Cloudera开发的实时日志收集系统，受到了业界的认可与广泛应用。2010年11月Cloudera开源了Flume的第一个可用版本0.9.2，这个系列版本被统称为Flume-OG。随着Flume功能的扩展，Flume-OG代码工程臃肿、核心组件设计不合理、核心配置不标准等缺点暴露出来，尤其是在Flume-OG的最后一个发行版本 0.94.0中，日志传输不稳定的现象尤为严重。为了解决这些问题，2011年10月Cloudera重构了核心组件、核心配置和代码架构，重构后的版本统称为Flume-NG。改动的另一原因是将 Flume 纳入 Apache 旗下，Cloudera Flume改名为Apache Flume。

Flume工作原理

Flume的数据流由事件（Event）贯穿始终。事件是Flume的基本数据单位，它携带日志数据（字节数组形式）并且携带有头信息，这些Event由Agent外部的Source生成，当Source捕获事件后会进行特定的格式化，然后Source会把事件推入（单个或多个）Channel中。可以把Channel看作是一个缓冲区，它将保存事件直到Sink处理完该事件。Sink负责持久化日志或者把事件推向另一个Source。以下是Flume的一些核心概念：
（1）Events：一个数据单元，带有一个可选的消息头,可以是日志记录、avro 对象等。
（2）Agent：JVM中一个独立的Flume进程，包含组件Source、Channel、Sink。
（3）Client：运行于一个独立线程，用于生产数据并将其发送给Agent。
（4）Source：用来消费传递到该组件的Event,从Client收集数据，传递给Channel。
（5）Channel：中转Event的一个临时存储，保存Source组件传递过来的Event，其实就是连接 Source 和 Sink ，有点像一个消息队列。
（6）Sink：从Channel收集数据，运行在一个独立线程。
Flume以Agent为最小的独立运行单位，一个Agent就是一个JVM。单Agent由Source、Sink和Channel三大组件构成，如下图所示：

值得注意的是，Flume提供了大量内置的Source、Channel和Sink类型。不同类型的Source、Channel和Sink可以自由组合。组合方式基于用户设置的配置文件，非常灵活。比如：Channel可以把事件暂存在内存里，也可以持久化到本地硬盘上；Sink可以把日志写入HDFS、HBase、ES甚至是另外一个Source等等。Flume支持用户建立多级流，也就是说多个Agent可以协同工作,如下图所示:

Flume的安装

安装JDK

下载安装包并解压

配置环境变量

配置flume-env.sh文件

$ vim flume-env.sh
export JAVA_HOME=/home/hadoop/app/jdk1.7.0_79
export HADOOP_HOME=/home/hadoop/app/cdh/hadoop-2.6.0-cdh5.7.1

直接source总的配置文件更方便。

配置flume-env.sh文件

Flume部署（以连接kafka为例,来源）

创建配置文件

flume的配置文件在conf/目录下，默认的配置文件是flume-conf.properties，其实名字可随便取(这里取为sink2Kafka.conf)，我们可以为不同的任务创建不同的配置文件，然后在启动flume时传递该配置文件即可。

#source
a1.sources = sysSrc
a1.sources.sysSrc.type=avro
a1.sources.sysSrc.bind=master
a1.sources.sysSrc.port=33333
a1.sources.sysSrc.channels=fileChannel


#channel
a1.channels = fileChannel
a1.channels.fileChannel.type =memory
a1.channels.fileChannel.capacity=10000
a1.channels.fileChannel.transactionCapacity  =  100

#sink
a1.sinks = kafkaSink
a1.sinks.kafkaSink.channel=fileChannel
a1.sinks.kafkaSink.type=org.apache.flume.sink.kafka.KafkaSink
a1.sinks.kafkaSink.brokerList=master:9092
a1.sinks.kafkaSink.custom.partition.key=kafkaPartition
a1.sinks.kafkaSink.topic=my-replicated-topic
a1.sinks.kafkaSink.serializer.class=kafka.serializer.StringEncoder

关于flume配置参数更详细可参考：Flume配置参数说明

启动flume

保证zookeeper正常启动同时kafka也正常启动的情况下启动flume。

bin/flume-ng agent --conf conf --conf-file conf/sink2Kafka.conf --name a1 -Dflume.root.logger=INFO,console

启动kafka消费者现场

bin/kafka-console-consumer.sh --zookeeper h2:2181,h3:2181,h4:2181,h8:2181,h9:2181,h10:2181 --topic my-replicated-topic --from-beginning

利用flume带的avro客户端向flume发送消息

bin/flume-ng avro-client --conf conf --host master --port 33333 --filename ../mydata/log2.txt

如果出现类似如下错误（下面是hbase中的提示，flume出错的时候类似。）

SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/itcast/hbase-0.98.18-hadoop2/lib/slf4j-log4j12-1.6.4.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/itcast/hadoop-2.6.0/share/hadoop/common/lib/slf4j-log4j12-1.7.5.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.

是hadoop的slf4j 与hbase的slf4j jar包发生了冲突，移除其中一个即可

结果：可以看到kafka主题T20161031正确收到来自flume的avro客户端发送的消息

多节点集群搭建
flume官网
sparkstreaming+flume

Hive的安装与配置

对之前的配置作一些补充。

hive-site.xml核心内容


        hive.metastore.uris
        thrift://bigdata-master:9083

该段配置元数据操作的服务和接口


	javax.jdo.option.ConnectionURL
	jdbc:mysql://bigdata-client:3306/hive?createDatabaseIfNotExist=true

该段配置元数据存储的地方，真正的数据则是存储在hdfs上。
hive-env.sh核心内容

source /data/bigdata/soft/env/bigdata

把MySQL的JDBC驱动包复制到Hive的lib目录下。
JDBC驱动包的版本:mysql-connector-java-X.X.XX-bin.jar

出现如下错误

Caused by: MetaException(message:Could not connect to meta store using any of the URIs provided. Most recent failure: org.apache.thrift.transport.TTransportException: java.net.ConnectException: 拒绝连接 (Connection refused)
	at org.apache.thrift.transport.TSocket.open(TSocket.java:187)
	at org.apache.hadoop.hive.metastore.HiveMetaStoreClient.open(HiveMetaStoreClient.java:421)
	at org.apache.hadoop.hive.metastore.HiveMetaStoreClient.(HiveMetaStoreClient.java:236)
	at org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient.(SessionHiveMetaStoreClient.java:74)
	at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
	at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:62)
	at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)
	at java.lang.reflect.Constructor.newInstance(Constructor.java:423)
	at org.apache.hadoop.hive.metastore.MetaStoreUtils.newInstance(MetaStoreUtils.java:1521)

解决办法：

先检查mysql 链接jdbc使用到的启动 JAR是否放到 hive/lib 下面；
用命令行，mysql服务器能否正常连接；查看数据库用户权限（GRANT ALL PRIVILEGES ON . TO XX@YY）；
有问题会有如下提示：

com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Access denied for user 'digger'@'%' to database 'hive'

检查配置hive-site.xml
网上建议新手不要配置下面的内容(如果是集群还是要配置的)

  
  hive.metastore.uris  
  thrift://xxxxxxxx  
  Thrift uri for the remote metastore. Used by metastore client to connect to remote metastore.

更换掉jline-0.9.94.jar
如果出现如下报错：

Terminal initialization failed; falling back to unsupported
java.lang.IncompatibleClassChangeError: Found class jline.Terminal, but interface was expected

原因是hadoop目录下存在老版本jline：

/hadoop-2.5.2/share/hadoop/yarn/lib：
-rw-r--r-- 1 root root   87325 Mar 10 18:10 jline-0.9.94.jar

解决方法是：
将hive下的新版本jline的JAR包拷贝到hadoop下：

cp /hive/apache-hive-1.1.0-bin/lib/jline-2.12.jar ./

试试将注掉/etc/mysql/my.cnf中 bind_address=127.0.0.1（应该不需要）
启动hive
首先启动metastore: hive --server metastore &>/dev/null &,日志会空设备其实就是丢弃不在屏幕显示，根据自己需要来设置。
运行hive命令即可启动。

HBase的分布式安装与配置

来源1，来源2
zookeeper 配置
HBase配置
hbase-env.sh

source /data/bigdata/soft/env/bigdata

hbase-site.xml



        hbase.rootdir
        hdfs://master:8020/hbase


        hbase.zookeeper.quorum
        master,slave4,slave5


        hbase.cluster.distributed
        true

分别设置Hbase的Master，和zookeeper的服务器。
regionservers文件

slave1
slave2
slave3

设置RegionServer

Phoenix 介绍和基本用法

Redis 的安装使用

http://www.runoob.com/redis/redis-intro.html
对于利用python需要的安装包：redis-4.0.11.tar.gz ，redis-2.10.5-py2.py3-none-any.whl

Storm的安装使用

http://storm.apache.org/releases/current/Setting-up-development-environment.html
安装合适的版本，需要考虑与之结合的其他组件。

下载安装包，如梦apache-storm-1.2.2.tar.gz
将安装包解压至目标位置
修改storm的配置文件conf/storm.yaml
storm本地伪集群配置大致如下(集群模式的配置请查阅相关资料)：

storm.zookeeper.servers:
     - "127.0.0.1"
#由于我之前已经在其他节点安装了zookeeper，这里只要改成对应的节点ip即可。
nimbus.seeds: ["127.0.0.1"]
ui.port: 8080
#也可以改为其他端口号，我改成了9090
nimbus.host: "localhost"
supervisor.slots.ports:
    - 6700
    - 6701
    - 6702
    - 6703
#注意这里supervisor的端口号前有空格，端口号不能用"",网上有的资料有""号，坑死了。

可能碰到的问题：
Unable to create file /pankoo/soft/apache-storm-1.2.2/logs/access-web-nimbus.log
这是storm 安装目录的权限问题，chown XXX：XXX storm即可

java.lang.IllegalArgumentException: Field supervisor.slots.ports must be an Iterable of java.lang.Number
看看supervisor设置的端口号
将端口号加了引号，去掉引号就可以了，如：

supervisor.slots.ports:
   - 6700
   - 6701
   - 6702
   - 6703

将storm添加至环境变量
启动storm
启动之前，要先启动zookeeper.

nohup storm nimbus &
nohup storm supervisor &
nohup storm ui &

启动需要花费数秒钟时间，直到打开http://localhost:9090能正常显示web页说明启动正常

Flink的安装使用

http://ifeve.com/apache-flink-introduction/
https://www.cnblogs.com/leesf456/p/8027772.html

mysql的安装使用

Ubuntu 16.04 上安装 MySQL 5.7 教程
如果出现问题，可查看sudo apt-get install mysql-server 安装不上
Windows系统安装MySQL
MySQL几种经典的安装方式介绍
二进制安装mysql数据库:

官网下载mysql-5.7.18-linux-glibc2.5-x86_64.tar.gz
解压
配置路径
添加mysql用户并创建数据库目录

[root@localhost ~]# groupadd  mysql 
[root@localhost ~]# useradd -r -g mysql -s /bin/false -M  mysql
[root@localhost ~]# cd /usr/local/mysql/
[root@localhost mysql]# mkdir data
[root@localhost mysql]# chown -R mysql:mysql /usr/local/mysql/
#注意不是操作软链接，或者可能子目录的拥有者不会发生变化
[root@localhost mysql]# chgrp -R mysql .
[root@localhost mysql]# chmod  +755  data/

给mysql数据库初始化

[root@localhost mysql]# mysqld --initialize --user=mysql --basedir=/usr/local/mysql --datadir=/usr/local/mysql/data
[root@localhost mysql]#

5.7以后的版本，默认有一个随机密码，而不是没有密码；随机密码就是在初始化的过程中产生，注意将这一随机密码保存下来。

添加mysql主配置文件

vim /etc/my.cnf
[client]
socket=/usr/local/mysql/mysql.sock
[mysqld]
basedir=/usr/local/mysql
datadir=/usr/local/mysql/data
pid-file=/usr/local/mysql/data/mysqld.pid
socket=/usr/local/mysql/mysql.sock
log_error=/usr/local/mysql/data/mysqld.err

添加mysql服务并且启动
cp /usr/local/mysql/support-files/mysql.server /etc/init.d/mysqld;service mysqld start

mysql启动时报错：Starting MySQL… ERROR! The server quit without updating PID file (/opt/mysql/data/mysql.pid) 的解决方法
同样去事先定义好的/usr/local/mysql/data/目录下找到mysqld.err文件过滤出密码
cd /usr/local/mysql/data/;cat mysqld.err|grep password
同样登录mysql数据进行验证！！
mysql -u root -p

第一次登录修改密码的问题：
mysql 报错ERROR 1820 (HY000): You must reset your password using ALTER USER statement before executin

各个平台的mysql重启命令

/etc/init.d/mysqld restart

安装较量级数据库

很多时候可以使得mariaDB来代替mysql，其安装没有mysql那么多依赖和设置。
Linux下rpm包方式离线安装mariaDB

Java 开发环境配置

http://www.runoob.com/java/java-environment-setup.html
Linux 下安装JDK1.8
https://www.cnblogs.com/xuliangxing/p/7066913.html
就是解压、配置环境变量

scala安装

http://www.runoob.com/scala/scala-install.html
http://scala-ide.org/

Hue安装部署

HUE管理工具
Hue安装
高可用Hadoop平台－Hue In Hadoop
Linux下rpm包方式离线安装mariaDB
Hue v4.3.0, released October 17th 2018
Hue 4.3 and its Analytics and Django improvements are out!
Hue Administration Guide
HUE下载链接

一、 HUE简介

Hue是Apache开源的大数据UI组件，可以通过界面操作包括Hdfs、mysql、Hive、Hbase等大部分Hadoop组件。
特点：

可视化操作存储在Hdfs的文件
提供了编辑区，作为算法的开发调试功能
作为客户端，将需要上线的算法文件或者Jar包提交到集群做计算
提供了参数配置和定时执行任务的功能

二、安装

下载地址: http://gethue.com/hue-4-and-its-new-interface-is-out
下载后解压(本次项目安装在/opt路径下)
tar –zxf hue-4.0.0.tgz –C /opt
安装依赖
yum -y install krb5-devel cyrus-sasl-gssapi cyrus-sasl-devel libxml2-devel libxslt-devel mysql mysql-devel openldap-devel python-devel python-simplejson sqlite-devel

官网上hue-4.0.1上是说安装
sudo yum install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi cyrus-sasl-plain gcc gcc-c++ krb5-devel libffi-devel libxml2-devel libxslt-devel make mysql mysql-devel openldap-devel python-devel sqlite-devel gmp-devel
这个具体根据linux上安装，如果怕出错就装全一点

不提示错误则表示依赖安装成功

cd /opt/hue-4.0.0
make apps

编译成功后会生成/opt/hue-4.0.0/build目录
(或从服务器上复制 scp –r hue-4.0.0 ***.***.***.***:/opt只能在opt下—因在opt下编译待验证)

三、修改配置

vi /opt/hue-4.0.0/desktop/conf/hue.ini
1.	time_zone=Asia/Shanghai
2.	# Webserver runs as this user(root设为管理员帐号)
  server_user=root
  server_group=root
3.	561行[[database]](配置HUE数据库若没有创建一个    CREATE DATABASE `hue` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;)
[[database]]
	engine=mysql
host=***.***.***.***
 port=3306
 user=root
 password=root
     name=hue

703行 [[interpreters]]
定义hue中开放的接口,将需要的接口前面#去掉
843行[[hdfs_clusters]]

[[[default]]]
      # Enter the filesystem uri(定义HDFS的namespace)
      fs_defaultfs=hdfs://hdp （hdfs主备名称）
			 webhdfs_url=http://hadoop02.***.com:50070/webhdfs/v1 (主)
			 hadoop_conf_dir=/etc/hadoop/conf

867行[[yarn_clusters]]

resourcemanager_host=hadoop02.***.com (yarn resourcemanager 查看地址)
# The port where the ResourceManager IPC listens on
 resourcemanager_port=8050
 # Whether to submit jobs to this cluster
 submit_to=True
  # Resource Manager logical name (required for HA)
  ## logical_name=
  # Change this if your YARN cluster is Kerberos-secured
  security_enabled=false
  # URL of the ResourceManager API
  resourcemanager_api_url=http://***-tdp-spark02.***.com:8088
  # URL of the ProxyServer API
  # proxy_api_url=http://***-tdp-spark02.***.com:8088
   # URL of the HistoryServer API
   history_server_api_url=http://***-tdp-spark02.***.com:19888
  # URL of the Spark History Server
   spark_history_server_url=http://***-tdp-spark02.***.com:18080
   # In secure mode (HTTPS), if SSL certificates from YARN Rest APIs
   # have to be verified against certificate authority
   ssl_cert_ca_verify=false

1080行[spark]接口定义

[spark]
  # Host address of the Livy Server.
   livy_server_host=***-tdp-spark02.***.com

  # Port of the Livy Server.
   livy_server_port=8998

  # Configure Livy to start in local 'process' mode, or 'yarn' workers.
   		livy_server_session_kind=yarn

1315行[zookeeper]接口定义

	host_ports=***-tdp-spark01.***.com:2181,***-tdp-spark02.***.com:2181,***-tes-ambari.***.com:2181

1356行[liboozie]

oozie_url=http://***.26.38.***:11000/oozie

详细见复件：

到ambari界面修改livy配置
livy_server_csrf_protection.enabled:改成false,防止跨域
修改为false
由于集群自带Python2.6,而算法需要python2.7，需要在spark,yarn,oozie里设置Pythond 环境变量

 yarn-env template: 
 export PYSPARK_PYTHON =/usr/anacoda2/bin/python2.7
 export PYSPARK_DRIVER_PYTHON=/usr/anacoda2/bin/python2.7
 
 spark-env template:
 export PYSPARK_PYTHON =/usr/anacoda2/bin/python2.7
 export PYSPARK_DRIVER_PYTHON=/usr/anacoda2/bin/python2.7

四、启动脚本: cd /opt

由于HUE与其他组件的交互是通过livy来进行的，所以在启动hue之前，其实是需要先启动livy的。
关于livy的消息可参考如下的文章：
Livy：基于Apache Spark的REST服务
spark livy hue

配置：

 cat livy-env.sh 

export SPARK_HOME=/opt/spark-2.1.1-bin-2.6.0-cdh5.11.1
export SPARK_CONF_DIR=${SPARK_HOME}/conf
export HADOOP_CONF_DIR=/etc/hadoop/conf.cloudera.yarn

vim livy.conf
#默认是local模式 
livy.server.session.factory = yarn

启动：

bin/livy-server
#放到后台
bin/livy-server >/dev/null 2>&1 &

sh ./ hue_start.sh
进入浏览器输入***.26.38.***:8888
(假如出现html页面提示找不到表，则需要初始化HUE数据库

cd /opt/hue-4.0.0/build/env
bin/hue syncdb
bin/hue migrate)

HUE问题集锦

error1：当出现

这是由于“IP为***.**.**.**，名字为root”的用户没有权限访问数据库
解决办法:
grant all privileges on *.* to root@'%' identified by '******' //***表示数据库连接密码

根据配置中定义的root用户登录
新建一个hdfs用户
Pyspark代码编辑窗口
Py文件提交，设置参数和定时任务
Workflow:工作流，到hdfs上选择算法文件，选择参数直接运行
Scheduler:定时，选择已经定义好的Workflow，为参数赋值后设置指定时间运行
a. Workflow
将Spark图标拖到action区域进行编辑

选择从HDFS上传文件

ARGUMENTS为参数定义，可定义多个参数
Option list为运行时spark相关参数(视情况而定)
配置好以后点击右上角设置键,将运行模式client该为cluster

点击保存后并运行填入对应的参数，代码里获取参数

Scheduler
当定义好一个workflow并保存后，可以直接在界面上选择Schedule进行定时执行

保存后运行

附加:

配置过程中可能出现的问题:org.apache.oozie.action.ActionExecutorException: Could not locate Oozie sharelib
a. 执行oozie admin -oozie http://***.26.38.***:11000/oozie -shareliblist查看可利用的包,
b. 执行/usr/hdp/current/oozie-server/bin/oozie-setup.sh sharelib create -fs hdfs://http://***.26.38.***:8020 -locallib /usr/hdp/current/oozie-server/oozie-sharelib.tar.gz将oozie运行所依赖的所有jar上传至hdfs指定路径
2．利用hue配置连续action
hue启动pyspark等脚本问题,出现csrf跨域，改Livy配置
hue出现’sparksession is not created’,修改spark python版本变量和系统python环境变量
hue安装时初始化数据库,执行:bin/hue syncdb和bin/hue migrate(不然报错找不到表)
问题:org.apache.oozie.action.ActionExecutorException: Could not locate Oozie sharelib
a. 执行oozie admin -oozie http://***.26.***.75:11000/oozie -shareliblist查看可利用的包,
b. 执行/usr/hdp/current/oozie-server/bin/oozie-setup.sh sharelib create -fs hdfs://http://***.26.***.75:8020 -locallib /usr/hdp/current/oozie-server/oozie-sharelib.tar.gz将oozie运行所依赖的所有jar上传至hdfs指定路径
c. 在oozie添加配置(第一个路径前可能要加hdfs://ns)
HDP系统自带python2.6，算法需要python2.7,所以需要在spark和yarn的环境变量里配python2.7的地址
python写HANA数据库需要安装dbapi
将这4个文件(dbapi.py, __init__.py, resultrow.py, pyhdbcli.so)添加到/usr/anaconda2/lib/python2.7/site-packages下面
参考https://blogs.sap.com/2014/04/02/%E5%9C%A8python%E4%B8%AD%E8%BF%9E%E6%8E%A5sap-hana/
参数传递

HUE变通的方法安装

在集群环境如果没有网，自动下载安装会比较困难。
其他可以将已经安装好的hue,整个拷到其他机。
后面就主要是进行各种配置。
我们一般会将mysql作为HUE的数据库，但mysql并不是一定要在安装HUE的过程中安装，也可以后来安装mysql，再配置给HUE.

关于配置mysql过程中的一些问题，可以参考
Hue添加MySQL数据库
用MySQL解决HUE登录忘记账号、密码

关于HUE的其他资料：
高可用Hadoop平台－Hue In Hadoop
Hadoop 管理工具HUE配置
HUE管理工具
How to build Hue on Ubuntu
Hue Administration Guide

你可能感兴趣的:(系统平台搭建)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
从鸡肉高汤到记忆的魔法再到有效提示的艺术步子哥人工智能
还记得小时候那些天马行空的白日梦吗？也许只要按下键盘上的某个神奇组合，电脑就会发出滴滴的声响，一个隐藏的世界突然在你眼前展开，让你获得超凡的能力，摆脱平凡的生活。这听起来像是玩过太多电子游戏的幻想，但实际上，间隔重复系统给人的感觉惊人地相似。在最佳状态下，这些系统就像魔法一样神奇。本文将以一个看似平凡的鸡肉高汤食谱为例，深入浅出地探讨如何编写有效的间隔重复提示，让你像掌握烹饪技巧一样轻松地掌握记忆
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
人生的每一步路都算数 sheli
如果你想打工，一直靠打工赚钱，那你就会不断的希望自己变得更专业，不断的希望能够获得更好的工作机会，升职加薪。如果你的目标志不在此，而是拥有自己的企业，那你的选择就会出现差别。在认真打工的人眼里，会“不务正业”，会总是选择不同岗位，甚至放弃高薪机会。但是这背后都是有更加长远的规划。成功富人所必需的管理技能包括：1．对现金流的管理。2．对系统的管理。3．对人员的管理。所以，在没有获得这些能力之前，只要
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
Low Power概念介绍-Voltage Area 飞奔的大虎
随着智能手机，以及物联网的普及，芯片功耗的问题最近几年得到了越来越多的重视。为了实现集成电路的低功耗设计目标，我们需要在系统设计阶段就采用低功耗设计的方案。而且，随着设计流程的逐步推进，到了芯片后端设计阶段，降低芯片功耗的方法已经很少了，节省的功耗百分比也不断下降。芯片的功耗主要由静态功耗（staticleakagepower）和动态功耗(dynamicpower)构成。静态功耗主要是指电路处于等
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
docker igotyback eureka 云原生
Docker容器的文件系统是隔离的，但是可以通过挂载卷（Volumes）或绑定挂载（BindMounts）将宿主机的文件系统目录映射到容器内部。要查看Docker容器的映射路径，可以使用以下方法：查看容器配置：使用dockerinspect命令可以查看容器的详细配置信息，包括挂载的卷。例如：bashdockerinspect在输出的JSON格式中，查找"Mounts"部分，这里会列出所有的挂载信息
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
openssl+keepalived安装部署 _小亦_ 项目部署 keepalived openssl
文章目录OpenSSL安装下载地址编译安装修改系统配置版本Keepalived安装下载地址安装遇到问题安装完成配置文件keepalived运行检查运行状态查看系统日志修改服务service重新加载systemd检查配置文件语法错误OpenSSL安装下载地址考虑到后面设备可能没法连接到外网，所以采用安装包的方式进行部署，下载地址：https://www.openssl.org/source/old/
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
最超值的Mac——Mac mini 初心么么哒
你知道最超值的Mac是什么吗？自2005年以来，Macmini一直是Apple台式机产品线中的主要产品。最初推出是为了让对Mac好奇的Mac进入Apple生态系统的一种简单方式，现在新的AppleSiliconMacmini可能是任何寻找新Mac的人的最有吸引力的购买。什么是AppleSiliconMacmini？M1Macmini是Apple最小的台式电脑，同时也是最快的台式电脑之一。最新型号由
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
CentOS的根目录下，/bin 和 /sbin 用途和权限 Energet!c Linux日常 centos linux 运维
CentOS的根目录下，/bin和/sbin用途和权限一、/bin(Binary)二、/sbin(SystemBinary)三、总结在CentOS的根目录下，/bin和/sbin目录有不同的用途和权限一、/bin(Binary)用途:存放系统的基本命令，这些命令对所有用户都是可用的。例如：ls、cp、mv、rm等。权限:普通用户和系统管理员都可以使用这些命令。二、/sbin(SystemBinar
2.2.6 通知类控件 Toast、Menu 常思行
本文例程下载：WillFlow_Toast、WillFlowMenu一、什么是Toast？Toast也被叫做吐司，是Android系统提供的一种非常好的提醒方式，在程序中可以使用它将一些短小的信息通知给用户，它有如下两个特点：Toast是没有焦点的Toast显示的时间有限过一定的时间就会自动消失所以一般来讲Toast的使用并不会影响我们的正常操作，并且它通常不会占用太大的屏幕空间，有着良好的用户体
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

平台搭建---大数据框架---大数据组件的安装及部署

大数据组件图解

HDFS的安装与配置

spark的安装与配置

zookeeper 分布式集群的安装与配置

Kafka分布式集群的安装与配置

flume的安装与配置

Flume简介

Flume工作原理

Flume的安装

安装JDK

下载安装包并解压

配置环境变量

配置flume-env.sh文件

配置flume-env.sh文件

Flume部署（以连接kafka为例,来源）

创建配置文件

启动flume

启动kafka消费者现场

利用flume带的avro客户端向flume发送消息

Hive的安装与配置

HBase的分布式安装与配置

Phoenix 介绍和基本用法

Redis 的安装使用

Storm的安装使用

Flink的安装使用

mysql的安装使用

安装较量级数据库

Java 开发环境配置

scala安装

Hue安装部署

一、 HUE简介

二、 安装

三、 修改配置

四、 启动脚本: cd /opt

HUE问题集锦

附加:

HUE变通的方法安装

你可能感兴趣的:(系统平台搭建)

二、安装

三、修改配置

四、启动脚本: cd /opt