HP DL160 Gen9服务器集群部署文档

HP DL160 Gen9服务器集群部署文档

硬件配置
=======================================================
Server       Memory   CPU           DISK           NetWork
DL160①       32GB   6*1.9GHZ   2*2TB(SATA)       2*1GBE
DL160②       32GB   6*1.9GHZ   2*2TB(SATA)       2*1GBE
DL160③       24GB   6*1.9GHZ   2*2TB(SATA)       2*1GBE
DL160④       24GB   6*1.9GHZ   2*2TB(SATA)       2*1GBE
DL160⑤       24GB   6*1.9GHZ   2*2TB(SATA)       2*1GBE
DL160⑥       8GB      6*1.9GHZ   2*1TB(SATA)       2*1GBE
=======================================================

集群规划
==============================================================
Host       IP                          Role                        Soft                     Process
lf1           192.168.0.211       HDFS Master           Hadoop2.4.1       NameNode(Active)
                                            HBase Master            Hbase0.98.8        DFSZKFailoverController
                                                                                                     HMaster(Active)
lf3           192.168.0.213       YARN Master           Hadoop2.4.1       ResourceManager(Active)
                                             HBase Master           Hbase0.98.8       DFSZKFailoverController
                                                                                                     HMaster(Backup)
lf5           192.168.0.215       HDFS Slave              Hadoop2.4.1       DataNode
                                                                                                      JournalNode
                                            YARN Slave              Hadoop2.4.1       NodeManager
                                            ZooKeeper Follower ZooKeeper3.4.5   QuorumPeerMain
                                            HBase Slave           Hbase0.98.8          HRegionServer
                                            Sqoop                     Sqoop1.4.5           Sqoop

lf6           192.168.0.216        HDFS Slave              Hadoop2.4.1       DataNode
                                                                                                      JournalNode
                                             YARN Slave              Hadoop2.4.1       NodeManager
                                             ZooKeeper Leader    ZooKeeper3.4.5   QuorumPeerMain
                                             HBase Slave           Hbase0.98.8          HRegionServer
                                             Hive                        Hive0.14.0

lf7           192.168.0.217       HDFS Slave               Hadoop2.4.1       DataNode
                                                                                                       JournalNode
                                             YARN Slave               Hadoop2.4.1       NodeManager
                                 ZooKeeper Follower   ZooKeeper3.4.5   QuorumPeerMain
                                             HBase Slave              Hbase0.98.8       HRegionServer
===============================================================

一、安装JDK（在lf1节点上）
   cd /home/lefuBigDataDev/clouds/
   安装jdk
       tar -zxvf jdk-7u65-linux-x64.tar.gz
       mv jdk1.7_65 jdk
   配置JAVA_HOME到环境变量
       vim /etc/profile
       export JAVA_HOME=/home/lefuBigDataDev/clouds/jdk
       export PATH=.:$JAVA_HOME/bin:$PATH
       shift+zz
   刷新环境变量使JAVA_HOME立即生效
       source /etc/profile
   验证jdk是否安装成功
       java -version
   复制配置好的jdk和/etc/profile到其他节点
       scp -r /home/lefuBigDataDev/clouds/jdk lefuBigDataDev@lf3:/home/lefuBigDataDev/clouds/
       scp /etc/profile lefuBigDataDev@lf3:/etc/   ##在lf5节点上执行source /etc/profile使环境变量立即生效
       scp -r /home/lefuBigDataDev/clouds/jdk lefuBigDataDev@lf5:/home/lefuBigDataDev/clouds/
       scp /etc/profile lefuBigDataDev@lf5:/etc/   ##在lf5节点上执行source /etc/profile使环境变量立即生效
       scp -r /home/lefuBigDataDev/clouds/jdk lefuBigDataDev@lf6:/home/lefuBigDataDev/clouds/
       scp /etc/profile lefuBigDataDev@lf6:/etc/   ##在lf6节点上执行source /etc/profile使环境变量立即生效
       scp -r /home/lefuBigDataDev/clouds/jdk lefuBigDataDev@lf7:/home/lefuBigDataDev/clouds/
       scp /etc/profile lefuBigDataDev@lf7:/etc/   ##在lf7节点上执行source /etc/profile使环境变量立即生效


二、安装ZooKeeper（在lf5节点上）
   cd /home/lefuBigDataDev/clouds/
   安装ZooKeeper
       tar -zxvf zookeeper-3.4.5.tar.gz
       mv zookeeper-3.4.5 zk
   修改zookeeper配置文件
       cd /home/lefuBigDataDev/clouds/zk/conf
       mv zoo_sample.cfg zoo.cfg
       zoo.cfg
           dataDir=/home/lefuBigDataDev/clouds/zk/data
           server.1=lf5:2888:3888
           server.2=lf6:2888:3888
           server.3=lf7:2888:3888
       cd /home/lefuBigDataDev/clouds/zk/
       mkdir data
       cd data
       echo "1">myid
   配置ZOOKEEPER_HOME到环境变量
       vim /etc/profile
       export ZOOKEEPER_HOME=/home/lefuBigDataDev/clouds/jdk
       export PATH=.:$ZOOKEEPER_HOME/bin:$JAVA_HOME/bin:$PATH
       shift+zz
   刷新环境变量使ZOOKEEPER_HOME立即生效
       source /etc/profile
   复制配置好的zk和/etc/profile到其他节点
       复制到lf6节点：scp -r /home/lefuBigDataDev/clouds/zk lefuBigDataDev@lf6:/home/lefuBigDataDev/clouds/ ##修改zk/data/myid的值为2
       scp /etc/profile lefuBigDataDev@lf6:/etc/   ##在lf6节点上执行source /etc/profile使环境变量立即生效
       复制到lf7节点：scp -r /home/lefuBigDataDev/clouds/zk lefuBigDataDev@lf7:/home/lefuBigDataDev/clouds/ ##修改zk/data/myid的值为3
       scp /etc/profile lefuBigDataDev@lf7:/etc/   ##在lf7节点上执行source /etc/profile使环境变量立即生效
   验证ZooKeeper是否安装成功
       在lf5节点上执行启动ZooKeeper命令：
           zkServer.sh start       ##启动ZooKeeper
           jps                       ##如果出现了QuorumPeerMain进程表示ZooKeeper启动成功
           zkServer.sh status       ##偶数节点为Follower
       在lf6节点上执行命令：
           zkServer.sh start       ##启动ZooKeeper
           jps                       ##如果出现了QuorumPeerMain进程表示ZooKeeper启动成功
           zkServer.sh status       ##奇数节点为Leader
       在lf7节点上执行命令：
           zkServer.sh start       ##启动ZooKeeper
           jps                       ##如果出现了QuorumPeerMain进程表示ZooKeeper启动成功
           zkServer.sh status       ##偶数节点为Follower


三、安装Hadoop（在lf1节点上）
   cd /home/lefuBigDataDev/clouds/
   安装Hadoop
       tar -zxvf hadoop-2.4.1-x64.tar.gz
       mv hadoop-2.4.1 hadoop
   修改hadoop配置文件(hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-env.sh、mapred-site.xml、yarn-env.sh、yarn-site.xml、slaves)
       cd /home/lefuBigDataDev/clouds/hadoop/etc/hadoop
       1、hadoop-env.sh
           export JAVA_HOME=/home/lefuBigDataDev/clouds/jdk
           export HADOOP_HEAPSIZE=2048
       2、core-site.xml
           <configuration>
               <property>
                   <name>fs.defaultFS</name>
                   <value>hdfs://ns1</value>
                   <description>指定hdfs的nameservice为ns1</description>
               </property>
               <property>
                   <name>hadoop.tmp.dir</name>
                   <value>/home/lefuBigDataDev/clouds/hadoop/tmp</value>
                   <description>指定hadoop存放数据的临时目录</description>
               </property>
               <property>
                   <name>ha.zookeeper.quorum</name>
                   <value>lf5:2181,lf6:2181,lf7:2181</value>
                   <description>采用QJM方式的高可用需要用到的zookeeper集群节点</description>
               </property>
               <property>
                   <name>io.file.buffer.size</name>
                   <value>131072</value>
                   <description>指定hadoop辅助IO操作的缓冲区为128KB，默认是4KB</description>
               </property>
               <property>
                   <name>io.compression.codecs</name>
                   <value>org.apache.hadoop.io.compress.DefaultCodec,org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.BZip2Codec</value>
                   <description>hdfs实现数据压缩的算法包</description>
               </property>
               <property>
                   <name>fs.trash.interval</name>
                   <value>43200</value>
                   <description>开启hadoop回收站功能，保存回收站的数据30天，回收站默认为0分钟，表示关闭</description>
               </property>
               <property>
                   <name>fs.trash.checkpoint.interval</name>
                   <value>43200</value>
                   <description>开启hadoop回收站检查间隔（默认为0分钟，必须小于等于fs.trash.interval的时间）</description>
               </property>
           </configuration>
       3、hdfs-site.xml
           <configuration>
               <property>
                   <name>dfs.namenode.name.dir</name>
                   <value>/home/lefuBigDataDev/clouds/hadoop/dfs/name</value>
                   <description>指定hadoop的NameNode存放元数据fsImage文件在本地文件系统上的路径</description>
               </property>
               <property>
                   <name>dfs.datanode.data.dir</name>
                   <value>/home/lefuBigDataDev/clouds/hadoop/dfs/data</value>
                   <description>指定hadoop的DataNode存放数据块在本地文件系统上的路径，多个文件夹用逗号分隔</description>
               </property>
               <property>
                   <name>dfs.namenode.edits.dir</name>
                   <value>/home/lefuBigDataDev/clouds/hadoop/dfs/name</value>
                   <description>指定hadoop的NameNode存放编辑日志edits文件在本地文件系统上的路径</description>
               </property>
               <property>
                   <name>dfs.replication</name>
                   <value>3</value>
                   <description>指定hdfs上存放数据的副本数为3，完全分布式下默认为3</description>
               </property>
               <property>
                   <name>dfs.blocksize</name>
                   <value>134217728</value>
                   <description>指定hdfs的数据块大小为128MB，默认块大小为128MB</description>
               </property>
               <property>
                   <name>dfs.webhdfs.enabled</name>
                   <value>true</value>
                   <description>启用REST方式通过web查看hdfs上的文件、文件夹等详细信息</description>
               </property>
               <property>
                   <name>dfs.nameservices</name>
                   <value>ns1</value>
                   <description>指定hdfs的nameservice为ns1，需要和core-site.xml中的保持一致</description>
               </property>
               <property>
                   <name>dfs.ha.namenodes.ns1</name>
                   <value>nn1,nn2</value>
                   <description>ns1下面有两个NameNode，分别是nn1，nn2</description>
               </property>
               <property>
                   <name>dfs.namenode.rpc-address.ns1.nn1</name>
                   <value>lf1:9000</value>
                   <description>nn1的RPC通信地址</description>
               </property>
               <property>
                   <name>dfs.namenode.http-address.ns1.nn1</name>
                   <value>lf1:50070</value>
                   <description>nn1的http通信地址</description>
               </property>
               <property>
                   <name>dfs.namenode.rpc-address.ns1.nn2</name>
                   <value>lf2:9000</value>
                   <description>nn2的RPC通信地址</description>
               </property>
               <property>
                   <name>dfs.namenode.http-address.ns1.nn2</name>
                   <value>lf2:50070</value>
                   <description>nn2的http通信地址</description>
               </property>
               <property>
                   <name>dfs.namenode.shared.edits.dir</name>
                   <value>qjournal://lf5:8485;lf6:8485;lf7:8485/ns1</value>
                   <description>指定NameNode的元数据在JournalNode上的存放位置</description>
               </property>
               <property>
                   <name>dfs.journalnode.edits.dir</name>
                   <value>/home/lefuBigDataDev/clouds/hadoop/dfs/journal</value>
                   <description>指定JournalNode在本地磁盘存放数据的位置</description>
               </property>
               <property>
                   <name>dfs.ha.automatic-failover.enabled</name>
                   <value>true</value>
                   <description>活动NameNode失效时与备用NameNode完成自动切换</description>
               </property>
               <property>
                   <name>dfs.client.failover.proxy.provider.ns1</name>
                   <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
                   <description>配置自动切换实现方式的java类</description>
               </property>
               <property>
                   <name>dfs.ha.fencing.methods</name>
                   <value>
                       sshfence
                       shell(/bin/true)
                   </value>
                   <description>非平稳故障转移需要使用规避（fencing）机制，多种规避方法以换行分隔，每个规避方法一行</description>
               </property>
               <property>
                   <name>dfs.ha.fencing.ssh.private-key-files</name>
                   <value>/home/lefuBigDataDev/.ssh/id_rsa</value>
                   <description>使用规避sshfence隔离机制时需要ssh免登陆</description>
               </property>
               <property>
                   <name>dfs.ha.fencing.ssh.connect-timeout</name>
                   <value>30000</value>
                   <description>配置规避sshfence隔离机制超时时间</description>
               </property>
               <property>
                   <name>dfs.datanode.du.reserved</name>
                   <value>10737418240</value>
                   <description>预留10GB给其他非HDFS应用程序使用</description>
               </property>
           </configuration>
       4、mapred-env.sh
           export JAVA_HOME=/home/lefuBigDataDev/clouds/jdk
           export HADOOP_JOB_HISTORYSERVER_HEAPSIZE=1000
           export HADOOP_MAPRED_ROOT_LOGGER=INFO,RFA
       5、mapred-site.xml
           <configuration>
               <property>
                   <name>mapreduce.framework.name</name>
                   <value>yarn</value>
                   <description>指定mr框架为yarn方式</description>
               </property>
               <property>
                   <name>mapreduce.task.io.sort.factor</name>
                   <value>100</value>
                   <description>reducer进入排序（合并map的输出）阶段默认合并因子是10，这里的100是为了减少合并的次数</description>
               </property>
               <property>
                   <name>mapreduce.job.jvm.numtasks</name>
                   <value>-1</value>
                   <description>开启jvm重用，在密集型任务计算时效率更高</description>
               </property>
               <property>
                   <name>mapreduce.output.fileoutputformat.compress.codec</name>
                   <value>org.apache.hadoop.io.compress.DefaultCodec</value>
                   <description>用于处理map任务输出的编解码器</description>
               </property>
               <property>
                   <name>mapreduce.map.maxattempts</name>
                   <value>4</value>
                   <description>map任务失败最大尝试次数，默认尝试4次</description>
               </property>
               <property>
                   <name>mapreduce.reduce.maxattempts</name>
                   <value>4</value>
                   <description>reduce任务失败最大尝试次数，默认尝试4次</description>
               </property>
               <property>
                   <name>mapreduce.reduce.shuffle.parallelcopies</name>
                   <value>10</value>
                   <description>reduce任务复制map输出的阶段，默认启用5个线程，这里指定为10,当map输出数量小于该值时则只每个map任务输出对应一个reduce复制线程</description>
               </property>
               <property>
                   <name>mapreduce.map.speculative</name>
                   <value>false</value>
                   <description>关闭map任务的推测执行</description>
               </property>
               <property>
                   <name>mapreduce.reduce.speculative</name>
                   <value>false</value>
                   <description>关闭reduce任务的推测执行</description>
               </property>
               <property>
                   <name>mapreduce.job.reduce.slowstart.completedmaps</name>
                   <value>0.80</value>
                   <description>慢启动reduce任务，默认调度器会等待作业5%的map任务结束后调用reduce任务开始等待，等待的时候reduce是会占用reduce任务槽导致其他作业分配不到reduce任务。如果是大型作业时会降低集群的利用率，这里设置某个作业的map任务运行到80%的时候再启动reduce等待</description>
               </property>
           </configuration>
       6、yarn-env.sh
           export JAVA_HOME=/home/lefuBigDataDev/clouds/jdk
       7、yarn-site.xml
           <configuration>
               <property>
                   <name>yarn.resourcemanager.ha.enabled</name>
                   <value>true</value>
                   <description>开启ResourceManager的HA</description>
               </property>
               <property>
                   <name>yarn.resourcemanager.cluster-id</name>
                   <value>yrc</value>
                   <description>指定ResourceManager的集群ID</description>
               </property>
               <property>
                   <name>yarn.resourcemanager.ha.rm-ids</name>
                   <value>rm1,rm2</value>
                   <description>指定HA方式的活动和备用的ResourceManager的名字</description>
               </property>
               <property>
                   <name>yarn.resourcemanager.hostname.rm1</name>
                   <value>lf3</value>
                   <description>指定活动的ResourceManager的节点</description>
               </property>
               <property>
                   <name>yarn.resourcemanager.hostname.rm2</name>
                   <value>lf4</value>
                   <description>指定备用的ResourceManager的节点</description>
               </property>
               <property>
                   <name>yarn.resourcemanager.zk-address</name>
                   <value>lf5:2181,lf6:2181,lf7:2181</value>
                   <description>指定zk集群地址</description>
               </property>
               <property>
                   <name>yarn.nodemanager.aux-services</name>
                   <value>mapreduce_shuffle</value>
                   <description>在NodeManager上扩展自定义服务</description>
               </property>
               <property>
                   <name>yarn.nodemanager.resource.cpu-vcores</name>
                   <value>6</value>
                   <description>yarn使用虚拟cpu个数，默认8个；虚拟cpu个数在生产中建议和物理cpu核数相同</description>
               </property>
               <property>
                   <name>yarn.nodemanager.resource.memory-mb</name>
                   <value>16384</value>
                   <description>yarn节点上可使用的物理内存总量，默认8192MB（8GB），这里设置为16384MB（16GB）</description>
               </property>
               <property>
                   <name>yarn.nodemanager.vmem-pmem-ratio</name>
                   <value>2.1</value>
                   <description>任务每使用1MB物理内存，最多可使用虚拟内存量，默认是2.1MB</description>
               </property>
               <property>
                   <name>yarn.nodemanager.pmem-check-enabled</name>
                   <value>true</value>
                   <description>是否启动一个线程检查每个任务正使用的物理内存量，如果任务超出分配值，则直接将其杀掉，默认是true</description>
               </property>
               <property>
                   <name>yarn.nodemanager.vmem-check-enabled</name>
                   <value>true</value>
                   <description>是否启动一个线程检查每个任务正使用的虚拟内存量，如果任务超出分配值，则直接将其杀掉，默认是true</description>
               </property>
               <property>
                   <name>yarn.scheduler.minimum-allocation-mb</name>
                   <value>1024</value>
                   <description>单个任务可申请的最少物理内存量，默认是1024MB（1GB），如果一个任务申请的物理内存量少于该值，则该对应的值改为这个数</description>
               </property>
               <property>
                   <name>yarn.scheduler.maximum-allocation-mb</name>
                   <value>15360</value>
                   <description>单个任务可申请的最多物理内存量，默认是8192MB（8GB），这里是15360MB（15GB）</description>
               </property>
           </configuration>
       8、slaves
           lf5
           lf6
           lf7
   配置HADOOP_HOME到环境变量
       vim /etc/profile
       export HADOOP_HOME=/home/lefuBigDataDev/clouds/jdk
       export PATH=.:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$JAVA_HOME/bin:$PATH
   刷新环境变量使HADOOP_HOME立即生效
       source /etc/profile
   复制配置好的hadoop到其他节点
       复制到lf3节点：scp -r /home/lefuBigDataDev/clouds/hadoop lefuBigDataDev@lf3:/home/lefuBigDataDev/clouds/ ##添加HADOOP_HOME到/etc/profile，然后执行source /etc/profile立即生效
       复制到lf5节点：scp -r /home/lefuBigDataDev/clouds/hadoop lefuBigDataDev@lf5:/home/lefuBigDataDev/clouds/ ##添加HADOOP_HOME到/etc/profile，然后执行source /etc/profile立即生效
       复制到lf6节点：scp -r /home/lefuBigDataDev/clouds/hadoop lefuBigDataDev@lf6:/home/lefuBigDataDev/clouds/ ##添加HADOOP_HOME到/etc/profile，然后执行source /etc/profile立即生效
       复制到lf7节点：scp -r /home/lefuBigDataDev/clouds/hadoop lefuBigDataDev@lf7:/home/lefuBigDataDev/clouds/ ##添加HADOOP_HOME到/etc/profile，然后执行source /etc/profile立即生效
   开始准备启动hadoop集群，严格按照如下步骤执行
       1、检查lf5、lf6、lf7节点上的ZooKeeper集群是否启动（HDFS HA和YARN HA都需要依赖ZooKeeper集群）
           在lf5节点上执行命令：
               zkServer.sh status ##如果没有QuorumPeerMain进程则执行zkServer.sh start启动
           在lf6节点上执行命令：
               zkServer.sh status ##如果没有QuorumPeerMain进程则执行zkServer.sh start启动
           在lf7节点上执行命令：
               zkServer.sh status ##如果没有QuorumPeerMain进程则执行zkServer.sh start启动
       2、在lf1节点上启动JournalNode
           cd /home/lefuBigDataDev/clouds/hadoop/sbin
           hadoop-daemons.sh start journalnode
       3、在lf1节点上格式化hadoop的HDFS，即hadoop的分布式文件系统
           cd /home/lefuBigDataDev/clouds/hadoop/bin
           hdfs namenode -format   ##日志中出现这行内容Storage directory /home/lefuBigDataDev/clouds/hadoop/dfs/name has been successfully formatted.则表示格式化HDFS成功
       4、在lf1节点上格式化ZKFC，即ZooKeeper故障转移控制器
           cd /home/lefuBigDataDev/clouds/hadoop/bin
           hdfs zkfc -formatZK       ##日志中出现这行内容ha.ActiveStandbyElector: Successfully created /hadoop-ha/ns1 in ZK.则表示格式化ZKFC成功
       5、在lf1节点上启动hadoop的HDFS
           cd /home/lefuBigDataDev/clouds/hadoop/sbin
           start-dfs.sh
       6、在lf3节点上启动hadoop的YARN
           cd /home/lefuBigDataDev/clouds/hadoop/sbin
           start-yarn.sh
       7、验证hadoop集群是否启动成功
           1、使用shell验证：
               输入命令：for i in lf1 lf3 lf5 lf6 lf7; do echo $i; ssh $i `which jps`; done   ##如下进程表示hadoop集群启动成功
                   lf1
                   3598 DFSZKFailoverController
                   9197 Jps
                   3283 NameNode
                   lf3
                   2902 ResourceManager
                   3037 JobHistoryServer
                   7491 Jps
                   lf5
                   3148 DataNode
                   3370 NodeManager
                   3255 JournalNode
                   3073 QuorumPeerMain
                   15238 Jps
                   lf6
                   3220 NodeManager
                   2917 QuorumPeerMain
                   10380 Jps
                   2997 DataNode
                   3105 JournalNode
                   lf7
                   2974 QuorumPeerMain
                   3163 JournalNode
                   3277 NodeManager
                   3056 DataNode
                   12048 Jps
           2、使用浏览器方式验证：
               输入lf1:50070验证HDFS
               输入lf3:8088验证YARN
               输入lf3:19888验证HistoryServer
       8、以上两种方式验证通过则表示Hadoop集群正确部署并启动成功

四、安装HBase（在lf1节点上），前提条件是必须已有ZooKeeper集群
   cd /home/lefuBigDataDev/clouds/
   安装HBase
       tar -zxvf hbase-0.98.8-hadoop2-bin.tar.gz
       mv hbase-0.98.8-hadoop2-bin hbase
   修改hbase配置文件(hbase-env.sh,hbase-site.xml,regionservers,需要将Hadoop的hdfs-site.xml和core-site.xml 放到hbase/conf下)
       1、hbase-env.sh
           export JAVA_HOME=/home/lefuBigDataDev/clouds/jdk
           export HBASE_HEAPSIZE=3000
       2、hbase-site.xml
           <configuration>
               <property>
                       <name>hbase.rootdir</name>
                       <value>hdfs://ns1/hbase</value>
                       <description>指定hbase在HDFS上存储的路径</description>
               </property>
               <property>
                       <name>hbase.cluster.distributed</name>
                       <value>true</value>
                       <description>指定hbase集群为完全分布式</description>
               </property>
               <property>
                       <name>hbase.zookeeper.quorum</name>
                       <value>lf5:2181,lf6:2181,lf7:2181</value>
                       <description>指定HBase集群使用外部的zookeeper集群的地址</description>
               </property>
               <property>
                       <name>zookeeper.session.timeout</name>
                       <value>60000</value>
                       <description>RegionServer与zookeeper连接超时时间默认180000毫秒（3分钟），当超过超时时间时，zookeeper会将超时节点的RegionServer从RegionServer集群清单中清除，当HMaster收到移除通知后会对超时节点的Regions重新负载均衡，让其他存活的RegionServer接管。这里改为60000毫秒（1分钟）</description>
               </property>
               <property>
                   <name>hbase.regionserver.handler.count</name>
                   <value>80</value>
                   <description>RegionServer端开启的RPC监听器实例个数（RegionServer能够处理的IO请求线程数）。老版本默认10,0.98.8中默认是30,这里改为80</description>
               </property>
                   <property>
                   <name>hfile.block.cache.size</name>
                   <value>0.4</value>
                   <description>regionserver cache的大小，默认是0.4，是整个堆内存的多少比例作为regionserver的cache，调大该值会提升查询性能。如果有大量的查询，写入不多，则调到0.5。当这里设置大了，有MapReduce作业Scan HBase时需要在MapReduce作业的Scan类中添加scan.setCacheBlocks(false)，这样可以避免由于MapReduce使用regionserver的cache都被替换，造成hbase的查询性能明显下降。</description>
               </property>
               <property>
                   <name>hbase.hregion.memstore.flush.size</name>
                   <value>268435456</value>
                   <description>regionserver的单个region memstore的大小，默认是128M，这里设为256。在hbase结构中,一个regionserver管理多个region，一个region对应一个hlog和多个store，一个store对应多个storefile和一个memstore，这里的hbase.hregion.memstore.flush.size意思一个region下面的所有store里面的memstore的达到多少时，开始将这些memstore flush到hdfs中去，配置这个值，需
                   要参考一下，平均每个regionserver管理的region数量，如果每台regionsever管理的region不多的话，可以适当的调大该值，如512M时再flush</description>
               </property>
               <property>
                   <name>hbase.hregion.max.filesize</name>
                   <value>10737418240</value>
                   <description>默认10GB，regions会被hmaster balance入各个regionserver,后随着单region的记录数增加，触发splite条件一般为hbase.hregion.max.filesize，会对其进行splite，找到region的middlekey,之后一分为二成为两个region，当然这是一个完整事务，之后会随着balance入不同的regionserver进行负载方面的均衡。</description>
               </property>
               <property>
                   <name>hbase.hstore.compactionThreshold</name>
                   <value>5</value>
                   <description>设置执行Compaction(Major或Minor)操作的阈值，默认是3。对于HBase负载较重的系统，为降低过频繁的合并操作，这里设置成5。</description>
               </property>
           </configuration>
       3、regionservers
           lf5
           lf6
           lf7
   配置HBASE_HOME到环境变量
       vim /etc/profile
       export HBASE_HOME=/home/lefuBigDataDev/clouds/hbase
       export PATH=.:$HBASE_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$JAVA_HOME/bin:$PATH
       shift+ZZ
   刷新环境变量使HBASE_HOME立即生效
       source /etc/profile
   复制配置好的hbase到其他节点
       复制到lf3节点：scp -r /home/lefuBigDataDev/clouds/hbase lefuBigDataDev@lf3:/home/lefuBigDataDev/clouds/ ##添加HBASE_HOME到/etc/profile，然后执行source /etc/profile立即生效
       复制到lf5节点：scp -r /home/lefuBigDataDev/clouds/hbase lefuBigDataDev@lf5:/home/lefuBigDataDev/clouds/ ##添加HBASE_HOME到/etc/profile，然后执行source /etc/profile立即生效
       复制到lf6节点：scp -r /home/lefuBigDataDev/clouds/hbase lefuBigDataDev@lf6:/home/lefuBigDataDev/clouds/ ##添加HBASE_HOME到/etc/profile，然后执行source /etc/profile立即生效
       复制到lf7节点：scp -r /home/lefuBigDataDev/clouds/hbase lefuBigDataDev@lf7:/home/lefuBigDataDev/clouds/ ##添加HBASE_HOME到/etc/profile，然后执行source /etc/profile立即生效
   开始准备启动hbase集群，严格按照如下步骤执行
       1、验证各个节点的时间误差，HBase不允许最大时间差超过30秒
           for i in lf1 lf3 lf5 lf6 lf7; do echo $i; ssh $i date; done
       2、如果各个节点的时间误差超过30秒则执行如下命令
           for i in lf1 lf3 lf5 lf6 lf7; do echo $i; ssh $i date -s 月/日/年; done
           for i in lf1 lf3 lf5 lf6 lf7; do echo $i; ssh $i date -s 时/分/秒; done
       3、检查lf5、lf6、lf7节点上的ZooKeeper集群是否启动（HBase集群需要依赖ZooKeeper集群）
           在lf5节点上执行命令：
               zkServer.sh status ##如果没有QuorumPeerMain进程则执行zkServer.sh start启动
           在lf6节点上执行命令：
               zkServer.sh status ##如果没有QuorumPeerMain进程则执行zkServer.sh start启动
           在lf7节点上执行命令：
               zkServer.sh status ##如果没有QuorumPeerMain进程则执行zkServer.sh start启动
       4、在lf1节点上启动hbase HA Active进程
               cd /home/lefuBigDataDev/clouds/hbase/bin
               start-hbase.sh
       5、在lf3节点上启动hbase HA Backup进程
               hbase-daemon.sh start master
       6、验证hbase集群是否运行成功
           1、使用shell验证：
               输入命令：for i in lf1 lf3 lf5 lf6 lf7; do echo $i; ssh $i `which jps`; done   ##如下进程表示hbase集群启动成功
                   lf1
                   11850 NameNode
                   15778 Jps
                   12167 DFSZKFailoverController
                   12407 HMaster
                   lf3
                   8861 ResourceManager
                   11192 Jps
                   9083 JobHistoryServer
                   9301 HMaster
                   lf5
                   17944 QuorumPeerMain
                   18029 DataNode
                   18250 NodeManager
                   21167 Jps
                   18136 JournalNode
                   18441 HRegionServer
                   lf6
                   15900 Jps
                   12687 NodeManager
                   5492 RunJar
                   12383 QuorumPeerMain
                   12466 DataNode
                   12878 HRegionServer
                   12573 JournalNode
                   lf7
                   14187 NodeManager
                   16753 Jps
                   13956 DataNode
                   13881 QuorumPeerMain
                   14073 JournalNode
                   14378 HRegionServer
           2、使用浏览器方式验证：
               输入lf1:60010验证HBase集群信息
               输入lf3:60010验证HBase备用节点信息
       7、以上两种方式验证通过则表示HBase集群正确部署并启动成功


五、安装Sqoop（在lf5节点上），前提条件是已有Hadoop集群
   cd /home/lefuBigDataDev/clouds/
   安装Sqoop
       tar -zxvf sqoop-1.4.5.bin.tar.gz
       mv sqoop-1.4.5.bin sqoop
   添加SQOOP_HOME到环境变量
       export SQOOP_HOME=/home/lefuBigDataDev/clouds/sqoop
       shift+ZZ
   刷新环境变量使SQOOP_HOME立即生效
       source /etc/profile
   验证sqoop是否安装成功
       sqoop version

六、安装Hive（在lf6节点上），前提条件是已有Hadoop集群
   cd /home/lefuBigDataDev/clouds/
   安装Sqoop
       tar -zxvf apache-hive-0.14.0-bin.tar.gz
       mv apache-hive-0.14.0-bin hive
   添加SQOOP_HOME到环境变量
       export HIVE_HOME=/home/lefuBigDataDev/clouds/hive
       shift+ZZ
   刷新环境变量使HIVE_HOME立即生效
       source /etc/profile
   修改hive配置文件（hive-env.sh、hive-site.xml）
       1、hive-env.sh
           export JAVA_HOME=/home/lefuBigDataDev/clouds/jdk
           export HADOOP_HOME=/home/lefuBigDataDev/clouds/hadoop
           export HIVE_HOME=/home/lefuBigDataDev/clouds/hive
       2、hive-site.xml
           <configuration>
              <property>
               <name>javax.jdo.option.ConnectionURL</name>
               <value>jdbc:mysql://lf5:3306/lefu?createDatabaseIfNotExist=true</value> ##如果写成远程访问提示过期需要修改mysql库的表
               <description>指定hive的元数据存储的数据库为mysql，使用JDBC的方式连接mysql，如果mysql中不存在hive数据库则创建</description>
              </property>
              <property>
               <name>javax.jdo.option.ConnectionDriverName</name>
               <value>com.mysql.jdbc.Driver</value>
               <description>指定hive元数据存储的数据库的JDBC连接驱动类</description>
              </property>
              <property>
               <name>javax.jdo.option.ConnectionUserName</name>
               <value>root</value>
               <description>使用指定用户登录hive的元数据存储数据库</description>
              </property>
              <property>
               <name>javax.jdo.option.ConnectionPassword</name>
               <value>******</value>
               <description>使用指定密码登录hive的元数据存储数据库</description>
              </property>
              <property>
               <name>hive.querylog.location</name>
               <value>/home/lefuBigDataDev/clouds/hive/tmp</value>
               <description>默认取值为${system:java.io.tmpdir}/${system:user.name}，这个目录是不存在的</description>
              </property>
              <property>
               <name>hive.exec.local.scratchdir</name>
               <value>/home/lefuBigDataDev/clouds/hive/tmp</value>
               <description>默认取值为${system:java.io.tmpdir}/${system:user.name}，这个目录是不存在的</description>
              </property>
              <property>
               <name>hive.downloaded.resources.dir</name>
               <value>/home/lefuBigDataDev/clouds/hive/tmp</value>
               <description>默认取值为${system:java.io.tmpdir}/${hive.session.id}_resources，这个目录是不存在的</description>
              </property>
           </configuration>
       3、验证hive安装
           1、使用shell验证
               hive
           2、登陆mysql，mysql中有个lefu的数据库表示hive配置成功

你可能感兴趣的:(服务器)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
最简单将静态网页挂载到服务器上(不用nginx) 全能全知者服务器 nginx 运维前端 html 笔记
最简单将静态网页挂载到服务器上(不用nginx)如果随便弄个静态网页挂在服务器都要用nignx就太麻烦了，所以直接使用Apache来搭建一些简单前端静态网页会相对方便很多检查Web服务器服务状态：sudosystemctlstatushttpd#ApacheWeb服务器如果发现没有安装web服务器：安装Apache：sudoyuminstallhttpd启动Apache：sudosystemctl
阿里云服务器4核8G配置购买及价格类文章汇总（10篇）阿里云最新优惠和活动汇总
阿里云服务器4核8G配置如何购买？价格是多少？4核8G配置的阿里云服务器可以通过云服务器产品页购买也可以通过阿里云活动去下单购买，一般通过活动购买的用户比较多，但是不同实例规格的阿里云服务器价格不一样，带宽不同价格也不一样，本文为大家汇总了10篇关于阿里云服务器4核8G配置购买教程文章和价格类文章，分为购买类文章和价格类文章，以供大家参考如何购买阿里云服务器4核8G配置和最新优惠价格是多少。阿里云
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
NPM私库搭建-verdaccio（Linux） Beam007 npm linux 前端
1、安装nodelinux服务器安装nodea)、官网下载所需的node版本https://nodejs.org/dist/v14.21.0/b)、解压安装包若下载的是xxx.tar.xz文件，解压命令为tar-xvfxxx.tar.xzc)、修改环境变量修改：/etc/profile文件#SETPATHFORNODEJSexportNODE_HOME=NODEJS解压安装的路径exportPAT
[实验室服务器使用]使用VSCode、PyCharm、MobaXterm和CMD连接远程服务器 YuanDaima2048 工具使用服务器 vscode pycharm cmd 代理模式机器学习实验
文章总览：YuanDaiMa2048博客文章总览实验室服务器使用：使用VSCode、PyCharm、MobaXterm和CMD连接远程服务器在进行实验室工作时，远程连接服务器是常见的需求之一。本篇文章根据个人的一些使用介绍使用不同工具连接服务器的方法，并提供优化功能，使服务器能够使用本机代理的说明。准备服务器账号信息Host（主机）:10.XXX.XX.XXXPort（端口）:[SSHPort]U
L1 L2 L3 缓存京天不下雨 windows 缓存 windows
L1L2L3缓存L1Cache(一级bai缓存)是CPU第一层高速缓存，分为数据缓存和指令缓存。du内置的zhiL1高速缓存的容量和结构对daoCPU的性能影响较大，不过高速缓冲存储器均由静态RAM组成，结构较复杂，在CPU管芯面积不能太大的情况下，L1级高速缓存的容量不可能做得太大。一般服务器CPU的L1缓存的容量通常在32—4096KB。L2由于L1级高速缓存容量的限制，为了再次提高CPU的运
golang实现从服务器下载文件到本地指定目录余生逆风飞翔 golang 服务器开发语言
一、连接服务器，采用sftp连接模式packagemiddlewaresimport("fmt""time""github.com/pkg/sftp""golang.org/x/crypto/ssh")//建立服务器连接funcConnect(user,password,hoststring,portint)(*sftp.Client,error){var(auth[]ssh.AuthMethod
鲲鹏 ARM 架构麒麟 Lylin v10 安装 Nginx (离线) 焚木灵 arm开发架构 nginx 服务器
最近做一个银行的项目，银行的服务器是鲲鹏ARM架构的服务器，并且是麒麟v10的系统，这里记录一下在无法访问外网安装Nginx的方法。其他文章：鲲鹏ARM架构麒麟Lylinv10安装Mysql8.3(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装Node和NVM(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装Pm2(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装P
Nginx之代理模块 ngx_http_proxy_module 途径日暮不赏丶 nginx nginx
正向代理正向代理是指位于客户机（A）和站点服务器（B）之间的代理服务器（C），为了从站点服务器（B）获取资源，客户机（A）向代理服务器（C）发送请求并指定站点服务器（B），然后代理服务器（C）向站点服务器（B）转交请求并将获取的资源返回给客户机（A）。上述这样的代理模式称为正向代理，正向代理最大的特点：客户端非常明确要访问的服务器地址；服务器只清楚请求来自哪个代理服务器，而不清楚来自哪个具体的客户
导致格式错误的 Lambda 代理响应的原因以及如何修复它 zqhdz米时空汇编
当人们尝试使用AWSAPIGateway和AWSLambda构建无服务器应用程序时，经常出现的一个问题是_由于配置错误而执行失败：Lambda代理响应格式错误。_没有什么比通用错误消息更糟糕的了，它们不会告诉您解决问题所需的任何内容，对吧？AWS并不是以其错误消息设计而闻名，如果甚至可以这样称呼它的话，更不用说为您提供解决问题的方法了。那么如何修复这个Lambda错误以及是什么原因造成的呢？花椒壳
网关gateway学习总结猪猪365 学习总结学习总结
一微服务概述:微服务网关就是一个系统!通过暴露该微服务的网关系统,方便我们进行相关的鉴权,安全控制,日志的统一处理,易于监控的相关功能!实现微服务网关技术都有哪些呢?1nginx:nginx是一个高性能的http和反向代理web的服务器,同事也提供了IMAP/POP3/SMTP服务.他可以支撑5万并发链接,并且cpu,内存等资源消耗非常的低,运行非常的稳定!2Zuul:Zuul是Netflix公司
Nginx之ngx_http_proxy_connect_module模块小米bb Nginx nginx http 运维
近期由于项目需要使用到https正向代理，而nginx官方模块仅支持做http正向代理，一番百度学习后发现了该模块，故今日记录下此笔记供大家一起学习交流ngx_http_proxy_connect_module模块主要用于隧道SSL请求的代理服务器GitHub地址：http://www.github.com/chobits/ngx_http_proxy_connect_modulenginx配置：
Nginx：高性能的Web服务器与反向代理张某布响丸辣 nginx 前端服务器 java SpringBoot
在当今的互联网世界中，Web服务器的选择对于网站的性能、稳定性和安全性至关重要。Nginx（发音为“engineX”）凭借其卓越的性能、丰富的功能集和灵活的配置选项，成为了众多网站和应用程序的首选Web服务器和反向代理。本文将深入探讨Nginx的特点、应用场景、基本配置以及它如何助力你的Web项目。Nginx简介Nginx是一个开源的、高性能的HTTP和反向代理服务器，也是一个IMAP/POP3/
Android shell 常用 debug 命令晨春计 Audio debug android linux
目录1、查看版本2、am命令3、pm命令4、dumpsys命令5、sed命令6、log定位查看APK进程号7、log定位使用场景1、查看版本1.1、Android串口终端执行getpropro.build.version.release#获取Android版本uname-a#查看linux内核版本信息uname-r#单独查看内核版本1.2、linux服务器执行lsb_release-a#查看Lin
解决SDK Manager 中没有 Support Library 木鱼wzh
1、直接修改SDK-MANAGER打开sdk-manager—->Tools—->options然后点击packages—->showobsoletepackages即可在最下面的Extras目录下找到推荐两个自己使用的镜像服务器：mirrors.neusoft.edu.cn端口80mirrors.dormforce.net端口802、去官网下载SupportLibrar点击这里进入官网进入百度云
Nginx从入门到实践(三) 听你讲故事啊
动静分离动静分离是将网站静态资源（JavaScript，CSS，img等文件）与后台应用分开部署，提高用户访问静态代码的速度，降低对后台应用访问。动静分离的一种做法是将静态资源部署在nginx上，后台项目部署到应用服务器上，根据一定规则静态资源的请求全部请求nginx服务器，达到动静分离的目标。rewrite规则Rewrite规则常见正则表达式Rewrite主要的功能就是实现URL的重写，Ngin
Nginx的使用场景：构建高效、可扩展的Web架构张某布响丸辣 nginx 前端架构
Nginx，作为当今最流行的Web服务器和反向代理软件之一，凭借其高性能、稳定性和灵活性，在众多Web项目中扮演着核心角色。无论是个人博客、中小型网站，还是大型企业级应用，Nginx都能提供强大的支持。本文将探讨Nginx的几个主要使用场景，帮助读者理解如何在实际项目中充分利用Nginx的优势。1.静态文件服务对于包含大量静态文件（如HTML、CSS、JavaScript、图片等）的网站，Ngin
【nginx】ngx_http_proxy_connect_module 正向代理等风来不如迎风去网络服务入门与实战 nginx http 运维
50.65无法访问服务器，(403错误)50.196可以访问服务器。那么，配置65通过196访问。需要一个nginx作为代理【nginx】搭配okhttp配置反向代理发送原生的nginx是不支持okhttp的CONNECT请求的。大神竟然给出了一个java工程GINX编译ngx_http_proxy_connect_module及做正向代理是linux构建的。是windows构建的：编译Windo
第三十一节:Vue路由:前端路由vs后端路由的了解曹老师
1.认识前端路由和后端路由前端路由相对于后端路由而言的,在理解前端路由之前先对于路由有一个基本的了解路由:简而言之,就是把信息从原地址传输到目的地的活动对于我们来说路由就是:根据不同的url地址展示不同的页面内容1.1后端路由以前咱们接触比较多的后端路由,当改变url地址时,浏览器会向服务器发送请求,服务器根据这个url,返回不同的资源内容后端路由的特点就是前端每次跳转到不同url地址,都会重新访
非关系型数据库天秤-white nosql
一、为什么要用Nosql1.单机MySQL的时代。一个基本的网站访问量一般不会太大，单个数据库完全足够。那时候更多使用的静态网页html，服务器根本没有太大压力。这时候网站的瓶颈是什么？-数据量如果太大，一个机器放不下。-数据量太大需要建立数据的索引（B+Tree），一个服务器内存放不下。-访问量读写混合，一个服务器承受不了。2.memcached缓存+MySQL+垂直拆分（读写分离）。网站80%
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S