Raini.闭雨哲

大数据平台搭建：Hadoop-3.x + Spark-2.x + Hive-2.x + Hbase-1.4 + Phoenix-4.14 + Cassandra + ES + Accumulo-1.9

换了新笔记本，做个笔记。

一，软件准备（自取所需）

Java-1.8

Scala-2.11

Hadoop-3.1.1

Spark-2.3.2

Hive-2.3.4

phoenix

二，SSH免密码登录

（即使是当地的单机也需要SSH，否则格式化的hadoop的存储系统时无权限，导致失败

：本地主机：@localhost：权限被拒绝（公钥，密码）开始）

公共密钥生成命令（在客户端下依次执行，所有选项按回车即可）

（1）$ ssh-keygen -t dsa -f ~/.ssh/id_dsa

（2）$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

[注释：〜/.ssh/id_dsa.pub文件为公钥，拷贝到服务器的〜/.ssh /目录中，执行cat ~/.ssh/id_dsa.pub >> 〜/.ssh/authorized_keys，权限只给用户本人，否则无法连接]

尝试连接（第一次可能需要输入密码）：

：〜$ ssh localhost

Ps：如果配了ssh免密，登入时还需要输入密码，需要需改.ssh文件夹访问权限,分配权限为登陆用户

chmod 700 /home/raini/.ssh
chmod 600 /home/raini/.ssh/*
chown raini: /home/raini/.ssh
chown raini: /home/raini/.ssh/*

三，安装Java和Scala

1.分别解压Java和Scala到自己想存放的目录

2.配置环境变量

raini @ biyuzhe：〜$ gedit .bashrc （在末尾加入）

## java
export JAVA_HOME=/home/raini/app/jdk
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib:$CLASSPATH
export PATH=${JAVA_HOME}/bin:$JRE_HOME/bin:$PATH

## scala
export SCALA_HOME=/home/raini/app/scala
export PATH=${SCALA_HOME}/bin:$PATH

3.执行$ source .bashrc （应用更改）

4.验证

四，安装Hadoop

解压：tar -zxvf hadoop-3.1.1.tar.gz

2. raini @ biyuzhe：〜$ gedit .bashrc（在文件里追加）

## hadoop-3.x
export HADOOP_HOME=/home/raini/app/hadoop
export CLASSPATH=".:$JAVA_HOME/lib:$CLASSPATH"
#
export HADOOP_COMMON_HOME=$HADOOP_HOME 
export HADOOP_HDFS_HOME=$HADOOP_HOME 
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_YARN_HOME=$HADOOP_HOME 
#
export HADOOP_INSTALL=$HADOOP_HOME 
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native 
export HADOOP_CONF_DIR=$HADOOP_HOME 
export HADOOP_PREFIX=$HADOOP_HOME 
export HADOOP_LIBEXEC_DIR=$HADOOP_HOME/libexec 
export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native:$JAVA_LIBRARY_PATH 
export HADOOP_CONF_DIR=$HADOOP_PREFIX/etc/hadoop
#
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
# 
#export HDFS_DATANODE_USER=root
#export HDFS_DATANODE_SECURE_USER=root
#export HDFS_SECONDARYNAMENODE_USER=root
#export HDFS_NAMENODE_USER=root

3. vi etc/hadoop/core-site.xml


  
    fs.defaultFS
    hdfs://biyuzhe:9000
  
  
        hadoop.tmp.dir
        /home/raini/app/hadoop/tmp/tmp

集群模式：

4. vi etc/hadoop/hdfs-site.xml



  
    dfs.replication
    1
  
      
        dfs.namenode.name.dir
        /home/raini/app/hadoop/tmp/hdfs/name
    
    
        dfs.namenode.data.dir
        /home/raini/app/hadoop/tmp/hdfs/data

集群模式：

5. vi etc/hadoop/mapred-site.xml

集群模式（单机可选）：

6. vi hadoop-env.sh

export JAVA_HOME=/home/raini/app/jdk
export HADOOP_HOME=/home/raini/app/hadoop

# 默认情况下，Hadoop的生成大量调试日志。 为了制止这种行为，开头和结尾查找行的export HADOOP_OPTS并将其更改为：
export HADOOP_OPTS="$HADOOP_OPTS -XX:-PrintWarnings -Djava.net.preferIPv4Stack=true"

# pid文件
export HADOOP_PID_DIR=/home/raini/app/tmp/pids

7.格式化HDFS文件系统

$ bin/hdfs namenode -format

8.启动名称节点和数据节点守护进程

$ sbin/start-dfs.sh

9.jps查看进程

10.访问名称节点的网络服务

http://localhost:9870/ ，查看hadoop状况

五，安装Spark

解压：tar -zxvf spark-2.3.2-bin-hadoop2.7.tgz

2. raini @ biyuzhe：〜$ gedit .bashrc（在文件里追加）

顺便把pyspark也配置了

## spark
export SPARK_HOME=/home/raini/app/spark
export PATH=${SPARK_HOME}/bin:$PATH
export PYSPARK_PYTHONPATH=${SPARK_HOME}/bin:${SPARK_HOME}/python:${SPARK_HOME}/python/lib/py4j-0.10.7-src.zip:$PATH
# PYSPARK
export PYSPARK_DRIVER_PYTHON=$ANACONDA_ROOT/bin/ipython notebook
export PYSPARK_PYTHON=$ANACONDA_ROOT/envs/py35/bin/python
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"

3.更改配置

1. vim slaves （追加自己的主机名）
##localhost
biyuzhe

2.vim spark-env.sh 
追加：
export JAVA_HOME=/home/raini/app/jdk
export SCALA_HOME=/home/raini/app/scala
export SPARK_WORKER_MEMORY=1G
export HADOOP_HOME=/home/raini/app/hadoop
export HADOOP_CONF_DIR=/home/raini/app/hadoop/etc/hadoop
export SPARK_MASTER_HOST=biyuzhe
export SPARK_PID_DIR=/home/raini/app/spark/data/pid
export SPARK_LOCAL_DIRS=/home/raini/app/spark/data/spark_shuffle


3.vim spark-defaults.conf
追加：
# Example:
# spark.master                     spark://master:7077
# spark.eventLog.enabled           true
# spark.eventLog.dir               hdfs://namenode:8021/directory ## 但是hadoop配置的是9000
# spark.serializer                 org.apache.spark.serializer.KryoSerializer
# spark.driver.memory              5g
# spark.executor.extraJavaOptions  -XX:+PrintGCDetails -Dkey=value -Dnumbers="one two three"

spark.master                     spark://biyuzhe:7077
spark.eventLog.enabled           true
spark.eventLog.dir               hdfs://biyuzhe:9000/eventLog
spark.serializer                 org.apache.spark.serializer.KryoSerializer
spark.driver.memory              1g
# spark.executor.extraJavaOptions  -XX:+PrintGCDetails -Dkey=value -Dnumbers="one two three"

## 安装mmlspark
#spark.jars.packages    Azure:mmlspark:0.12

raini @ biyuzhe：〜$ hadoop fs -mkdir /eventLog

4.启动Spark

$SPARK_HOME/sbin/start-all.sh

5.web监控

http://biyuzhe:8080/

（六）配置Pyspark环境

1.追加配置（基于anoconda envs）

# added by Anaconda3 
export ANACONDA_ROOT=/home/raini/app/anoconda3
export PATH=${ANACONDA_ROOT}/bin:$PATH

# pyspark
export PYSPARK_DRIVER_PYTHON=$ANACONDA_ROOT/bin/ipython notebook
export PYSPARK_PYTHON=$ANACONDA_ROOT/envs/py35/bin/python
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"

raini @ biyuzhe：〜$ source .bashrc

2.运行pyspark

raini @ biyuzhe：〜$ pyspark --packages Azure：mmlspark：0.14

自动跳转到的IPython的中，现在就可以编辑与运行代码了：

不使用的IPython的：

3.Pyspark设置指定的Python的版本

修改spark-env.sh文件，在末尾添加

export PYSPARK_PYTHON=/home/raini/app/anoconda3/envs/py35/bin/python

（完）

遇到的问题

1. Spark无法连接Hadoop异常：

错误SparkContext：91 - 初始化SparkContext时出错.java.net.ConnectException
：从biyuzhe / 127.0.1.1调用biyuzhe：8021连接异常失败： java.net.ConnectException：拒绝连接; 有关更多详细信息，请参阅：
   sun.reflect
   上的sun.reflect.NativeConstructorAccessorImpl.newInstance（NativeConstructorAccessorImpl.java:62）
   中的sun.reflect.NativeConstructorAccessorImpl.newInstance0（本地方法）中的http：//wiki.apache .org / hadoop / ConnectionRefused.DissatingConstructorAccessorImpl.newInstance（DelegatingConstructorAccessorImpl.java:45）
   在java.lang.reflect.Constructor.newInstance（Constructor.java:423）
   在org.apache.hadoop.net.NetUtils.wrapWithMessage（NetUtils.java）：792）
   在org.apache .hadoop。 net.NetUtils.wrapException（NetUtils.java:732）
   在org.apache.hadoop.ipc.Client.call（Client.java:1479）
   在org.apache .hadoop。 ipc.Client.call（Client.java:1412）...

方法1.修改配置的端口8021（火花的默认）成9000（HDFS的默认）

方法2（待验证）./ etc / hosts中不要有:: 1的段，屏蔽掉：

六,安装Hive

MySQL的安装

sudo apt install mysql-server

一、（仅对于新安装的执行这步，已有MySQL的跳过）

重置root用户密码：

SET PASSWORD FOR 'root'@'localhost' = PASSWORD('root');

或：

update mysql.user set authentication_string=PASSWORD('root'), plugin='mysql_native_password' where user='root';

给用户赋权：

grant all privileges on *.* to 'root'@'%' identified by 'root';

grant all privileges on *.* to 'root'@'localhost' identified by 'root';(与上相仿)

更新：

flush privileges;

二、

登录MySQL：

# mysql -u root -p

建立数据库hive：

mysql> create database hive;

mysql> show databases;

修改hive数据库的字符集为latin1：

mysql> alter database hive character set latin1;

创建hive用户，并授权：

mysql> create user 'hive'@'localhost' identified by 'hive';

mysql> grant select,insert,update,delete,alter,create,index,references on metastore.* to 'hive'@'localhost';

或者：mysql>grant all privileges on *.* to 'hive'@'node1' identified by 'hive' with grant option;

注意：@后面改成你的hostname

更新：

mysql>flush privileges;

三、使用新用户登录并设置密码

$ mysql [-h master] -uhive -p (回车再回车)

mysql> SET PASSWORD FOR hive@localhost = PASSWORD('hive');

查询的MySQL的版本：

mysql>select version(); //5.7.24-0ubuntu0.18.04.1

下载MySQL的JDBC的驱动包：

http://dev.mysql.com/downloads/connector/j/

选择独立平台，下载mysql-connector-java-8.0.13.zip，复制msyql的JDBC驱动包到蜂巢的LIB目录下。

Hive安装配置

在.bashrc中添加如下：

#Hive

export HIVE_HOME = /home/raini/app/hive

export PATH = $ PATH:${HIVE_HOME}/bin

export CLASSPATH = $CLASSPATH.:{HIVE_HOME}/lib

配置hive-env.sh文件：

HADOOP_HOME = /home/raini/app/hadoop

export HIVE_CONF_DIR = /home/raini/app/hive/conf

#export HADOOP_HEAPSIZE = 512

＃导入第三方lib包，参考（https://blog.csdn.net/qianshangding0708/article/details/50381966）

#export HIVE_AUX_JARS_PATH = /home/raini/app/hive/../.jar(绝对路径，多个用，分隔）

PS :(不配置该变量，仅需要将所需 jar放入新建目录 $ {HIVE_HOME}/auxlib下即可）

(可选配置)：

HADOOP_HOME=/usr/local/Cellar/hadoop/3.1.1/libexec
export HIVE_CONF_DIR=/Users/zhengsiming/app/hive/conf
#export HADOOP_HEAPSIZE = 512
export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_201.jdk/Contents/Home
export HADOOP_HOME=/usr/local/Cellar/hadoop/3.1.1/libexec
export HIVE_HOME=/Users/zhengsiming/app/hive

- 配置Hive的site.xml文件

（创建Hive-site.xml中所需文件夹）：

raini @ biyuzhe：〜$ hadoop fs -mkdir -p /user/hive/tmp

raini @ biyuzhe：〜$ hadoop fs -mkdir -p /user/hive/log

raini @ biyuzhe：〜$ hadoop fs -mkdir -p /user/hive/warehouse

（需要给755权限）：

raini @ biyuzhe：〜$ hadoop fs -chmod g + w /user/hive/tmp

raini @ biyuzhe：〜$ hadoop fs -chmod g + w /user/hive/log

raini @ biyuzhe：〜$ hadoop fs -chmod g + w /user/hive/warehouse

（一步到位）：

hdfs dfs -mkdir -p /user/hive/warehouse
hdfs dfs -mkdir -p /user/hive/tmp
hdfs dfs -mkdir -p /user/hive/log
hdfs dfs -chmod -R 777 /user/hive/warehouse
hadoop fs -chmod 777 /user/hive/tmp
hdfs dfs -chmod -R 777 /user/hive/tmp 
hdfs dfs -chmod -R 777 /user/hive/log

（新建hive-site.xml文件）：





    

    
        javax.jdo.option.ConnectionURL
        jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true
    
    

    
        javax.jdo.option.ConnectionDriverName
        com.mysql.cj.jdbc.Driver
    MySQL-5.5之前 com.mysql.jdbc.Driver
    

    
        javax.jdo.option.ConnectionUserName
        hive
    
    

    
        javax.jdo.option.ConnectionPassword
        hive
    
    
    
        hive.metastore.warehouse.dir
        /user/hive/warehouse
    指定Hive的数据存储目录，默认位置在HDFS的/user/hive/warehouse路径下
    

    
        hive.exec.scratdir
        /user/hive/tmp
    hive的数据临时文件目录，默认位置为HDFS的/tmp/hive路径下
    

    

    
        hive.querylog.location
        /home/raini/app/hive/logs
    这个是用于存放hive相关日志的目录,Location of Hive run time structured log file
    

    
        hive.server2.logging.operation.log.location
        /home/raini/app/hive/iotmp/operation_logs
        Top level directory where operation logs are stored if logging functionality is enabled
    
    
        hive.downloaded.resources.dir
        /home/raini/app/hive/iotmp/resource_dir
        Temporary local directory for added resources in the remote file system.
    
    
        hive.exec.local.scratchdir
        /home/raini/app/hive/iotmp/scratchdir
        Local scratch space for Hive jobs
    

    
        hive.cli.print.current.db
        true

- （vim hive-log4j.proprties）和（vim hive-exec-log4j2.properties）：

property.hive.log.dir =（/home/raini/app/app/hive/log）

＃当hive运行时，日志存储的地方，（上面hive已经配置过了，所以这步跳过）

- （第一次执行，初始化）：

raini@biyuzhe:~$ schematool -dbType mysql -initSchema

--（启动hive服务）：

raini@biyuzhe:~$ hive --service metastore &

raini@biyuzhe:~$ hive --service metastore > /tmp/hive_metastore.log 2>&1 &

--（启动hive）：

raini@biyuzhe:~$ hive

Loading class `com.mysql.jdbc.Driver'. This is deprecated. The new driver class is `com.mysql.cj.jdbc.Driver'. The driver is automatically registered via the SPI and manual loading of the driver class is generally unnecessary.

Ps:（最新的mysql驱动用的驱动名称变了，

所以改变jdbc.driverClassName= com.mysql.cj.jdbc.Driver ）

--（测试）：

hive (default)> create table test(id int, name string) row format delimited FIELDS TERMINATED BY ',';

Time taken: 3.162 seconds

多余的：若是分布式，scp -r hive-2.3/ raini@node2:/home/app/hive之后只需做一部就可设置node2节点为客户端节点（可以在node2终端打开hive）

beeline连接hiveserver2

连接之前要先设置代理用户,可不输入用户名和密码直接回车进入。在hadoop的core-site.xml中,设置如下属性(proxyuser后面是运行hive的超级用户,raini是我的用户名):

 
    hadoop.proxyuser.raini.hosts
    *


    hadoop.proxyuser.raini.groups
    *

设置了以后, 无论使用什么用户登陆,都使用hive超级用户 (raini启动hiveserver2) 来代理, 使当前用户以raini的权限进行操作, 但所建立的表还是属于当前用户.

--（端口信息可以在hive-site.xml修改，默认的，可跳过）：


  hive.server2.thrift.port
  10000


  hive.server2.thrift.bind.host
  localhost

--（在一个窗口中启动hiveserver2）:

或放置后台：raini@biyuzhe:~/app$ hive --service hiveserver2 &

此时后台多了一个RunJar

--（启动beeline）：

beeline> !connect jdbc:hive2://localhost:10000

可以看到不输入用户名密码也可以进入，（因为前面hdfs 上的文件夹/ tmp 和/ hive /仓给给了权限，可777，也可755 ）

Hbase安装

（也可以使用Hbase自带zookeeper）

zookeeper安装

只需配置conf/zoo.cfg即可

zoo.cfg(单机)

# 最重要的5个 # 通常是tickTime=tickTime*initLimit  就是20000
tickTime=2000
initLimit=5
syncLimit=2
dataDir=/home/raini/app/zookeeper/dataDir 
dataLogDir=/home/raini/app/zookeeper/dataLogDir
clientPort=2181

# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
#
# Be sure to read the maintenance section of the 
# administrator guide before turning on autopurge.
#
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
#autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
#autopurge.purgeInterval=1

zoo.cfg(集群)

# 最重要的5个 # 通常是tickTime=tickTime*initLimit  就是20000
tickTime=2000
initLimit=5
syncLimit=2
dataDir=/home/raini/app/zookeeper/dataDir 
dataLogDir=/home/raini/app/zookeeper/dataLogDir
# 先查看端口是否占用，或修改成12181
clientPort=2181

# 3台机器
server.1=192.168.110.1:2888:3888
server.2=192.168.110.2:2888:3888
server.3=192.168.110.3:2888:3888

#maxClientCnxns=60
#autopurge.snapRetainCount=3
#autopurge.purgeInterval=1

完成～发送到另外两台机器。

然后：

node1的data/myid配置如下：
echo '1' > data/myid

node2的data/myid配置如下：
echo '2' > data/myid

node3的data/myid配置如下：
echo '3' > data/myid

分别启动：

zkServer.sh start > /home/app/zookeeper/zookeeper.out

查看状态：

zkServer.sh status

最后：

将zoo.cfg 复制到hbase/conf/下即可。

Ps: 若第一台zoo启动后没查看到进程，可以不管它，启动完后面的机器它会自己起来的。

Hbase-env.sh

## 追加：
export JAVA_HOME=/home/raini/app/jdk
export HBASE_CLASSPATH=/home/raini/app/hbase/conf/
export HBASE_PID_DIR=/home/raini/app/tmp/pids
#使用HBase自带的zookeeper（单机环境）
export HBASE_MANAGES_ZK=true

#不使用HBase自带的zookeeper（集群环境）
export HBASE_MANAGES_ZK=false

hbase-site.xml

(单机环境)：


  
    hbase.rootdir   
    hdfs://biyuzhe:9000/hbase
  
  
    hbase.cluster.distributed   
    true
  
  
    hbase.zookeeper.quorum   
    127.0.0.1
  
  
		hbase.zookeeper.property.clientPort
		2181
  
    
		zookeeper.znode.parent
		/hbase
  
  
    hbase.zookeeper.property.dataDir
    /home/raini/app/tmp/hbase_zoo_dataDir
  

  
           dfs.replication
           1
  
  
        hbase.master.maxclockskew
        150000
  
  
        zookeeper.session.timeout.ms
        150000

（集群环境-3台）：

注意：

hbase.zookeeper.property.clientPort 和 zookeeper.znode.parent 要配置好（方便以后配置janusGraph）

还有配置里使用的要么使用IP，不然全使用hostname，以免出现janusGraph(hbase-client)连接不上hbase-server

regionservers

#修改为主机名 <----建议写与hostname不同的主机ip , 不需要写master-ip在里边，因为master作为Hmaster了

node2-ip

node3-ip

启动Hbase

在node1$ start-hbase.sh

运行Hbase

$ hbase shell

HBase Shell 基本操作

status –查看HBase状态
    hbase(main):001:0> status

version –查看HBase版本信息
    hbase(main):002:0> version

create tablename,columnname1,…,columnnameN –创建表
    hbase(main):013:0* create 'testtable','colfam1','colfam2','colfam3'

describe tablename –描述表定义
    hbase(main):014:0> describe 'testtable'

list –列出所有表
    hbase(main):015:0> list

put tablename,rowname,columnname,value –插入数据
    hbase(main):019:0* put 'testtable','row1','colfam1','123'
    hbase(main):020:0> put 'testtable','row1','colfam1:col1','456'

scan tablename –全表查询
    hbase(main):021:0> scan 'testtable'

get tablename,rowname –查询表中行的数据
    hbase(main):022:0> get 'testtable','row1'

count tablename –查询表中的记录数
    hbase(main):023:0> count 'testtable'

delete tablename,rowname, columnname–删除一个CELL
    hbase(main):041:0> delete 'testtable','row1','colfam1:col1'

disable & drop tablename –删除表
    hbase(main):043:0> disable 'testtable'
    hbase(main):042:0> drop 'testtable'

exists tablename –判断表是否存在
    hbase(main):045:0> exists 'testtable'

disable&alter tablename –删除表中一个列族
    hbase(main):008:0> describe 'testtable'

truncate tablename –清空整张表
    hbase(main):005:0> truncate 'testtable'
    hbase(main):016:0* disable 'testtable'
    hbase(main):011:0> alter 'testtable',NAME=>'colfam1',METHOD=>'delete'
    hbase(main):012:0> describe 'testtable'
    hbase(main):018:0> enable 'testtable'

deleteall tablename rowname –删除表中整行
    hbase(main):010:0> scan 'testtable'
    hbase(main):012:0> deleteall 'testtable','row1'

Phoenix安装配置

下载：http://mirror.bit.edu.cn/apache/phoenix/

官网：http://phoenix.apache.org/#

前提：Hadoop ，zookeeper，Hbase-1.4 都安装成功

解压：$ tar -zxvf ./apache-phoenix-4.14.1-HBase-1.4-bin.tar.gz

安装：Phoenix 仅安装在Master节点

配置：
　　1、将 Phoenix 目录下的 phoenix-4.14.1-HBase-1.4-client.jar、phoenix-core-4.14.1-HBase-1.4.jar、phoenix-4.14.1-HBase-1.4-server.jar 拷贝到 hbase 集群各个节点的安装目录 lib 里。

　　2、将 hbase 配置文件 hbase-site.xml 拷贝到 Phoenix 的 bin 目录下，覆盖原有的配置文件。

　　3、将 hdfs 配置文件 core-site.xml、 hdfs-site.xml 拷贝到 Phoenix 的 bin 目录下。

环境变量：

#phoenix
export PHOENIX_HOME=/home/raini/app/phoenix
export PHOENIX_CLASSPATH=$PHOENIX_HOME
export PATH=$PATH:$PHOENIX_HOME/bin

修改启动文件权限：

　　Phoenix/bin/下： chmod 777 psql.py和sqlline.py

启动：

　　重启 hbase 集群，raini@biyuzhe:~/app/phoenix$ python2 ./bin/sqlline.py biyuzhe:2181

Cassandra的安装及配置

安装jdk和python-2.7(建议直接安装anaconda2)
vi .bashrc

# cassandra
export CASSANDRA_HOME=/home/raini/app/cassandra
export PATH=$CASSANDRA_HOME/bin:$PATH

新建cassandra数据存放的文件夹（用安装包的方式就需要这一步）

可以根据磁盘情况设置这3个文件夹，但是要和cassandra.yaml里的想对应

mkdir /home/raini/app/tmp/cassandra/data
mkdir /home/raini/app/tmp/cassandra/commitlog
mkdir /home/raini/app/tmp/cassandra/saved_caches
mkdir /home/raini/app/tmp/cassandra/hints

tmp/cassandra/data SSTable文件在磁盘中的存储位置,可以有多个地址

tmp/cassandra/commitlog 文件在磁盘中的存储位置.

tmp/cassandra/saved_caches 数据缓存文件在磁盘中的存储位置.保存表和行的缓存

tmp/cassandra/hints 存储提示目录

如果可能,可以考虑将tmp/cassandra/data和tmp/cassandra/commitlog设置在不同的磁盘中,这样有利于分散整体系统的磁盘I/O的压力.

修改con/cassandra.yaml中的一些参数


cluster_name: 'JanusGraphCassandraCluster'

hints_directory: /cassandra/hints           #存储提示目录

- seeds: "127.0.0.1"      #Cassandra集群中的种子节点地址,可以设置多个,用半角逗号隔开,必须是ip

listen_address: localhost               #需要监听的IP或主机名。改成本机IP

start_rpc: true                        #是否开始thrift rpc服务器,默认false

rpc_address: localhost                #Cassandra服务器对外提供服务的地址  本机ip

rpc_port: 9160                       #Cassandra服务器对外提供服务的端口号 9161

启动：

$ cassandra -f -R #启动，-f表示前台启动，-R表示以管理员身份启动

$ cassandra >> /home/raini/app/cassandra/cassandra.out & #后台启动

在某些本地化的环境中，如果得到如下错误：

expr: 语法错误
expr: 语法错误
bin/cassandra: 59: [: Illegal number:
bin/cassandra: 63: [: Illegal number:
bin/cassandra: 67: [: Illegal number:
expr: 语法错误
bin/cassandra: 81: [: Illegal number:
Invalid initial heap size: -XmsM
Error: Could not create the Java Virtual Machine.
Error: A fatal exception has occurred. Program will exit.

这种情况下，在/etc/cassandra/cassandra-env.sh中取消以下行注释即可：

#MAX_HEAP_SIZE="4G"
#HEAP_NEWSIZE="800M"

将MAX HEAP SIZE 设置为不超过硬件RAM的一半，这没用。Cassandra使用Off-Heap-Storage。

简单使用

进入数据库

$ bin/cqlsh

#类似于mysql 现在还没有配置身份验证所以暂时不需要带上用户名密码

$ ./bin/cqlsh node1 9042 # 连接到一个指定的服务器 (9042是监听端口)

thriftServer端口是9161

基本用法

在使用命令的时候记得常用tab，会有自动补齐功能。

帮助：

cqlsh> help;

cqlsh> CREATE_TABLE help;

显示当前cluster：

cqlsh> DESCRIBE CLUSTER;

显示当前存在的keyspaces：

cqlsh> DESCRIBE KEYSPACES ;

Cluster: JanusGraphCassandraCluster

这些system_traces system_schema system_auth system system_distributed自带的系统keyspaces是用来做内部管理的，有点和master，temp database类似。Cassandra使用这些keyspaces保存schema，tracing和security information。

使用keyspace和表

-Cassandra keyspace和关系型数据库的概念类似。它可以定义一个或多个（表 or column families）。

创建keyspace：

cqlsh> CREATE KEYSPACE janusgraph WITH replication = {'class': 'SimpleStrategy', 'replication_factor': '1'};

cqlsh> DESCRIBE janusgraph;

注：class代表使用什么作为replication策略，replication_factor表示这个keyspace的数据需要写到几个node上面去。在production的环境下面，一定不能只使用1个replication_factor。

切换到新建的keyspace：

cqlsh> USE janusgraph ;

在新建的keyspace里面创建表：

cqlsh:janusgraph> CREATE TABLE user ( first_name text, last_name text, PRIMARY KEY (first_name));

cqlsh:janusgraph> DESCRIBE user ;

注：也可以直接使用 CREATE TABLE janusgraph.user ( 这种语法创建表，不需要切换keyspace。

插入数据到表中：

cqlsh:janusgraph> INSERT INTO user (first_name, last_name ) VALUES ( 'zhe', 'xiao');

cqlsh:janusgraph> SELECT * FROM user ;

cqlsh:my_keyspace> DELETE last_name FROM user WHERE first_name = 'zhe';

cqlsh:my_keyspace> select * from user ;

cqlsh:my_keyspace> DELETE FROM user WHERE first_name = 'zhe';

清空或者删除表：

cqlsh:my_keyspace> TRUNCATE user ;

cqlsh:my_keyspace> DROP TABLE user ;

遇到问题

启动cassandra报错：java.lang.OutOfMemoryError: unable to create new native thread

当前会话有效设置

ulimit -u # 查看nproc
ulimit -u 65535 # 设置nproc，仅当前会话有效

全局有效

cat /etc/security/limits.d/90-nproc.conf
* soft nproc 1024

vi /etc/security/limits.d/90-nproc.conf
* soft nproc 655350

ES安装及配置

elasticsearch.yml

3台机器配置不同点1：

（node1）node.name: es-node-1

（node2）node.name: es-node-2

（node3）node.name: es-node-3

3台机器配置不同点2：

（node1）network.host: 192.168.110.21

（node2）network.host: 192.168.110.22

（node3）network.host: 192.168.110.23

3台机器配置如下：

（3个配置文件，最少可以只有两处不同，红标处--即需要修改为对应机器的参数）node1示例：

单机模式： 只需将黄线处注释掉即可。

jvm.options

修改为：

-Xms2g

Ps: 数值需一样，很多人配置为机器内存的1/2

报错一：

ERROR: bootstrap checks failed

解决方案：

vim /etc/security/limits.conf //添加, 【注销后并重新登录生效】

* soft nofile 300000

* hard nofile 300000

* soft nproc 102400

* hard nproc 102400

查看是否生效

[seven@localhost ~]$ ulimit -Hn

65536

报错二：

max virtual memory areas vm.max_map_count [65530] likely too low, increase to at least [262144]

解决方案：

vim /etc/sysctl.conf //添加

fs.file-max = 1645037

vm.max_map_count=655360

执行：sysctl -p

ERROR三: bootstrap checks failed

system call filters failed to install; check the logs and fix your configuration or disable system call filters at your own risk

解决方法：在elasticsearch.yml中配置bootstrap.system_call_filter为false，注意要在Memory下面:

bootstrap.memory_lock: false
bootstrap.system_call_filter: false

ERROR四: max number of threads [1024] for user [raini] is too low, increase to at least [4096]

修改 /etc/security/limits.d/90-nproc.conf

原：
*          soft    nproc     1024
改为：
*          soft    nproc     5120

Ps: Xshell连接的集群需要断开重连接才生效

启动ES：

每台机器都执行：elasticseach > ./elasticseach.out &

Accumulo安装

参考：Accumulo安装：Hbase同胞兄弟-1.9.2

你可能感兴趣的:(spark,hadoop)

hadoop3.x--搭建hadoop高可用集群（HA模式）运维小菜 hadoop hadoop hdfs
hadoop高可用集群（HA模式）一、安装前1.集群规划2.安装前配置3.安装jdk与hadoop4.克隆虚拟机与互信配置5.搭建zookeeper集群二、HDFS1.配置hdfs2.初始化启动hdfs集群三、MapReduce与Yarn1.配置MapReduce2.配置yarn3.启动yarn四、验证1.查看java进程2.hdfs与yarn前台页面一、安装前1.集群规划hostnameipNN
在虚拟机上安装Hadoop 杜清卿 hadoop
基本步骤与安装java一致:先用finalshell将hadoop-3.1.3.tar.gz导入到opt目录下面的software文件夹下面，然后解压,最后配置环境变量。1.使用finalshell上传。这里直接鼠标拖动操作即可。2.解压。进入到Hadoop安装包路径下，cd/opt/software/，再解压安装文件到/opt/module下，对应的命令是:tar-zxvfhadoop-.1.3
hadoop集群配置-scp拓展使用杜清卿 hadoop 服务器大数据
任务1：在hadoop102上，将hadoop101中/opt/module/hadoop-3.1.3目录拷贝到hadoop102上。分析：使用scp进行拉取操作：先登录到hadoop2使用命令：scp-rroot@hadoop101:/opt/module/hadoop-3.1.3/opt/module/任务2：在hadoop101上操作，将hadoop100中/opt/module目录下所有目
大数据学习（75）-大数据组件总结 viperrrrrrr 大数据 impala yarn hdfs hive CDH mapreduce
大数据学习系列专栏：哲学语录:用力所能及，改变世界。如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、CDHCDH（ClouderaDistributionIncludingApacheHadoop)是由Cloudera公司提供的一个集成了ApacheHadoop以及相关生态系统的发行版本。CDH是一个大数据平台，简化和加速了大数据处理分析的部署和管理。CDH提供Hadoop的
Sqoop安装部署愿与狸花过一生大数据 sqoop hadoop hive
ApacheSqoop简介Sqoop（SQL-to-Hadoop）是Apache开源项目，主要用于：将关系型数据库中的数据导入Hadoop分布式文件系统（HDFS）或相关组件（如Hive、HBase）。将Hadoop处理后的数据导出回关系型数据库。核心特性批量数据传输支持从数据库表到HDFS/Hive的全量或增量数据迁移。并行化处理基于MapReduce实现并行导入导出，提升大数据量场景的效率。自
ssh命令满分对我强制爱 linux 服务器运维 spark
ssh命令无需密码也可登录要先关闭防火墙，命令如下：systemctlstopfirewalldsystemctldisablefirewalldsystemctlstatusfirewalldeg：目标：hadoop100通过ssh访问hadoop101,hadoop102时不需要密码，其他两台设备也类似。具体操作如下：1.在hadoop100中生成公钥和密码。ssh-keygen-trsa三次
优化Apache Spark性能之JVM参数配置指南 weixin_30777913 jvm spark 大数据开发语言性能优化
ApacheSpark运行在JVM之上，JVM的垃圾回收（GC）、内存管理以及堆外内存使用情况，会直接对Spark任务的执行效率产生影响。因此，合理配置JVM参数是优化Spark性能的关键步骤，以下将详细介绍优化策略和配置建议。通过以下优化方法，可以显著减少GC停顿时间、提升内存利用率，进而提高Spark作业吞吐量和数据处理效率。同时，要根据具体的工作负载和集群配置进行调整，并定期监控Spark应
GraphCube、Spark和深度学习技术赋能快消行业关键运营环节 weixin_30777913 开发语言大数据深度学习人工智能 spark
在快消品（FMCG）行业，需求计划（DemandPlanning）、库存管理（InventoryManagement）和需求供应管理（DemandSupplyManagement）是影响企业整体效率和利润水平的关键运营环节。GraphCube图多维数据集技术、Spark大数据分析处理技术和深度学习技术的结合，为这些环节提供了智能化、动态化和实时化的解决方案，显著提升业务运营效率和企业利润。一、技术
Hive面试题御风行云天面试题大全 hive hadoop 数据仓库面试
Hive面试题1Hive基础概念1.1解释Hive是什么以及它的用途Hive的主要用途：1.2描述Hive架构和组件1.HiveCLI/Beeline和WebUI2.HiveQL3.HiveDriver（驱动）4.Metastore5.Compiler（编译器）6.Optimizer（优化器）7.Executor（执行器）8.HadoopCoreComponents（核心组件）9.HiveUDFs
【新品发售】NVIDIA 发布全球最小个人 AI 超级计算机 DGX Spark segmentfault
GTC2025大会上，NVIDIA正式推出了搭载NVIDIAGraceBlackwell平台的个人AI超级计算机——DGXSpark。赞奇可接受预订，直接私信后台即刻预订！DGXSpark(前身为ProjectDIGITS)支持AI开发者、研究人员、数据科学家和学生，在台式电脑上对大模型进行原型设计、微调和推理。用户可以在本地运行这些模型，或将其部署在NVIDIADGXCloud或任何其他加速云或
Kafka Connect Node.js Connector 指南丁操余
KafkaConnectNode.jsConnector指南kafka-connectequivalenttokafka-connect:wrench:fornodejs:sparkles::turtle::rocket::sparkles:项目地址:https://gitcode.com/gh_mirrors/ka/kafka-connect项目介绍KafkaConnectNode.jsConn
#Hadoop全分布式安装 #mysql安装 #hive安装砸吧砸吧 hadoop hive yarn mysql
分布式（多台机器部署不同组件）与集群（多台机器部署相同组件）概念。Linux基础命令linux具有文件数：目录、文件，从根目录开始，路径具有唯一性。pwd：显示当前路径特殊符号：/：根目录.：隐藏文件，如果路径以.开始，表示当前目录下..：当前目录下的上一级~：当前目录的home目录--help：帮助命令使用linux常用操作命令tab键：自动补全ls：显示指定目录内容默认：当前路径-a：显示所有
JAVA学习-练习试用Java实现“对大数据集中的网络日志进行解析和异常行为筛查” 守护者170 java学习 java 学习
问题：编写一个Spark程序，对大数据集中的网络日志进行解析和异常行为筛查。解答思路：下面是一个简单的Spark程序示例，用于解析网络日志并筛查异常行为。这个示例假设日志文件格式如下：timestamp,ip_address,user_id,action,event,extra_info2023-01-0112:00:00,192.168.1.1,123,login,success,none202
JAVA学习-练习试用Java实现“实现一个Spark应用，对大数据集中的文本数据进行情感分析和关键词筛选” 守护者170 java学习 java 学习
问题：实现一个Spark应用，对大数据集中的文本数据进行情感分析和关键词筛选。解答思路：要实现一个Spark应用，对大数据集中的文本数据进行情感分析和关键词筛选，需要按照以下步骤进行：1.环境准备确保的环境中已经安装了ApacheSpark。可以从[ApacheSpark官网](https://spark.apache.org/downloads.html)下载并安装。2.创建Spark应用以下是
Hadoop（在Linux中安装jdk）錠诗味 linux hadoop 运维
安装之前需准备：1.需要远程连接软件2.需要jdk3.需要准备两个文件夹01/export/software安装包02/export/servers解压文件夹现在正式开始安装1.将压缩包存放在/export/software目录下2.进入到software目录进行解压cd/export/software（切换目录）tar-zxvfjdk-8u202-linux-x64.tar.gz-C/expor
数据仓库和非结构化数据。 weixin_30631587 数据库
数据仓库包含标准化数据。还包含外部数据/非结构化数据如果外部数据量小可以保持数据库内部或者专用服务器。如果量大只能记住地址，在etl加载当然也有需求是实时数据比如股票汇率拿只能etl过程处理非结构化数据包含图片，视频音频如果是传统数据库db2oracle存在里面是不合适的。存储影响性能如果是hadoop无所谓影响不大，但是从使用者的角度非结构化数据只能转换关系使用建一张元数据表存储非结构化存储位置
CentOS 7系统中hadoop的安装和环境配置代码小张z centos hadoop linux
1.创建Hadoop安装解压路径：mkdir-p/usr/hadoop2.进入路径：cd/usr/hadoop3.下载安装包（我这里用的是阿里云镜像压缩包）：wgethttps://mirrors.aliyun.com/apache/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz4.解压安装包到hadoop文件路径：tar-zxvf/usr/hadoo
Hive与Spark的UDF：数据处理利器的对比与实践窝窝和牛牛 hive spark hadoop
文章目录Hive与Spark的UDF：数据处理利器的对比与实践一、UDF概述二、HiveUDF解析实现原理代码示例业务应用三、SparkUDF剖析-JDBC方式使用SparkThriftServer设置通过JDBC使用UDFSparkUDF的Java实现（用于JDBC方式）通过beeline客户端连接使用业务应用场景四、Hive与SparkUDF在JDBC模式下的对比五、实际部署与最佳实践六、总结
尚硅谷电商数仓6.0，hive on spark,spark启动不了新时代赚钱战士 hive spark hadoop
在datagrip执行分区插入语句时报错[42000][40000]Errorwhilecompilingstatement:FAILED:SemanticExceptionFailedtogetasparksession:org.apache.hadoop.hive.ql.metadata.HiveException:FailedtocreateSparkclientforSparksessio
数据中台（二）数据中台相关技术栈 Yuan_CSDF #数据中台
1.平台搭建1.1.Amabari+HDP1.2.CM+CDH2.相关的技术栈数据存储：HDFS，HBase，Kudu等数据计算：MapReduce,Spark,Flink交互式查询：Impala,Presto在线实时分析：ClickHouse，Kylin，Doris，Druid，Kudu等资源调度：YARN，Mesos，Kubernetes任务调度：Oozie，Azakaban，AirFlow，
一文搞懂大数据神器Spark，真的太牛了！ qq_23519469 大数据 spark 分布式
Spark是什么在如今这个大数据时代，数据量呈爆炸式增长，传统的数据处理方式已经难以满足需求。就拿电商平台来说，每天产生的交易数据、用户浏览数据、评论数据等，数量巨大且种类繁多。假如要对这些数据进行分析，比如分析用户的购买行为，找出最受欢迎的商品，预测未来的销售趋势等，用普通的单机处理方式，可能需要花费很长时间，甚至根本无法完成。这时，Spark就应运而生了。Spark是一个开源的、基于内存计算的
Hadoop相关面试题努力的搬砖人. java 面试 hadoop
以下是150道Hadoop面试题及其详细回答，涵盖了Hadoop的基础知识、HDFS、MapReduce、YARN、HBase、Hive、Sqoop、Flume、ZooKeeper等多个方面，每道题目都尽量详细且简单易懂：Hadoop基础概念类1.什么是Hadoop？Hadoop是一个由Apache基金会开发的开源分布式计算框架，主要用于处理和存储大规模数据集。它提供了高容错性和高扩展性的分布式存
Flink读取kafka数据并写入HDFS 王知无(import_bigdata) Flink系统性学习专栏 hdfs kafka flink
硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之Hadoop/HDFS/Yarn篇2021年从零到大数据专家面试篇之SparkSQL篇2021年从零到大数据专家面试篇之消息队列篇2021年从零到大数据专家面试篇之Spark篇2021年从零到大数据专家面试篇之Hbase篇
Apache storm 赵世炎 storm hadoop
Apachestorm是一个分布式的实时大数据处理系统。用于在容错和水平可拓展方法中处理大量数据。它是一个流数据框架，具有很高的摄取率，无状态。通过zk管理分布式环境和集群状态，并行地对实时数据执行各种操作。storm易于设置和操作，并且它保证每个消息将通过拓扑至少处理一次。基本上Hadoop和Storm框架用于分析大数据。两者互补，在某些方面有所不同。ApacheStorm执行除持久性之外的所有
什么是Apache Avro？ maozexijr apache
什么是ApacheAvro？ApacheAvro是一个开源的数据序列化框架，主要用于高效的数据交换和存储。它由ApacheHadoop项目开发，广泛应用于大数据生态系统中（如Hadoop、Kafka等）。Avro提供了一种紧凑、快速的二进制数据格式，同时支持丰富的数据结构和模式演化。核心特性跨语言支持Avro支持多种编程语言（如Java、Python、C++、Go等），使得不同语言之间的数据交换变
计算机毕业设计之基于Hadoop的热点新闻分析系统的设计与实现微信bishe69 课程设计 python django mysql
近些年来，随着科技的飞速发展，互联网的普及逐渐延伸到各行各业中，给人们生活带来了十分的便利，热点新闻分析系统利用计算机网络实现信息化管理，使整个热点新闻分析的发展和服务水平有显著提升。本文拟采用PyCharm开发工具，django框架、Python语言、Hadoop大数据处理技术进行开发，后台使用MySQL数据库进行信息管理，设计开发的热点新闻分析系统。通过调研和分析，系统拥有管理员和用户两个模块
Hadoop 实战笔记（二）-- HDFS 常用 shell 命令总结 dazhong2012 Hadoop hdfs hadoop
一、HDFS命令显示当前目录结构#显示当前目录结构hadoopfs-ls#递归显示当前目录结构hadoopfs-ls-R#显示根目录下内容hadoopfs-ls/创建目录#创建目录hadoopfs-mkdir#递归创建目录hadoopfs-mkdir-p删除操作#删除文件hadoopfs-rm#递归删除目录和文件hadoopfs-rm-R从本地加载文件到HDFS#二选一执行即可hadoopfs-p
元戎启行最新战略RoadAGI：所有移动智能体都将被AI驱动量子位
2025年3月18日（北京时间），元戎启行作为国内人工智能企业代表，出席由NVIDIA主办的GTC大会。会上，公司CEO周光发表了技术主题演讲，展示了公司的最新战略布局RoadAGI，并发布道路通用人工智能平台——AISpark（以下简称”Spark平台”）。RoadAGI是元戎启行实现物理世界通用人工智能的关键一步，旨在让包括智能驾驶汽车在内的移动智能体，都具有在道路上自主行驶、与物理世界深度交
SparkSQL编程-RDD、DataFrame、DataSet 早拾碗吧 Spark spark hadoop 大数据 sparksql
三者之间的关系在SparkSQL中Spark为我们提供了两个新的抽象，分别是DataFrame和DataSet。他们和RDD有什么区别呢？首先从版本的产生上来看：RDD(Spark1.0)—>Dataframe(Spark1.3)—>Dataset(Spark1.6)如果同样的数据都给到这三个数据结构，他们分别计算之后，都会给出相同的结果。不同是的他们的执行效率和执行方式。在后期的Spark版本中
How Spark Read Sftp Files from Hadoop SFTP FileSystem IT•轩辕 Cloudy Computation spark hadoop 大数据
GradleDependenciesimplementation('org.apache.spark:spark-sql_2.13:3.5.3'){excludegroup:"org.apache.logging.log4j",module:"log4j-slf4j2-impl"}implementation('org.apache.hadoop:hadoop-common:3.3.4'){exc
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&