jan0215

三台机器集群搭建

下载的地址：

http://archive.cloudera.com/cdh5/cdh/5/oozie-4.1.0-cdh5.14.2.tar.gz http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.14.2.tar.gz http://archive.cloudera.com/cdh5/cdh/5/hue-3.9.0-cdh5.14.2.tar.gz http://archive.cloudera.com/cdh5/cdh/5/zookeeper-3.4.5-cdh5.14.2.tar.gz http://archive.cloudera.com/cdh5/cdh/5/spark-1.6.0-cdh5.14.2.tar.gz http://archive.cloudera.com/cdh5/cdh/5/hbase-1.2.0-cdh5.14.2.tar.gz http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.14.2.tar.gz http://archive.cloudera.com/cdh5/cdh/5/flume-ng-1.6.0-cdh5.14.2.tar.gz

配置：

一：初始化环境部署处理
============================
注：安装过程都使用root用户

CDH 安装在/opt。
============================
1.1 环境准备：
   Centos7.3x64 所有主机名配置配置好所有机器的无密钥登陆

1.2 主机名配置
   主机名 IP
   master 192.168.9.80
   slave1 192.168.9.20
   slave2 192.168.9.220

   配置/etc/hostname
   分别是master和slave1和slave2

   3台都配置/etc/hosts

   加入:
   192.168.9.80 master
   192.168.9.20 slave1
   192.168.9.220 slave2

1.3 关闭防火墙
       systemctl stop firewalld.service
       systemctl disable firewalld.service
       firewall-cmd

       关闭iptables：
       iptables -F
       systemctl stop iptables.service
       service iptables save
       systemctl disable iptables.service

       禁用 selinux ：
       vi /etc/selinux/config
       将selinux=enforcing改成selinux=disabled

1.4 配置SSH免密登录
   1.每台服务器下都输入命令 ssh-keygen -t rsa，生成 key，一律不输入密码，直接回车，/root 就会生成 .ssh 文件夹。
       注意（.ssh文件默认隐藏,使用ls -al 即可查看）

   2.在 192.168.9.80 服务器下，合并公钥到 authorized_keys 文件，进入 /root/.ssh 目录，通过 SSH 命令合并.
       cat id_rsa.pub>> authorized_keys
   ssh [email protected] cat ~/.ssh/id_rsa.pub>> authorized_keys
   ssh [email protected] cat ~/.ssh/id_rsa.pub>> authorized_keys
   3.把 192.168.9.80 服务器的 authorized_keys、known_hosts 复制到 192.168.9.20、192.168.9.220 服务器的 /root/.ssh 目录
       scp authorized_keys [email protected]:/root/.ssh/
       scp authorized_keys [email protected]:/root/.ssh/
       scp known_hosts [email protected]:/root/.ssh/
       scp known_hosts [email protected]:/root/.ssh/

       到192.168.9.20下
       scp ~/.ssh/authorized_keys slave2:~/.ssh/
       到192.168.85.220下
       scp ~/.ssh/authorized_keys master:~/.ssh/
       scp ~/.ssh/authorized_keys slave1:~/.ssh/

1.5 所有机器配置JDK1.8
   rpm -qa | grep java 如果有的话请先卸载
   卸载命令：rpm –e --nodeps(忽略依赖) 安装包名
   下载jdk-8u171-linux-x64.tar.gz
       上传到目录/software

       解压:tar xzvf jdk-8u171-linux-x64.tar.gz -C /opt/
       配置环境变量
           vim /etc/profile

           export JAVA_HOME=/opt/jdk1.8.0_171
           export PATH=$JAVA_HOME/bin:$PATH
           export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
       使环境变量生效
           source /etc/profile

1.5 所有机器配置外部YUM源
   备份/etc/yum.repos.d/CentOS-Base.repo
       cp /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup

   将yum配置文件放入到yum.repos.d文件夹下
       cp CentOS7-Base-163.repo /etc/yum.repos.d/
   进入yum源配置文件所在文件夹
       cd /etc/yum.repos.d
   运行yum makecache生成缓存
       yum makecache
   更新系统(时间比较久,主要看个人网速)
       yum -y update

   安装ntp服务
       yum install ntp

1.7 配置ntp服务器（master）
   https://blog.csdn.net/worldchinalee/article/details/82109932
   1.安装ntp
       yum -y install ntp
   2.在master查看是否启动ntp服务：
       service ntpd status
   3.同步时间
       ntpdate pool.ntp.org
   4.修改本地机器作为ntp服务器
       cd /etc/
       mv ntp.conf ntp.conf.bak
       vim ntp.conf
       # 修改后的内容如下：
       # 系统时间与BIOS时间的偏差记录
       driftfile /var/lib/ntp/drift
       # restrict控制权限
       # 对于默认的client拒绝所有的操作
       restrict default kod nomodify notrap nopeer noquery
       # 针对ipv6的默认client操作
       restrict -6 default kod nomodify notrap nopeer noquery
       # 允许本机访问
       restrict 127.0.0.1
       restrict -6 ::1
       # 允许网段10.75.299访问
       restrict 10.75.229.0 mask 255.255.255.0 nomodify notrap
       # 本机作为ntp源
       server 127.127.1.0
       fudge 127.127.1.0 stratum 10
   4.同步硬件时钟
       vim /etc/sysconfig/ntpd
       SYNC_HWCLOCK=yes
   5.确认服务器状态
       # pgrep ntpd
       # netstat -tlunp|grep ntp
       # ntpstat
       # ntpq -p
   6.配置客户端
       先在客户端安装ntp服务:
       yum install ntp ntpdate -y

       ntpdate 192.168.9.80

       每天晚上1点同步时间
       crontab -e 00 01 * * * root /usr/sbin/ntpdate 192.168.9.80; /sbin/hwclock -w
1.8安装mysql(5.6.41)
1、先检查系统是否装有mysql
       rpm -qa | grep mysql如果有的话请先卸载(yum remove mysql)

       rpm -e --nodeps

       这里返回空值，说明没有安装
   2、下载mysql的repo源
       wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm
       补充：如果这里wget命令不能用则用yum安装wget
       yum install wget

   3.安装mysql-community-release-el7-5.noarch.rpm包
       sudo rpm -ivh mysql-community-release-el7-5.noarch.rpm

   4.安装mysql
       sudo yum install mysql-server

       根据步骤安装就可以了，不过安装完成后，没有密码，需要重置密码。

       安装后再次查看mysql
   5.安装完毕后启用mysql服务
       # systemctl start mysqld
       # systemctl status mysqld

       接下来登录重置密码：
       mysql -u root -p
       mysql > use mysql;
       mysql > update user set password=password('123456') where user='root';
       mysql > exit;
       重启mysql服务后才生效 # systemctl restart mysqld

       必要时加入以下命令行，为root添加远程连接的能力。链接密码为 “root”（不包括双引号）

mysql> grant all privileges on *.* to 'root'@'%' identified by '123456' with grant option;

查询数据库编码格式，确保是 UTF-8

           show variables like "%char%";
           set names utf8;

   6.配置mysql

       6.1 mysql安装在主节点上，使用mysql命令登录

6.2 新建一个scm用户，并赋予所有权限，密码是scm

           mysql> grant all on *.* to 'scm'@'localhost' identified by 'temp' with grant option;

           Query OK, 0 rows affected, 1 warning (0.00 sec)
7.查看安装的mysql版本:mysql -V

   8.重启mysql命令：systemctl restart mysqld

   9. 开机启动
systemctl enable mysqld.service
==========================================================================================================
二： CDH5.14.2 安装与配置
1、配置HADOOP
   新建用户hadoop，从root用户获取/opt文件夹的权限，所有节点都要执行
   useradd -m hadoop -s /bin/bash
   passwd hadoop
   chown -R hadoop /opt/
   chown -R hadoop /software

   解压Hadoop
   tar -zxvf /software/hadoop-2.6.0-cdh5.14.2.tar.gz -C /opt/

   配置环境
   vim /etc/profile

   添加：
   export HADOOP_HOME=/opt/hadoop-2.6.0-cdh5.14.2
   export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

   环境变量生效：
   source /etc/profile
   echo $HADOOP_HOME

2.修改配置文件
   2.1 core-site.xml


                   fs.defaultFS
                   hdfs://cluster1


                   hadoop.tmp.dir
                   /home/hadoop/app/tmp


                   ha.zookeeper.quorum
                   master:2181,slave1:2181,slave2:2181



   2.2 hdfs-site.xml


                   dfs.replication
                   3


dfs.permissions
false


                   dfs.permissions.enabled
                   false


dfs.nameservices
cluster1


               dfs.ha.namenodes.cluster1
               master,slave1


               dfs.namenode.rpc-address.cluster1.master
               master:9000


               dfs.namenode.http-address.cluster1.master
               master:50070


               dfs.namenode.rpc-address.cluster1.slave1
               slave1:9000


               dfs.namenode.http-address.cluster1.slave1
               slave1:50070


               dfs.ha.automatic-failover.enabled
               true


               dfs.namenode.shared.edits.dir
               qjournal://master:8485;slave1:8485;slave2:8485/cluster1


               dfs.client.failover.proxy.provider.cluster1
               org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider


               dfs.journalnode.edits.dir
               /home/hadoop/data/journaldata/jn


               dfs.ha.fencing.methods
               shell(/bin/true)


               dfs.ha.fencing.ssh.private-key-files
               /root/.ssh/id_rsa


               dfs.ha.fencing.ssh.connect-timeout
               10000



   2.3 mapred-site.xml（正常情况下没有这个文件，可由 mapred-queues.xml.template 复制而来）


                   mapreduce.framework.name
                   yarn

   2.4 yarn-site.xml


               yarn.resourcemanager.connect.retry-interval.ms
               2000



               yarn.resourcemanager.ha.enabled
               true



               yarn.resourcemanager.ha.automatic-failover.enabled
               true



               yarn.resourcemanager.ha.automatic-failover.embedded
               true



               yarn.resourcemanager.cluster-id
               yarn-rm-cluster



               yarn.resourcemanager.ha.rm-ids
               rm1,rm2



               yarn.resourcemanager.hostname.rm1
               master



               yarn.resourcemanager.hostname.rm2
               slave1



               yarn.resourcemanager.recovery.enabled
               true



               yarn.resourcemanager.zk.state-store.address
               master:2181,slave1:2181,slave2:2181



               yarn.resourcemanager.zk-address
               master:2181,slave1:2181,slave2:2181



               yarn.resourcemanager.address.rm1
               master:8032



               yarn.resourcemanager.scheduler.address.rm1
               master:8034



               yarn.resourcemanager.webapp.address.rm1
               master:8088



               yarn.resourcemanager.address.rm2
               slave1:8032



               yarn.resourcemanager.scheduler.address.rm2
               slave1:8034



               yarn.resourcemanager.webapp.address.rm2
               slave1:8088



               yarn.nodemanager.aux-services
               mapreduce_shuffle


               yarn.nodemanager.aux-services.mapreduce_shuffle.class
               org.apache.hadoop.mapred.ShuffleHandler



   2.5 slaves
       slave2
   2.6 hadoop-env.sh
export JAVA_HOME=/opt/jdk1.8.0_171
3.复制配置文件到其他节点

   scp -r core-site.xml slave1:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/
   scp -r core-site.xml slave2:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/

   scp -r hdfs-site.xml slave1:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/
   scp -r hdfs-site.xml slave2:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/

   scp -r mapred-site.xml slave1:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/
   scp -r mapred-site.xml slave2:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/

   scp -r yarn-site.xml slave1:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/
   scp -r yarn-site.xml slave2:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/

   scp -r slaves slave1:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/
   scp -r slaves slave2:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/

   scp -r hadoop-env.sh slave1:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/
   scp -r hadoop-env.sh slave2:/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop/


4.安装启动zookeeper
   4.1 解压到指定的目录：/opt
       tar -zxvf /software/zookeeper-3.4.5-cdh5.14.2.tar.gz -C /opt

   4.2 进入zookkeeper目录，创建存放数据的目录
   [hadoop@hadoop ~]$ sudo mkdir /opt/zookeeper-3.4.5-cdh5.14.2/zkData

   4.3 在conf目录里
   [hadoop@hadoop ~]$ cp -a /opt/zookeeper-3.4.5-cdh5.14.2/conf/zoo_sample.cfg /opt/zookeeper-3.4.5-cdh5.14.2/conf/zoo.cfg
   然后修改：dataDir=/opt/zookeeper-3.4.5-cdh5.14.2/zkData
   创建日志存放目录：
   [hadoop@hadoop ~]$ sudo mkdir /opt/zookeeper-3.4.5-cdh5.14.2/logs
   [hadoop@hadoop ~]$ vi /opt/zookeeper-3.4.5-cdh5.14.2/libexec/zkEnv.sh
   找到如下位置修改语句：ZOO_LOG_DIR="$ZOOKEEPER_HOME/logs"

   4.4 配置环境变量
       [hadoop@hadoop ~]$ vim /etc/profile
       添加如下两行：
       export ZOOKEEPER_HOME=/opt/zookeeper-3.4.5-cdh5.14.2
       export PATH=$PATH:$HADOOP_HOME:$ZOOKEEPER_HOME/bin
       环境变量生效：
       [hadoop@hadoop ~]$ source /etc/profile

   4.5 复制zookeeper到其他节点
       scp -r /opt/zookeeper-3.4.5-cdh5.14.2/ slave1:/opt/
       scp -r /opt/zookeeper-3.4.5-cdh5.14.2/ slave2:/opt/

   4.6 启动zookeeper
       ./zkServer.sh start

       查看状态：
       ./zkServer.sh status
5.启动hadoop
   5.1 启动所有节点上面的journalnode进程
       sbin/hadoop-daemon.sh start journalnode

   5.2 执行格式化并启动Namenode
       bin/hdfs namenode -format //namenode 格式化

       bin/hdfs zkfc -formatZK //格式化高可用

       bin/hdfs namenode //启动namenode
       注意：执行完上述命令后，程序就会在等待状态，只有执行完下一步时，利用按下ctrl+c来结束namenode进程。

   5.3 此同时，需要在备节点（比如，slave1）上执行数据同步
       bin/hdfs namenode -bootstrapStandby

   5.4 然后关闭所有节点上面的journalnode进程
       sbin/hadoop-daemon.sh stop journalnode

   5.5 一键启动hdfs所有相关进程,只需在master节点执行：
       sbin/start-dfs.sh
       [root@master sbin]# jps
       12928 Jps
       12849 DFSZKFailoverController
       12452 NameNode
       11773 QuorumPeerMain
       12671 JournalNode

   5.6 验证是否启动成功
       通过web界面查看namenode启动情况。
       http://master:50070

       注意：在浏览器输入以上网址时，需要先在本机的hosts目录下添加如下映射：
       192.168.9.80 master
       192.168.9.20 slave1
       192.168.9.220 slave2

       启动成功之后，查看关闭其中一个namenode ，然后在启动namenode 观察切换的状况
       使用命令 kill -9 12452

   5.7 启动YARN
       1、在master节点上执行。
       sbin/start-yarn.sh
       2、在slave1节点上面执行。
       sbin/yarn-daemon.sh start resourcemanager

6.关闭顺序
       在slave1节点上面执行：
           sbin/yarn-daemon.sh stop resourcemanager
       在master节点上执行：
           sbin/stop-yarn.sh

           sbin/stop-dfs.sh

   再次启动时要先启动zookeeper
======================================================================================================
三、HBase安装

1、将软件包上传到Linux系统指定目录下： /software

2、解压到指定的目录：/opt
[hadoop@hadoop ~]$ sudo tar -zxvf /software/hbase-1.2.0-cdh5.14.2.tar.gz -C /opt

3、配置环境变量
   [hadoop@hadoop ~]$ vim /etc/profile
   添加如下两行：
   export HBASE_HOME=/opt/hbase-1.2.0-cdh5.14.2
   export PATH=$PATH:$HBASE_HOME/bin
   环境变量生效：
   [hadoop@hadoop ~]$ source /etc/profile

4、编辑hbase-env.sh文件

[hadoop@hadoop ~]$ cd /opt/hbase-1.2.0-cdh5.7.1/conf/

[hadoop@hadoop ~]$ vi hbase-env.sh

export JAVA_HOME=/opt/jdk1.8.0_171

   export HBASE_CLASSPATH=/opt/hadoop-2.6.0-cdh5.14.2/etc/hadoop

   export HBASE_MANAGES_ZK=false

5、编辑hbase-site.xml 文件

   [hadoop@hadoop ~]$ cd /opt/hbase-1.2.0-cdh5.14.2/conf/
   [hadoop@hadoop ~]$ vi hbase-site.xml


       hbase.rootdir
       hdfs://master:9000/hbase


       hbase.tmp.dir
       /opt/hbase-1.2.0-cdh5.14.2/data/tmp


       hbase.cluster.distributed
       true


       dfs.replication
       1


hbase.zookeeper.property.clientPort
2181


       hbase.zookeeper.quorum
       master,slave1,slave2



   修改regionservers文件，指定从节点机器
slave1
   slave2

   复制到从节点：
   scp -r /opt/hbase-1.2.0-cdh5.14.2/ slave1:/opt/
   scp -r /opt/hbase-1.2.0-cdh5.14.2/ slave2:/opt/

6、启动
   （注意不要再standby的namenode上启动）
   bin/hbase-daemon.sh start master
   bin/hbase-daemon.sh start regionserver
   或者直接
   bin/start-hbase.sh
   [hadoop@hadoop bin]$ sh start-hbase.sh

7、验证
   [root@master bin]# jps
   6565 Jps
   5990 HMaster
   5191 DFSZKFailoverController
   4776 NameNode
   5001 JournalNode
   25565 QuorumPeerMain
   5311 ResourceManager

   [root@slave1 opt]# jps
   19904 Jps
   19009 NameNode
   19667 HRegionServer
   19194 DFSZKFailoverController
   19083 JournalNode
   14383 QuorumPeerMain

8、进入shell
   [hadoop@hadoop ~]$ cd /opt/hbase-1.2.0-cdh5.14.2/bin
   [hadoop@hadoop bin]$ hbase shell
9、进入hbase web
   http://master:60010/master-status
=================================================================================================================
四、Hive安装(注:Hive只需在一个节点上安装)

1、将软件包上传到Linux系统指定目录下： /software

2、解压到指定的目录：/opt
[hadoop@hadoop ~]$ sudo tar -zxvf /software/hive-1.1.0-cdh5.14.2.tar.gz -C /opt

3、配置环境变量
   [hadoop@hadoop ~]$ vi /etc/profile
   添加如下两行：
   export HIVE_HOME=/opt/hive-1.1.0-cdh5.14.2
   export PATH=$PATH:$HIVE_HOME/bin
   环境变量生效：
   [hadoop@hadoop ~]$ source /etc/profile


4、编辑hive-site.xml 文件

   [hadoop@hadoop ~]$ cd /opt/hive-1.1.0-cdh5.14.2/conf/
   [hadoop@hadoop ~]$ vi hive-site.xml


           hive.metastore.warehouse.dir
           /home/hadoop/hive/warehouse

       #mysql 数据配置

           javax.jdo.option.ConnectionURL
           jdbc:mysql://master:3306/hive?createDatabaseIfNotExist=true


       javax.jdo.option.ConnectionDriverName
       com.mysql.jdbc.Driver


       javax.jdo.option.ConnectionUserName
       hive


       javax.jdo.option.ConnectionPassword
       hive

       #配置 Hive 临时文件存储地址

       hive.exec.scratchdir
       /home/hadoop/hive/data/hive-${user.name}
       Scratch space for Hive jobs

       hive.exec.local.scratchdir
       /home/hadoop/hive/data/${user.name}
       Local scratch space for Hive jobs



5.上传mysql JDBC的jar到hive的lib下,并修改权限
   mysql-connector-java-5.1.44-bin.jar

6.修改hive-env.xml
   修改如下内容:
   # Set HADOOP_HOME to point to a specific hadoop install directory
   HADOOP_HOME=/opt/hadoop-2.6.0-cdh5.14.2

# Hive Configuration Directory can be controlled by:
export HIVE_CONF_DIR=/opt/hive-1.1.0-cdh5.14.2/conf

   # Folder containing extra ibraries required for hive compilation/execution can be controlled by:
   export HIVE_AUX_JARS_PATH=/opt/hive-1.1.0-cdh5.14.2/lib

7.重命名hive-log4j.properties (去掉.template)
   $ mkdir logs
   修改hive-log4j.properties
   hive.log.dir=/opt/hive-1.1.0-cdh5.14.2/logs

   /**
       注意：启动hive之前要先启动mysql

为hive创建一个mysql用户,并且赋予权限
mysql> create user 'hive'@'%' identified by 'hive';

mysql> grant all on *.* to 'hive'@'master' identified by 'hive';
GRANT ALL PRIVILEGES ON *.* TO 'hive'@'localhost' IDENTIFIED BY 'hive' WITH GRANT OPTION;

mysql> set password for 'hive'@'master'=password('hive');

       mysql> flush privileges;

       查看所有用户：
       select user,host from mysql.user;
       删除用户：
       DROP USER 'hive'@'%'

   */

8.执行初始化Hive操作
   schematool -dbType mysql -initSchema ## MySQL作为元数据库

9、启动
在第一个窗口中输入：hive --service metastore &
[hadoop@hadoop ~]$ cd /opt/hive-1.1.0-cdh5.14.2/bin

10、验证
   $ bin/hive
hive> show databases;
OK
   default
   Time taken: 8.651 seconds, Fetched: 1 row(s)

11、置mysql开机启动

// 检查是否已经是开机启动
systemctl list-unit-files | grep mysqld

   // 开机启动
   systemctl enable mysqld.service
=====================================================================
五、flume 安装
   说明：
   Flume OG:Flume original generation 即Flume 0.9.x版本
   Flume NG:Flume next generation ，即Flume 1.x版本。

1.下载flume的cdh 版本：flume-ng-1.6.0-cdh5.14.2.tar.gz

   tar -zxvf flume-ng-1.6.0-cdh5.14.2.tar.gz -C /opt

2.修改配置文件

   flume-env.sh 增加java 的环境
   export JAVA_HOME=/opt/jdk1.8.0_171

3、配置环境变量
   [hadoop@hadoop ~]$ vim /etc/profile
   添加如下两行：
   export FLUME_HOME=/opt/apache-flume-1.6.0-cdh5.14.2-bin
   export FLUME_CONF_DIR=$FLUME_HOME/conf
   export PATH=$PATH:$FLUME_HOME/bin
   环境变量生效：
   [hadoop@hadoop ~]$ source /etc/profile

4.配置文件
   cp flume-conf.properties.template flume-conf.properties
   -------------------------------------------------------
   在打印台打印：
   agent.sources = source1
   agent.channels = channel1
   agent.sinks = sink1

   # For each one of the sources, the type is defined
   agent.sources.source1.type = netcat
   agent.sources.source1.bind = localhost
   agent.sources.source1.port = 44444

# The channel can be defined as follows.
agent.sources.source1.channels = channel1

# Each sink's type must be defined
agent.sinks.sink1.type = logger

#Specify the channel the sink should use
agent.sinks.sink1.channel = channel1

   # Each channel's type is defined.
   agent.channels.channel1.type = memory
   agent.channels.channel1.transactionCapacity = 100
   # Other config values specific to each type of channel(sink or source)
   # can be defined as well
   # In this case, it specifies the capacity of the memory channel
   agent.channels.channel1.capacity = 1000

   -------------------------------------------------------
   直接写入到hdfs:
   # the channels and the sinks.
   # Sources, channels and sinks are defined per agent,
   # in this case called 'agent'
   agent1.sources = source1 //定义source名此片为source1
   agent1.channels = channel1 //定义channel名此片为channel1
   agent1.sinks = sink1 //定义sink名此片为sink1


   # For each one of the sources, the type is defined
   agent1.sources.source1.type = exec //source的类型，exec
   agent1.sources.source1.shell = /bin/bash -c
   agent1.sources.source1.command = tail -n +0 -F /usr/local/nginx/logs/access.log //要采集的日志文及命令
   agent1.sources.source1.channels = channel1
   agent1.sources.source1.threads = 5;

   # The channel can be defined as follows.
   agent1.channels.channel1.type = memory
   agent1.channels.channel1.capacity = 100
   agent1.channels.channel1.transactionCapacity = 100
   agent1.channels.channel1.keep-alive = 30

   # Each sink's type must be defined
   df

   agent1.sinks.sink1.type = hdfs //sink的类型：hdfs

   #Specify the channel the sink should use
   agent1.sinks.sink1.channel = channel1
   agent1.sinks.sink1.hdfs.path = hdfs://192.168.89.29:9000/flume //hdfs的api地址
   agent1.sinks.sink1.hdfs.writeFormat = Text
   agent1.sinks.sink1.hdfs.fileType = DataStream
   agent1.sinks.sink1.hdfs.rollInterval = 0
   agent1.sinks.sink1.hdfs.rollSize = 100
   agent1.sinks.sink1.hdfs.rollCount = 0
   agent1.sinks.sink1.hdfs.batchSize = 100
   agent1.sinks.sink1.hdfs.txnEventMax = 100
   agent1.sinks.sink1.hdfs.callTimeout = 60000
   ----------------------------------------------------------------------
   直接写入到kafka:
   flume2kafka by log4j:

   a1.sources = r1
   a1.channels = c1
   a1.sinks = k1

   a1.sources.r1.type = avro
   a1.sources.r1.bind = master
   a1.sources.r1.port = 44444

   a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
   a1.sinks.k1.kafka.topic = FlumeLog4jTopic1
   a1.sinks.k1.kafka.bootstrap.servers = master:9092
   a1.sinks.k1.kafka.batchSize=10

   a1.channels.c1.type=memory
   a1.sources.r1.channels=c1
   a1.sinks.k1.channel = c1
   flume-ng agent --conf conf --conf-file /opt/apache-flume-1.6.0-cdh5.14.2-bin/conf/flume2kafkabylog4j.properties --name a1 -Dflume.root.logger=INFO,console


   Flume2KafkaAgent.sources=mysource
   Flume2KafkaAgent.channels=mychannel
   Flume2KafkaAgent.sinks=mysink

   Flume2KafkaAgent.sources.mysource.type=spooldir
   Flume2KafkaAgent.sources.mysource.channels=mychannel
   Flume2KafkaAgent.sources.mysource.spoolDir=/tmp/logs

   Flume2KafkaAgent.sinks.mysink.channel=mychannel
   Flume2KafkaAgent.sinks.mysink.type=org.apache.flume.sink.kafka.KafkaSink
   Flume2KafkaAgent.sinks.mysink.kafka.bootstrap.servers=master:9092,slave1:9093,slave2:9094
   Flume2KafkaAgent.sinks.mysink.kafka.topic=FlumeKafkaSinkTopic1
   Flume2KafkaAgent.sinks.mysink.kafka.batchSize=20
   Flume2KafkaAgent.sinks.mysink.kafka.producer.requiredAcks=1

   Flume2KafkaAgent.channels.mychannel.type=memory
   Flume2KafkaAgent.channels.mychannel.capacity=30000
   Flume2KafkaAgent.channels.mychannel.transactionCapacity=100

   flume-ng agent --conf conf --conf-file /opt/apache-flume-1.6.0-cdh5.14.2-bin/conf/kafkasink.properties --name Flume2KafkaAgent -Dflume.root.logger=INFO,console
   ----------------------------------------------------------------------
   写入到HDFS:
   agent1.sources=source1
   agent1.sinks=sink1
   agent1.channels=channel1

   #配置source1
   agent1.sources.source1.type=spooldir
   agent1.sources.source1.spoolDir=/root/data/
   agent1.sources.source1.channels=channel1
   agent1.sources.source1.fileHeader = false

   #配置sink1
   agent1.sinks.sink1.type=hdfs
   agent1.sinks.sink1.hdfs.path=hdfs://master:9000/data
   #生成的文件类型，默认是Sequencefile，可用DataStream，则为普通文本
   agent1.sinks.sink1.hdfs.fileType=DataStream
   agent1.sinks.sink1.hdfs.writeFormat=TEXT
   agent1.sinks.sink1.hdfs.rollSize=0
   #不根据event个数产生新文件
   agent1.sinks.sink1.hdfs.rollCount = 0
   agent1.sinks.sink1.hdfs.rollInterval=0
   agent1.sinks.sink1.hdfs.minBlockReplicas=1
   agent1.sinks.sink1.hdfs.threadsPoolSize = 30
   agent1.sinks.sink1.channel=channel1

   #配置channel1
   agent1.channels.channel1.type=file
   agent1.channels.channel1.checkpointDir=/root/data/point
   agent1.channels.channel1.dataDirs = /root/data/tmp

   flume-ng agent --conf conf --conf-file /opt/apache-flume-1.6.0-cdh5.14.2-bin/conf/flume-hdfs.properties --name agent1 -Dflume.root.logger=INFO,console

5.启动agent
   ./bin/flume-ng agent --conf conf --conf-file /opt/apache-flume-1.6.0-cdh5.14.2-bin/conf/flume-conf.properties --name a1 -Dflume.root.logger=INFO,console

   如果执行flume-ng 的时候执行报错：Caused by: java.lang.ClassNotFoundException: org.apache.flume.tools.GetJavaProperty

错误: 找不到或无法加载主类 org.apache.flume.tools.GetJavaProperty或者Error: Could not find or load main class org.apache.flume.tools.GetJavaProperty

一般来说是由于装了HBASE等工具的原因

   将hbase的hbase.env.sh的一行配置注释掉
   # Extra Java CLASSPATH elements. Optional.
   #export HBASE_CLASSPATH=/home/hadoop/hbase/conf
   2、或者将HBASE_CLASSPATH改为JAVA_CLASSPATH,配置如下
   # Extra Java CLASSPATH elements. Optional.
   export JAVA_CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

6.telnet 登陆处理：
   重新复制一个窗口：
   telnet localhost 44444
   telnet安装：
   安装方式：yum
   [root@master ~]# yum list |grep telnet
   telnet-server.x86_64 1:0.17-59.el7 @base
   telnet.x86_64 1:0.17-59.el7 base
   [root@localhost /]# yum install telnet-server.x86_64

[root@localhost /]]# yum install telnet.x86_64

   [root@localhost /]# yum list |grep xinetd
   xinetd.x86_64 2:2.3.15-12.el7 @base
   [root@localhost /]# yum install xinetd.x86_64

   安装完成后，将xinetd服务加入开机自启动:
       systemctl enable xinetd.service
   将telnet服务加入开机自启动：
       systemctl enable telnet.socket
   最后，启动以上两个服务即可：
       systemctl start telnet.socket
       systemctl start xinetd（或service xinetd start）

补充：source和channel之间的关系是多对多的关系
channel和sink之间的关系是一对多的关系
==============================================================================
六、kafka安装部署多个节点
1.下载Kafka并解压
   tar -zxvf kafka_2.11-2.0.0.tgz -C /opt //其对应的 Scala 版本为 2.11：
2.配置环境变量
   vim /etc/profile
   export KAFKA_HOME=/opt/kafka_2.11-2.0.0/
   export PATH=$PATH:$KAFKA_HOME/bin
   环境变量生效：
   [hadoop@hadoop ~]$ source /etc/profile
2.配置文件修改
   vi server.properties

   broker.id=1,其他两个为2,3
   delete.topic.enable=true
   listeners=PLAINTEXT://:9092 其他两个为9093,9094
   zookeeper.connect=192.168.9.80:2181,192.168.9.20:2181,192.168.9.220:2181

3.复制到其他节点
   scp -r /opt/kafka_2.11-2.0.0 slave1:/opt/
   scp -r /opt/kafka_2.11-2.0.0 slave2:/opt/
   [记得修改broker.id]

4.启动Kafka
   进入kafka bin目录，敲入命令 ./kafka-server-start.sh -daemon ../config/server.properties

   停止kafka
   bin/kafka-server-stop.sh
5.检查测试

登录zookeeper（切换到zk的bin目录下），先连接zk：

[root@master bin]# ./zkCli.sh -server 192.168.9.80:2181

[zk: 192.168.9.80:2181(CONNECTED) 3] ls /brokers/ids
[1, 2, 3]
6.创建Topic

   ./bin/kafka-topics.sh --create --zookeeper 192.168.9.80:2181,192.168.9.20:2181,192.168.9.220:2181 --replication-factor 2 --partitions 2 --topic FlumeKafkaSinkTopic1
   查看topic
   ./bin/kafka-topics.sh --zookeeper 192.168.9.80:2181,192.168.9.20:2181,192.168.9.220:2181 --list
   信息查看
   [root@master bin]#./kafka-topics.sh --zookeeper 192.168.9.80:2181,192.168.9.20:2181,192.168.9.220:2181 --describe --topic FlumeKafkaSinkTopic1
   Topic:FlumeKafkaSinkTopic1   PartitionCount:2   ReplicationFactor:2   Configs:
   Topic: FlumeKafkaSinkTopic1   Partition: 0   Leader: 1   Replicas: 1,2   Isr: 1,2
   Topic: FlumeKafkaSinkTopic1   Partition: 1   Leader: 2   Replicas: 2,3   Isr: 2,3
7.发送消息

   bin/kafka-console-producer.sh --topic FlumeKafkaSinkTopic1 --broker-list 192.168.9.80:9092,192.168.9.20:9093,192.168.9.220:9094


8.消费消息
   bin/kafka-console-consumer.sh --topic FlumeLog4jTopic1 --bootstrap-server 192.168.9.80:9092 --from-beginning
9.删除topic
   kafka-topics.sh --delete --zookeeper 192.168.9.80:2181 --topic FlumeKafkaSinkTopic1

log4j.logger.org.example.MyClass = INFO,stdout,flume

你可能感兴趣的:(三台机器集群搭建)

高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
uwsgi 安装
1.根据机器python环境版本进行安装pip/pip3installuwsgi安装可能报错[gcc-pthread]plugins/python/python_plugin.oInfileincludedfromplugins/python/python_plugin.c:1:plugins/python/uwsgi_python.h:2:10:fatalerror:Python.h:Nosuc
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
2.4 基于dpdk的用户态协议栈的实现百亿苍狗高性能网络设计专栏开发语言网络
操作系统PosixAPI所提供的网络接口，数据收发是基于用户态与内核态的频繁切换实现。而dpdk实现了绕过内核监管，直接在用户态访问网络硬件，避免频繁状态切换。DPDK安装与配置虚拟机环境配置检查是否支持多队列网卡cat/proc/interrupts|grepens33(获取整个机器的终端)，结果19:4202120IO-APIC19-fasteoiens33，不支持多队列网卡。虚拟机关机，修改
使用 DeepSeek R1 和 Ollama 开发 RAG 系统使用 DeepSeek R1 和 Ollama 构建强大的 RAG 系统。了解开发智能 AI 解决方案的设置过程、最佳实践和技巧。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介DeepSeekR1和Ollama提供了用于构建检索增强生成(RAG)系统的强大工具。本指南介绍了使用这些技术开发RAG应用程序的设置、实施和最佳实践。为什么RAG系统会改变游戏规则检索增强生成(RAG)系统结合了搜索和生成AI的优点，可实现精确且准确的情境感知响应。借助DeepSeekR1和Ollama等工具，创建RAG系统不再令人生畏。无论您是构建聊天机器人、知识助手还是AI驱动的搜索引擎
NVIDIA 系列之使用生成式 AI 增强 ROS2 机器人技术：使用 BLIP 和 Isaac Sim 进行实时图像字幕制作知识大胖 NVIDIA GPU和大语言模型开发教程人工智能机器人
简介在快速发展的机器人领域，集成先进的AI模型可以显著增强机器人系统的功能。在本博客中，我们将探讨如何在ROS2（机器人操作系统2）环境中利用BLIP（引导语言图像预训练）模型进行实时图像字幕制作，并使用NVIDIAIsaacSim进行模拟。我们将介绍如何实现一个ROS2节点，该节点订阅摄像头源、应用BLIP模型进行图像字幕制作，并实时显示结果。这种集成展示了生成式AI在增强人机交互方面的强大功能
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
思维链革命：让大模型突破“机器思考”的边界 John Song AI 人工智能思维链2.0 CoT 多模态思维链元认知优化
以下是对LilianWeng思维链技术深度解析文章（原文链接）的博客化重构，融合技术本质与应用实践：思维链革命：让大模型突破“机器思考”的边界——解析ChainofThought技术体系与下一代推理架构一、从黑箱到透明思考：CoT的核心突破传统LLM困境：“大模型如同天才自闭症患者——知识渊博却无法展示思考路径”CoT解决方案：#标准CoT提示模板prompt="""问题：小明有5个苹果，吃掉2个
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
车身焊接机器人系列编程：Yaskawa MA2010_（11）.机器人维护与保养 zhubeibei168 机器人（二）机器人网络
机器人维护与保养1.机器人维护的必要性在汽车制造行业中，车身焊接机器人（如YaskawaMA2010）的高效运行对于生产线的稳定性和生产质量至关重要。机器人维护不仅能够延长机器人的使用寿命，还能确保其在长时间运行中的性能稳定。维护工作主要包括定期检查、清洁、润滑、更换易损件和故障诊断等。本节将详细介绍这些维护工作的具体步骤和注意事项。2.定期检查定期检查是机器人维护的基础，可以及时发现潜在问题并进
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
AI 时代程序员的出路：高薪神话还能撑多久？ freewind 人工智能
2025年，美国市场一名普通软件工程师的平均总包仍在15–16万美元/年，位居各行业顶薪之列BuiltInCoursera。可就在同时，71%的企业已经把AI写码模型引入生产线，近一半“用得相当激进”LegitSecurity——意味着写代码这件事，正在被机器半自动接管。下一个五年，程序员还能稳坐“金饭碗”吗？1|程序员为什么一直“贵”？原因解释稀缺性计算机教育普及赶不上互联网爆发，10年形成长期
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI产品经理需要了解的算法知识 AI劳模人工智能产品经理 AI产品经理 AI产品经理入门零基础入门产品经理算法语言模型
1、自然语言生成（NLG）自然语言生成（NaturalLanguageGeneration，简称NLG）是一种人工智能技术，它的目标是将计算机的数据、逻辑或算法产生的信息转换成人类可读的自然语言文本。换句话说，NLG能让机器“学会”写文章、报告、故事或者其他任何形式的文字，就像人类作家那样。这项技术使得机器能够理解复杂的数据并将其转化为易于理解的语言，以适应不同的受众和情境。应用实例：金融报告自动
机器视觉在OCR（字符识别）检测中的应用
目前，对印刷品的检测工作一般采用人工方法进行质量检测，然后再由工作人员将成品和次品进行分类堆放。这样一来，不仅增加了工作人员的劳动强度，而且检测质量也难以得到保障。其次，则是效率低下，浪费时间成本。印品质量自动检测系统满足印刷企业对于产品质量控制的需求。系统采用自主研发的表面缺陷检测、色彩测量、快速建模等核心算法，广泛适用于包装印刷、标签印刷、商业印刷质量在线检测和印后终检。机器视觉用于印刷、包装
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
专题：2025供应链数智化与效率提升报告|附100+份报告PDF、原数据表汇总下载拓端研究室 php 开发语言
全文链接：https://tecdat.cn/?p=42926在全球产业链重构与数字技术革命的双重驱动下，供应链正经历从传统经验驱动向数据智能驱动的范式变革。从快消品产能区域化布局到垂类折扣企业的效率竞赛，从人形机器人的成本优化到供应链金融对中小企业的赋能，技术创新与模式重构正在重塑行业价值网络。本报告洞察基于《灼识咨询：2025中国供应链金融科技行业蓝皮书》《中国银河证券：折扣业态供应链效率深度
Octo：伯克利开源机器人开发框架
【摘要】在各种机器人数据集上预先训练的大型策略有可能改变机器人学习：这种通用机器人策略无需从头开始训练新策略，只需使用少量领域内数据即可进行微调，但具有广泛的泛化能力。然而，为了广泛应用于各种机器人学习场景、环境和任务，这些策略需要处理不同的传感器和动作空间，适应各种常用的机器人平台，并轻松高效地微调到新领域。在这项工作中，我们旨在为开发开源、广泛适用的通用机器人操作策略奠定基础。作为第一步，我们
java 监控 native 内存_JVM内存使用情况监控赵阿Q java 监控 native 内存
详解JVM运行时内存使用情况监控java语言,开发者不能直接控制程序运行内存,对象的创建都是由类加载器一步步解析,执行与生成与内存区域中的;并且jvm有自己的垃圾回收器对内存区域管理,回收;但是我们已经可以通过一些工具来在程序运行时查看对应的jvm内存使用情况,帮助更好的分析与优化我们的代码;注:查看系统里java进程信息//查看当前机器上所有运行的java进程名称与pid(进程编号)jps-l/
Golang defer 的编译器实现细节 Golang编程笔记 golang 开发语言后端 ai
Golangdefer的编译器实现细节：从语法糖到运行时的全链路解析关键词：Go语言、defer、编译器优化、运行时、延迟执行摘要：本文将深入解析Go语言中defer关键字的底层实现细节。我们将从defer的基础用法出发，逐步拆解编译器如何将defer语法转换为机器可执行的代码，并结合Go编译器的优化历史（如开放编码优化）、运行时关键结构体（_defer）以及实际汇编代码，揭示defer从“语法糖
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
【养老机器人】核心技术杭州队长(⁎⁍̴̛ᴗ⁍̴̛⁎) 人工智能
1.毫米波雷达如何检测心跳和呼吸？毫米波雷达（通常工作在60GHz或77GHz频段）可以探测到人体胸腔的微米级位移，而心跳和呼吸会引起胸腔的周期性运动：呼吸：幅度较大（约5-10毫米），频率较低（0.1-0.5Hz）。心跳：幅度极小（约0.1-0.5毫米），频率较高（0.8-2.5Hz）。通过分析雷达回波的相位变化，可以提取这些微动信号：调频连续波（FMCW）雷达：发射连续调频信号，接收反射信号后
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l