几窗花鸢

云服务器安装Hive

文章目录

- 1. 安装Hive(最小化部署)
- 2. MySQL安装
- 3. Hive元数据配置到MySQL
- 4. HiveServer2服务
- 5. Metastore服务运行模式
- 6. 编写脚本来管理hive的metastore/hiveserver2服务的启动和停止
- - 1.7 Hive常用命令
- 7. Hive参数配置方式
- - 7.1 Hive常见的几个属性配置

安装Hive的前提是先安装Hadoop集群，并且hive只需要在Hadoop的namenode节点中安装即可，可以不再datanode节点上安装

1. 安装Hive(最小化部署)

在s1服务器解压缩hive的安装包至/opt/module 目录下,并改名为hive-3.1.2

[gaochuchu@s1 softs]$ tar -zxvf /opt/softs/apache-hive-3.1.2-bin.tar.gz -C /opt/module/
[gaochuchu@s1 module]$ mv apache-hive-3.1.2-bin/ hive-3.1.2

配置环境变量，在/etc/profile.d/my_env.sh中添加环境变量

[gaochuchu@s1 module]$ sudo vim /etc/profile.d/my_env.sh 
#HIVE_HOME
export HIVE_HOME=/opt/module/hive-3.1.2
export PATH=$PATH:$HIVE_HOME/bin
source /etc/profile

初始化元数据库，此时默认为derby数据库

 [gaochuchu@s1 hive-3.1.2] bin/schematool -dbType derby -initSchema

启动Hive和简单使用Hive
```
[gaochuchu@s1 hive-3.1.2]$ bin/hive
hive> show databases;
hive> show tables;
hive> create table test(id int);
hive> insert into test values(1);
hive> select * from test;
```
- 注意hive是存储在hdfs之上，因此默认hive的所有表都存在hdfs中的hive的默认目录/user/hive/warehouse
- 并且所有的hiveQL语句会转换成mapreduce任务，例如上述插入一条数据的例子，会转为mapreduce任务
退出hive客户端
```
hive>quit;
```
使用默认derby数据库的弊端
- 原因在于 Hive 默认使用的元数据库为 derby，开启 Hive 之后就会占用元数据库，且不与其他客户端共享数据，所以一次只能开启一个hive客户端，开启两个的时候，我们动态监测/tmp/gaochuhcu/hive.log数据库就会发现报错
- 所以我们需要将 Hive 的元数据地址改为 MySQL。

2. MySQL安装

因为Hive中主要还是用MySQL作为元数据库,首先卸载数据库中已有的mariadb

[gaochuchu@s1 ~]$  sudo rpm -e --nodeps mariadb-libs
[gaochuchu@s1 ~]$  sudo rpm -e --nodeps mariadb-devel

如果服务器已经安装了8.0版本的mysql，可以安装如下示例安装mysql5.7实例，原先8.0版本的mysql实例仍然保留
解压缩mysql5.7到/opt/module目录下
并在该mysql目录下创建数据目录/opt/module/mysql57/data

在/opt/module/mysql57/目录下添加配置文件my.cnf

[gaochuchu@s1 mysql57]$ vim my.cnf
port=3308
datadir=/opt/module/mysql57/data
socket=/opt/module/mysql57/data/mysql.sock
log-error=/opt/module/mysql57/data/mysqld.log
pid-file=/opt/module/mysql57/data/mysqld.pid

安装mysql

[gaochuchu@s1 mysql57]$ 
bin/mysqld \
--defaults-file=/opt/module/mysql57/my.cnf \
--initialize \
--user=gaochuchu \
--basedir=/opt/module/mysql57 \
--datadir=/opt/module/mysql57/data

启动mysql

bin/mysqld_safe \
--defaults-file=/opt/module/mysql57/my.cnf \
--user=gaochuchu &

查看初始化密码
```
grep "password" /var/log/mysqld.log
```

利用初始化密码进入mysql，并且修改数据库密码

[gaochuchu@s1 data]$ mysql -S /opt/module/mysql57/data/mysql.sock -P 3308 -uroot -p
#这里设置新密码为gcc2022
mysql> set password=password("gcc2022");
#开启远程访问
mysql> use mysql;
mysql> GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 'gcc2022';	
mysql> flush privileges;

停止mysql

[gaochuchu@s1 ~]$ ps -aux|grep mysqld
#通过kill 命令停止

3. Hive元数据配置到MySQL

将MYSQL的JDBC驱动拷贝到Hive的lib目录下

[gaochuchu@s1 mysql57]$ cp /opt/softs/mysql-connector-java-5.1.27-bin.jar $HIVE_HOME/lib

在mysql数据库中创建名为metastore的hive元数据的数据库

在$HIVE_HOME/conf目录下新建hive-site.xml文件，配置和连接mysql元数据库相关的内容



<configuration>
 
 <property>
 <name>javax.jdo.option.ConnectionURLname>
 <value>jdbc:mysql://s1:3308/metastore?useSSL=falsevalue>
property>

 
 <property>
 <name>javax.jdo.option.ConnectionDriverNamename>
 <value>com.mysql.jdbc.Drivervalue>
property>



 <property>
 <name>javax.jdo.option.ConnectionUserNamename>
 <value>rootvalue>
 property>

 

 <property>
 <name>javax.jdo.option.ConnectionPasswordname>
 <value>gcc2022value>
property>

 
 <property>
 <name>hive.metastore.schema.verificationname>
 <value>falsevalue>
property>

 
 <property>
 <name>hive.metastore.event.db.notification.api.authname>
 <value>falsevalue>
 property>

 
 <property>
<name>hive.metastore.warehouse.dirname>
 <value>/user/hive/warehousevalue>
 property>
configuration>

初始化Hive元数据库（修改为MySQL存储元数据）

 [gaochuchu@s1 hive-3.1.2]$ bin/schematool -initSchema -dbType mysql -verbose

启动Hive
```
gaochuchu@s1 hive-3.1.2]$ bin/hive
```

使用hive

hive> show databases;
hive> show tables;
hive> create table test (id int);
hive> insert into test values(1);
hive> select * from test;

4. HiveServer2服务

为用户提供远程访问Hive数据的功能，因此Hive的hiveserver2服务的作用是提供jdbc/odbc接口

远程访问Hive数据库时，客户端并未直接访问Hadoop集群，而是由HiveServer2代理访问。

Hadoop端配置
hivesever2的模拟用户功能，依赖于Hadoop提供的proxy user（代理用户功能），只有Hadoop中的代理用户才能模拟其他用户的身份访问Hadoop集群。因此，需要将hiveserver2的启动用户设置Hadoop的代理用户，增加配置文件core-site.xml并分发


<property>
    <name>hadoop.proxyuser.gaochuchu.hostsname>
    <value>*value>
property>


<property>
    <name>hadoop.proxyuser.gaochuchu.groupsname>
    <value>*value>
property>


<property>
    <name>hadoop.proxyuser.gaochuchu.usersname>
    <value>*value>
property>

Hive端口配置

修hive-site.xml配置文件，增加配置信息


<property>
	<name>hive.server2.thrift.bind.hostname>
	<value>s1value>
property>


<property>
	<name>hive.server2.thrift.portname>
	<value>10000value>
property>

启动hiveserver2

[gaochuchu@s1 hive-3.1.2]$ bin/hive --service hiveserver2

使用beeline客户端

[gaochuchu@s1 hive-3.1.2]$ bin/beeline -u jdbc:hive2://s1:10000 -n gaochuchu
#退出beeline客户端
0: jdbc:hive2://s1:10000> !quit

关于Hive的图形化客户端

DBeaver（免费）

DataGrip（付费）：可以支持多种数据库，而且学生根据校园邮箱免费使用正版Datagrip
- 试用了一下其可视化数据编辑器非常好用，而且代码导航，代码提示能力很强。

5. Metastore服务运行模式

嵌入式模式

将metastore看作一个依赖嵌入到Hiveserver2和每一个HiveCLI客户端进程，使得Hiveserver2和HiveCLI客户端直接连接访问数据库。
独立服务模式

把metastore服务独立出来单独启动，Hiveserver2和Hive命令行客户端都访问metastore服务，然后再由metastore访问元数据库。
- metastore服务不负责存储元数据，只负责提供访问元数据的接口。
生产环境中，不推荐使用嵌入式模式。因为其存在以下两个问题：
（i）嵌入式模式下，每个Hive CLI都需要直接连接元数据库，当Hive CLI较多时，数据库压力会比较大。
（ii）每个客户端都需要用户元数据库的读写权限，元数据库的安全得不到很好的保证。
独立服务模式会在s1上的hive-site.xml中配置jdbc服务，其他节点如果是hive客户端，则在hive-site.xml中删除jdbc有关的配置

并配置如下：
```
 
 <property>
 <name>hive.metastore.urisname>
 <value>thrift://s1:9083value>
 property>
```

实例测试：

s1配置metastore，s2上配置客户端

s1启动metastore

[gaochuchu@s1 hive-3.1.2]$ hive --service metastore
使用nohup 命令可以让其后台运行
[gaochuchu@s1 hive-3.1.2]$ nohup hive --service metastore &

s2的/opt/module/hive-3.1.2/conf/，配置hive-site.xml，删除jdbc的相关参数，添加配置：
```
<property>
 <name>hive.metastore.urisname>
 <value>thrift://s1:9083value>
 property>
```

s2节点上启动客户端

[gaochuchu@s2 hive-3.1.2]$ bin/hive

报错：

Exception in thread "main" java.lang.RuntimeException: java.net.ConnectException: Call From s2/...84 to s1:9000 failed on connection exception: java.net.ConnectException: Connection refused; For more details see:  http://wiki.apache.org/hadoop/ConnectionRefused
	at org.apache.hadoop.hive.ql.session.SessionState.start(SessionState.java:651)
	at org.apache.hadoop.hive.ql.session.SessionState.beginStart(SessionState.java:591)
	at org.apache.hadoop.hive.cli.CliDriver.run(CliDriver.java:747)
	at org.apache.hadoop.hive.cli.CliDriver.main(CliDriver.java:683)
	at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
	at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
	at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
	at java.lang.reflect.Method.invoke(Method.java:498)
	at org.apache.hadoop.util.RunJar.run(RunJar.java:318)
	at org.apache.hadoop.util.RunJar.main(RunJar.java:232)

解决：

查看了hadoop的配置，NameNode的内部通信端口设置的是8020，但是hive中连接却是9000,说明hadoop中配置的相关端口信息未同步到hive
将/opt/module/hadoop-3.1.3/etc/hadoop/的core-site.xml以及hdfs-site.xml文件放在/opt/module/hive-3.1.2/conf/目录下

6. 编写脚本来管理hive的metastore/hiveserver2服务的启动和停止

在 /opt/module/hive-3.1.2/bin/创建脚本文件hiveservices.sh

[gaochuchu@s1 hive-3.1.2]$ sudo chmod +x /bin/hiveservices.sh 
#启动metastore/hiveserver2
hiveservices.sh start
#停止metastore/hiveserver2
hiveservices.sh stop
#重启metastore/hiveserver2
hiveservices.sh restart
#查看状态metastore/hiveserver2
hiveservices.sh status

1.7 Hive常用命令

[gaochuchu@s1 hive-3.1.2]$ bin/hive -help
Hive Session ID = cf0fbd78-e8f7-46dd-ab83-a8fcbf2b58e1
usage: hive
 -d,--define <key=value>          Variable substitution to apply to Hive
                                  commands. e.g. -d A=B or --define A=B
    --database <databasename>     Specify the database to use
 -e <quoted-query-string>         SQL from command line
 -f <filename>                    SQL from files
 -H,--help                        Print help information
    --hiveconf <property=value>   Use value for given property
    --hivevar <key=value>         Variable substitution to apply to Hive
                                  commands. e.g. --hivevar A=B
 -i <filename>                    Initialization SQL file
 -S,--silent                      Silent mode in interactive shell
 -v,--verbose                     Verbose mode (echo executed SQL to the
                                  console)

-e 不进入hive的交互窗口执行sql语句

[gaochuchu@s1 hive-3.1.2]$ hive -e "select * from stu;"

-f 执行脚本中的sql语句

[gaochuchu@s1 hive-3.1.2]$ hive -f test.sql

退出hive窗口

hive(default)>exit;
hive(default)>quit;

Hive客户端查看hdfs文件系统
```
hive(default)>dfs -ls /;
```

查看在hive中输入的所有历史命令

#在当前用户的根目录下
[gaochuchu@s1 ~]$ cat .hivehistory

7. Hive参数配置方式

配置文件方式

默认配置文件：hive-default.xml

用户自定义配置文件：hive-site.xml

注意：用户自定义配置会覆盖默认配置。另外，Hive 也会读入 Hadoop 的配置，因为 Hive是作为 Hadoop 的客户端启动的，Hive 的配置会覆盖 Hadoop 的配置。配置文件的设定对本机启动的所有 Hive 进程都有效。
命令行参数方式

启动 Hive 时，可以在命令行添加-hiveconf param=value 来设定参数。
```
[gaochuchu@s1 hive-3.1.2] bin/hive -hiveconf mapred.reduce.tasks=10;
```
仅仅对本次hive启动有效
参数声明方式

可以在 HQL 中使用 SET 关键字设定参数

例如：
```
hive (default)> set mapred.reduce.tasks=100;
```
注意：仅对本次 hive 启动有效。

查看参数设置

hive (default)> set mapred.reduce.tasks;

上述三种设定方式的优先级依次递增。即配置文件<命令行参数<参数声明。注意某些系

统级的参数，例如 log4j 相关的设定，必须用前两种方式设定，因为那些参数的读取在会话

建立以前已经完成了。

7.1 Hive常见的几个属性配置

Hive客户端显示当前库和表头:在hive-sites.xml配置文件中增加配置

<property>
 <name>hive.cli.print.headername>
 <value>truevalue>
 property>
 <property>
 <name>hive.cli.print.current.dbname>
 <value>truevalue>
 property>

Hive的运行日志信息配置

Hive的log默认存放在/tmp/gaochuchu/hive.log 目录下（当前用户名）

修改hive的log日志存在到/opt/module/hive-3.1.2/logs

#修改hive-log4j2.properties.template 文件名为/hive-log4j2.properties
[gaochuchu@s1 conf]$ mv hive-log4j2.properties.template hive-log4j2.properties
#在/hive-log4j2.properties中修改log的存放位置
[gaochuchu@s1 conf]$ vim hive-log4j2.properties 
#property.hive.log.dir = ${sys:java.io.tmpdir}/${sys:user.name}
改为：
property.hive.log.dir = /opt/module/hive-3.1.2/logs

Hive的JVM对内存设置

新版本的Hive启动的时候，默认申请的JVM堆内存大小为256M,JVM堆内存申请太小，导致后期开启本地模式，执行复杂SQL时经常会报错：

java.lang.OutOfMemoryError:Java Heap space。

因此最好提前调整一个HADOOP_HEAPSIZE这个参数
```
#修改hive-env.sh.tmplate 文件名为hive-env.sh
[gaochuchu@s1 conf]$ mv hive-env.sh.template hive-env.sh
#将hive-env.shi其中的参数export HADOOP_HEAPSIZE修改为2048
export HADOOP_HEAPSIZE=2048
```

python 一小时教程 wsf_123456 python Python 编程 C C#C++
1序言面向读者本文适合有经验的程序员尽快进入Python2.x世界.特别地,如果你掌握Java和Javascript,不用1小时你就可以用Python快速流畅地写有用的Python程序.Python3.x用户请参考:http://www.cnitblog.com/yunshichen/archive/2009/04/01/55924.html(由于Django不支持python3,所以为了你的发展
Redis教程(二十一)：Redis怎么保证缓存一致性 ThatMonth 缓存 redis 数据库
传送门：Redis教程汇总篇，让你从入门到精通Redis的缓存一致性Redis的缓存一致性是指在使用Redis作为缓存层时，保证缓存中的数据与数据库中的数据保持一致的状态。在分布式系统中，数据一致性是一个重要的问题，因为可能存在多个客户端同时读写同一数据，或者数据在不同节点间需要同步更新。在涉及缓存的场景中，保持缓存一致性面临以下挑战：数据更新：当数据库中的数据被修改后，相关联的缓存数据需要被相应
Ceph Cookbook: 掌握分布式存储技术的实践指南云山雾村
本文还有配套的精品资源，点击获取简介：《CephCookbook》是一本面向希望深入学习Ceph分布式存储系统的读者的实用指南。本书通过实际案例和操作指导，全面介绍Ceph的核心概念和关键技术。介绍了Ceph的三个主要组件：RADOS、RBD和RGW，以及它们如何协同工作以提供高可用性和数据冗余。读者将学习Ceph的安装、配置、管理和优化，以及如何利用其高级特性，如CRUSH算法和多租户管理。本书
HIVE 面试题总结小余真旺财 Hive hive
Hive依赖于HDFS存储数据，Hive将HQL转换成MapReduce执行，所以说Hive是基于Hadoop的一个数据仓库工具，实质就是一款基于HDFS的MapReduce计算框架，对存储在HDFS中的数据进行分析和管理。一、Hive架构用户接口：CLI（hiveshell）、JDBC/ODBC(java访问hive)、WEBUI（浏览器访问hive）元数据：元数据包括：表名、表所属的数据库（默
Linux C多人网络聊天室 HWY_猿网络编程多人网络聊天室 Linux网络聊天室聊天室 Linux C 多人网络聊天室
经过好几天的日夜奋斗，总算把这个聊天室给做出来了，虽然说不上多好，但也是这几天从早到晚劳动的成功，所以就写这篇博文来记录一下啦。别的不敢说，确保能用就是了，完整代码在最后哦~当然啦，如果有幸被转发，还请注明来处哈~一、功能这个Linux下C版本的多人网络聊天室具备以下几个基本功能（或者说需求）：（一）C/S模式，IPv4的TCP通信；（二）客户端登录需要账号密码，没有账号需要注册；（三）服务器每接
从云端到私有：智慧任务管理工具的私有化转型之路项目管理软件
智慧任务管理工具私有化是指将智慧任务管理工具部署在组织内部的私有服务器或云环境中，以确保数据的安全性、隐私性和完全控制权。以下是对智慧任务管理工具私有化的详细解析：一、私有化的优势●数据安全：私有化部署确保所有数据存储在组织内部的服务器或私有云中，避免数据泄露或被第三方访问，特别适合处理敏感信息或需要遵守数据保护法规（如GDPR、HIPAA等）的组织。●定制化开发：组织可以完全控制系统的配置、更新
构建专属工作流：私有化部署下的数据安全与效率双赢项目管理软件
工作流管理软件私有化是指将工作流管理软件部署在组织内部的私有服务器或专有云环境中，以确保数据的安全性、隐私性和组织的完全控制权。以下是对工作流管理软件私有化的详细分析：一、私有化的优势数据安全：○私有化部署确保所有数据存储在组织内部的服务器或私有云中，避免了数据泄露或被第三方访问的风险。○特别适合处理敏感信息或需要遵守数据保护法规（如GDPR、HIPAA等）的组织。定制化开发：○组织可以完全控制系
Hive 面试题昨夜为你摘星
什么是Hive?Hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行。Hive的意义（最初研发的原因）?降低程序员使用Hadoop的难度，降低学习成本Hive的内部组成模块，作用
C# Socket网络通信【高并发场景】阿波茨的鹅 C#开发 c#网络开发语言
用途在C#中，Socket类是用于在网络上进行低级别通信的核心类。它提供了对TCP、UDP等协议的支持，可以实现服务器和客户端之间的数据传输。Socket提供了比TcpClient、UdpClient等更细粒度的控制，因此通常用于需要更多控制的场景。使用服务器usingSystem;usingSystem.Net;usingSystem.Net.Sockets;usingSystem.Text;c
redisCluster集群相关查询结果详解 ghostp redis redis
redisCluster集群相关查询结果详解进入redis进群查看集群信息CLUSTERINFO命令CLUSTERNODES命令info命令infoCommandstats命令查询服务器相关key的大小单个key查询某些前缀key批量查询进入redis进群在安装redis的机器上，找到安装目录的bin文件夹，使用以下命令来进入集群：[root@localhostbin]#./redis-cli-c
第十一章：服务器信道管理模块转调仿Rabbit消息队列 c++消息队列
目录第一节：模块介绍第二节：通信协议第三节：信道模块实现3-1.类型别名定义3-2.Channel类3-3.ChannelManager类下期预告：该模块在mqserver目录下实现。第一节：模块介绍服务器信道的作用是处理来自于客户端的各种请求，然后返回一个响应，那么客户端都有哪些请求呢？比如：交换机的声明与创建、队列的声明与创建、绑定与解绑等。请求的种类如此多，信道要怎么识别这些请求，执行对应的
hivePB级迁移方案我要用代码向我喜欢的女孩表白数据库 bigdata-大数据专栏 hive
1、评估磁盘空间大小、调整副本数、设置heapsize大小2、distcp-i-skipcrccheck源端到目标端，迁移3、元数据迁移，建表，替换location地址，或者导出db4、表分区修复5、配置增量T-1迁移或者T-26、校验历史分区脚本，表结构，大小，文件数7、根据ditcp不对的，进行补数脚本，删分区，重拉8、任务校验，客户跑完任务后，校验指定分区的count数和内容的md59、任务
深入探讨Ceph：分布式存储架构的未来深度Linux ceph 分布式架构 C/C++
在数字化浪潮汹涌澎湃的当下，数据量呈爆发式增长，传统存储系统在应对海量数据存储、高并发访问以及灵活扩展等方面，逐渐显得力不从心。分布式存储技术应运而生，成为解决现代数据存储难题的关键方案，而Ceph作为分布式存储领域的佼佼者，正日益受到广泛关注和应用。Ceph以其卓越的性能、高可靠性、强大的扩展性以及开源的特性，在众多分布式存储系统中脱颖而出，被广泛应用于云计算、大数据、人工智能等前沿领域。无论是
【Multipath网络层协议】MPTCP工作原理码上为赢 Multipath精通之路 multipath MPTCP
常见网络层多路径协议介绍MPTCP（MultipathTCP）MPTCP是在传统TCP基础上进行扩展的协议，它允许在源端和目的端之间建立多个TCP子流，这些子流可以通过不同的网络路径传输数据。例如，一台笔记本电脑同时连接了Wi-Fi网络和以太网网络，当使用MPTCP进行数据传输时，它可以将数据分别通过Wi-Fi和以太网这两条不同的路径发送到目标服务器，从而充分利用两条链路的带宽。LISP（Loca
最好Wordpree+Apache+PHP安装教程伶星37 apache php 开发语言
前提需要PHP的安装最少需要7.4以上Mysql的安装，直接默认最新版就行APache服务器（HTTP服务器，只有用这个你的软件才能在服务器上运行）安装apache安装sudoaptinstallapache2查看防火墙sudoufwapplist如果有Apache那么就可以直接访问安装PHP版本7.4就可以sudoaptinstallphp-mysqlsudosystemctlrestartap
Nginx 请求转发配置指南 web13093320398 面试学习路线阿里巴巴 nginx linux 运维
Nginx请求转发配置指南1.简介Nginx是一款高性能的HTTP和反向代理服务器，也是一个IMAP/POP3/SMTP代理服务器。本文档将介绍如何使用Nginx配置请求转发，并解释一些常用的配置参数。2.Nginx安装在配置之前，确保你的系统已经安装了Nginx。如果未安装，可以使用以下命令进行安装：在CentOS/RHEL上：sudoyuminstallnginx-y在Ubuntu/Debia
自动化脚本在Xshell中的应用这多冒昧啊运维 github git 运维自动化自动化脚本脚本
Xshell是一款功能强大的终端模拟软件，主要用于远程连接和管理服务器。它支持多种协议，包括SSH、Telnet、SFTP等，使用户能够通过命令行界面对远程服务器进行操作。Xshell提供了丰富的功能和特点，使其成为系统管理员、开发人员和网络工程师的得力工具。目录一、概述二、自动化脚本在Xshell中的应用案例案例一：自动化系统更新与维护案例二：自动化备份与恢复案例三：自动化网络安全检查三、总结一
Llama.cpp 服务器安装指南（使用 Docker，GPU 专用）田猿笔记 AI 高级应用 llama 服务器 docker llama.cpp
前置条件在开始之前，请确保你的系统满足以下要求：操作系统：Ubuntu20.04/22.04（或支持Docker的Linux系统）。硬件：NVIDIAGPU（例如RTX4090）。内存：16GB+系统内存，GPU需12GB+显存（RTX4090有24GB）。存储：15GB+可用空间（用于源码、镜像和模型文件）。网络：需要互联网连接以下载源码和依赖。软件：已安装并运行Docker。已安装NVIDIA
端口映射/内网穿透方式及问题解决:warning: remote port forwarding failed for listen port Davide~苏 Linux 服务器运维内网穿透打洞端口映射
文章目录需求：A机器是内网机器，B机器是公网服务器，想要从公网，访问A机器的端口方式：端口映射，内网穿透，使用ssh打洞端口：遇到问题：命令执行成功，但是端口转发失败分析：目标服务器ssh配置问题解决：修改ssh配置需求：A机器是内网机器，B机器是公网服务器，想要从公网，访问A机器的端口方式：端口映射，内网穿透，使用ssh打洞端口：1：配置configvim~/.ssh/config输入Hostr
Spark技术系列（一）：初识Apache Spark——大数据处理的统一分析引擎数据大包哥 #Spark 大数据
Spark技术系列（一）：初识ApacheSpark——大数据处理的统一分析引擎1.背景与核心价值1.1大数据时代的技术演进MapReduce的局限性：磁盘迭代计算、中间结果落盘导致的性能瓶颈Spark诞生背景：UCBerkeleyAMPLab实验室为解决复杂迭代计算需求研发（2010年开源）技术定位：基于内存的通用分布式计算框架（支持批处理、流计算、机器学习、图计算等）1.2Spark内置模块S
RPC 服务分组：优化分布式系统架构的关键策略与代码实践阿贾克斯的黎明 qt 开发语言
目录RPC服务分组：优化分布式系统架构的关键策略与代码实践一、RPC服务分组的概念与作用二、实现RPC服务分组的步骤与代码示例（一）项目结构规划（二）编写proto文件（三）生成代码（四）编写服务逻辑（五）配置服务（六）启动服务组（七）服务调用在构建复杂的分布式系统时，RPC服务分组是一种有效的管理和组织方式，有助于提高系统的可维护性和扩展性。本文将详细介绍RPC服务分组的概念、作用，并通过实际步
什么是三次握手? 十五001 基础网络
三次握手，这是计算机网络中TCP协议建立连接的过程。三次握手是确保两个主机之间能够可靠通信的重要机制。1.什么是三次握手？定义三次握手是TCP协议用来建立可靠连接的过程。它通过三次消息交换，确保两个主机之间能够正确地发送和接收数据。这个过程包括三个步骤：SYN、SYN-ACK和ACK。2.三次握手的过程2.1第一次握手（SYN）发起方（客户端）：客户端向服务器发送一个SYN（同步）报文，表示请求建
RabbitMQ系列（零）概要 yyueshen RabbitMQ rabbitmq 分布式消息队列
一、消息队列总览1.什么是消息队列？消息队列（MessageQueue）是一种异步通信机制，允许分布式系统中的服务通过生产-消费模型传递数据。其核心价值在于：解耦性：生产者与消费者无需同时在线或直接交互削峰填谷：应对流量突发场景，避免系统过载（如秒杀系统请求缓冲）可靠性：通过持久化、重试机制保障消息不丢失2.典型应用场景场景实现原理案例服务异步化耗时操作异步执行（如日志记录）用户注册后异步发送通知
python使用kafka原理详解_Python操作Kafka原理及使用详解形象顧問Aking
Python操作Kafka原理及使用详解一、什么是KafkaKafka是一个分布式流处理系统，流处理系统使它可以像消息队列一样publish或者subscribe消息，分布式提供了容错性，并发处理消息的机制二、Kafka的基本概念kafka运行在集群上，集群包含一个或多个服务器。kafka把消息存在topic中，每一条消息包含键值(key)，值(value)和时间戳(timestamp)。kafk
linux 查看进程启动方式勤不了一点系统 linux 运维服务器
目录如果是systemd管理的服务怎么快速找到对应的服务器呢什么是CGroup查找进程对应的systemd服务方法一：查看/proc//cgroup文件方法二：使用ps命令结合--cgroup选项方法三：systemd-cgls关于system.slice与user.slice方法四：查看文件查找非system服务进程步骤1-判断是否是system服务进程步骤2-判断服务所在目录，查找启动脚本步骤
nginx 安装（下载解压就行，免安装）当归1024 nginx nginx 运维
nginx是一个高性能的HTTP和反向代理web服务器，同时也提供了IMAP/POP3/SMTP服务。nginx由C语言编写，内存占用少，性能稳定，并发能力强，功能丰富；可以在大多数UnixLinuxOS上编译运行，并有Windows移植版。1、nginx下载地址：nginx:download2、windows安装及启动nginx是绿色免安装的，解压后可以直接启动双击nginx.exe即可启动服务
python调用kafka smile__su python python kafka
先启动hadoop，zookeeper，kafka启动命令hadoop启动命令sbin/start-all.shzookeeper启动命令./bin/zkServer.shstart每台机器都要启动kafka启动命令bin/kafka-server-start.shconfig/server.properties每台机器都要启动进行以下操作的前提是将hadoop，zookeeper，kafka安装
Spring Boot 集成 Kafka m0_74823471 面试学习路线阿里巴巴 spring boot kafka linq
在现代软件开发中，分布式系统和微服务架构越来越受到关注。为了实现系统之间的异步通信和解耦，消息队列成为了一种重要的技术手段。Kafka作为一种高性能、分布式的消息队列系统，被广泛应用于各种场景。而SpringBoot作为一种流行的Java开发框架，提供了便捷的方式来构建应用程序。本文将介绍如何在SpringBoot项目中集成Kafka，包括Kafka的基本概念、SpringBoot集成Kafka的
什么是SSL?什么是TLS?SSL与TLS 区别 HOLD ON! 计算机网络
什么是SSL?什么是TLS?SSL与TLS区别chunqianpo7385一、什么是ssl？什么是tls？SSL：(SecureSocketLayer，安全套接字层)，位于可靠的面向连接的网络层协议和应用层协议之间的一种协议层。SSL通过互相认证、使用数字签名确保完整性、使用加密确保私密性，以实现客户端和服务器之间的安全通讯。SSL协议可分为两层：SSL记录协议(SSLRecordProtocol
爬虫第二篇（网络通信之发送请求）笨鸟笃行 python学习爬虫
发起请求请求的组成部分1.请求方式（get，post等）2.请求url（目标的url）3.请求头（一般需要包含user-agent，referer，cookie）4.请求体（主要应用于post请求，post请求的参数在请求体内，get参数一般在url里面）请求方式GET请求1.定义GET请求是HTTP协议中最常见的请求方法之一，用于从服务器获取资源。它通过URL地址来请求数据，通常用于获取网页内容
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》