cyw1900

Hadoop伪分布式环境搭建（hadoop-0.20.2、hive-0.11.0、pig-0.5.0、zookeeper-3.4.3）

一．安装虚拟机及前期准备

1. VMWare 下安装CentOS 6.0系统，网络制式采用NAT

2. 将hadoop添加到sudoers

su root

输入root的口令，成功后就换成了root用户

继续输入命令：

chmod u+w/etc/sudoers

vi/etc/sudoers

在此行：root ALL=(ALL:ALL) ALL 后加一行：

hadoopALL=(ALL:ALL) ALL

意思就是允许hadoop用户sudo运行任何命令

保存

chmod u-w/etc/sudoers

这是把sudoers文件的权限改回440,即root用户通常也只读。Ubuntulinux的sudo命令运行时会检查这个文件权限是否440, 如果不是440, sudo命令都没有办法工作。所以改完之后一定要改回原来的440.

3. 用winscp将jdk-6u24-linux-i586.bin、hadoop-0.20.2.tar.gz、hive-0.11.0.tar.gz、pig-0.5.0.tar.gz、zookeeper-3.4.3分别放入/usr/java、/usr/hadoop、/usr、/usr、/usr文件中。

二．ssh设置

1. Master（NameNode| JobTracker）作为客户端，要实现无密码公钥认证，连接到服务器Salve（DataNode| Tasktracker）上时，需要在Master上生成一个密钥对，包括一个公钥和一个私钥，而后将公钥复制到所有的Slave上。当Master通过SSH连接Salve时，Salve就会生成一个随机数并用Master的公钥对随机数进行加密，并发送给Master。Master收到加密数之后再用私钥解密，并将解密数回传给Slave，Slave确认解密数无误之后就允许Master进行连接了。这就是一个公钥认证过程，其间不需要用户手工输入密码。重要过程是将客户端Master复制到Slave上。

2. Master机器上生成密码对（以hadoop1登入）

ssh-keygen–t rsa –P ''

这条命是生成其无密码密钥对，询问其保存路径时直接回车采用默认路径。生成的密钥对：id_rsa和id_rsa.pub，默认存储在"/home/hadoop/.ssh"目录下。

查看"/home/hadoop/"下是否有".ssh"文件夹，且".ssh"文件下是否有两个刚生产的无密码密钥对。

接着在Master节点上做如下配置，把id_rsa.pub追加到授权的key里面去。

cat~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys

3. 在验证前，需要做两件事儿。第一件事儿是修改文件"authorized_keys"权限（权限的设置非常重要，因为不安全的设置安全设置，会让你不能使用RSA功能），另一件事儿是用root用户设置"/etc/ssh/sshd_config"的内容。使其无密码登录有效。

1）修改文件"authorized_keys"

chmod 600~/.ssh/authorized_keys

备注：如果不进行设置，在验证时，扔提示你输入密码，在这里花费了将近半天时间来查找原因。

2）设置SSH配置

　　用root用户登录服务器修改SSH配置文件"/etc/ssh/sshd_config"的下列内容。

vim/etc/ssh/sshd_config

RSAAuthentication yes #启用 RSA 认证

PubkeyAuthentication yes# 启用公钥私钥配对认证方式

AuthorizedKeysFile.ssh/authorized_keys # 公钥文件路径（和上面生成的文件同）

设置完之后记得重启SSH服务，才能使刚才设置有效。

service sshdrestart

退出root登录，使用hadoop1普通用户验证是否成功。

sshlocalhost

三．安装JDK（JDK1.6）

(1) #cd /usr/java
#sudo chmod 777 jdk-6u24-linux-i586.bin

使当前用户拥有对jdk-6u24-linux-i586.bin的执行权限;

(2) #sudo ./ jdk-6u24-linux-i586.bin
运行jdk-6u24-linux-i586.bin，这时会显示出JDK的安装许可协议，按空格翻页，最后程序会问你是不是同意上面的协议，当然同意啦，输入“yes”之后开始解压JDK到当前目录。此时屏幕上会显示解压的进度。

解压完成后 /usr/java目录下会新建一个名为“jdk-1.6.0_24”的目录，至此我们已经在CentOS下安装好了JDK。

(3) 以用户hadoop1登录，进入用户主目录/home/hadoop1,命令行中执行命令“vi.bashrc”,加入以下内容，配置用户的人环境变量，对系统的环境变量不会造成影响。

# set java environment

export JAVA_HOME=/usr/java/jdk1.6.0_24

export JRE_HOME=/usr/java/jdk1.6.0_24/jre

export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib

export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

在vi编辑器增加以上内容后保存退出，并执行以下命令使配置生效

chmod +x/home/hadoop/ .bashrc ；增加执行权限

source/home/hadoop/ .bashrc；

配置完毕后，在命令行中输入java-version，如出现下列信息说明java环境安装成功。

java version "1.6.0_24"

Java(TM) SE Runtime Environment (build 1.6.0_24-b04)

Java HotSpot(TM) 64-Bit Server VM (build 20.8-b03, mixedmode)

四．安装hadoop（以root登陆或者修改读写权限）

1. sudo chmod 777hadoop-0.20.2.tar.gz

sudo tar zxvfhadoop-0.20.2.tar.gz 进行hadoop压缩文件解压。

2.将hadoop的用户和用户组都改成创建者

sudo chown –Rhadoop:hadoop /usr/hadoop

~~这样就可以保存运行过程中产生的datanode和namenode等存储文件；~~

~~sudo chmod -Ra+w /usr/local~~

~~将hadoop的目录权限设为当前用户可写~~

3.配置hadoop-env.sh文件

命令为sudo vi hadoop-env.sh

添加 # set java environment

exportJAVA_HOME=/usr/java/jdk1.6.0_24

编辑后保存退出。

4.配置core-site.xml

[hadoop1@masterconf]# vi core-site.xml

hadoop.tmp.dir

/usr/hadoop/hadoop-0.20.2/tmp

A base for othertemporarydirectories.

fs.default.name

hdfs://master:9000

5.配置hdfs-site.xml

[hadoop1@masterconf]# vi hdfs-site.xml

dfs.replication

6.配置mapred-site.xml

[hadoop@vm10110041conf]$ sudo vi mapred-site.xml

mapred.job.tracker

http://192.168.131.131:9001

7.配置masters文件和slaves文件

[hadoop@masterconf]# vi masters

192.168.131.131

[hadoop@masterconf]# sudo vi slaves

192.168.131.131

注：因为在伪分布模式下，作为master的namenode与作为slave的datanode是同一台服务器，所以配置文件中的ip是一样的。

8.编辑主机名

[hadoop@master ~]#sudo vi /etc/hosts

# Do not removethe following line, or various programs

that requirenetwork functionality will fail.

127.0.0.1localhost

192.168.131.131master

192.168.131.131slave

9.修改PATH

修改自己的环境变量：

Vi /home/hadoop/.bashrc

未修改前是：Export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

在$PATH前面加入Hadoop的路径，不能在后面。

改完后是：

Export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:/usr/hadoop/hadoop-0.20.2/bin:$PATH

10.启动hadoop（第一次需要格式化）

启动过程

查看进程（一个都不能少）

五．Windows下，用Eclipse配置与使用hadoop

1. 解压hadoop-0.20.2.tar.gz到windows下本地磁盘，并将目录下/contrib/eclipse-plugin中hadoop-0.20.2-eclipse-plugin复制到eclipse的plugin目录下。

2. Eclipse下openperspective添加Map/Reduce

3. 切换到Map/Reduce下，右下角出现Map/ReduceLocations，点击添加

在Advancedparameters下修改hadoop.job.ugi中第一个用户修改为hadoop（如果没有该选项则重启eclipse继续查看），mapred.System.dir修改为/hadoop/mapred/system。

4. 现在在eclipse下可以看到DFSLocation，查看DFS中的文件夹，并进行新增、修改、删除操作。

1. Eclipse下windows->preference->HadoopMap/Reduce选择解压hadoop-0.20.2.tar.gz到windows下本地磁盘的路径。

2. 新建project，选择Map/ReduceProject命名为WordCount。

3. 在project下新建包wordCount，在包下新建Mapper类型WordCountMapper.class、Reducer类型WordCountReducer.class、Driver类型WordCount.class。

4. WordCountMapper.class

package wordCount;

importjava.io.IOException;

importjava.util.StringTokenizer;

importorg.apache.hadoop.io.IntWritable;

importorg.apache.hadoop.io.LongWritable;

importorg.apache.hadoop.io.Text;

importorg.apache.hadoop.io.Writable;

importorg.apache.hadoop.io.WritableComparable;

importorg.apache.hadoop.mapred.MapReduceBase;

importorg.apache.hadoop.mapred.Mapper;

importorg.apache.hadoop.mapred.OutputCollector;

importorg.apache.hadoop.mapred.Reporter;

public class WordCountMapperextends MapReduceBase

implementsMapper {

private final IntWritable one =new IntWritable(1);

private Text word = newText();

public voidmap(WritableComparable key, Writable value,

OutputCollector output, Reporter reporter) throws IOException{

String line = value.toString();

StringTokenizer itr = newStringTokenizer(line.toLowerCase());

while(itr.hasMoreTokens()) {

word.set(itr.nextToken());

output.collect(word, one);

}

// found myself having to add this for Eclipse to behappy...

// it matches the definition of the map() function better than whatthe hadoop example

// does... Oh well...

public void map(LongWritablekey, Text value,

OutputCollectoroutput, Reporter reporter) throws IOException {

String line = value.toString();

StringTokenizer itr = newStringTokenizer(line.toLowerCase());

while(itr.hasMoreTokens()) {

word.set(itr.nextToken());

output.collect(word, one);

}

5. WordCountReducer.class

package wordCount;

importjava.io.IOException;

importjava.util.Iterator;

importorg.apache.hadoop.io.IntWritable;

importorg.apache.hadoop.io.Text;

importorg.apache.hadoop.io.WritableComparable;

importorg.apache.hadoop.mapred.MapReduceBase;

importorg.apache.hadoop.mapred.OutputCollector;

importorg.apache.hadoop.mapred.Reducer;

importorg.apache.hadoop.mapred.Reporter;

public class WordCountReducerextends MapReduceBase

implements Reducer {

public voidreduce(Text key, Iterator values,

OutputCollector output, Reporter reporter) throws IOException{

intsum = 0;

while(values.hasNext()) {

IntWritable value = (IntWritable) values.next();

sum += value.get(); // process value

}

output.collect(key, new IntWritable(sum));

}

6. Wordcount.class

package wordCount;

importorg.apache.hadoop.fs.Path;

importorg.apache.hadoop.io.IntWritable;

importorg.apache.hadoop.io.Text;

importorg.apache.hadoop.mapred.JobClient;

importorg.apache.hadoop.mapred.JobConf;

importorg.apache.hadoop.mapred.Mapper;

importorg.apache.hadoop.mapred.Reducer;

importorg.apache.hadoop.mapred.TextInputFormat;

importorg.apache.hadoop.mapred.TextOutputFormat;

importorg.apache.hadoop.fs.Path;

importorg.apache.hadoop.io.IntWritable;

importorg.apache.hadoop.io.Text;

importorg.apache.hadoop.mapred.FileInputFormat;

importorg.apache.hadoop.mapred.FileOutputFormat;

importorg.apache.hadoop.mapred.JobClient;

importorg.apache.hadoop.mapred.JobConf;

public class WordCount{

publicstatic void main(String[] args) {

JobClient client = new JobClient();

JobConf conf = new JobConf(WordCount.class);

//specify output types

conf.setOutputKeyClass(Text.class);

conf.setOutputValueClass(IntWritable.class);

//specify input and output dirs

//FileInputPath.addInputPath(conf, new Path("input"));

//FileOutputPath.addOutputPath(conf, newPath("output"));

conf.setInputFormat(TextInputFormat.class);

conf.setOutputFormat(TextOutputFormat.class);

//make sure In directory exists in the DFS area

//make sure Out directory does NOT exist in DFS area

FileInputFormat.addInputPath(conf, new Path("input"));

FileOutputFormat.setOutputPath(conf, newPath("output"));

//specify a mapper

conf.setMapperClass(WordCountMapper.class);

//specify a reducer

conf.setReducerClass(WordCountReducer.class);

conf.setCombinerClass(WordCountReducer.class);

client.setConf(conf);

try{

JobClient.runJob(conf);

}catch (Exception e) {

e.printStackTrace();

}

7. 在usr/hadoop目录下新建两个文件夹分别命名为input和output，往input文件夹上传若干.txt文件。（foo.txt和sss.txt）

8. 选择 RunAs * Run On Hadoop

13. 刷新查看output文件夹得到计数结果。

六．安装配置hive（derby）

1. 在/usr/目录下新建文件夹hive，用winscp将hive.0.11.0.tar.gz上传到该文件夹

2. cd /usr/hive

sudo chmod 777 hive-0.11.0.tar.gz

sudo tar zxvf hive-0.11.0.tar.gz

接着建立软连接

ln –s hive-0.11.0 hive

然后，

vi /home/hadoop1/.bashrc

•添加环境变量

•export HIVE_HOME=/usr/hive/hive-0.11.0

•export PATH=…:$HIVE_HOME/bin:$PATH

3. •进入hive/conf目录

•依据hive-env.sh.template，创建hive-env.sh文件

•cp hive-env.sh.templatehive-env.sh

•修改hive-env.sh

•指定hive配置文件的路径

•exportHIVE_CONF_DIR=/usr/hive/hive-0.11.0/conf

•指定Hadoop路径

•HADOOP_HOME=/usr/hadoop/hadoop-0.20.2

4. 将conf/hive-default.xml.template复制两份，分别命名为hive-default.xml（用于保留默认配置）和hive-site.xml（用于个性化配置，可覆盖默认配置）

5. sudo chown –R hadoop:hadoop /usr/hive

6. 在确定hadoop正常启动的情况下启动hive

7. 建立表格

1. 退出hive

Exit；

七．安装配置hive（mysql）

1. 切换到root用户下，

# yum -y installmysql-server

2. 启动MySQL服务

[root@localhost ~]# chkconfig mysqld on　← 设置MySQL服务随系统启动自启动

[root@ localhost ~]# chkconfig --listmysqld　← 确认MySQL自启动

mysqld 0:off 1:off 2:on 3:on 4:on 5:on6:off　← 如果2--5为on的状态就OK

[root@ localhost ~]#/etc/rc.d/init.d/mysqldstart　← 启动MySQL服务

设置root密码(root)

[root@localhost ~]# mysql -u root　← 用root用户登录MySQL服务器

mysql> set password forroot@localhost=password('在这里填入root密码');root　←

创建hive数据库：createdatabase hive；

创建用户hive，它只能从localhost连接到数据库并可以连接到wordpress数据库：grantall on *.* to hive@localhost identified by 'hive'hive

3. 在Hive的conf目录下修改配置文件hive-site.xml，配置文件修改如下

javax.jdo.option.ConnectionURL

jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true

JDBC connectstring for a JDBCmetastore

javax.jdo.option.ConnectionDriverName

com.mysql.jdbc.Driver

Driver class namefor a JDBCmetastore

javax.jdo.option.ConnectionUserName

hive

username to useagainst metastoredatabase

javax.jdo.option.ConnectionPassword

hive

password to useagainst metastoredatabase

4. 把MySQL的JDBC驱动包（我使用的是mysql-connector-java-5.0.8-bin.jar，从http://downloads.mysql.com/archives/mysql-connector-java-5.0/mysql-connector-java-5.0.8.tar.gz下载并解压后可以找到）复制到Hive的lib目录下。

5. 启动Hive shell，执行

show tables;

如果不报错，表明基于独立元数据库的Hive已经安装成功了。

查看一下元数据的效果。

在Hive上建立数据表：

CREATE TABLE my(id INT,name string) ROW FORMAT DELIMITEDFIELDS TERMINATED BY '\t';

show tables;

select name from my;

然后我们以刚刚建立的hive帐号登录MySQL查看元数据信息。

mysql> use hive

Reading table information for completion of table and columnnames

You can turn off this feature to get a quicker startup with-A

Database changed

mysql> show tables;

+-----------------+

| Tables_in_hive |

+-----------------+

| BUCKETING_COLS |

|COLUMNS |

| DATABASE_PARAMS |

|DBS |

| PARTITION_KEYS |

|SDS |

|SD_PARAMS |

| SEQUENCE_TABLE |

|SERDES |

|SERDE_PARAMS |

|SORT_COLS |

|TABLE_PARAMS |

|TBLS |

+-----------------+

13 rows in set (0.00 sec)

mysql> select * from TBLS;

+--------+-------------+-------+------------------+--------+-----------+-------+----------+---------------+--------------------+--------------------+

+--------+-------------+-------+------------------+--------+-----------+-------+----------+---------------+--------------------+--------------------+

| 1 | 1319445990| 1| 0 | hadoop| 0| 1 |my | MANAGED_TABLE |NULL |NULL |

+--------+-------------+-------+------------------+--------+-----------+-------+----------+---------------+--------------------+--------------------+

1 row in set (0.00 sec)

在TBLS中可以看到Hive表的元数据。

6. 应用实例（jdbc）

l 关闭防火墙

#chkconfig --level35 iptables off

(注意中间的是两个英式小短线；重启)

在使用 JDBC 开发 Hive 程序时, 必须首先开启 Hive 的远程服务接口。使用下面命令进行开启:

hive -service hiveserver

1). 测试数据（/usr）

userinfo.txt文件内容(每行数据之间用tab键隔开):

1 xiapi

2 xiaoxue

3 qingqing

2). 在eclipse新建一个javaprojectHiveJdbcClient，packageHiveJdbcClient，classHiveJdbcClient.class。右击工程properties，library添加/usr/hive/hive-0.11.0/lib里的所有jar以及/usr/hadoop/hadoop-0.20.2里的hadoop-0.20.2-core.jar.

3).程序代码

packageHiveJdbcClient;

importjava.sql.Connection;

importjava.sql.DriverManager;

importjava.sql.ResultSet;

importjava.sql.SQLException;

importjava.sql.Statement;

importorg.apache.log4j.Logger;

public classHiveJdbcClient {

private static String driverName ="org.apache.hadoop.hive.jdbc.HiveDriver";

private static String url ="jdbc:hive://192.168.131.131:10000/default";

private static String user = "";

private static String password = "";

private static String sql = "";

private static ResultSet res;

private static final Logger log =Logger.getLogger(HiveJdbcClient.class);

public static void main(String[] args) {

try {

Class.forName(driverName);

Connection conn = DriverManager.getConnection(url, user,password);

Statement stmt = conn.createStatement();

// 创建的表名

String tableName = "testHiveDriverTable";

sql = "drop table " + tableName;

stmt.executeQuery(sql);

sql = "create table " + tableName + " (key int, valuestring) row format delimited fields terminated by'\t'";

stmt.executeQuery(sql);

// 执行“show tables”操作

sql = "show tables '" + tableName + "'";

System.out.println("Running:" + sql);

res = stmt.executeQuery(sql);

System.out.println("执行“showtables”运行结果:");

if (res.next()) {

System.out.println(res.getString(1));

}

// 执行“describe table”操作

sql = "describe " + tableName;

System.out.println("Running:" + sql);

res = stmt.executeQuery(sql);

System.out.println("执行“describetable”运行结果:");

while (res.next()) {

System.out.println(res.getString(1) + "\t" +res.getString(2));

}

// 执行“load data into table”操作

String filepath = "/usr/userinfo.txt";

sql = "load data local inpath '" + filepath + "' into table " +tableName;

System.out.println("Running:" + sql);

res = stmt.executeQuery(sql);

// 执行“select * query”操作

sql = "select * from " + tableName;

System.out.println("Running:" + sql);

res= stmt.executeQuery(sql);

System.out.println("执行“select* query”运行结果:");

while (res.next()) {

System.out.println(res.getInt(1) + "\t" +res.getString(2));

}

// 执行“regular hive query”操作

sql = "select count(1) from " + tableName;

System.out.println("Running:" + sql);

res = stmt.executeQuery(sql);

System.out.println("执行“regularhive query”运行结果:");

while (res.next()) {

System.out.println(res.getString(1));

}

conn.close();

conn = null;

} catch (ClassNotFoundException e) {

e.printStackTrace();

log.error(driverName + " not found!", e);

System.exit(1);

}catch (SQLException e) {

e.printStackTrace();

log.error("Connection error!", e);

System.exit(1);

}

得到结果：（eclipse）

Running:showtables 'testHiveDriverTable'

执行“show tables”运行结果:

testhivedrivertable

Running:describe testHiveDriverTable

执行“describe table”运行结果:

key int

value string

Running:loaddata local inpath '/usr/userinfo.txt' into tabletestHiveDriverTable

Running:select* from testHiveDriverTable

执行“select * query”运行结果:

1 xiapi

2 xiaoxue

3 qingqing

Running:selectcount(1) from testHiveDriverTable

执行“regular hive query”运行结果:

在centos终端显示

八．PIG安装与配置

1. cd /usr

sudo chmod 777 pig-0.5.0.tar.gz

sudo tar zxvf pig-0.5.0.tar.gz 进行压缩文件解压。

2.vim /home/hadoop/.bashrc

添加下列几行

export PIG_HOME=/usr/pig-0.5.0

export PIG_HADOOP_VERSION=20

export PIG_CLASSPATH=/usr/hadoop/hadoop-0.20.2/conf

export PATH=···:$PIG_HOME/bin:$PATH

1. source /home/hadoop/.bashrc

2. %pig，见如下配置成功

九．Zookeeper配置与安装

1. cd /usr

sudo chmod 777 zookeeper-3.4.3.tar.gz

sudo tar zxvf zookeeper-3.4.3.tar.gz 进行压缩文件解压。

chown -R hadoop:hadoop zookeeper-3.4.3

2. vim /home/hadoop/.bashrc

添加下列几行

export ZOOKEEPER_HOME=/usr/zookeeper-3.4.3

export CLASSPATH=···:$ZOOKEEPER_HOME/lib

export PATH=···:$ZOOKEEPER_HOME/bin:$PATH

source /home/hadoop/.bashrc

3. cd /usr/zoopkeeper-3.4.3/conf

将zoo_sample.cfd文件名称改为zoo.cfg

# The number ofmilliseconds of each tick

tickTime=2000

# The number ofticks that the initial

# synchronizationphase can take

initLimit=10

# The number ofticks that can pass between

# sending arequest and getting an acknowledgement

syncLimit=5

# the directorywhere the snapshot is stored.

# do not use /tmpfor storage, /tmp here is just

# examplesakes.

dataDir=/usr/zookeeper-3.4.3/data

# the port atwhich the clients will connect

clientPort=2181

# Be sure to readthe maintenance section of the

# administratorguide before turning on autopurge.

#http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance

# The number ofsnapshots to retain in dataDir

#autopurge.snapRetainCount=3

# Purge taskinterval in hours

# Set to "0" todisable auto purge feature

#autopurge.purgeInterval=1

4. cd /usr/zoopkeeper-3.4.3

bin/zkServer.shstart启动zookeeper

十．常见问题

问题：

在eclipse上操作DFS时，正常连接，但无法进一步展开查看具体内容

分析与解决方法：

一般情况下，这种情况下是namenode或者datanode未启动或者启动之后又自动停止工作，在虚拟机下用JPS命令行下查看具体情况，如果namenode未启动，则先运行stop-all.sh，重新启动start-all.sh，JPS查看没问题，过一段时间再看如果还是自动停止则重新格式化namenode；如果是datanode未启动，则进入/usr/hadoop/hadoop-0.20.2/tmp删除掉data文件再重新启动hadoop即可解决！

3.安装过程可能不断出现一些问题，上述教程已经确保如果完全按照教程操作不会出错（除了问题1、2），如果出错，请检查是否漏掉某些步骤或者设置。

你可能感兴趣的:(database)

Spring 核心技术解析【纯干货版】- XII：Spring 数据访问模块 Spring-R2dbc 模块精讲 m0_74825003 面试学习路线阿里巴巴 spring java 后端
在现代应用架构中，高并发、低延迟的需求推动了响应式编程的发展，而传统的JDBC由于其同步阻塞机制，在高吞吐场景下可能成为瓶颈。R2DBC（ReactiveRelationalDatabaseConnectivity）作为响应式关系型数据库访问标准，正是为了解决这一问题而诞生的。SpringR2DBC作为Spring生态对R2DBC的封装，提供了非阻塞、异步的数据库访问能力，并与SpringWebF
python把oracle的查询结果导出为insert语句优游的鱼 oracle python 数据库开发语言
可以使用cx_Oracle库在Python中连接Oracle数据库并执行查询。然后，可以使用pandas库将查询结果读取为DataFrame，并使用to_sql()方法将其导出为insert语句。示例代码如下：importcx_Oracleimportpandasaspd#ConnecttoOracledatabaseconn=cx_Oracle.connect('username/passwor
Postgresql 查询数据库列表，表列表，字段列表小毛驴850 postgresql 数据库
--列出数据库列表SELECT*FROMpg_database;--查询表字段明细SELECTcol.table_schema,col.table_name,col.ordinal_position,col.column_name,col.data_type,col.character_maximum_length,col.numeric_precision,col.numeric_scale,c
向量数据库实战介绍 Zhank10 数据库
本文将介绍三种常用的向量数据库：faiss,Milvus和Qdrant，并给出一个具体的使用例子。向量数据库（VectorDatabase）是一种专门用于存储、管理、查询、检索向量的数据库，主要应用于人工智能、机器学习、数据挖掘等领域。在向量数据库中，数据以向量的形式进行存储和处理，需要将原始的非向量型数据转化为向量表示（比如文本使用Embedding技术获得其表征向量）。这种数据库能够高效地进行
python 多进程 Zswdhy python
#-*-coding:utf-8-*-importtimeimportpymysqlfrommultiprocessingimportProcessfromdatetimeimportdatemonth=date.today().strftime("%Y%m")HOST,USER,PASSWD,DB,PORT='192.168.1.1','admin','password','database',
向量数据库milvus部署一方有点方 milvus
官方文档MilvusvectordatabasedocumentationRunMilvusinDocker(Linux)|MilvusDocumentationMilvusvectordatabasedocumentation按部署比较简单，这里说一下遇到的问题一：DockerCompose方式部署1、镜像无法拉取,(docker.io被禁)只能获取以下镜像，image:quay.io/core
BagelDB：AI的开源向量数据库 qahaj 人工智能数据库 python
BagelDB：AI的开源向量数据库BagelDB(OpenVectorDatabaseforAI)是一个类似于GitHub的AI数据协作平台。用户可以在这里创建、分享和管理向量数据集。BagelDB支持独立开发者的私有项目、企业内部的协作以及数据DAO的公共贡献。技术背景介绍随着人工智能和机器学习的快速发展，各种数据的重要性也在不断凸显。向量数据库作为存储向量化数据的重要工具，越来越受到开发者和
ubuntu14.04 sqlite3 及可视化工具安装 Andre-S linux工具可视化工具 sqlite3 界面数据库 ubuntu
1.安装sqlite3sudoapt-getinstallsqlite3检查版本：sqlite3-version2.使用方法查看帮助信息.help创建数据库sqlite3test.db查询数据库信息.database查看该数据库内的表信息.tables退出.exit3.安装图形化界面sudoapt-getinstallsqlitebrowser4.使用方法sqlitebrowsertest.db注
DAT 560G: Database Design and SQL 后端
DAT560G:DatabaseDesignandSQLSpring2025,MiniAAssignment#4:SQLPart3Instructions1.Thisisanindividualassignment.Youmaynotdiscussyourapproachtosolvingthesequestionswithanyone,otherthantheinstructororTA.2.P
MySQL赋予用户权限命令总结雪下的那么认真数据库
ySQL用户可用权限一个新建的MySQL用户没有任何访问权限，这就意味着你不能在MySQL数据库中进行任何操作。你得赋予用户必要的权限。以下是一些可用的权限：ALL:所有可用的权限CREATE:创建库、表和索引LOCK_TABLES:锁定表ALTER:修改表DELETE:删除表INSERT:插入表或列SELECT:检索表或列的数据CREATE_VIEW:创建视图SHOW_DATABASES:列出数
oracle查询DBname 和 hostname(instance) cyong888 数据库 oracle database
selecthost_namefromv$instance;selectnamefromv$database一个instance上有多个database。
基于oracle linux的 DBI/DBD 标准化安装文档 linux
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
mysql用户名怎么看 begei 面试学习路线阿里巴巴 mysql 数据库
要查看mysql中的用户名，可以使用以下方法：使用showdatabases命令查看数据库拥有者信息；使用ps命令查看正在运行的mysql进程；使用whoami命令查看当前操作系统用户名；查看/etc/mysql/my.cnf或/etc/my.cnf文件中的user或username选项。如何在MySQL中查看用户名要查看MySQL中的用户名，您可以使用以下命令：1SHOWDATABASES;这将
MySQL数据库入门：从零开始掌握数据库基础心随_风动数据库数据库 mysql
MySQL数据库入门：从零开始掌握数据库基础@[TOC](MySQL数据库入门：从零开始掌握数据库基础)什么是MySQL？为什么学习MySQL？MySQL的核心概念1.数据库（Database）2.表（Table）3.字段（Field）4.记录（Record）5.SQL（StructuredQueryLanguage）MySQL的安装与配置1.下载MySQL2.安装MySQL3.启动MySQL服务
学习Flask：[特殊字符] Day 3：数据库集成昨今数据库学习 flask
学习目标：使用SQLAlchemy操作数据库fromflask_sqlalchemyimportSQLAlchemyapp.config['SQLALCHEMY_DATABASE_URI']='sqlite:///site.db'db=SQLAlchemy(app)classUser(db.Model):id=db.Column(db.Integer,primary_key=True)userna
QtC++读取文件内容 galaxy_strive qt c++
QFilefile("../sys_database/canshu.txt");//目标文件路径if(!file.open(QIODevice::ReadOnly|QIODevice::Text)){QMessageBox::critical(this,"警告","文件读取失败！");return;}//创建一个QTextStream对象，用于从文件中读取文本数据。QTextStreamin(&f
YashanDB实例启停数据库
本章节将介绍YashanDB数据库的实例启停方式。数据库安装过程中将实例自动切换成OPEN阶段，并创建名为yashandb的数据库。执行如下SQL命令查看当前实例状态及数据库名称：SELECTstatusFROMV$INSTANCE;STATUS-----------------OPENSELECTdatabase_nameFROMV$DATABASE;DATABASE_NAME---------
mongodb常用操作命令行思理数据库 mongodb 数据库
1、MongoDBShell工具mongosh一般的链接命令格式为：mongosh"mongodb://hostname:port"示例：mongosh"mongodb://localhost:27017"2、显示所有数据库showdbs或者showdatabases3、切换到指定数据库（如果不存在则创建）：use4、删除当前数据库：db.dropDatabase()5、查看当前所使用的数据库db
MongoDB私人学习笔记奕辰杰私人学习笔记学习笔记 mongodb java
俗话说“好记性不如烂笔头”，编程的海洋如此的浩大，养成做笔记的习惯是成功的一步！此笔记主要是ZooKeeper3.4.9版本的笔记，并且笔记都是博主自己一字一字编写和记录，有错误的地方欢迎大家指正。一、基础知识：1、MongoDB的名称来源于HumongousDatabase，中文意思就是巨大无比的数据库，顾名思义，MongoDB就是为处理大数据而生，以解决海量数据的存储和高效查询使用为使命。是N
PG统计信息三思呐三思 PG postgres统计信息 postgres性能问题排查
文章目录一、统计信息1.1PG统计信息概述1.2负载指标统计信息1.2.1pg_stat_database指标含义1.2.2pg_stat_user_tables指标含义2.2.3pg_stat_user_indexes指标含义2.2.4pg_statio_user_tables指标含义2.2.5pg_stat_bgwriter指标含义2.2.6pg_stat_replication指标含义2.2
MySQL知识点汇总 Lucky Prince越数据库 mysql
一.数据库的基本概念数据库:数据库中存放的一般是多张表表:表是用来存放数据关系:两个表单公共字段行:也称为叫记录,也叫实体列:也称为叫字段,也叫属性.数据冗余：数据冗余可以减少,但是不能杜绝减少数据冗余的方法就是分表二.数据库的操作#创建数据库CREATEdatabasestudent;#显示所有数据库（了解）showDATABASES;#删除数据库dropdatabase`$%`;#如果存在就删
Scala的隐式对象 yuhuhuh scala
隐式对象：implicitobject//隐式对象//implicitobject//作用：给函数的隐式参数提供默认值objecttest5{caseclassDatabaseConfig(driver:String,url:String)//作为函数的隐式参数的默认值implicitobjectMySqlDefaultextendsDatabaseConfig("mysql","localhos
推荐开源项目：Contoso Data Generator 侯深业Dorian
推荐开源项目：ContosoDataGeneratorContoso-Data-GeneratorCustomContosodatabasegeneratorandready-to-useContososampledatabasesforSQLServer项目地址:https://gitcode.com/gh_mirrors/co/Contoso-Data-Generator1、项目介绍Conto
INX246 HTML CSS PHP 后端
GroupProject2/2024INX246ADVANCEDCOMPUTERPROGRAMMINGFORMODERNMANAGEMENTProjectOverviewGroupproject:3-4memberspergroupDevelopawebsitewithdatabaseandagroupreportProjectsubmissionandpresentation(on-sit
一文速通MySQL C__C.. mysql 数据库
MySQL是一种广泛使用的开源关系型数据库管理系统，它通过SQL（结构化查询语言）来管理和操作数据库。SQL语句主要分为三类：DDL（数据定义语言）、DML（数据操纵语言）和DCL（数据控制语言）。DDL（数据定义语言）：功能：用于定义和修改数据库的结构常见语句：查看数据库showdatabases;新建数据库createdatabase数据库名;删除数据库dropdatabase数据库名;查看当
Redis 持久化机制详解 wespten 数据库存储块存储文件存储对象存储分布式网络存储 redis 缓存数据库
Redis是内存数据库，数据都是存储在内存中，为了避免进程退出导致数据的永久丢失，需要定期将Redis中的数据以某种形式(数据或命令)从内存保存到硬盘；当下次Redis重启时，利用持久化文件实现数据恢复。除此之外，为了进行灾难备份，可以将持久化文件拷贝到一个远程位置。Redis持久化有2种：AOF（AppendOnlyFile）只追加日志文件；RDB(RedisDataBase)；RDB持久化和A
代写Name Database Systems 后端
AssessedCourseworkCourseNameDatabaseSystems(H)CourseworkNumber1/1DeadlineTime:16h30Date:14/03/2025%Contributiontofinalcoursemark20%SoloorGroup✓SoloGroup✓AnticipatedHoursAverage20hoursSubmissionInstruc
怎么提升自定义知识库的质量（向量知识库） CCSBRIDGE 人工智能人工智能
上传文档后，CherryStudio或者AnythingLLM会将内容转换为向量数据库（VectorDatabase），然后用于检索增强生成（RAG，Retrieval-AugmentedGeneration）。这样，LLM在回答问题时，可以从这些文档中检索相关内容，从而提高回答的准确性和信息量。1.影响检索效果的关键因素为了让LLM更准确、更高效地使用你的文档，这些因素很重要：✅适合的文档格式虽
面试八股文--数据库基础知识总结(1) 汤汤upup 面试八股文数据库 oracle sql
1、数据库的定义数据库（DataBase，DB）简单来说就是数据的集合数据库管理系统（DatabaseManagementSystem，DBMS）是一种操纵和管理数据库的大型软件，通常用于建立、使用和维护数据库。数据库系统（DatabaseSystem，DBS）是指基于数据库的计算机应用系统，通常由数据库、数据库管理系统、软件、数据库管理员、用户组成2、数据库中的一些基本概念元组：元组（tuple
面试八股文--数据库基础知识总结(2) MySQL 汤汤upup 面试八股文数据库面试 mysql
本文介绍关于MySQL的相关面试知识一、关系型数据库1、定义关系型数据库（RelationalDatabase）是一种基于关系模型的数据库管理系统（DBMS），它将数据存储在表格（表）中，并通过表格之间的关系来组织和管理数据。2、常见的关系型数据库MySQL：开源的、高性能的关系型数据库，适用于Web应用和中小型企业。PostgreSQL：开源的、功能强大的关系型数据库，支持复杂的数据类型和高级功
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息