珞清殇

基于Hadoop的数据仓库Hive的介绍、安装与基本应用

文章目录

- - 基于Hadoop的数据仓库Hive的介绍、安装与基本应用
  - - 一、概述
    - 二、Hive系统架构
    - 三、Hive工作原理
    - 四、Hive HA基本原理
    - 五、Impala
    - 六、Hive安装
    - 七、Hive编程实战
  - 附一：管理表(内部表)
  - 附二：外部表
  - 附三：分区表
  - 附四：Hive SQL 查询函数手册

基于Hadoop的数据仓库Hive的介绍、安装与基本应用

一、概述

数据仓库概念
- 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合，用于支持管理决策；
- 数据仓库的体系结构
传统数据仓库面临的挑战
- 无法满足快速增长的海量数据存储需求
- 无法有效处理不同类型的数据
- 计算和处理能力不足
Hive简介
- Hive是一个构建于Hadoop顶层的数据仓库工具；
- 支持大规模数据存储、分析，具有良好的可扩展性；
- 某种程度上可以看作是用户编程接口，本身不存储和处理数据；
- 依赖分布式文件系统HDFS存储数据；
- 依赖分布式并行计算模型MapReduce处理数据；
- 定义了简单的类似SQL 的查询语言——HiveQL；
- 用户可以通过编写的HiveQL语句运行MapReduce任务；
- 它可以很容易把原来构建在关系数据库上的数据仓库应用程序移植到Hadoop平台上；
- 它是一个可以提供有效、合理、直观组织和使用数据的分析工具；
Hive特点
- 采用批处理方式处理海量数据
  - Hive需要把HiveQL语句转换成MapReduce任务进行运行
  - 数据仓库存储的是静态数据，对静态数据的分析适合采用批处理方式，不需要快速响应给出结果，而且数据本身也不会频繁变化
- 提供适合数据仓库操作的工具
  - Hive本身提供了一系列对数据进行提取、转换、加载(ETL)的工具，可以存储、查询和分析存储在Hadoop中的大规模数据
  - 这些工具能够很好地满足数据仓库各种应用场景
Hive与Hadoop生态系统中其他组件的关系(略)
Hive与传统数据库的对比分析
Hive在企业中的部署和应用
- Hive在企业大数据分析平台中的应用

Hive在Facebook公司中的应用
- 基于Oracle的数据仓库系统已经无法满足激增的业务需求
- Facebook公司开发了数据仓库工具Hive，并在企业内部进行了大量部署

二、Hive系统架构

用户接口模块包括CLI、HWI、JDBC、ODBC、Thrift Server；
驱动模块(Driver)包括编译器、优化器、执行器等，负责把HiveSQL语句转换成一系列MapReduce作业；
元数据存储模块(Metastore)是一个独立的关系型数据库(自带derby数据库，或MySQL数据库)；

三、Hive工作原理

SQL语句转换成MapReduce作业的基本原理
- join的实现原理
- group by的实现原理
  
  select rank, level ,count(*) as value from score group by rank, level
Hive SQL查询转换成MapReduce作业的过程
- 当用户向Hive输入一段命令或查询时，Hive需要与Hadoop交互工作来完成该操作：
  - 驱动模块接收该命令或查询编译器；
  - 对该命令或查询进行解析编译；
  - 由优化器对该命令或查询进行优化计算；
  - 该命令或查询通过执行器进行执行；
- Step
  1. 由Hive驱动模块中的编译器对用户输入的SQL语言进行词法和语法解析，将SQL语句转化为抽象语法树的形式；
  2. 抽象语法树的结构仍很复杂,不方便直接翻译为MapReduce算法程序，因此把抽象语法树转化为查询块；
  3. 把查询块转换成逻辑查询计划，里面包含了许多逻辑操作符；
  4. 重写逻辑查询计划，进行优化，合并多余操作，减少MapReduce任务数量；
  5. 将逻辑操作符转换成需要执行的具体MapReduce任务；
  6. 对生成的MapReduce任务进行优化，生成最终的MapReduce任务执行计划；
  7. 由Hive驱动模块中的执行器，对最终的MapReduce任务进行执行输出；
- 说明
  - 当启动MapReduce程序时,Hive本身是不会生成MapReduce算法程序的；
  - 需要通过一个表示“Job执行计划”的XML文件驱动执行内置的、原生的Mapper和Reducer模块；
  - Hive通过和JobTracker通信来初始化MapReduce任务，不必直接部署在JobTracker所在的管理节点上执行；
  - 通常在大型集群上，会有专门的网关机来部署Hive工具，网关机的作用主要是远程操作和管理节点上的JobTracker通信来执行任务；
  - 数据文件通常存储在HDFS上，HDFS由名称节点管理；

四、Hive HA基本原理

由多个Hive实例进行管理的，这些Hive实例被纳入到一个资源池中，并由HAProxy提供一个统一的对外接口；
对于程序开发人员来说，可以把它认为是一台超强“Hive"；

五、Impala

Impala简介
- Impala是由Cloudera公司开发的新型查询系统，它提供SQL语义，能查询存储在Hadoop的HDFS和HBase上的PB级大数据，在性能上比Hive高出3~30倍；
- Impala的运行需要依赖于Hive的元数据；
- Impala是参照 Dremel系统进行设计的；
- Impala采用了与商用并行关系数据库类似的分布式查询引擎，可以直接与HDFS和HBase进行交互查询；
- Impala和Hive采用相同的SQL语法、ODBC驱动程序和用户接口；
- Impala与其它组件的关系；
Impala系统架构
- Impala和Hive、HDFS、HBase等工具是统一部署在一个Hadoop平台上的；
- Impala主要由Impalad，State Store和CLI三部分组成；
  - Impalad
    - 负责协调客户端提交的查询的执行；
    - 包含Query Planner、Query Coordinator和Query ExecEngine三个模块；
    - 与HDFS的数据节点(HDFS DN)运行在同一节点；
    - 给其他Impalad分配任务以及收集其他Impalad的执行结果进行汇总；
    - Impalad也会执行其他Impalad给其分配的任务，主要就是对本地HDFS和HBase里的部分数据进行操作；
  - State Store
    - 会创建一个statestored进程；
    - 负责收集分布在集群中各个Impalad进程的资源信息，用于查询调度；
  - CLI
    - 给用户提供查询使用的命令行工具；
    - 还提供了Hue、JDBC及ODBC的使用接口；
  说明：
  
  Impala中的元数据直接存储在Hive中。Impala采用与Hive相同的元数据、SQL语法、ODBC驱动程序和用户接口，从而使得在一个Hadoop平台上，可以统一部署Hive和Impala等分析工具，同时支持批处理和实时查询。
Impala查询执行过程
- Step 0
  - 当用户提交查询前，Impala先创建一个负责协调客户端提交的查询的Impalad进程，该进程会向Impala State Store提交注册订阅信息，State Store会创建一个statestored进程，statestored进程通过创建多个线程来处理Impalad的注册订阅信息.
- Step 1
  - 用户通过CLI客户端提交一个查询到impalad进程，Impalad的Query Planner对SQL语句进行解析，生成解析树；然后，Planner把这个查询的解析树变成若干PlanFragment，发送到Query Coordinator.
- Step 2
  - Coordinator通过从MySQL元数据库中获取元数据，从HDFS的名称节点中获取数据地址，以得到存储这个查询相关数据的所有数据节点.
- Step 3
  - Coordinator初始化相应impalad上的任务执行，即把查询任务分配给所有存储这个查询相关数据的数据节点.
- Step 4
  - Query Executor通过流式交换中间输出!!!，并由Query Coordinator汇聚来自各个impalad的结果.
- Step 5
  - Coordinator把汇总后的结果返回给CLI客户端
Impala与Hive的比较
- 不同点
  - Hive适合于长时间的批处理查询分析，而Impala适合于实时交互式SQL查询；
  - Hive依赖于MapReduce计算框架，Impala把执行计划表现为一棵完整的执行计划树，直接分发执行计划到各个Impalad执行查询；
  - Hive在执行过程中，如果内存放不下所有数据，则会使用外存，以保证查询能顺序执行完成，而Impala在遇到内存放不下数据时，不会利用外存，所以Impala目前处理查询时会受到一定的限制；
- 相同点
  - Hive与Impala使用相同的存储数据池，都支持把数据存储于HDFS和HBase中；
  - Hive与Impala使用相同的元数据；
  - Hive与Impala中对SQL的解释处理比较相似，都是通过词法分析生成执行计划；
- 总结
  - Impala的目的不在于替换现有的MapReduce工具；
  - 把Hive与Impala配合使用效果最佳；
  - 可以先使用Hive进行数据转换处理，之后再使用Impala在Hive处理后的结果数据集上进行快速的数据分析；

六、Hive安装

MySQL 安装与设置

为什么安装 MySQL 而不使用 Hive 自带的 derby？
使用 derby 不能开启多个 hive 客户端连接！
- 下载并安装 MySQL 官方的 Yum Repository，采用wget方式进行安装
```
wget -i -c http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm
```
- 使用上面的命令就直接下载了安装用的Yum Repository，大概25KB，然后就可以直接应用yum进行安装了，命令及执行效果如下：
```
sudo yum -y install mysql57-community-release-el7-10.noarch.rpm
```
- 安装Mysql服务器
```
sudo yum -y install mysql-community-server
```
- 启动Mysql并查看运行状态
```
sudo systemctl start  mysqld.service
```
```
sudo systemctl status mysqld.service
```
- 修改默认密码
  - 初始密码获取：
```
sudo grep "password" /var/log/mysqld.log
```
  - 输入密码登录mysql
```
mysql -u root -p
```
  - 密码修改
```
ALTER USER 'root'@'localhost' IDENTIFIED BY 'Hive@2020';
```
  注意:密码设置必须要大小写字母数字和特殊符号，不然不能配置成功。
- 开启mysql的远程访问
  执行以下命令开启远程访问限制(注意：下面命令开启所有的IP，如要开启某个具体IP是192.168.150.71，则将%替换成IP地址)：
```
grant all privileges on *.* to 'root'@'%' identified by 'Hive@2020' with grant option;
```
  刷新权限：
```
flush privileges;
```
- .修改mysql的字符编码以防止中文乱码问题
  - 显示原来编码
```
show variables like '%character%';
```
  - 若character_set_server不是utf-8，修改/etc/my.cnf(sudo vim /etc/my.cnf)(输入如下参数选项)
```
character_set_server=utf8
init_connect='SET NAMES utf8'
```
  - 重启数据库生效配置
```
sudo systemctl restart mysqld
```

Hive安装

下载Hive；

文件解压与赋权：

sudo tar -zxvf ./Downloads/apache-hive-3.1.2-bin.tar.gz -C /usr/local
cd /usr/local/
sudo mv apache-hive-3.1.2-bin hive
sudo chown -R hadoop ./hive

Hive环境变量配置：vim ~/.bashrc

export HIVE_HOME=/usr/local/hive
export PATH=$PATH:$HIVE_HOME/bin

记住：source ~/.bashrc

修改配置文件

新建hive-site.xml，添加如下配置信息



<configuration>
  <property>
    <name>javax.jdo.option.ConnectionURLname>
    <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&useUnicode=true&characterEncoding=UTF-8&useSSL=falsevalue>
   <description>
      JDBC connect string for a JDBC metastore.
      To use SSL to encrypt/authenticate the connection, provide database-specific SSL flag in the connection URL.
      For example, jdbc:postgresql://myhost/db?ssl=true for postgres database.
   description>
  property>

  <property>
    <name>javax.jdo.option.ConnectionDriverNamename>
    <value>com.mysql.jdbc.Drivervalue>
    <description>Driver class name for a JDBC metastoredescription>
  property>

  <property>
    <name>javax.jdo.option.ConnectionUserNamename>
    <value>hivevalue>
    <description>Username to use against metastore databasedescription>
  property>

  <property>
    <name>javax.jdo.option.ConnectionPasswordname>
    <value>hivevalue>
    <description>password to use against metastore databasedescription>
  property>
  <property>
    <name>hive.metastore.warehouse.dirname>
    <value>/hive/warehousevalue>
    <description>location of default database for the warehousedescription>
  property>

  <property>
    <name>hive.metastore.schema.verificationname>
    <value>falsevalue>
  property>

  <property>
     <name>datanucleus.readOnlyDatastorename>
     <value>falsevalue>
  property>
  <property>
     <name>datanucleus.fixedDatastorename>
     <value>falsevalue>
  property>
  <property>
     <name>datanucleus.autoCreateSchemaname>
     <value>truevalue>
  property>
  <property>
      <name>datanucleus.schema.autoCreateAllname>
      <value>truevalue>
  property>
  <property>
      <name>datanucleus.autoCreateTablesname>
      <value>truevalue>
  property>
  <property>
      <name>datanucleus.autoCreateColumnsname>
      <value>truevalue>
  property>
  <property>
      <name>hive.metastore.localname>
      <value>truevalue>
  property>
  <property>
       <name>hive.cli.print.headername>
       <value>truevalue>
  property>
  <property>
       <name>hive.cli.print.current.dbname>
       <value>truevalue>
  property>
configuration>

Hive的MySQL配置
- 加载驱动程序
  - 下载jdbc驱动：mysql-connector-java-5.1.49.tar.gz；
  - 解压拷贝：
```
sudo tar -zxvf ./Downloads/mysql-connector-java-5.1.49.tar.gz -C /usr/local   #解压
cd /usr/local/
cp mysql-connector-java-5.1.49/mysql-connector-java-5.1.49-bin.jar ./hive/lib
```
- 启动并登陆MySQL
  - mysql -u root -p
- 新建hive数据库
  - create database hive; # 与hive-site.xml中localhost:3306/hive的hive对应，用来保存hive元数据
- 配置Mysql允许hive接入
  - create user ‘hive’@‘localhost’ identified by ‘hive’; # hive用户密码；
  - GRANT ALL ON *.* TO ‘hive’@‘localhost’; # 将所有数据库的所有表的所有权限赋给hive用户；
  - flush privileges; # 刷新mysql系统权限关系表；
启动hive
- 启动hdfs与yarn：start-dfs.sh、start-yarn.sh
- 启动hive
```
cd /usr/local/hive
./bin/schematool -dbType mysql -initSchema
./bin/hive
```
- 使用mysql作为元数据库时登陆启动Hive过程中，可能出现的错误和解决方案：
  - java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument
    - 原因：hive内依赖的guava.jar和hadoop内的版本不一致；
    - 解决方法：
      - 查看hadoop安装目录下share/hadoop/common/lib内guava.jar版本；
      - 查看hive安装目录下lib内guava.jar的版本如果两者不一致，删除版本低的，并拷贝高版本的，问题解决；
  - org.datanucleus.store.rdbms.exceptions.MissingTableException: Required table missing : “VERSION” in Catalog “Schema”. DataNucleus requires this table to perform its persistence operations.
    - 解决方法：进入hive安装目录(比如/usr/local/hive)，执行如下命令
```
./bin/schematool -dbType mysql -initSchema
```
  - Hive metastore database is not initialized
    - 原因：以前曾经安装了Hive或MySQL，重新安装Hive和MySQL以后，导致版本、配置不一致
    - 解决方法：使用schematool工具(Hive现在包含一个用于 Hive Metastore 架构操控的脱机工具，名为 schematool)，此工具可用于初始化当前 Hive 版本的 Metastore 架构；此外，其还可处理从较旧版本到新版本的架构升级。故解决上述错误，在终端执行如下命令即可:
```
schematool -dbType mysql -initSchema
```

七、Hive编程实战

知识准备
- Hive的基本数据类型
  - TINYINT：1 byte 有符号整数(1)
  - SMALLINT：2 bytes 有符号整数(1)
  - INT：4 bytes 有符号整数(1)
  - BIGINT：8 bytes 有符号整数(1)
  - FLOAT：4 bytes 单精度浮点数(1.0)
  - DOUBLE：8 bytes 双精度浮点数(1.0)
  - BOOLEAN：布尔类型，true or false(false)
  - STRING：字符串，可指定字符集(“hive”)
  - TIMESTAMP：整数、浮点数or字符串(1321123121)
- Hive的集合数据类型
  - ARRAY：一组有序的字段，字段的类型必须相同；
  - MAP：一组无序的键/值对，键的类型必须是原子的，值可以是任何数据类型，同一个映射的键和值额类型必须相同；
  - STRUCT：一组命名的字段，字段类型可以不同
- Hive基本操作
  - 创建数据库、表、视图
    - 创建数据库：create database [if not exists] database_name;
      - hive> create database if not exists college;
    - 创建表(内部表、外部表以及分区表见附录)：
```
create [external] table [if not exists] table_name
[(col_1 dt [comment c_com_1],col_2 dt [comment c_com_2],...)] 
[partitioned by (col dt,...)];
```
      - hive> use college;
      - hive> create table if not exists student(id int,name string);
    - 创建视图
      - hive> create view stu as select id,name from student where id<10;
  - 查看数据库、表
    - 查看数据库
      - 查看所有数据库
        
        hive> show databases;
      - 查看以h开头的所有数据库
        
        hive> show databases like ‘col.*’
      - 查看hive数据库位置等信息
        
        describe database hive;
        
        desc database hive;
        
        desc database extended hive;
    - 查看表
      - hive> show tables;
      - hive> show tables in college like ‘s.*’;
  - 修改数据库、表
    - 修改数据库
      - 用户可以使用ALTER DATABASE命令为某个数据库的DBPROPERTIES设置键-值对属性值，来描述这个数据库的属性信息，数据库的其它元数据信息都是不可更改的，包括数据库名和数据库所在的目录位置
      - Ex
        
        alter database hive set dbproperties(‘createtime’=‘20201122’);
    - 修改表
      - 重命名(RENAME)表
        
        alter table table_name rename to new_table_name
      - 增加(ADD)/修改(CHANGE)/替换(REPLACE)列信息
        
        alter table table_name add columns (col dt); # 加到所有列后，但在partition列前
        
        alter table table_name change column col_name new_col_name data_type;
        
        alter table table_name replace columns (col_a dt,col_b dt,…); # 替换整个表的列
  - 删除数据库、表
    - 删除数据库
      - drop database db [cascade]; # 非空数据库使用cascade，否则报错
    - 删除表
      - drop table table_name;
  - 向表中装载数据
    - 装载本地数据
      - hive> load data local inpath ‘/home/hadoop/stu.txt’ overwrite into table student; # overwrite 覆盖
      - 与下述语句等同(load本地数据本质即为上传本地数据到hive数据表存放路径)
        
        hadoop fs -put /home/hadoop/stu.txt /hive/warehouse/college.db/student
    - 装载hdfs数据
      - hive> load data inpath ‘/user/hadoop/stu.txt’ overwrite into table student; # overwrite 覆盖
  - 向表中插入数据
    - insert (overwrite) table student_copy select * from student where id<10;
  - 从查询表中数据
    - 使用select…from…where…等语句，并结合关键字group by、having、like等操作；
    - case…when…then…
```
select id,name
  case
  when id=1 then 'first'
  when id=2 then 'second'
  else 'other' end from student;
```
  - 连接
    - 内连接：
```
select stu.*, course.* from stu join course on(stu.id=course.sid);
```
    - 左连接
```
select stu.*, course.* from stu left outer join course on(stu.id=course.sid); 
```
    - 右连接
```
select stu.*, course.* from stu right outer join course on(stu.id=course.sid); 
```
    - 全连接
```
select stu.*, course.* from stu full outer join course on(stu.id=course.sid);
```
    - 半连接
```
select stu.* from stu left semi join course on(stu.id=course.sid); 
```
- 数据类型转换
  - 隐式转换规则
    - 任何整数类型都可以隐式的转换为一个范围更广的类型：TINYINT $\rightarrow$ INT、INT $\rightarrow$ BIGINT等；
    - 所有整数类型、FLOAT和STRING类型(string like “12.1” but not “abc123”)都可以隐式地转换成DOUBLE；
    - TINYINT、SMALLINT、INT都可以转换为FLOAT；
    - BOOLEAN类型不可以转换为任何其它的类型；
  - 显示转换
    - CAST操作：
      - cast(“1” as int) $\rightarrow$ 1
      - cast(“abc123” as int) $\rightarrow$ NULL
实战一：创建person表并把下述数据文件内容载入person表；
```
jack,mary_tom,jackson:18_jackcon:19,NC_JX
tom,jack_frank,tomsom:21_tomson:16,SY_LN
```
- 创建person表
- 载入并查询数据
- 其它
实战二：Word Count，统计单词出现的次数，共三个文件fileA.txt、fileB.txt、fileC.txt，内容分别为“hello world”,“hello hadoop”,“hello hive”;
- create table docs(line string);
  load data local inpath ‘/home/hadoop/input’ overwrite into table docs;
- create table word_count as
  select word,count(1) as count from
  (select explode(split(line,’ ')) as word from docs) w
  group by word
  order by word;
- select * from word_count;

附一：管理表(内部表)

默认创建的表都是所谓的管理表，有时也被称为内部表，因为这种表，Hive会或多或少地控制着数据的生命周期。Hive默认情况下会将这些表的数据存储在由配置项hive.metastore.warehouse/dir所定义的目录或其子目录下。当我们删除一个管理表时，Hive也会删除这个表中的数据。管理表不适合和其它工具共享数据。

附二：外部表

Hive创建外部表时，仅记录数据所在的路径，不会对数据的位置做任何改变。外部表与内部表的主要区别在于删除外部表时，Hive不会删除这个表中的数据，重新创建该表仍然可以查到该数据(Mysql的元数据与Hdfs的原数据缺失任何一个都不能查询到该表的数据，且它们数据的先后，即先有元数据或先有原数据，不影响表数据的查询；Hive删除外部表只是删除元数据，但删除内部表会删除元数据与原数据)。

管理表与外部表的的互相转换：

查询表的类型：desc formatted student;
修改表为内部表or外部表：
- alter table student set tblproperties(‘EXTERNAL’=‘FALSE’);
- alter table student set tblproperties(‘EXTERNAL’=‘TRUE’)

注：‘EXTERNAL’='FALSE’必须大写；

附三：分区表

分区表实际上就是对应一个HDFS文件系统上的独立的文件夹，该文件夹是该分区所有的数据文件。Hive中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句的表达式选择查询所需要的指定的分区能够提高查询效率(避免全表扫描)。

分区表基本操作

创建分区表
载入数据
- 不指定分区，会报错(FAILED)或创建默认分区(依赖于hive版本)，本人hive版本为3.1.2，创建的是默认分区(下图)
- 指定分区
查询数据
- 非全表扫描
增加分区(添加多个分区，空格隔开)
删除分区(删除多个分区，逗号隔开)
查看分区
查看表分区信息
创建二级分区
载入数据：略
HDFS创建分区目录并上传数据如何通过select查询到(即需要添加元数据信息)
- 修复：rsck repair table partition_table_name;
- 以该分区目录添加分区；
- 载入数据到分区目录；

附四：Hive SQL 查询函数手册

官方手册

聚合计算

函数	功能说明
avg(x)	平均数
count([DISTINCT] col)	记录数，count(distinct x)为去重后的数量
sum(x)	总数，求和
max(x)	最大值，日期时间字段为最近的
min(x)	最小值，日期时间字段为最早的
collect_set(col)	收集group by聚合字段，返回去重后的数组(集合)
collect_list(col)	收集group by聚合字段，返回不去重后的数组
ntile(INTEGER x)	用于将分组数据按照顺序切分成n片，返回当前切片值

字符处理

函数	功能说明
cast(expr as )	转换表达式expr为type类型
length(int/str)	长度
reverse(int/str)	反转顺序
concat(1,2,‘a’)	字符串连接
concat_ws(‘-’,‘a’,‘b’)	指定分隔符的字符串连接
substr(‘foobar’,begin,num)	字符串截取。或substring
substring_index(str,‘-’,2)	分隔后取前几块
instr(‘abc’,‘ab’)	子串的位置，0为不存在
locate(‘a’,‘abc’,1)	子串是否存在，见例
upper,ucase	转大写
lower,lcase	转小写
trim ltrim rtrim	去空格，左右空格
parse_url	URL解析函数
get_json_object	json解析函数
space	空格字符串函数
repeat	重复字符串函数
ascii	首字符Ascii函数
lpad	左补足函数
rpad	右补足函数
split	字符串分割函数
find_in_set	集合查找函数
regexp_replace	正则表达式替换函数
regexp_extract	正则表达式解析函数

集合函数

函数	功能说明
array_contaions(Array, value)	返回Arrat是否包含value
size(Map)	返回Map的大小
size(Array)	返回Array的大小
map_keys(Map)	返回Map的key集合
map_values(Map)	返回Map的value集合
sort_array(Array)	返回排序后的Array

统计运算

函数	功能说明
+、-、*、/	加减乘除
%	取余
DIV	取整数部分
AND、OR、NOT	与、或、非
[NOT] IN (val1,val2,…)
[NOT] EXISTS (subquery)
=、<>	等值、不等值比较
>,<	大于、小于
>=、<=	大于等于、小于等于
IS [NOT] NULL	空值、非空值判断
REGEXP	正则表达式判断

窗口函数

函数	功能说明
rank()	相同值序号一样，跳过下个序号
dense_rank()	相同值序号一样，不跳过下个序号
row_number()	顺序排序，值同序号不同，序号不重
cume_dist()	同列占比，小于等于当前值的行数/分组内总行数
lag(col,n=1,DEFAULT)	统计窗口内往上第n行值
lead(col,n=1,DEFAULT)	统计窗口内往下第n行值
first_value(col)	分组内排序后，截止到当前行第一个值
last_value(col)	分组内排序后，截止到当前行最后一个值

时间函数

函数	功能说明
current_timestamp()	当前时间
current_date()	当前日期
unix_timestamp(time,format)	指定格式日期转UNIX时间戳
from_unixtime()	UNIX时间戳转日期
to_date()	日期时间转日期
date_format(time,format)	时间日期格式化
year() month() day()	日期转年、月、日
hour() minute() second()	日期转时、分、秒
weekofyear()	日期转周
datediff()	日期比较，时间相差
date_add()	日期增加
date_sub()	日期减少
trunc(date[,fmt])	指定元素截去日期值

逻辑判断

函数	功能说明
if(condition,value when true,value when false)	条件判断
case when	多条件分支
coalesce(a1,a2,…,an)	返回第一个不为Null的值
isnull(a)\isnotnuall(a)	判断是否为/不为空值
nvl(a,b)	a为Null时返回b，否则为a
nullif(a,b)	a=b时，返回NULL，否则为a

混合函数

reflect(或java_method())调用java自带函数

select reflect("java.lang.String","Max",2,3);
select java_method("java.lang.String","Min",2,5);

虚表生成：略
- stack
- explode
- inline
其它
- 内置命令
  - 查看所有函数：show functions
  - 查看函数的用法：desc function fun_name
  - 查看函数的用法与其它信息：desc function extended fun_name
- WITH AS
```
with
	a as (select * from scott.emp),
	b as (select * from scott.dept)
select * from a, b where a.deptno = b.deptno;
```
- UNION
  - UNION 操作符合并的结果集，不允许重复值
  - UNION ALL 允许有重复值

Source
Hadoop Course PPT and Word of NEU

你可能感兴趣的:(大数据,Note,hive)

数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
C++11中的std::function
文章转载自：http://www.jellythink.com/archives/771看看这段代码先来看看下面这两行代码：std::functiononKeyPressed;std::functiononKeyReleased;这两行代码是从Cocos2d-x中摘出来的，重点是这两行代码的定义啊。std::function这是什么东西？如果你对上述两行代码表示毫无压力，那就不妨再看看本文，就当温
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
ETL可视化工具 DataX -- 简介( 一) dazhong2012 软件工具数据仓库 datax ETL
引言DataX系列文章：ETL可视化工具DataX–安装部署(二)ETL可视化工具DataX–DataX-Web安装(三)1.1DataX1.1.1DataX概览DataX是阿里云DataWorks数据集成的开源版本，在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AWS 管理秘籍（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/cf1c4e1db999839ba88fc56df4011156译者：飞龙协议：CCBY-NC-SA4.0序言AWS平台的增长速度非常快，正在被各行各业广泛采用。正如俗话所说，朋友不会让朋友建立数据中心。不管从哪个角度看，按需计算、网络和存储的模式将持续存在。尤其是当你看到AWS平台在功能和增强方面的更新速度时，很难再去反对站在巨人的肩膀上，尤其是
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
AWS Terraform 架构指南（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/8b2d222956a050c7632b9eee086dadcf译者：飞龙协议：CCBY-NC-SA4.0第七章：7在项目中实现Terraform您准备好开始使用Terraform开发您的AWS基础设施了吗？在本章中，您将学习Terraform的基础知识，并了解如何在AWS中部署您的第一个模板。我们将介绍选择合适的AWS提供商和选择满足您项目需求的
Cool Pi CM5-LAPTOP Linux Quick Start Guide george-coolpi linux 运维服务器开源 arm开发 AI编程
MachineIntroductionCOOLPICM5open-sourcenotebookisaproductthatcombineshighperformance,portability,andopen-sourcespirit.Itnotonlymeetsthebasiccomputingneedsofusers,butalsoprovidesanidealplatformforthose
玩转Docker | 使用Docker部署NotepadMX笔记应用程序心随_风动玩转Docker docker 笔记 eureka
玩转Docker|使用Docker部署NotepadMX笔记应用程序前言一、NotepadMX介绍工具简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署NotepadMX服务下载NotepadMX镜像编辑部署文件创建容器检查容器状态检查服务端口安全设置四、访问NotepadMX服务访问NotepadMX首页设置访问验证编辑笔记总结前言在如今快节奏的工作与学习中，一
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
Hive简介
文章目录Hive简介Hive特点Hive和RDBMS的对比Hive的架构Hive的数据组织Hive数据类型Hive简介1、Hive由Facebook实现并开源2、是基于Hadoop的一个数据仓库工具3、可以将结构化的数据映射为一张数据库表4、并提供HQL(HiveSQL)查询功能5、底层数据是存储在HDFS上6、Hive的本质是将SQL语句转换为MapReduce任务运行7、使不熟悉MapRedu
K3s-io/kine项目核心架构与数据流解析富珂祯
K3s-io/kine项目核心架构与数据流解析kineRunKubernetesonMySQL,Postgres,sqlite,dqlite,notetcd.项目地址:https://gitcode.com/gh_mirrors/ki/kine项目概述K3s-io/kine是一个创新的存储适配器，它在传统SQL数据库之上实现了轻量级的键值存储功能。该项目最显著的特点是采用单一数据表结构，通过巧妙的
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
精益敏捷之道（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/0b2addbef6e2afb0ce49d44d7300959a译者：飞龙协议：CCBY-NC-SA4.0前言“精益敏捷之道：通过价值流管理释放企业潜力”一书源于首席作者塞西尔·‘加里’·鲁普与尊敬的同事理查德·克纳斯特、史蒂夫·佩雷拉和艾尔·沙洛韦的合作努力。他们的目标是为IT专家、商业专业人士以及各行业和组织的领域专家提供一本关于现代精益敏捷和
Python DevOps 实用指南（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/0228db3442938136abc9262d5596d201译者：飞龙协议：CCBY-NC-SA4.0序言欢迎阅读本书！让我们来谈谈本书的内容以及你将从中学到的东西。本书涉及两件事：DevOps和Python。它讲述了这两者是如何相互作用的——无论你称它们为实体、哲学、框架，或者其他任何名称。本书将帮助你在技术层面上理解Python，同时也在概
Python爬虫：从图片或扫描文档中提取文字数据的完整指南 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言数据挖掘 c++
1.引言随着大数据技术的不断进步，图像数据逐渐成为了许多行业中重要的数据源之一。图像中不仅包含了丰富的视觉信息，还可能蕴含着大量的文字数据。对于科研、企业、政府等多个领域而言，如何从图片或扫描文档中提取出有价值的文字信息是一个亟待解决的问题。在这一过程中，OCR（OpticalCharacterRecognition，光学字符识别）技术成为了解决这一问题的重要工具。在本文中，我们将探讨如何使用Py
Python 取证学习指南第二版（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/46c71d4b3d6fceaba506eebc55284aa5译者：飞龙协议：CCBY-NC-SA4.0前言在编写《学习Python取证》一书时，我们有一个目标：以一种方式教授Python在取证中的应用，使得没有编程经验的读者可以立即跟随并开发出可以用于案件工作中的实用代码。但这并不意味着本书仅适合Python新手；在整个过程中，我们会逐步让读者
Python 取证学习指南第二版（三）
原文：annas-archive.org/md5/46c71d4b3d6fceaba506eebc55284aa5译者：飞龙协议：CCBY-NC-SA4.0第七章：模糊哈希哈希是DFIR中最常见的处理过程之一。这个过程允许我们总结文件内容，并分配一个代表文件内容的独特且可重复的签名。我们通常使用MD5、SHA1和SHA256等算法对文件和内容进行哈希。这些哈希算法非常有价值，因为我们可以用它们进行
低版本hive(1.2.1)UDF实现清除历史分区数据 ༺水墨石༻ hive hive UDF hive hadoop 数据仓库
目标：通过UDF实现对表历史数据清除入参：表名、保留天数N一、pom文件4.0.0com.examplehive-udf-example1.0-SNAPSHOTjarhive-udf-exampleHiveUDFfordeletingpartitionsbydateUTF-81.81.8org.apache.hivehive-exec1.2.1org.apache.hivehive-metasto
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？架构师李肯嵌入式物联网开发进阶 c语言面试性能优化
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？我相信大部分初中级C程序员在面试的过程中，可能都被问过关于memcpy函数的问题，甚至需要手撕memcpy。本文从另一个角度带你领悟一下memcpy的面试题，你可以看看是否能接得住？文章目录1写在前面2源码实现2.1函数申明2.2简单的功能实现2.3满足大数据量拷贝的功能实现3源码测试4小小总结5更多分享1写在前面假如你遇到下面的面试
shell脚本实现Hive库表迁移 docsz hive Linux shell
1、获取hive所有库的建表语句#获取hive所有库的建表语句#!/bin/bashmkdir-p~/hive/tables/tablesDDL#获取库名hive-e"showdatabases;">~/hive/databases.txtsed-i'1,3d'~/hive/databases.txtsed-i'$d'~/hive/databases.txtcat~/hive/databases.
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
大数据技术之集群数据迁移
dfs.namenode.rpc-address.nameservice1.namenode30hadoop104:8020dfs.namenode.rpc-address.nameservice1.namenode37hadoop106:8020dfs.namenode.http-address.nameservice1.namenode30hadoop104:9870dfs.namenode.
HIVE（二） 2301_78012738 hive 数据仓库
目录访问HIVE的三种方式DDLDML数据操作向表中装载数据数据导出常用函数Like和RLike分组Join排序分区表和分桶表访问HIVE的三种方式启动Hive命令，CtrlC退出客户端，执行测试语句，与sql一致[wyc@hadoop102hive]$bin/hive经验小结：在hive中执行语句报错：ExecutionError,returncode2fromorg.apache.hadoop
如何通过YashanDB优化企业大数据处理流程数据库
在当今数据驱动的商业环境中，企业面临着巨大的数据处理挑战。性能瓶颈、数据一致性问题和可扩展性需求使得大数据处理成为一项复杂任务。作为一种新兴的数据库管理系统，YashanDB以其独特的架构设计和强大的数据处理能力，在解决这些挑战方面提供了有效的手段。本文旨在探讨如何利用YashanDB优化大数据处理流程，为企业提供高效、可靠的解决方案。YashanDB的体系架构与部署形态YashanDB支持多种部
debian 安装 mysql5.7 你会忘记吃饭吗 debian 运维
cd/usr/local/src:wgethttps://downloads.mysql.com/archives/get/p/23/file/mysql-server_5.7.29-1debian10_amd64.deb-bundle.tartar-xvfxx.tarcdxx:执行dpkg-imysql-community-client_5.7.29-1debian10_amd64.deb返回S
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地