乡里伢崽

hive初始化、处理流程详解

CliDriver

初始化过程

CliDriver.main 是 Cli 的入口

（1）解析(Parse)args，放入cmdLine，处理 –hiveconf var=val 用于增加或者覆盖hive/hadoop配置，设置到System的属性中。
（2）配置log4j，加载hive-log4j.properties里的配置信息。
（3）创建一个HiveConf，设置hiveJar= hive-exec-0.6.0.jar ，初始化加载hive-default.xml、 hive-site.xml。
（4）创建一个CliSessionState（SessionState）
（5）处理-S， -e， -f， -h，-i等信息，保存在SessionState中。如果是-h，打印提示信息，并退出。
（6） –hiveconf var=val 设置的属性设置到HiveConf中。
（7） ShimLoader，load HadoopShims
（8） CliSessionState设置到SessionState中，创建一个hive_job_log_ xxx文件（用于记录Hive的一些操作信息）保存到SessionState的hiveHist 。
（9）创建CliDriver.
（10）在接受hivesql命令前，执行一些初始化命令，这些命令存在文件中，文件可以通过-i选项设置，如果没有设置就去查找是否有$HIVE_HOME/bin/.hiverc和System.getProperty("user.home")/.hiverc两个文件，如果有就执行这两个文件中的命令。
（11）如果是–e，执行命令并退出，如果是-f，执行文件中的命令并退出。
（12）创建ConsoleReader，读取用户输入，遇到“；”为一个完整的命令，执行该命令(CliDriver.processLine )，接着读取处理用户的输入。用户输入的命令记录在user.home/.hivehistory文件中。

读取用户输入hivesql，处理运行过程

CliDriver.processLine   去掉命令末尾的;，

CliDriver.processCmd

Split命令，分析第一个单词：
（1）如果是quit或者exit，不区分大小写，退出。
（2）source，执行文件中的HiveQL
（3）！，执行命令，如!ls，列出当前目录的文件信息。
（4）list，列出jar/file/archive。
（5）如果是其他，则生成调用相应的CommandProcessor处理。

CommandProcessor

CommandProcessorFactory
（1）set           SetProcessor，设置修改参数,设置到SessionState的HiveConf里。
（2）dfs           DfsProcessor，使用hadoop的 FsShell运行hadoop的命令。
（3）add         AddResourceProcessor 添加到SessionState的resource_map里，运行提交job的时候会写入 Hadoop的Distributed Cache。
（4）delete    DeleteResourceProcessor从SessionState的resource_map里删除。
（5）其他       Driver

Driver
Driver.run(String command) // 处理一条命令
{
int ret = compile(command); // 分析命令，生成Task。
ret = execute(); // 运行Task。
}

（1）词法分析，生成AST树，ParseDriver完成。
（2）分析AST树，AST拆分成查询子块，信息记录在QB，这个QB在下面几个阶段都需要用到，SemanticAnalyzer.doPhase1完成。
（3）从metastore中获取表的信息，SemanticAnalyzer.getMetaData完成。
（4）生成逻辑执行计划，SemanticAnalyzer.genPlan完成。
（5）优化逻辑执行计划，Optimizer完成，ParseContext作为上下文信息进行传递。
（6）生成物理执行计划，SemanticAnalyzer.genMapRedTasks完成。
（7）物理计划优化，PhysicalOptimizer完成，PhysicalContext作为上下文信息进行传递。
（8）执行生成的物理计划，获得结果。
（1）～（7）在Driver的compile中完成。
（8）在Driver的execute中完成，在执行阶段一个一个Task运行，不会改变物理计划。
整个Hive代码架构还不够清晰，传递的上下文信息比较臃肿，比较难理解。

Driver.compile

Driver.compile(String command) // 处理一条命令
{
(1) Context
      ctx = new Context(conf); // private Context ctx; Driver的一个字段变量
(2) Parser(antlr):HiveQL->AbstractSyntaxTree(AST)
      ParseDriver pd = new ParseDriver();
      ASTNode tree = pd.parse(command, ctx);
(3) SemanticAnalyzer
      BaseSemanticAnalyzer sem = SemanticAnalyzerFactory.get(conf, tree);
      // Do semantic analysis and plan generation
      sem.analyze(tree, ctx);
      // 说明：如果有SEMANTIC_ANALYZER_HOOK("hive.semantic.analyzer.hook",null)这个hook，那么会在sem.analyze(tree, ctx);前执行hook.preAnalyze(hookCtx, tree);在sem.analyze(tree, ctx);后执行hook.postAnalyze(hookCtx, sem.getRootTasks(), sem.getFetchTask()); 这里的hook有多个
(4) QueryPlan
   plan = new QueryPlan(command, sem);
(5) Schema
   schema = getSchema(sem, conf); // / get the output schema
}
Parser是：
使用antlr，语法规则是 Hive.g
ql/src/java目录下面的：org.apache.hadoop.hive.ql. ParseDriver

SemanticAnalyzerFactory/SemanticAnalyzer
多种SemanticAnalyzer：
(1)ExplainSemanticAnalyzer（会调用SemanticAnalyzer获得相应信息）
explain 某条HiveSQL时调用
EXPLAIN [EXTENDED] query
(2)LoadSemanticAnalyzer
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]
(3)DDLSemanticAnalyzer
SHOW TABLES、DROP TABLE、DESC TABLE等时
(4)FunctionSemanticAnalyzer
CREATE/DROP FUNCTION
(5)SemanticAnalyzer
select 等
（6）其他SemanticAnalyzer，Hive-0.6、0.7只有上面5种，trunk里面针对新功能新特性添加了相应的SemanticAnalyzer

Driver.execute

Driver.execute() // 运行命令生成的Task（一个或多个）
{
    (1) Get all the pre execution hooks and execute them.
    (2) 把root Tasks 加到 runnable队列
    (3) 运行该SQL产生的Task
        while (running.size() != 0 || runnable.peek() != null) { //task running队列不为空，或者runnable不为空。
            while (runnable.peek() != null && running.size() < maxthreads) {//runnable队列不为空
                   Task<? extends Serializable> tsk = runnable.remove();//删除runnable队列头的task
                   launchTask(tsk, queryId, noName, running, jobname, jobs, driverCxt); //运行Task，如果打开了并发提交会通过新的线程去运行Task，否则就是主线程运行Task，直到Task运行完毕，把Task对应的TaskResult和TaskRunner加入running队列
             }

             //从running队列中获取一个运行完的Task
             TaskResult tskRes = pollTasks(running.keySet());
             TaskRunner tskRun = running.remove(tskRes);
             Task<? extends Serializable> tsk = tskRun.getTask();

              int exitVal = tskRes.getExitVal(); //task完成的状态
              if (exitVal != 0) { //Task失败
                    获得task的backupTask
                    有backup，把backup加入到runnable队列，没有就需要返回return 9;，表示HiveSQL运行失败。而不是System.exit(9);
              }

               // 把task的ChildTasks加入到runnable队列。
        }
   (4) Get all the post execution hooks and execute them.
}
Driver.launchTask(Task<? extends Serializable> tsk, String queryId, boolean noName,
      Map<TaskResult, TaskRunner> running, String jobname, int jobs, DriverContext cxt){

    tsk.initialize(conf, plan, cxt); // Task初始化
    TaskResult tskRes = new TaskResult(); // task信息：是否成功执行，是否运行
    TaskRunner tskRun = new TaskRunner(tsk, tskRes);

    // Launch Task
    if (HiveConf.getBoolVar(conf, HiveConf.ConfVars.EXECPARALLEL) && tsk.isMapRedTask()) { //并发提交打开并且这个是MR task，在另一个线程中执行。
      // Launch it in the parallel mode, as a separate thread only for MR tasks
      tskRun.start();
    } else {
      tskRun.runSequential(); // 主线程执行
    }
    running.put(tskRes, tskRun); // 放入running队列
}

Task：
(1) ConditionalTask
(2) CopyTask
(3) DDLTask
(4) ExecDriver
      (5) MapRedTask
(6) ExplainTask
(7) FetchTask
(8) FunctionTask
(9) MapredLocalTask
(10) MoveTask

核心之一：SemanticAnalyzer
ql/src/java目录下面的： org.apache.hadoop.hive.ql.SemanticAnalyzer

SemanticAnalyzer. analyzeInternal(ASTNode ast)
{
        // analyze create table command
        if (ast.getToken().getType() == HiveParser.TOK_CREATETABLE) { //带有create
            isCreateTable = true;
            // if it is not CTAS, we don't need to go further and just return
            if ((child = analyzeCreateTable(ast, qb)) == null) { // create-table-as-select 返回查询子树
regular create-table or create-table-like statements 返回null
                 return;
            }
        }

doPhase1(child, qb, initPhase1Ctx());//分析AST树

getMetaData(qb); //从数据库中获得表的信息

Operator sinkOp = genPlan(qb);// AST-〉operator trees

Optimizer optm = new Optimizer();
pCtx = optm.optimize();// 优化 operator trees -〉operator trees

       // At this point we have the complete operator tree
       // from which we want to find the reduce operator
       genMapRedTasks(qb); // operator trees-〉MapReduce Tasks
}

Hive原理分析:
(1) 从HQL语句到AST的转化过程是很机械，使用ANTLR，根据Hive.g的语法分析规则，生成AST。
(2) 从AST转化到QB，再到DAG图不是那么很容易明白，所以需要理清楚一下。
AST-〉QB就是把AST里面的一些信息和子查询分析出来，如所有涉及的表和表的别名（如果这条HQL查询语句中没有为表取别名，那么取别名为表名）的对应关系保存到QB的aliasToTabs，目标表（目标表即输出的table）的子AST。where子句，select子句，join子句，等一些子查询的AST分析出来，保存起来。
QBMetaData是查询相关的元数据信息，如所有源表（源表即从哪些表取得输入数据）到该表的Table关联。表的Table用来记录Table有哪些字段，各个字段的类型，表的分隔符等等信息。目标表名（存放输出结果的表）到表的Table的关联，目标表可以有多个，因为输出可能是写入多个表。

QB-〉DAG图的转化过程。
从QB生成operator，从生成的QB中的子查询生成Operator并保存记录它们之间的父子关系，还可能插入一些operator，这些operator是一些必要的辅助功能。
后面需要对这个DAG图，即operator图进行拆分，生成一些mapreduce作业（job），如有一个map阶段可能有多个operator，完成这些operator的功能，如某个Job的map执行多个operator，TableScanOperator是第一个operator，从读取一个表的数据开始（一条一条记录,record），在接着可能就是跟据where生成的operator（FilterOperator），过滤哪些不符合规则的记录（record,key/value），在接着是执行根据select生成的Select Operator（该operator选择仅需要的字段，过滤无关的字段，从而减少中间数据），最后是一个Reduce Output Operator，该operator完成map的输出，生成中间key和value。
作业的reduce也是可以执行多个operator的。

从QB生成的Operator里面有父子关系，生成mapreduce时，会对这个具有父子关系的operator图进行切分，生成一个个阶段，有些阶段是mapreduce作业，这些作业执行多个operator的功能。

ReduceSinkOperator是map的最后一个Operator，因为该operator需要生成一个map的输出，即输出key和输出value。

生成Operator树的过程：SemanticAnalyzer.genPlan(QB qb)
(1) 子查询必须有一个别名即alias，遍历所有的子查询，出现多个子查询在Join时出现，join两边的表都是来自子查询。
(2) 遍历所有的源表，出现多个在join时出现。
(3)处理join，在on条件中的过滤条件会推到join前即ReduceSinkOperator前，如果是一个join，那么先生成两个ReduceSinkOperator，然后再生成JoinOperator，join这两个表。
下面的是在SemanticAnalyzer.genBodyPlan(QB qb, Operator input) 里面完成。
(4) optimizeMultiGroupBy
（4.1）optimizeMultiGroupBy可以优化时走的路径跟下面的不相同。
     (4.2)    对每个select进行处理，多个select出现在Multi-Group-By Inserts、Multi Table/File Inserts、Dynamic-partition Insert等情况下。multi_insert.q


SemanticAnalyzer.doPhase1(ASTNode ast, QB qb, Phase1Ctx ctx_1) {
     switch (ast.getToken().getType()) {
         case HiveParser.TOK_SELECTDI:
         case HiveParser.TOK_SELECT:
            （1）在QBParseInfo里保存select查询子节点，Map<String, ASTNode> destToSelExpr;
            （2）有hint，在QBParseInfo保存hints子节点，ASTNode hints;
            （3）处理ast子树的聚合函数，HiveParser.TOK_FUNCTION、TOK_FUNCTIONDI、TOK_FUNCTIONSTAR，
            （4）处理select中column别名Map<ASTNode, String> exprToColumnAlias;
            （5）保存聚合函数，QBParseInfo的LinkedHashMap<String, LinkedHashMap<String, ASTNode>> destToAggregationExprs;
            （6）TOK_FUNCTIONDI，抽取保存distinct聚合函数，HashMap<String, List<ASTNode>> destToDistinctFuncExprs;
         case HiveParser.TOK_WHERE:
               在QBParseInfo里保存where查询子节点，HashMap<String, ASTNode> destToWhereExpr;
         case HiveParser.TOK_DESTINATION:
               在QBParseInfo里面保存目标地址子节点信息，HashMap<String, ASTNode> nameToDest;
         case HiveParser.TOK_FROM:
               只有一个子节点，有四种子节点
                （1）一种是表，数据来源于一个表。processTable，处理别名，没有别名表名就是别名。
                （2）一种是子查询，数据来源于子查询，processSubQuery，子查询必须要有个别名，子查询可能是单独的一个query或者是两个query的union。子查询也是递归调用doPhase1来完成相关分析。
                （3）一种是视图，数据来源于一个视图，processLateralView
                （4）一种是Join，数据来源于几个表的join，processJoin，join子节点的孩子节点是两个或者三个，孩子节点可以是表、子查询、join子节点，保存join子查询ASTNode joinExpr;
         case HiveParser.TOK_CLUSTERBY:
                在QBParseInfo里保存cluster by查询子节点，HashMap<String, ASTNode> destToClusterby;
         case HiveParser.TOK_DISTRIBUTEBY:
               在QBParseInfo里保存distribute by查询子节点，有distribute by的时候不能有cluster by和order by，HashMap<String, ASTNode> destToDistributeby;
         case HiveParser.TOK_SORTBY:
               在QBParseInfo里保存sort by查询子节点，有sort by的时候不能有cluster by和order by，HashMap<String, ASTNode> destToSortby;
         case HiveParser.TOK_ORDERBY:
               在QBParseInfo里保存order by查询子节点，有order by的时候不能有cluster by，HashMap<String, ASTNode> destToOrderby;
         case HiveParser.TOK_GROUPBY:
               在QBParseInfo里保存group by查询子节点，HashMap<String, ASTNode> destToGroupby;
         case HiveParser.TOK_LIMIT:
               在QBParseInfo里保存limit查询子节点，HashMap<String, Integer> destToLimit;
         case HiveParser.TOK_UNION:
     }

         if (!skipRecursion) {
      // Iterate over the rest of the children
      int child_count = ast.getChildCount();
      for (int child_pos = 0; child_pos < child_count; ++child_pos) {
        // Recurse
        doPhase1((ASTNode) ast.getChild(child_pos), qb, ctx_1); //递归处理各个孩子节点
      }
    }
}

SemanticAnalyzer.getMetaData(QB qb) {
         （1）从数据库中获取表的信息，这些表是记录在QB的HashMap<String, String> aliasToTabs;中
         表的别名和对应的org.apache.hadoop.hive.ql.metadata.Table保存记录在QB的QBMetaData qbm;的HashMap<String, Table> aliasToTable;中。
         （2）如果有子查询，递归调用getMetaData(QB qb)从数据库获取表的信息
         （3）获取目的表的信息
                   目的子节点存储在QBParseInfo的HashMap<String, ASTNode> nameToDest;
                   目的节点有2种：（3.1）目的是表，表分分区表和非分区表（3.2）目的是本地目录或者hdfs目录，获得设置一个中间临时目录
}

SemanticAnalyzer.genPlan(QB qb){
    （1）处理子查询，生成子查询的operator tree
    （2）遍历source tables，记录保存在QB的HashMap<String, String> aliasToTabs;里面，对每个源表生成一个TableScanOperator，保存到SemanticAnalyzer的HashMap<TableScanOperator, Table> topToTable;里
    （3）处理视图
    （4）处理join
    （5）genBodyPlan，生成剩下的operator tree.
}

SemanticAnalyzer.genBodyPlan(QB qb, Operator input) {
      （1）multi-group by优化
      （2）遍历所有的destination tables，保存记录在QBParseInfo的Map<String, ASTNode> destToSelExpr;里，从select获得。
               （2.1）有where语句生成FilterOperator，从QBParseInfo.destToWhereExpr里查询
               （2.2）有group by或者聚合函数，根据相关配置生成相应operator tree.
               （2.3）生成SelectOperator，选取相应字段，来自select语句
               （2.4）有cluster by 或者distribute by或者order by或者sort by生成相应的ReduceSinkOperator和ExtractOperator，如果是order by设置reduce数为1
               （2.5）分两种情况，qbp是子查询与qbp不是子查询
                            （2.5.1）是子查询
                            （2.5.2）不是子查询
                                  有limit，生成相应的LimitOperator，这里需要分情况，是否需要两个MR
                                  如果需要进行类型转换则生成相应的SelectOperator，生成FileSinkOperator
}

Optimizer.optimize() {

}

SemanticAnalyzer.genMapRedTasks(QB qb) {

}

核心之二：MapRedTask
TaskRunner：
public void runSequential() {
    int exitVal = -101;
    try {
      exitVal = tsk.executeTask(); //运行Task.executeTask()
    } catch (Throwable t) {
      t.printStackTrace();
    }
    result.setExitVal(exitVal);
}
Task：
public int executeTask() {
      int retval = execute(driverContext); //各个子类实现该方法
}
protected abstract int execute(DriverContext driverContext);
这里介绍MapRedTask这个Task.

MapRedTask：
public int execute(DriverContext driverContext) {
（1） setNumberOfReducers(); // estimate number of reducers   推测reduce个数
（2） if (!ctx.isLocalOnlyExecutionMode() &&
          conf.getBoolVar(HiveConf.ConfVars.LOCALMODEAUTO)) { //HiveConf.ConfVars.HADOOPJT不是local，并且LOCALMODEAUTO("hive.exec.mode.local.auto", true)打开
//hive.exec.mode.local.auto用于小job自动转换为本地运行，should hive determine whether to run in local mode automatically
           判断job能否本地运行，目前的判断条件是：(一)输入数据小于等于128M (二)map数小于等于4 (三) reduce数小于等于1，这3个条件都满足，该任务就在本地运行。
         }
（3）计算得到 runningViaChild
      runningViaChild =
        "local".equals(conf.getVar(HiveConf.ConfVars.HADOOPJT)) ||
        conf.getBoolVar(HiveConf.ConfVars.SUBMITVIACHILD);
       //如果是本地运行或者通过子进程提交作业，runningViaChild为true
      (3.1) 如果runningViaChild为false，super.execute(driverContext); ExecDriver.execute完成task。
      (3.2) 如果runningViaChild为true，通过子进程完成
               executor = Runtime.getRuntime().exec(cmdLine, env, new File(workDir));
               子进程的入口main函数是ExecDriver.main()
}

核心之三：ExecDriver
/home/tianzhao/apache/hive-0.6.0/build/hadoopcore/hadoop-0.19.1/bin/hadoop jar /home/tianzhao/apache/hive-0.6.0/build/ql/hive-exec-0.6.0.jar org.apache.hadoop.hive.ql.exec.ExecDriver -plan /tmp/hive-tianzhao/hive_2011-05-31_09-30-02_222_4000721282829102058/plan5577504731701425227.xml -jobconf datanucleus.connectionPoolingType=DBCP
使用hadoop jar hive-exec-0.6.0.jar org.apache.hadoop.hive.ql.exec.ExecDriver提交job给hadoop，作业的信息诸如operator等信息序列化到了 -plan plan5577504731701425227.xml里面。
ExecMapper、ExecReducer在configure(JobConf job)运行的时候会反序列化出来。
hive提交给hadoop的MapReduce作业，map阶段运行ExecMapper，reduce阶段运行ExecReducer。

add jar/add file/add archive，这些archive、jar和文件会写入 Distributed Cache里面。在MapTask和ReduceTask运行的时候读取调用。写入Distributed Cache参考ExecDriver。

ExecDriver使用JobClient提交Job后，定期查看Job的进展情况，Job完成后，调用operator的jobClose()方法。

hive.exec.plan
org.apache.hadoop.hive.ql.exec.Utilities.setMapRedWork() 会设置plan的ID

ExecDriver.execute(DriverContext driverContext) {
    (1) 创建ScratchDir目录
    (2) 设置mapper类，reducer类等等
           job.setMapperClass(ExecMapper.class);
    (3) 如果有MapredLocalWork，并且不是localMode，那么上传文件到HDFS，该文件加入DistributedCache。场景用于auto map join，auto map join会产生两个Task：MapredLocalTask+MapRedTask。 MapredLocalTask将小表的数据从hdfs fetch下来，put到一个HashTable，写入到本地的一个文件中。在MapRedTask中把本地的这个文件写入hdfs，add到DistributedCache，就是当前的部分。这里的小表写入HashTable合并相同的key，只需要在client端做一次，在map端只需要读取使用即可。加入DistributedCache是为了一个TaskTracker多次运行MapTask使用到一个文件时不需要多次下载，只需一次下载即可。
（4）MapredWork写入hdfs，副本数设置为10，加入DistributedCache
          Utilities.setMapRedWork(job, work, ctx.getMRTmpFileURI());
   （5）创建JobClient
          JobClient jc = new JobClient(job);
   （6）运行PrejobHooks
          runPreJobHooks(); // Call the Pre-job hooks' list
    （7）提交job
         orig_rj = rj = jc.submitJob(job);
     （8）定时检测job时候运行完成
         private void progress(ExecDriverTaskHandle th) throws IOException {
                 while (!rj.isComplete()) {
                        Thread.sleep(pullInterval); // pullInterval默认是1000L，HIVECOUNTERSPULLINTERVAL("hive.exec.counters.pull.interval", 1000L)，通过hive.exec.counters.pull.interval可以设置
                        updateCounters(th); //获取更新进度信息
                        String report = " " + getId() + " map = " + mapProgress + "%, reduce = " + reduceProgress
          + "%"; // 打印这行进度信息
                 }
                 // while循环外，job已经结束
                 runPostJobHooks(rj); //运行PostJobHooks
         }
      （9）清理操作
      （10）运行Operator的jobClose方法
            for (Operator<? extends Serializable> op : work.getAliasToWork().values()) {
                  op.jobClose(job, success, feedBack);
            }
            work.getReducer().jobClose(job, success, feedBack);
      （11）return (returnVal); 返回
}

ExecDriver.main( )
两个地方调用
（1）MapRedTask   ：
           在本地执行或者通过子进程提交两种方式下会调用。
           ExecDriver.main(String[] args) {
               } else {
                     MapredWork plan = Utilities.deserializeMapRedWork(pathData, conf);
                     ExecDriver ed = new ExecDriver(plan, conf, isSilent);
                     ret = ed.execute(new DriverContext());
               }
           }
（2）MapredLocalTask ：
           启动子进程执行
           ExecDriver.main(String[] args) {
                     if (localtask) {
                         memoryMXBean = ManagementFactory.getMemoryMXBean();
                         MapredLocalWork plan = Utilities.deserializeMapRedLocalWork(pathData, conf);
                         MapredLocalTask ed = new MapredLocalTask(plan, conf, isSilent);
                         ret = ed.executeFromChildJVM(new DriverContext()); // 从hdfs上面获取小表数据，写到HashTable中，然后dump到本地的一个文件。
                     }
           }

http://bupt04406.iteye.com/blog/1096504

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
Presto【基础 01】简介+架构+数据源+数据模型 2401_84254343 程序员架构
一个Catalog包含Schema和Connector。例如，配置JMX的Catalog，通过JXMConnector访问JXM信息。当执行一条SQL语句时，可以同时运行在多个Catalog。Presto处理table时，是通过表的完全限定（fully-qualified）名来找到Catalog。例如，一个表的权限定名是hive.test_data.test，则test是表名，test_data是
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
大数据之flink与hive 星辰_mya 大数据 flink hive
其实吧我不太想写flink，因为线上经验确实不多，这也是我需要补的地方，没有条件创造条件，先来一篇吧flink：高性能低延迟流批一体的分布式计算框架基于事件时间对实时数据精准处理快速响应支持批处理，高效离线分析和数据挖掘数据仓库的引擎丰富数据源/接收器，集成多种数据存储格式和源，比较常见就是咱们今天的主题hive了checkpoint恢复机制，故障恢复快速恢复计算任务分布式弹性扩展，据业务灵活增加
hive血缘关系之输入表与目标表的解析 zxfBdd hive 大数据治理大数据
接了一个新需求：需要做数据仓库的血缘关系。正所谓兵来将挡水来土掩，那咱就动手吧。血缘关系是数据治理的一块，其实有专门的第三方数据治理框架，但考虑到目前的线上环境已经趋于稳定，引入新的框架无疑是劳民伤财，伤筋动骨，所以就想以最小的代价把这个事情给做了。目前我们考虑做的血缘关系呢只是做输入表和输出表，最后会形成一张表与表之间的链路图。这个东西的好处就是有助于仓库人员梳理业务，后面可能还会做字段之间的血
初级练习[3]:Hive SQL子查询应用大数据深度洞察 Hive hive sql hadoop 数据仓库大数据数据库
目录环境准备看如下链接子查询查询所有课程成绩均小于60分的学生的学号、姓名查询没有学全所有课的学生的学号、姓名解释：没有学全所有课，也就是该学生选修的课程数<总的课程数。查询出只选修了三门课程的全部学生的学号和姓名环境准备看如下链接环境准备https://blog.csdn.net/qq_45115959/article/details/142057624?spm=1001.2014.3001.5
Linux下载压缩包：tar.gz、zip、tar.bz2格式全攻略 promise524 Linux linux 运维服务器后端 bash shell
在Linux中，下载各种格式的压缩包（如.tar.gz、.zip、.tar.bz2等）通常使用命令行工具如wget和curl。1.使用wget下载压缩包wget是Linux中最常用的文件下载工具，支持HTTP、HTTPS、FTP等协议，可以直接从命令行下载文件。基本命令：wget[URL]下载.tar.gz文件wgethttps://test.com/archive.tar.gz此命令将从指定的U
Anaconda版本和Python版本对应关系纬领网络 python anaconda3
官网下载地址：https://repo.anaconda.com/archive/下载地址：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/anaconda3版本基础python版本Anaconda3-2024.06-1Python3.12.4Anaconda3-2024.02-1Python3.11.7Anaconda3-2023.09
R语言包AMORE安装报错问题以及RStudio与Rtools环境配置卡卡_R-Python R语言数据分析与可视化 r语言开发语言
在使用R语言进行AMORE安装时会遇到报错，这时候需要采用解决办法：'''AMORE包安装，需要离线官网下载安装包：Indexof/src/contrib/Archive/AMORE(r-project.org)https://cran.r-project.org/src/contrib/Archive/AMORE/一、出现的问题最近开始学习R语言，安装了最新版的R4.4.1和RStudio，但安
中级练习[3]：Hive SQL用户行为与商品销售数据分析大数据深度洞察 Hive hive 数据仓库大数据 sql
目录1.用户累计消费金额及VIP等级查询1.1题目需求1.2代码实现2.首次下单后第二天连续下单的用户比率查询2.1题目需求2.2代码实现3.每个商品销售首年的年份、销售数量和销售金额统计3.1题目需求3.2代码实现1.用户累计消费金额及VIP等级查询1.1题目需求从订单信息表(order_info)中统计每个用户截止其每个下单日期的累积消费金额，以及每个用户在其每个下单日期的VIP等级。VIP等
Python基础知识进阶之正则表达式_头歌python正则表达式进阶前端陈萨龙程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
博客园怎么了？ YYH1992
新年好，给大家拜个早年！今年来到安徽过年，无聊中，不知不觉中又来到博客园了（忠实粉丝哦），却发现一件奇怪的事情，请看截图难道博客园被挂马了？抑或其它问题？如果真有问题，还请dudu抓紧时间修正，免得影响我们园子的声誉！我要下线了，出去买回家的车票了，只能年后回家了。。。转载于:https://www.cnblogs.com/HollisYao/archive/2008/02/06/1065351.
linux下文件的复制、移动与删除搬砖中年人
一、文件复制命令cp命令格式：cp[-adfilprsu]源文件(source)目标文件(destination)cp[option]source1source2source3...directory参数说明：-a:是指archive的意思，也说是指复制所有的目录-d:若源文件为连接文件(linkfile)，则复制连接文件属性而非文件本身-f:强制(force)，若有重复或其它疑问时，不会询问用户
2024年最全使用Python求解方程_python解方程(1)，字节面试官迟到 2401_84569545 程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
兼容 Trino Connector，扩展 Apache Doris 数据源接入能力｜Lakehouse 使用手册 vvvae1234 apache
ApacheDoris内置支持包括Hive、Iceberg、Hudi、Paimon、LakeSoul、JDBC在内的多种Catalog，并为其提供原生高性能且稳定的访问能力，以满足与数据湖的集成需求。而随着ApacheDoris用户的增加，新的数据源连接需求也随之增加。因此，从3.0版本开始，ApacheDoris引入了TrinoConnector兼容框架。Trino/Presto作为业界较早应用
SAP HANA makaitai BW sap 数据库工具报表 layer 服务器
原文地址：http://LiuAlex.com/archives/1776也是刚刚开始学习HANA的一些知识，一边看书一遍做笔记，说到底无非是用自己的语言来理解标准帮组文档所讲解的意思，肯定有理解失误的地方，毕竟没有参加过标准培训，即使有培训，从老师那边来的知识也不可能是完整的传授过来，中间多少的知识遗漏是正常的，所以多看看HELP的文档，应该可以原汁原味的理解作者的意思。这张图片是从SAPHAN
Hive SQL查询汇总分析大数据深度洞察 Hive hive sql hadoop 数据仓库数据库大数据
目录SQL查询汇总分析成绩查询查询编号为“02”的课程的总成绩查询参加考试的学生个数分组查询查询各科成绩最高和最低的分查询每门课程有多少学生参加了考试（有考试成绩）查询男生、女生人数分组结果的条件查询平均成绩大于60分的学生的学号和平均成绩查询至少选修四门课程的学生学号查询同姓（假设每个学生姓名的第一个字为姓）的学生名单并统计同姓人数大于2的姓查询每门课程的平均成绩，结果按平均成绩升序排序，平均成
RMAN-08137 rman delete archivelog force jnrjian 数据库 oracle
deleteforcearchiveloguntiltime'trunc(sysdate-4)'backedup1timestodevicetypedisk;SymptomsDatabaseAClonedtoDatabaseBonCloneserver.GoldenGateisConfiguredonSourcedatbaseA.DatabaseBwhichisclonedfromSourcedo
hive表格统计信息不准确 weixin_41956627 hive hive hadoop 数据仓库
问题描述有个hive分区表，orc存储格式，有个分区，查询selectcount(1)fromtablewheredt='yyyyMMdd'结果是0，但查询select*fromtablewheredt='yyyyMMdd'又能查到数据，去hdfs对应目录下查看，也能看到有数据文件解决执行如下sqlANALYZETABLEdb.table1PARTITION(dt='20240908')COMPU
Conda创建环境失败：000和404错误柚柚柚柚柚 conda
一、首先下载Anaconda1.打开网址Indexof/anaconda/archive/|清华大学开源软件镜像站|TsinghuaOpenSourceMirror，滑到最底部，下载Anaconda3-5.3.1-Linux-x86_64.sh。2.使用winscp拖动本地的Anaconda3-5.3.1-Linux-x86_64.sh到服务器的个人工作目录下。二、安装Anaconda软件，创建虚
C#中两个问号的含义 weixin_30363981 测试
stringstrParam=Request.Params["param"]??"";取??左边的值,如果??左边的值为null则取右边的值转载于:https://www.cnblogs.com/shadowtale/archive/2012/10/19/2731152.html
如何下载各个版本的tomcat-比如tomcat9 耳边轻语999 tomcat java
1，找到tomcat官网https://tomcat.apache.org/ApacheTomcat®-Welcome!找到tomcat9，或者archives1.1，找到对应版本1.2，找到小版本1.3，找到bin2，Indexof/dist/tomcat/tomcat-9/v9.0.39/bin2.1，下载对应的解压版本或者安装版本
Percona-toolkit工具详解小一_d28d
1.pt工具安装[root@master~]#yuminstall-ypercona-toolkit-3.1.0-2.el7.x86_64.rpm2.常用工具使用介绍2.1pt-archiver归档表#重要参数--limit100每次取100行数据用pt-archive处理--txn-size100设置100行为一个事务提交一次，--where'id>/root/db/checksum.logpt
Ubuntu更换apt-get的下载源愤愤的有痣青年
将以下内容替换/etc/apt/sources.list中的内容deb-srchttp://archive.ubuntu.com/ubuntuxenialmainrestricted#Addedbysoftware-propertiesdebhttp://mirrors.aliyun.com/ubuntu/xenialmainrestricteddeb-srchttp://mirrors.aliy
apt 下载指定架构的包及离线安装的方法错误重复学习记录 linux
#设置系统架构sudodpkg--add-architectureamd64#安装apt-rdependssudoaptinstallapt-rdepends#创建单独的目录mkdir-p/home/apt/postgresql-client-common#仅下载安装包sudoapt-getinstall--download-onlysudomv/var/cache/apt/archives/*/
游戏运营环节的一些关键转化率 turtle081025 数据分析游戏网络游戏运营
转载于http://www.gamedatas.com/archives/134转化率这个指标在各行各业的数据分析中运用的非常之广泛，例如：电商中就会存在，点击到订单生成的一系列转化率，传统的销售行业也会在做广告的时候考虑该广告能够转化多少订单，而在游戏行业，转化率同样是一个不容忽视的指标。一般来说，游戏运营的过程中主要会关注到这些转化率：1.下载-安装（激活）转化率；2.安装（激活）-注册转化率
Python API操作RocketMQ 京城小筑 #Python编程 python
背景：开发背景:公司相关报表需求需要将订单业务数据同步至RocketMQ中，由于需要保证开发的一致性(多个部门协同开发)，所以采用读取Hive离线数据的方式通过PythonAPI写入RocketMQ中，便于其他开发同事调用~开发环境:本地调试系统MacPython3.7.5rocketmq0.4.4(Python模块)rocketmq-client-python2.0.0(Python模块)服务器
hive搭建 -----内嵌模式和本地模式 lzhlizihang hive hadoop
文章目录一、内嵌模式（使用较少）1、上传、解压、重命名2、配置环境变量3、配置conf下的hive-env.sh4、修改conf下的hive-site.xml5、启动hadoop集群6、给hdfs创建文件夹7、修改hive-site.xml中的非法字符8、初始化元数据9、测试是否成功10、内嵌模式的缺点二、本地模式（最常用）1、检查mysql是否正常2、上传、解压、重命名3、配置环境变量4、修改c
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

hive初始化、处理流程详解

你可能感兴趣的:(hive)