图数据库NebulaGraph

读 NebulaGraph源码｜查询语句 LOOKUP 的一生

本文由社区用户 Milittle 供稿

LOOKUP 是图数据库 NebulaGraph 的一个查询语句。它依赖索引，可以查询点或者边的信息。在本文，我将着重从源码的角度解析一下 LOOKUP 语句的一生是如何度过的。

本文源码阅读基于内核源码的 v3.3.0 版本，详见 GitHub https://github.com/vesoft-inc/nebula/releases/tag/v3.3.0

读源码之前

首先，我们需要明确 NebulaGraph 中 LOOKUP 语句的语法：

LOOKUP ON {<vertex_tag> | <edge_type>}
[WHERE <expression> [AND <expression> ...]]
YIELD <return_list> [AS <alias>]
[<clause>];

<return_list>
    <prop_name> [AS <col_alias>] [, <prop_name> [AS <prop_alias>] ...];

是 Tag 的类型，比如：数据集 basketballplayer 中的 player 和 team；
是 EdgeType 的类型，比如：数据集 basketballplayer 中的 follow 和 serve；
是表达式；
是返回的列表，比如：id(vertex)，这部分内容详细参见 nGQL 的 Schema 函数 nGQL Schema 函数详解；
是子句，可以是 ORDER BY、LIMIT 等子句，子句详情参见子句；

这里有个 LOOKUP 使用注意事项：

如果已经存在点、边，但是没有索引。必须在新建索引后再通过 REBUILD INDEX 重建索引，才能使其生效；

读语句解析原理

为了便于大家理解这里放一张 NebulaGraph 计算层的服务架构：

我们再来看下此次阅读的语句，是一个比较简单的 LOOKUP Sentence。用比较简单的语句来解析 LOOKUP 语句的基本原理，后面可以慢慢扩展条件语句和子句：

// 我们需要分析以下语句
LOOKUP ON player YIELD id(vertex);

1. 从 Parser 开始

我们先从 Parser 入手分析 LOOKUP Sentence 的组成部分。这里不介绍 lex 词法分析和 yacc 语法分析，感兴趣的小伙伴自己可以了解一下。下面，我们直接上我们关心的部分：

我们打开源码，找到文件 src/parser/parser.yy 文件，里面有所有语句的定义。我们定位到 LOOKUP Sentence，是这里 https://github.com/Milittle/nebula/blob/90a3107044ce1621c7834a0f36a4eef273ec2f31/src/parser/parser.yy#L2176。下面便是 LOOKUP 语句的定义，你也可以拷贝上面的链接访问 GitHub 查看。来，我们分析分析每个部分：

/// LOOKUP 语句的语法定义

lookup_sentence
    : KW_LOOKUP KW_ON name_label lookup_where_clause yield_clause {
        $$ = new LookupSentence($3, $4, $5);
    }
    ;

// KW_LOOKUP 是 LOOKUP 的关键字，大小写不敏感的
// KW_ON 是 ON 的关键字，大小写不敏感的
// name_label 是 LABEL 的定义，也是 strval，简单的说就是字符串
// lookup_where_clause 是 WHERE 子句的定义，这个我们后面有机会扩展介绍，也有一个对应的语义定义
// yield_clause 这个是 YIELD 输出数据的关键语句，在 v3.x 版本以后，YIELD 子句是必须要指定的，不指定会报语法错误

/// YIELD clause 的语法定义，其实 YIELD clause 用在了很多其他语句中，比如 GO、FIND PATH、GET SUBGRAPH

yield_clause
    : %empty { $$ = nullptr; }
    | KW_YIELD yield_columns {
        if ($2->hasAgg()) {
            delete($2);
            throw nebula::GraphParser::syntax_error(@2, "Invalid use of aggregating function in yield clause.");
        }
        $$ = new YieldClause($2);
    }
    | KW_YIELD KW_DISTINCT yield_columns {
        if ($3->hasAgg()) {
            delete($3);
            throw nebula::GraphParser::syntax_error(@3, "Invalid use of aggregating function in yield clause.");
        }
        $$ = new YieldClause($3, true);
    }
    ;

// 可以为 empty，但是后面 validator 会进行校验，不指定就会报 Error
// KW_YIELD 是 YIELD 的关键字，大小写不敏感
// yield_columns 是输出的列信息，也有对应的一个语法定义
// KW_DISTINCT 是 distinct 关键字，表示是否去除重复数据的语义，大小写不敏感

// LOOKUP Sentence 就是上面所有的信息组成，都会被构造在这个类里面，也就是 LOOKUP 语句的内容了

下面，我们继续从 lookup_sentence 语句的定义往下规约看，可以看到它属于 src/parser/parser.yy:2917: traverse_sentence → src/parser/parser.yy:2936: piped_sentence → src/parser/parser.yy:2942: set_sentence → src/parser/parser.yy:3924: sentence → src/parser/parser.yy:3933: seq_sentence。

其实，上面这些你可以暂时忽略，因为这些都是对 sentence 的规约抽象，有些集合语句和管道语句。这里，我想表达的是这些语句一定会映射到 seq_sentence 上的，即，序列语句。你可以把它理解为用分号分隔的复合语句，只不过这里面只包含了一条 lookup_sentence 而已。这样子，就好理解为什么下文在 seq_sentence 寻找入口代码，而不是 lookup_sentence.

2. 从 nGQL 解析看 LOOKUP 语句

第二，从 nGQL 的解析过程继续看 LOOKUP Sentence。其实，刚才已经强调过了，这里解析出来的对象一定是 seq_sentence。

/// src/graph/service/QueryInstance.cpp

void QueryInstance::execute() {
  Status status = validateAndOptimize(); // 1. 负责 validate、执行计划生成、执行计划优化等工作
  if (!status.ok()) {
    onError(std::move(status));
    return;
  }

  // Sentence is explain query, finish
  if (!explainOrContinue()) {  // 6. 判断是否是 explain 语句。如果是，直接输出执行计划，不做实际物理算子执行
    onFinish();
    return;
  }

  // The execution engine converts the physical execution plan generated by the Planner into a
  // series of Executors through the Scheduler to drive the execution of the Executors.
  scheduler_->schedule()    // 7. 实际物理算子调度执行的部分，通过 DAG，对每一个 plan -> executor 的转换执行（后续步骤会进行详解）
      .thenValue([this](Status s) {
        if (s.ok()) {
          this->onFinish(); // 8. 这里是干完了所有物理执行计划，然后开始处理客户端 resp 了
        } else {
          this->onError(std::move(s)); // 9. 这里是上面的过程出错了，需要处理 Error 信息
        }
      }) // 10. 下面是处理一些异常情况，也是走错误分支
      .thenError(folly::tag_t<ExecutionError>{},
                 [this](const ExecutionError &e) { onError(e.status()); })
      .thenError(folly::tag_t<std::exception>{},
                 [this](const std::exception &e) { onError(Status::Error("%s", e.what())); });
}

// 这个函数执行的是注释 1 的内容
Status QueryInstance::validateAndOptimize() {
  auto *rctx = qctx()->rctx();
  auto &spaceName = rctx->session()->space().name;
  VLOG(1) << "Parsing query: " << rctx->query();
  // Result of parsing, get the parsing tree
  // 2. 第一步中的语法解析就是这里的解释，对 nGQL 进行词法语法解析，出来的 result 就是 Sentence*，通过我们上面的分析，这里吐出来的就是 seq_sentence 了
  auto result = GQLParser(qctx()).parse(rctx->query());
  NG_RETURN_IF_ERROR(result);
  sentence_ = std::move(result).value();
  // 3. 这里是做指标的统计。这个可以在 dashboard 里面展示
  if (sentence_->kind() == Sentence::Kind::kSequential) {
    size_t num = static_cast<const SequentialSentences *>(sentence_.get())->numSentences();
    stats::StatsManager::addValue(kNumSentences, num);
    if (FLAGS_enable_space_level_metrics && spaceName != "") {
      stats::StatsManager::addValue(
          stats::StatsManager::counterWithLabels(kNumSentences, {{"space", spaceName}}), num);
    }
  } else {
    stats::StatsManager::addValue(kNumSentences);
    if (FLAGS_enable_space_level_metrics && spaceName != "") {
      stats::StatsManager::addValue(
          stats::StatsManager::counterWithLabels(kNumSentences, {{"space", spaceName}}));
    }
  }

  // Validate the query, if failed, return
  // 4. 这个是源码校验 nGQL 解析出来的内容是否符合我们的预期，如果不符合预期就报语法错误
  // validate 过程还会涉及到执行计划的生成，重点函数
  NG_RETURN_IF_ERROR(Validator::validate(sentence_.get(), qctx()));
  // Optimize the query, and get the execution plan
  // 5. 对上面生成的执行计划进行 RBO 规则的优化，这个留在后面有机会再介绍
  NG_RETURN_IF_ERROR(findBestPlan());
  stats::StatsManager::addValue(kOptimizerLatencyUs, *(qctx_->plan()->optimizeTimeInUs()));
  if (FLAGS_enable_space_level_metrics && spaceName != "") {
    stats::StatsManager::addValue(
        stats::StatsManager::histoWithLabels(kOptimizerLatencyUs, {{"space", spaceName}}));
  }

  return Status::OK();
}

我们按照上面的注释部分进行讲解，有的比较容易的部分，像注释 1、2、3、5。我们下面重点介绍注释 4 的部分

// src/graph/validator/Validator.cpp

// Entry of validating sentence.
// Check session, switch space of validator context, create validators and validate.
// static
// 1. 参数 sentence 就是刚才我们从语法解析器中拿到的 seq_sentence
// 2. 参数 qctx 是我们查询上下文，一个语句进来对应一个查询上下文，这个是在 QueryEngine 里面生成的，感兴趣可以自行阅读一下
Status Validator::validate(Sentence* sentence, QueryContext* qctx) {
  DCHECK(sentence != nullptr);
  DCHECK(qctx != nullptr);

  // Check if space chosen from session. if chosen, add it to context.
  auto session = qctx->rctx()->session();
  if (session->space().id > kInvalidSpaceID) {
    auto spaceInfo = session->space();
    qctx->vctx()->switchToSpace(std::move(spaceInfo));
  }

  // 3. 既然我们需要校验该 sentence 是否符合我们的预期，则需要根据 sentence 的类型，创建一个 validator，记住目前是 seq_sentence
  // 所以生成的就是 SequentialValidator，可以直接看下 makeValidator 函数的 switch case
  auto validator = makeValidator(sentence, qctx);
  // 4. 调用 validator 进行校验，我们切换到下面的函数中
  NG_RETURN_IF_ERROR(validator->validate());

  auto root = validator->root();
  if (!root) {
    return Status::SemanticError("Get null plan from sequential validator");
  }
  qctx->plan()->setRoot(root);
  return Status::OK();
}

// 5. 所有子类 validator，调用 validate 方法，进行校验
// Validate current sentence.
// Check validator context, space, validate, duplicate reference columns,
// check permission according to sentence kind and privilege of user.
Status Validator::validate() {
  if (!vctx_) {
    VLOG(1) << "Validate context was not given.";
    return Status::SemanticError("Validate context was not given.");
  }

  if (!sentence_) {
    VLOG(1) << "Sentence was not given";
    return Status::SemanticError("Sentence was not given");
  }

  if (!noSpaceRequired_ && !spaceChosen()) {
    VLOG(1) << "Space was not chosen.";
    return Status::SemanticError("Space was not chosen.");
  }

  if (!noSpaceRequired_) {
    space_ = vctx_->whichSpace();
    VLOG(1) << "Space chosen, name: " << space_.spaceDesc.space_name_ref().value()
            << " id: " << space_.id;
  }

  auto vidType = space_.spaceDesc.vid_type_ref().value().type_ref().value();
  vidType_ = SchemaUtil::propTypeToValueType(vidType);

  // 6. 调用子类 validateImpl
  NG_RETURN_IF_ERROR(validateImpl());

  // Check for duplicate reference column names in pipe or var statement
  NG_RETURN_IF_ERROR(checkDuplicateColName());

  // Execute after validateImpl because need field from it
  if (FLAGS_enable_authorize) {
    NG_RETURN_IF_ERROR(checkPermission());
  }

  // 7. 这里是生成执行计划调用
  NG_RETURN_IF_ERROR(toPlan());

  return Status::OK();
}

讲了这么久了，啥时候到 LOOKUP。只能说快了，因为第一次讲源码，一些上下文信息需要讲清楚，不然大家一看就看得云里雾里了。

3. 深入到 validator

下面，我们要进入 SequentialValidator.cpp 的 validateImpl() 去一探究竟。

// src/graph/validator/SequentialValidator.cpp

// Validator of sequential sentences which combine multiple sentences, e.g. GO ...; GO ...;
// Call validator of sub-sentences.
Status SequentialValidator::validateImpl() {
  Status status;
  if (sentence_->kind() != Sentence::Kind::kSequential) {
    return Status::SemanticError(
        "Sequential validator validates a SequentialSentences, but %ld is "
        "given.",
        static_cast<int64_t>(sentence_->kind()));
  }
  auto seqSentence = static_cast<SequentialSentences*>(sentence_);
  auto sentences = seqSentence->sentences();

  if (sentences.size() > static_cast<size_t>(FLAGS_max_allowed_statements)) {
    return Status::SemanticError("The maximum number of statements allowed has been exceeded");
  }

  DCHECK(!sentences.empty());

  // 我们的 StartNode 就是这里创建出来的
  seqAstCtx_->startNode = StartNode::make(seqAstCtx_->qctx);
  // 一般序列语句中会放很多语句，也就是分号分隔的语句，这里我们只有一条语句就是 lookup_sentence
  // LOOKUP 语句创建出来 LookupValidator，终于看到曙光了
  for (auto* sentence : sentences) {
    auto validator = makeValidator(sentence, qctx_);
    NG_RETURN_IF_ERROR(validator->validate());
    seqAstCtx_->validators.emplace_back(std::move(validator));
  }

  return Status::OK();
}

4. 读一读 LookupValidator

终于，看到点 LOOKUP 的影子了，LookupValidator 驾到：

// src/graph/validator/LookupValidator.cpp

// LOOKUP 的 validateImpl 比较简洁，直接对 From Where Yield e分别进行校验

Status LookupValidator::validateImpl() {
  lookupCtx_ = getContext<LookupContext>();

  // 详情请见下面的子函数分析
  NG_RETURN_IF_ERROR(validateFrom());
  // 此次不涉及，我们先不做分析
  NG_RETURN_IF_ERROR(validateWhere());
  // 详情请见下面的子函数分析
  NG_RETURN_IF_ERROR(validateYield());
  return Status::OK();
}

// Validate specified schema(tag or edge) from sentence
Status LookupValidator::validateFrom() {
  auto spaceId = lookupCtx_->space.id;
  auto from = sentence()->from();
  // 根据 spaceId 和指定的 label_name 查询 Schema
  auto ret = qctx_->schemaMng()->getSchemaIDByName(spaceId, from);
  NG_RETURN_IF_ERROR(ret);
  // 指定的是不是边类型
  lookupCtx_->isEdge = ret.value().first;
  // 指定的 schemaId
  lookupCtx_->schemaId = ret.value().second;
  schemaIds_.emplace_back(ret.value().second);
  return Status::OK();
}

// Validate yield clause.
Status LookupValidator::validateYield() {
  auto yieldClause = sentence()->yieldClause();
  if (yieldClause == nullptr) {
    return Status::SemanticError("Missing yield clause.");
  }
  // 这个是判断是否指定了 distinct 关键字，用于后续生成 dedup
  lookupCtx_->dedup = yieldClause->isDistinct();
  lookupCtx_->yieldExpr = qctx_->objPool()->makeAndAdd<YieldColumns>();

  // 如果是边类型，返回的列中，有 src、dst、rank、type
  if (lookupCtx_->isEdge) {
    idxReturnCols_.emplace_back(nebula::kSrc);
    idxReturnCols_.emplace_back(nebula::kDst);
    idxReturnCols_.emplace_back(nebula::kRank);
    idxReturnCols_.emplace_back(nebula::kType);
    // 校验边类型
    NG_RETURN_IF_ERROR(validateYieldEdge());
  } else { // 如果点类型、返回的列中有 vid
    idxReturnCols_.emplace_back(nebula::kVid);
    // 校验点类型，这次我们介绍点类型的校验
    NG_RETURN_IF_ERROR(validateYieldTag());
  }
  if (exprProps_.hasInputVarProperty()) {
    return Status::SemanticError("unsupport input/variable property expression in yield.");
  }
  if (exprProps_.hasSrcDstTagProperty()) {
    return Status::SemanticError("unsupport src/dst property expression in yield.");
  }
  extractExprProps();
  return Status::OK();
}

// Validate yield clause when lookup on tag.
// Disable invalid expressions, check schema name, rewrites expression to fit semantic,
// check type and collect properties.
Status LookupValidator::validateYieldTag() {
  auto yield = sentence()->yieldClause();
  auto yieldExpr = lookupCtx_->yieldExpr;
  // yield 子句里面的每一个逗号分隔的就是一个 col、我们的示例语句是 id(vertex)
  // src/parser/parser.yy:1559 对 col 进行了定义
  for (auto col : yield->columns()) {
    // 如果发现表达式有 Edge 类型的，则直接把语义错误
    if (ExpressionUtils::hasAny(col->expr(), {Expression::Kind::kEdge})) {
      return Status::SemanticError("illegal yield clauses `%s'", col->toString().c_str());
    }
    // 如果是 label 属性，则进行表达式名字的校验，比如 yield player.name 这种语句
    if (col->expr()->kind() == Expression::Kind::kLabelAttribute) {
      const auto& schemaName = static_cast<LabelAttributeExpression*>(col->expr())->left()->name();
      if (schemaName != sentence()->from()) {
        return Status::SemanticError("Schema name error: %s", schemaName.c_str());
      }
    }
    // 这块应该是重写表达式，有 label 属性转换为 Tag 的 prop，这里不是特别清楚，后续精读一下
    col->setExpr(ExpressionUtils::rewriteLabelAttr2TagProp(col->expr()));
    NG_RETURN_IF_ERROR(ValidateUtil::invalidLabelIdentifiers(col->expr()));

    auto colExpr = col->expr();
    // 推测表达式的类型
    auto typeStatus = deduceExprType(colExpr);
    NG_RETURN_IF_ERROR(typeStatus);
    // 组织输出，由名字和类型组成的集合对象
    outputs_.emplace_back(col->name(), typeStatus.value());
    yieldExpr->addColumn(col->clone().release());
    NG_RETURN_IF_ERROR(deduceProps(colExpr, exprProps_, &schemaIds_));
  }
  return Status::OK();
}

到这里，LOOKUP 的 validator 工作差不多完事了。

5. 语句如何变成执行计划

介绍得不够细致，我还在熟悉过程，接下来就是介绍将 sentence 转换成执行计划的过程了。

执行计划生成

执行计划的生成，像是一些简单的语句，就通过子类的 validator 的 toPlan 直接生成了，比如：SHOW HOSTS 这个语句，就是直接在 ShowHostsValidator::toPlan 方法中直接生成执行计划。但是，对于一些比较复杂的语句来说，子类 validator 都没有实现 toPlan 方法，也就是需要借助父类的 toPlan 方法来生成执行计划。比如，本文在读的 LOOKUP 语句也属于复杂语句：

// src/graph/validator/Validator.cpp

// 这里就是复杂语句生成执行计划的入口
// 需要配合 AstContext 来生成，对于 LOOKUP 语句来说，就是 LookupContext
// Call planner to get final execution plan.
Status Validator::toPlan() {
  // **去子类 LookupValidator 的 getAstContext() 方法看下，是不是返回的是 LookupContext**
  auto* astCtx = getAstContext();
  if (astCtx != nullptr) {
    astCtx->space = space_;
  }
  // 利用抽象语法树上下文，借用 Planner 的 toPlan 生成具体的执行计划
  auto subPlanStatus = Planner::toPlan(astCtx);
  NG_RETURN_IF_ERROR(subPlanStatus);
  auto subPlan = std::move(subPlanStatus).value();
  // 将返回的 subPlan 对 root 和 tail 进行填充
  root_ = subPlan.root;
  tail_ = subPlan.tail;
  VLOG(1) << "root: " << root_->kind() << " tail: " << tail_->kind();
  return Status::OK();
}

6. 进入 toPlan() 一探究竟

从章节 5. 上面获知，需要进入 Planner 的 toPlan 方法一探究竟

// src/graph/planner/Planner.cpp

StatusOr<SubPlan> Planner::toPlan(AstContext* astCtx) {
  if (astCtx == nullptr) {
    return Status::Error("AstContext nullptr.");
  }
  const auto* sentence = astCtx->sentence;
  DCHECK(sentence != nullptr);
  // 从抽象语法树的执行上下文取到我们的 sentence
  // 下面的 plannerMap 是我们在 src/graph/planner/PlannersRegister.cpp 注册好的，一些复杂的语句都在这里注册好了
  auto planners = plannersMap().find(sentence->kind());
  if (planners == plannersMap().end()) {
    return Status::Error("No planners for sentence: %s", sentence->toString().c_str());
  }
  for (auto& planner : planners->second) { // second 是语句具体对应的 planner 的实例化对象： MatchAndInstantiate
    if (planner.match(astCtx)) { // match 方法是具体 planner 的 match 方法，对应到 LookupPlaner，就是 match
      // 这里的 instantiate 是 LookupPlanner 的 make 方法
      // 这里的 transform 是拿着 lookupcontext 生成执行计划的函数
      return planner.instantiate()->transform(astCtx);
    }
  }
  return Status::Error("No planner matches sentence: %s", sentence->toString().c_str());
}

7. 计划中的 transform()

我们分析到这里，使用了 Planner 的 toPlan 方法生成一些复杂语句的执行计划。接下来，就是进去 LookupPlanner 的 transform 方法从 LookupContext 转换到执行计划的过程了。我们直接定位到 LookupPlanner 的 transform 方法上：

// src/graph/planner/ngql/LookupPlanner.cpp

StatusOr<SubPlan> LookupPlanner::transform(AstContext* astCtx) {
  // 是不是我们上面提到的 lookupContext
  auto lookupCtx = static_cast<LookupContext*>(astCtx);
  auto qctx = lookupCtx->qctx;
  // ON 后面的 name_label
  auto from = static_cast<const LookupSentence*>(lookupCtx->sentence)->from();
  SubPlan plan;
  
  // 如果是边的话，生成的是 EdgeIndexFullScan
  if (lookupCtx->isEdge) {
    auto* edgeIndexFullScan = EdgeIndexFullScan::make(qctx,
                                                      nullptr,
                                                      from,
                                                      lookupCtx->space.id,
                                                      {},
                                                      lookupCtx->idxReturnCols,
                                                      lookupCtx->schemaId,
                                                      lookupCtx->isEmptyResultSet);
    edgeIndexFullScan->setYieldColumns(lookupCtx->yieldExpr);
    plan.tail = edgeIndexFullScan;
    plan.root = edgeIndexFullScan;
  } else { // 如果是点的话，生成的是 TagIndexFullScan
    auto* tagIndexFullScan = TagIndexFullScan::make(qctx,
                                                    nullptr,
                                                    from,
                                                    lookupCtx->space.id,
                                                    {},
                                                    lookupCtx->idxReturnCols,
                                                    lookupCtx->schemaId,
                                                    lookupCtx->isEmptyResultSet);
    tagIndexFullScan->setYieldColumns(lookupCtx->yieldExpr);
    plan.tail = tagIndexFullScan;
    plan.root = tagIndexFullScan;
  }
  plan.tail->setColNames(lookupCtx->idxColNames);

  // 我们没有指定 where 语句，所以不会有 filter 算子
  if (lookupCtx->filter) {
    plan.root = Filter::make(qctx, plan.root, lookupCtx->filter);
  }
  // 会有 Project 算子生成：对输出列做一个映射
  plan.root = Project::make(qctx, plan.root, lookupCtx->yieldExpr);
  // 这里是 distinct 关键字，我们没有指定，默认是没有这个算子的
  if (lookupCtx->dedup) {
    plan.root = Dedup::make(qctx, plan.root);
  }

  return plan;
}

8. explain 验证生成的执行计划

通过我们上述的介绍，执行计划已经生成了。那么，我们是不是可以通过 explain 或者 profile 来验证我们分析生成的执行计划就是 Project→TagIndexFullScan→Start 呢。下面是我们通过 explain 生成的执行计划，它验证了我们分析的源码和生成的执行计划是一致的。大喜

(root@nebula) [basketballplayer]> explain lookup on player yield id(vertex)
Execution succeeded (time spent 615µs/1.057064ms)

Execution Plan (optimize time 42 us)

-----+------------------+--------------+----------------+-----------------------------------
| id | name             | dependencies | profiling data | operator info                    |
-----+------------------+--------------+----------------+-----------------------------------
|  2 | Project          | 3            |                | outputVar: {                     |
|    |                  |              |                |   "colNames": [                  |
|    |                  |              |                |     "id(VERTEX)"                 |
|    |                  |              |                |   ],                             |
|    |                  |              |                |   "type": "DATASET",             |
|    |                  |              |                |   "name": "__Project_2"          |
|    |                  |              |                | }                                |
|    |                  |              |                | inputVar: __TagIndexFullScan_1   |
|    |                  |              |                | columns: [                       |
|    |                  |              |                |   "id(VERTEX)"                   |
|    |                  |              |                | ]                                |
-----+------------------+--------------+----------------+-----------------------------------
|  3 | TagIndexFullScan | 0            |                | outputVar: {                     |
|    |                  |              |                |   "colNames": [                  |
|    |                  |              |                |     "_vid",                      |
|    |                  |              |                |     "player._tag",               |
|    |                  |              |                |     "player.age",                |
|    |                  |              |                |     "player.name"                |
|    |                  |              |                |   ],                             |
|    |                  |              |                |   "type": "DATASET",             |
|    |                  |              |                |   "name": "__TagIndexFullScan_1" |
|    |                  |              |                | }                                |
|    |                  |              |                | inputVar:                        |
|    |                  |              |                | space: 6                         |
|    |                  |              |                | dedup: false                     |
|    |                  |              |                | limit: 9223372036854775807       |
|    |                  |              |                | filter:                          |
|    |                  |              |                | orderBy: []                      |
|    |                  |              |                | schemaId: 7                      |
|    |                  |              |                | isEdge: false                    |
|    |                  |              |                | returnCols: [                    |
|    |                  |              |                |   "_vid",                        |
|    |                  |              |                |   "_tag",                        |
|    |                  |              |                |   "age",                         |
|    |                  |              |                |   "name"                         |
|    |                  |              |                | ]                                |
|    |                  |              |                | indexCtx: [                      |
|    |                  |              |                |   {                              |
|    |                  |              |                |     "columnHints": [],           |
|    |                  |              |                |     "filter": "",                |
|    |                  |              |                |     "index_id": 11               |
|    |                  |              |                |   }                              |
|    |                  |              |                | ]                                |
-----+------------------+--------------+----------------+-----------------------------------
|  0 | Start            |              |                | outputVar: {                     |
|    |                  |              |                |   "colNames": [],                |
|    |                  |              |                |   "type": "DATASET",             |
|    |                  |              |                |   "name": "__Start_0"            |
|    |                  |              |                | }                                |
-----+------------------+--------------+----------------+-----------------------------------

阶段小结

源码阅读到这里，我们知道 Graph 层从一个 nGQL 语句，到生成执行计划的所有过程。当中可能有一些细节没有面面俱到，但是，我们应该整体对代码有了初步了解。

9. 调度执行计划

接下来，我们要了解执行计划是如何被物理执行、Executor 是如何调度执行计划的。目前，我们只涉及到三个物理算子的执行，而且 Start 节点是一个没有实际语义的算子。这里我们仔细分析一下 TagIndexScan 和 Project 算子。

我们需要先回到第二章节的注释 7 那里了。注释 5 我们就不讲了，那里是内核语句 RBO 规则对执行计划进行优化的子模块，我们的简单语句的执行计划不涉及这块，留下后续扩展介绍吧。

// src/graph/scheduler/AsyncMsgNotifyBasedScheduler.cpp
// 我们回到了注释 7 那里，对 scheduler_ 的 shcedule 方法解读一下
// 然后我们再看 LOOKUP 语句的两个物理算子在这里是怎么执行的
// 目前内核只实现了基于消息的异步调度器
folly::Future<Status> AsyncMsgNotifyBasedScheduler::schedule() {
  // 拿到执行计划的 root 节点，在这次的语句中，就是 Project
  auto root = qctx_->plan()->root();
  // 这块还没有深入解读过，后续再扩展吧
  if (FLAGS_enable_lifetime_optimize) {
    // special for root
    root->outputVarPtr()->userCount.store(std::numeric_limits<uint64_t>::max(),
                                          std::memory_order_relaxed);
    analyzeLifetime(root);
  }
  // 递归将执行计划 convert 到物理执行计划 Executor，也就是 Project->ProjectExecutor, TagindexFullScan->IndexScanExecutor
  // 把物理 Executor 的拓扑结构创建出来
  //    ProjectExecutor 依赖 IndexScanExecutor IndexScanExecutor 的后继是 ProjectExecutor
  //    IndexScanExecutor 依赖 StartExecutor StartExecutor 的后继是 IndexScanExecutor
  auto executor = Executor::create(root, qctx_);
  // 这里开始 DAG 的物理计划执行
  // 调度是基于 folly 的 Promise 和 Future 异步调用展开的
  return doSchedule(executor);
}

folly::Future<Status> AsyncMsgNotifyBasedScheduler::doSchedule(Executor* root) const {
  // 这个是按照算子的 id，承诺给别的算子的 promise（你可以理解为谁依赖这个算子，那么就给谁一个 promise）
  std::unordered_map<int64_t, std::vector<folly::Promise<Status>>> promiseMap;
  // 这个是当前算子，被谁许诺过的 future，是从 promise 那里或者的结果值。也就是说，如果这个算子依赖了某些算子，只有它们的许诺兑现了（promise set value），这里的 future 才能得到处理
  std::unordered_map<int64_t, std::vector<folly::Future<Status>>> futureMap;
  // 这个 queue 是为了辅助算子生成 promiseMap 和 futureMap 的
  std::queue<Executor*> queue;
  // 这个 queue2 是为结合刚才生成的 promiseMap 和 futureMap 实际进行调度运行的
  std::queue<Executor*> queue2;
  // 算子节点访问标记，避免重复遍历
  std::unordered_set<Executor*> visited;

  auto* runner = qctx_->rctx()->runner();
  // 首先把 root 的 promise 出来，这个对于我们的执行计划中的算子就是 Project
  folly::Promise<Status> promiseForRoot;
  auto resultFuture = promiseForRoot.getFuture();
  promiseMap[root->id()].emplace_back(std::move(promiseForRoot));
  queue.push(root);
  visited.emplace(root);
  // 开始 DAG 访问图计算节点，生成每一个节点的 promise 和 future
  while (!queue.empty()) {
    auto* exe = queue.front();
    queue.pop();
    queue2.push(exe);

    std::vector<folly::Future<Status>>& futures = futureMap[exe->id()];
    if (exe->node()->kind() == PlanNode::Kind::kArgument) {
      auto nodeInputVar = exe->node()->inputVar();
      const auto& writtenBy = qctx_->symTable()->getVar(nodeInputVar)->writtenBy;
      for (auto& node : writtenBy) {
        folly::Promise<Status> p;
        futures.emplace_back(p.getFuture());
        auto& promises = promiseMap[node->id()];
        promises.emplace_back(std::move(p));
      }
    } else {
      for (auto* dep : exe->depends()) {
        auto notVisited = visited.emplace(dep).second;
        if (notVisited) {
          queue.push(dep);
        }
        folly::Promise<Status> p;
        futures.emplace_back(p.getFuture());
        auto& promises = promiseMap[dep->id()];
        promises.emplace_back(std::move(p));
      }
    }
  }
  // 开始调度执行，下面的 scheduleExecutor 这个方法是关键
  // 这个方法是纯异步运行的，比如运行 ProjectExecutor，它的依赖是 IndexScanExecutor
  // 那么 ProjectExecutor 的 future 就来自于 IndexScanExecutor 的 promise
  // ProjectExecutor 需要在 folly::collect 出等待 IndexScanExecutor 的执行结束
  // 这样 ProjectExecutor 才可以得到执行的机会
  while (!queue2.empty()) {
    auto* exe = queue2.front();
    queue2.pop();

    auto currentFuturesFound = futureMap.find(exe->id());
    DCHECK(currentFuturesFound != futureMap.end());
    auto currentExeFutures = std::move(currentFuturesFound->second);

    auto currentPromisesFound = promiseMap.find(exe->id());
    DCHECK(currentPromisesFound != promiseMap.end());
    auto currentExePromises = std::move(currentPromisesFound->second);

    scheduleExecutor(std::move(currentExeFutures), exe, runner)
        .thenTry([this, pros = std::move(currentExePromises)](auto&& t) mutable {
          if (t.hasException()) {
            notifyError(pros, Status::Error(std::move(t).exception().what()));
          } else {
            auto v = std::move(t).value();
            if (v.ok()) {
              notifyOK(pros); // **Promise填充：成功以后具体填充promise的地方**
            } else {
              notifyError(pros, v);
            }
          }
        });
  }

  return resultFuture;
}

// 你可以把这个函数理解为异步调度器，上面把所有的算子通过这个函数进行了调度
// 第一个参数包含了该算子所有的 futures，也就是这个算子依赖算子的 promise 需要执行结束，这里的 futures 才可以获取到结果
// 第二个参数是该算子的 Executor
// 第三个参数是执行器，你可以理解为线程池

// 根据不同的算子类型，实现不同的分支运行，我们上面的语句是走 default 分支
// lookup on player yield id(vertex)；语句整体的调度过程
// ProjectExecutor(P)->IndexScanExecutor(I)->Start(S）执行计划。下面我们用简写来表示三个算子
// 首先 P 算子调度以后，它到了 default 分支，depends 不为空，那么走 runExecutor
// P 算子的 future 就来自于 I 算子的 promise，所以需要等待 I 算子的执行结束
// I 算子调度到这个函数以后，它到了 default 分支，depends 不为空，那么走 runExecutor
// I 算子的 future 就来自于 S 算子的 promise，所以需要等待 S 算子的执行结束
// S 算子调度到这个函数以后，它到了 default 分支，depends 为空，那么走 runLeafExecutor
// S 算子就开始 execute 的逻辑了，可以去看看 StartExecutor 的 executor 方法，啥也没干，所以之前说 start 算子没啥语义
// S 算子结束以后，它的 promise 被填充，其实是上面那个函数的回调填充的，具体看我上面的注释 **Promise 填充**
// 那么 I 算子的 future 就得到了响应，去 runExecutor 看看，是不是也是有一个回调，立马发起了 I 算子的调用
// 当 I 算子的 promise 也被上面的函数填充
// 那么 P 算子的 executor 也得到了执行，这下就算执行完
folly::Future<Status> AsyncMsgNotifyBasedScheduler::scheduleExecutor(
    std::vector<folly::Future<Status>>&& futures, Executor* exe, folly::Executor* runner) const {
  switch (exe->node()->kind()) {
    case PlanNode::Kind::kSelect: {
      auto select = static_cast<SelectExecutor*>(exe);
      return runSelect(std::move(futures), select, runner);
    }
    case PlanNode::Kind::kLoop: {
      auto loop = static_cast<LoopExecutor*>(exe);
      return runLoop(std::move(futures), loop, runner);
    }
    case PlanNode::Kind::kArgument: {
      return runExecutor(std::move(futures), exe, runner);
    }
    default: {
      if (exe->depends().empty()) {
        return runLeafExecutor(exe, runner);
      } else {
        return runExecutor(std::move(futures), exe, runner);
      }
    }
  }
}

10. LOOKUP 语句的算子在执行什么？

上面我介绍了物理算子通过 folly 三方库的 Promise 和 Future 异步编程模型来实现调度执行。接下来，重点介绍一下我们本次 LOOKUP 语句中两个算子执行了什么。源码走起：上面的语句主要介绍了三个物理算子：ProjectExecutor、IndexScanExecutor、StartExecutor。这里多说一句，因为和 IndexScan 有关的算子都会映射到 IndexScanExecutor。

// StartExecutor：啥也没干

// IndexScanExecutor：是主要干活的，需要 graph 和 storage 的 rpc，拉取数据

// ProjectExecutor：这个物理执行算子不需要和 storage 交互，直接在 graph 层闭环计算

// 这三个算子，我们只分析后两个算子的源码：

// src/graph/executor/query/IndexScanExecutor.cpp

folly::Future<Status> IndexScanExecutor::execute() {
  return indexScan();
}

folly::Future<Status> IndexScanExecutor::indexScan() {
  // 拿到和 storage 交互的 storageClient
  StorageClient *storageClient = qctx_->getStorageClient();
  auto *lookup = asNode<IndexScan>(node());
  if (lookup->isEmptyResultSet()) {
    DataSet dataSet({"dummy"});
    return finish(ResultBuilder().value(Value(std::move(dataSet))).build());
  }

  const auto &ictxs = lookup->queryContext();
  auto iter = std::find_if(
      ictxs.begin(), ictxs.end(), [](auto &ictx) { return !ictx.index_id_ref().is_set(); });
  if (ictxs.empty() || iter != ictxs.end()) {
    return Status::Error("There is no index to use at runtime");
  }
  // Req 的公共请求参数
  StorageClient::CommonRequestParam param(lookup->space(),
                                          qctx()->rctx()->session()->id(),
                                          qctx()->plan()->id(),
                                          qctx()->plan()->isProfileEnabled());
  return storageClient
      ->lookupIndex(param,
                    ictxs,
                    lookup->isEdge(), // 是不是边类型
                    lookup->schemaId(), // schemaId
                    lookup->returnColumns(), // resp 返回的列数据
                    lookup->orderBy(), // 是否带有 orderBy，为了下推 TopN 算子
                    lookup->limit(qctx_)) // 是否带有 limit，为了下推 limit 算子
      .via(runner())
      .thenValue([this](StorageRpcResponse<LookupIndexResp> &&rpcResp) {
        addStats(rpcResp, otherStats_);
        return handleResp(std::move(rpcResp));
      });
}

// TODO(shylock) merge the handler with GetProp
template <typename Resp>
Status IndexScanExecutor::handleResp(storage::StorageRpcResponse<Resp> &&rpcResp) {
  auto completeness = handleCompleteness(rpcResp, FLAGS_accept_partial_success);
  if (!completeness.ok()) {
    return std::move(completeness).status();
  }
  auto state = std::move(completeness).value();
  nebula::DataSet v;
  // 把每一个 resp 拉出来处理，因为我们 storage 是可以分布式部署的
  // 这里有一个问题重点提出一下，结果集会维护在 ectx_ 中，供 ProjectExecutor 一会取
  for (auto &resp : rpcResp.responses()) {
    if (resp.data_ref().has_value()) {
      nebula::DataSet &data = *resp.data_ref();
      // TODO: convert the column name to alias.
      if (v.colNames.empty()) {
        v.colNames = data.colNames;
      }
      v.rows.insert(v.rows.end(), data.rows.begin(), data.rows.end());
    } else {
      state = Result::State::kPartialSuccess;
    }
  }
  if (!node()->colNames().empty()) {
    DCHECK_EQ(node()->colNames().size(), v.colNames.size());
    v.colNames = node()->colNames();
  }
  return finish(
      ResultBuilder().value(std::move(v)).iter(Iterator::Kind::kProp).state(state).build());
}

// src/graph/executor/query/ProjectExecutor.cpp

folly::Future<Status> ProjectExecutor::execute() {
  SCOPED_TIMER(&execTime_);
  auto *project = asNode<Project>(node());
  // 刚才说从 storage 获取的结果数据都放在 ectx_ 里面了
  auto iter = ectx_->getResult(project->inputVar()).iter();
  DCHECK(!!iter);
  QueryExpressionContext ctx(ectx_);

  // 默认 max_job_size 是 1，我们先看 if 分支，看 handleJob 到底干了啥
  if (FLAGS_max_job_size <= 1) {
    auto ds = handleJob(0, iter->size(), iter.get());
    return finish(ResultBuilder().value(Value(std::move(ds))).build());
  } else {
    DataSet ds;
    ds.colNames = project->colNames();
    ds.rows.reserve(iter->size());

    auto scatter = [this](size_t begin, size_t end, Iterator *tmpIter) -> StatusOr<DataSet> {
      return handleJob(begin, end, tmpIter);
    };

    auto gather = [this, result = std::move(ds)](auto &&results) mutable {
      for (auto &r : results) {
        auto &&rows = std::move(r).value();
        result.rows.insert(result.rows.end(),
                           std::make_move_iterator(rows.begin()),
                           std::make_move_iterator(rows.end()));
      }
      finish(ResultBuilder().value(Value(std::move(result))).build());
      return Status::OK();
    };

    return runMultiJobs(std::move(scatter), std::move(gather), iter.get());
  }
}

DataSet ProjectExecutor::handleJob(size_t begin, size_t end, Iterator *iter) {
  auto *project = asNode<Project>(node());
  auto columns = project->columns()->clone();
  DataSet ds;
  ds.colNames = project->colNames();
  QueryExpressionContext ctx(qctx()->ectx());
  ds.rows.reserve(end - begin);
  // 从头到尾遍历数据，去除关心的数据
  for (; iter->valid() && begin++ < end; iter->next()) {
    Row row;
    for (auto &col : columns->columns()) {
      Value val = col->expr()->eval(ctx(iter)); // 这个是表达式的 eval 执行，对于我们 id(vertex) 对应的是：src/common/function/FunctionManager.cpp:1832 auto &attr = functions_["id"];
      row.values.emplace_back(std::move(val)); // 这个对于 id(vertex) 的 val 来说，就是 vertex.id
    ds.rows.emplace_back(std::move(row));
  }
  return ds;
}

11. 数据结果显示

我们通过物理执行算子，把数据放在最后一个算子的 ProjectExecutor 的 ectx_(ExecutionContext) 里面了。我们接下来就是要知道，哪个流程把这个执行上下文的数据取走了：给客户端的 resp 填充这些数据，最终显示到我们的 nebula-console，或者其他客户端中。Its time to go back to 章节 2. 的注释 8：

// 请看第二步的注释 8：
this->onFinish(); // 8. 这里是干完了所有物理执行计划，然后开始处理客户端 resp 了

// 我们进到 onFinish 函数看下：
void QueryInstance::onFinish() {
  auto rctx = qctx()->rctx();
  VLOG(1) << "Finish query: " << rctx->query();
  auto &spaceName = rctx->session()->space().name;
  rctx->resp().spaceName = std::make_unique<std::string>(spaceName);
  // 这个函数做了填充结果数据到 resp 中
  fillRespData(&rctx->resp());

  auto latency = rctx->duration().elapsedInUSec();
  rctx->resp().latencyInUs = latency;
  addSlowQueryStats(latency, spaceName);
  rctx->finish();

  rctx->session()->deleteQuery(qctx_.get());
  // The `QueryInstance' is the root node holding all resources during the
  // execution. When the whole query process is done, it's safe to release this
  // object, as long as no other contexts have chances to access these resources
  // later on, e.g. previously launched uncompleted async sub-tasks, EVEN on
  // failures.
  delete this;
}

 // 把执行的数据从 ectx 中取出，然后填充到执行 resp 中，这次语句执行就结束了
// Get result from query context and fill the response
void QueryInstance::fillRespData(ExecutionResponse *resp) {
  auto ectx = DCHECK_NOTNULL(qctx_->ectx());
  auto plan = DCHECK_NOTNULL(qctx_->plan());
  const auto &name = plan->root()->outputVar();
  if (!ectx->exist(name)) return;

  auto &&value = ectx->moveValue(name);
  if (!value.isDataSet()) return;

  // Fill dataset
  auto result = value.moveDataSet();
  if (!result.colNames.empty()) {
    // 结果填充
    resp->data = std::make_unique<DataSet>(std::move(result));
  } else {
    // 如果有错误，错误码和错误信息
    resp->errorCode = ErrorCode::E_EXECUTION_ERROR;
    resp->errorMsg = std::make_unique<std::string>("Internal error: empty column name list");
    LOG(ERROR) << "Empty column name list";
  }
}

小结

目前为止，我们把 LOOKUP 是怎么在内核中执行的一生的源码解读就做完了。有很多细节没有展开，后续的文章中我们将不断展开。其实，对于任意一个语句，基本执行的流程和 LOOKUP 的一生都类似，其中有不同的地方就是额外的算子不同，算子之间处理的逻辑不同。而且，这次我们没有打开 Storage 服务的代码，可以作为一个遗留项。

祝大家都可以在 NebulaGraph 图数据库的源码世界里面翱翔，欢迎大家和我来进行交流，学习 Wey Gu 的方式，给大家留一个微信联系方式：echo TWlsaXR0bGVUaW1l | base64 -d Call me.

谢谢你读完本文 (///▽///)

要来近距离体验一把图数据库吗？现在可以用用 NebulaGraph Cloud 来搭建自己的图数据系统哟，快来节省大量的部署安装时间来搞定业务吧~ NebulaGraph 阿里云计算巢现 30 天免费使用中，点击链接来用用图数据库吧~

想看源码的小伙伴可以前往 GitHub 阅读、使用、(^з)-☆ star 它 -> GitHub；和其他的 NebulaGraph 用户一起交流图数据库技术和应用技能，留下「你的名片」一起玩耍呢~

你可能感兴趣的:(Nebula,Graph,数据库,java,mysql)

Java实现二叉树 zhangpeng455547940 数据结构与算法设计 Java java 开发语言
二叉树实现类importjava.io.*;publicclassBST{privatestaticclassBSTNodeimplementsSerializable{Comparabledata;BSTNodeleft;BSTNoderight;publicBSTNode(){}publicBSTNode(Comparabledata){this.data=data;}publicBSTNod
Linux安装mysql8 zhangpeng455547940 计算机数据库 linux mysql 服务器
1、安装包解压卸载mariadbrpm-qa|grepmariadbrpm-emariadb-libs-5.5.68-1.el7.x86_64--nodeps解压安装包tar-xvfmysql-8.0.31-linux-glibc2.12-x86_64.tartar-xvfmysql-8.0.31-linux-glibc2.12-x86_64.tar.xz2、新建用户和组groupaddmysql
数据处理领域有OLTP和OLAP两大类型驭风少年56 每日知识分享学习
OLTP全称OnlineTransactionProcessing联机事务处理系统存储的是业务数据，记录某类业务事件的发生，suchas:下单，注册，支付等等。典型代表有Mysql,Oracle等数据库，对应的网站，系统应用后端数据库应用比较简单，数据量相对较少，是GB级别的，面向业务开发人员。OLAP全称是OnlineAnalyticalProcessing联机分析处理系统存储多业务历史数据，支
Java后端面试八股文：系统化学习指南，告别零散知识点钢板兽高频八股 java 面试后端 jvm redis mysql linux
Java后端面试中的八股大家通常都会参考小林或者JavaGuide，但是这些八股内容太多了，字数成万，我们基本上是看一遍忘一遍，自己也曾经根据网上面经整理过自己的八股题库，通篇共有五万字，知识点也很散，所以想把每个部分的内容系统地写成文章，比如JVM部分的八股，我会写两到三篇的文章帮助自己系统地理解这部分的八股知识，所以这篇文章会按照分块整理自己发布过的所有八股文章，这篇文章后续也会持续更新，也起
关于java：如何一次向arraylist添加多个值？ sqzr316 Java
Howtoaddmanyvaluestoanarraylistatonce?假设我有以下代码：Stringa="sometexte";Stringb="text";Stringc="sf";Stringd="kjel";Stringe="lkjl";ArrayListlist=newArrayList();//betterwaytodoalltheseaddswithouthavingtotype
市面上的OLTP和OLAP工具有哪些研创通之逍遥峰数据库数据分析
市面上的OLTP（OnlineTransactionProcessing，联机事务处理）和OLAP（OnlineAnalyticalProcessing，联机分析处理）系统或数据库众多，它们各自具有不同的特点和应用场景。以下是对市面上主流的OLTP和OLAP系统或数据库的归纳：OLTP系统或数据库OLTP系统主要用于处理大量的短期在线事务，支持高并发、实时性强、数据一致性要求高。常见的OLTP系统
MySQL精选面试题米二 mysql 数据库 oracle
文章目录1.sql优化2.数据库优化3.悲观锁和乐观锁4.共享锁与排他锁5.索引的目的是什么？6.B+Tree对比BTree的优点：6.1磁盘读写代价更低6.2查询速度更稳定且能存更多索引6.3B+树叶子节点两两相连增快区间访问7.聚簇索引和非聚簇索引的区别8.forupdate9.间隙锁GapLocks10.临键锁Next-KeyLocks11.MVCC是什么?1.sql优化对查询进行优化，应尽
java-练习-学生管理系统 3coo Java java 开发语言
该文章为本人学习复习用本人为Java自学新手，代码实现可能存在冗余或设计不当之处，恳请各位前辈：1⃣指出代码中的不合理实现2⃣推荐更优的解决方案3⃣相关技术扩展建议这个代码是我在看黑马的时候自己看项目文档敲的后续学了static初始化然后我使用在了我的这个学生管理系统不知道为什么static初始化数据没添加进去还出现了空指针的问题,问了很多ai建议都是在getindex方法中的if修改为:if(u
OLAP与OLTP：数据处理系统的两种核心架构思静鱼 #Mysql-数据库架构
文章目录OLAP和OLTP的主要区别OLAP常见数据库和OLTP常见数据库OLAP是英文OnlineAnalyticalProcessing的缩写，中文称为联机分析处理。它是一种基于多维数据模型的分析处理技术，用于从不同的角度进行数据挖掘和分析，以帮助用户快速发现数据之间的相关性和趋势。OLAP技术通常涉及到预计算、缓存和查询优化等方面的技术，可用于构建在线分析系统（OLAP系统）。该系统将大量的
java 如何解决SQL注入攻击红团子的码农生活 java sql oracle
问题描述action=login&start=login&login=a&password=+or1=1%23&user_type=1&page=1。被sql注入了怎么解决原因分析：提示：首先，用户的注入语句中，password参数的值是+or1=1%23，解码后应该是"or1=1#"，这显然是一个经典的SQL注入尝试，利用逻辑或使条件永真，注释掉后续的密码验证。参考搜索结果中的例子，比如‌1和‌
Windows下安装kafka 计算机软件程序设计环境搭建 windows kafka 分布式
在Windows系统下安装Kafka可以按照以下步骤进行：1.安装Java环境Kafka是基于Java开发的，因此需要先安装Java环境。下载Java：访问OracleJava下载页面或OpenJDK下载页面，选择适合你系统的Java版本（建议Java8及以上）进行下载。安装Java：运行下载的安装程序，按照提示完成安装。配置环境变量：右键点击“此电脑”，选择“属性”。点击“高级系统设置”，在弹出
slf4j导入那个依赖_复杂Spring项目中SLF4J最佳使用姿势 weixin_39955421 slf4j导入那个依赖
一、Java日志体系概述图1-1Java日志体系概况图1-1展示了Java日志体系的三个主要部分：日志门面接口(SLF4J、JCL)一系列绑定和桥接具体的日志实现先来两个例子：Spring项目中通过CommonsLogging直接使用log4j图1-2通过CommonsLogging使用log4j本例中由于spring-core中原生依赖commons-logging，所以只需要添加log4j和l
深入理解Java中的@Async异步功能程序员总部 java java 开发语言
在Java开发中，处理异步任务是一个很重要的环节，特别是当你希望提高应用程序的响应速度时。Spring框架提供了一个非常方便的注解——@Async，使得异步编程变得简单而高效。接下来我们就来聊聊@Async的工作原理、使用方法以及一些实际应用场景。什么是@Async？@Async是Spring框架中的一个注解，用于实现异步方法的调用。当一个方法被标记为@Async时，Spring会在后台线程中执行
Java打包镜像部署的全景解析程序员总部 java java 开发语言
在现代软件开发中，Java作为一种广泛使用的编程语言，赋予开发者强大的能力，能够轻松创建跨平台应用。随着云计算和微服务架构的普及，Java应用的打包与镜像部署变得愈发重要。今天，就让我们来聊聊如何高效地将Java应用打包成镜像并部署到生产环境。我们得了解Java应用的基本构建流程。Java应用通常使用Maven或Gradle等构建工具。Maven是一个流行的项目管理工具，通过XML配置文件来定义项
如何使用Python与MySQL数据库进行查询和更新操作？程序员总部 python 数据库 python mysql
在当今的开发环境中，数据库操作是程序员日常工作的一部分。Python作为一种流行的编程语言，提供了众多库来简化与数据库的交互。MySQL，作为一种广泛使用的关系型数据库，尤其受欢迎。那么，如何用Python进行MySQL数据库的查询和更新呢？本文会详细介绍一下这个过程，包括如何设置环境、连接数据库以及进行基本的查询与更新操作。环境准备在开始之前，你需要确保你的计算机上安装了Python和MySQL
Android Retrofit 框架注解定义与解析模块深度剖析(一) &有梦想的咸鱼& Android Retrofit原理 android retrofit
一、引言在现代Android和Java开发中，网络请求是不可或缺的一部分。Retrofit作为Square公司开源的一款强大的类型安全的HTTP客户端，凭借其简洁易用的API和高效的性能，在开发者社区中广受欢迎。Retrofit的核心特性之一便是通过注解来定义HTTP请求，这种方式使得代码更加清晰、易读且易于维护。本文将深入Retrofit框架的源码，对其注解定义与解析模块进行全面且细致的分析，揭
【Java】中Maven依赖详解 God Zhang Maven 算法 java maven
14天阅读挑战赛一、maven概念maven是Apache下的一个纯Java开发的开源项目。基于项目对象模型（缩写：POM）概念，Maven利用一小段描述信息管理一个项目的构件。Maven是一个项目管理工具，可以对Java项目进行构建以及对依赖进行管理。二、Maven环境安装1、maven官方网站http://maven.apache.org/下载apache-maven-3.5.0-bin.zi
欧拉筛（线性筛）：找出所有小于等于给定整数n的质数的算法日月知行 java 算法数论基础
大体思路：与埃氏筛不同，埃氏筛（Java）：找出所有小于等于给定整数n的质数的算法-CSDN博客欧拉筛不是把素数的所有倍数标记为非素数，而是每扫过一个数(这个数用外循环的i来表示，遍历isPrime数组）（无论这个数是素数还是非素数）将该数与前面标记为素数的数相乘的数筛掉（内循环进行更新真正的质数primes质数列表）。确保每个合数仅被其最小质因数标记一次，这样才能解决重复标记问题，时间复杂度降为
InnoDB和MyISAM bobo306 mysql-面试题 mysql 数据库 java
InnoDB和MyISAM是使用MySQL时最常用的两种引擎类型，我们重点来看下两者区别。事务和外键InnoDB支持事务和外键，具有安全性和完整性，适合大量insert或update操作MyISAM不支持事务和外键，它提供高速存储和检索，适合大量的select查询操作锁机制InnoDB支持行级锁，锁定指定记录。基于索引来加锁实现。MyISAM支持表级锁，锁定整张表。索引结构InnoDB使用聚集索引
MySql--多表查询及聚合函数总结小五Z Mysql mysql 数据库数据结构
建议先阅读MySql--增删改查表设计总结-CSDN博客目录建议先阅读MySql--增删改查表设计总结-CSDN博客一、聚合函数二、GROUPBY分组查询HAVING子句三、联合查询（表连接查询）1.内连接2.表连接的执行过程3.外连接4.自连接5.子查询6.合并查询四、SQL语句中各部分的执行顺序一、聚合函数1.COUNT(列||*)：统计结果的个数。2.SUM（列）：求和。3.AVG(列)：求
第五阶段【MySQL数据库：常用PT工具】06：使用pt-archiver来进行数据归档做一个有趣的人Zz DBA数据工程师成长之路数据库 mysql dba
一、环境准备1、环境准备准备好一套主从复制的环境，以及一个归档的实例，也就是一个单机部署的MySQL192.168.5.130主库192.168.5.132从库归档库192.168.5.129归档2、创建用户创建归档用户，主库130创建CREATEUSER'dba_archive'@'192.168.%'IDENTIFIEDWITHMYSQL_NATIVE_PASSWORDBY'admin';GR
mysql创建数据库_MySQL创建数据库的两种方法杨朝伟 mysql创建数据库
本文为大家分享了两种MySQL创建数据库的方法，供大家参考，具体内容如下第一种方法：使用mysqladmin创建数据库使用普通用户，你可能需要特定的权限来创建或者删除MySQL数据库。所以我们这边使用root用户登录，root用户拥有最高权限，可以使用mysqlmysqladmin命令来创建数据库。实例以下命令简单的演示了创建数据库的过程，数据名为TUTORIALS:[root@host]#mys
「MySQL 数据库优化」降低存储与查询成本的最佳实践网罗开发 python集终端集数据库 mysql
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
华为OD机试E卷 - 贪心歌手（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python 华为OD机试E卷 javascript c++
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述一个歌手准备从A城去B城参加演出。按照合同，他必须在T天内赶到歌手途经N座城市歌手不能往回走每两座城市之间需要的天数都可以提前获知。歌手在每座城市都可以在路边卖唱赚钱。经过调研，歌手提前获知了每座城市卖唱的收入预期：如果在一座城市第一天卖唱可以赚M，后续每天的收入会减少D（第二天赚的钱是M-D，第三天是M-2D…）。如
华为OD机试 -猜字谜（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为华为od python java javascript c++
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述小王设计了一个简单的猜字谜游戏，游戏的谜面是一个错误的单词，比如nesw，玩家需要猜出谜底库中正确的单词。猜中的要求如下：对于某个谜面和谜底单词，满足下面任一条件都表示猜中：变换顺序以后一样的，比如通过变换w和e的顺序，“nwes”跟“news”是可以完全对应的；字母去重以后是一样的，比如“woood”和“wood”是
Javaweb第一天 2301_76231794 Javaweb servlet java
一、javase、javaweb、javaee的关系图CS架构：客户机-服务器，类似要在手机上使用某个软件，需要去下载，用户操作界面的体验感好，但是更新功能需要发布，需要兼容不同类型的系统，BS架构：浏览器-服务器，类似访问某个网站，不需要下载，用户操作界面的体验感需要网络加载快，并且可以快速体验更新的功能，不需要兼容不同类型的系统。URL（统⼀资源定位符，获取服务器资源的一种）：格式:协议://
JavaSE第五天——基础语法 2301_76231794 JavaSE java 开发语言
一、多变量类型和作用域1、变量变量是用来存储数据的容器。每个变量都有一个特定的类型，该类型决定了变量可以存储什么类型的数据变量的使用必须遵循“先声明，后使用”的原则。变量的声明包括指定变量的名称和类型，而变量的初始化则是为变量分配内存空间并设置初始值变量类型可以分为两大类：基本类型（PrimitiveTypes）和引用类型（ReferenceTypes）2、变量的作用域类变量（静态变量）：作用域为
MongoDB的数据存储格式是什么？思维导图代码示例（java 架构) 用心去追梦 mongodb java 架构
MongoDB使用BSON（BinaryJSON）作为其主要的数据存储格式。BSON是一种二进制表示的结构化数据格式，它扩展了JSON的概念，使其更适合于数据库操作。以下是关于MongoDB数据存储格式的详细介绍：MongoDB数据存储格式BSON(BinaryJSON)定义：BSON是一种类JSON的二进制序列化文档格式，专为高效存储和传输而设计。特点：类型丰富：除了基本的JSON类型外，还支持
华为OD机试E卷 -猜字谜（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python c语言 javascript c++华为od机考e卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述小王设计了一个简单的猜字谜游戏，游戏的谜面是一个错误的单词，比如nesw，玩家需要猜出谜底库中正确的单词。猜中的要求如下：对于某个谜面和谜底单词，满足下面任一条件都表示猜中：变换顺序以后一样的，比如通过变换w和e的顺序，“nwes”跟“news”是可以完全对应的；字母去重以后是一样的，比如“woood”和“wood”是
LeetCode——726. 原子的数量(Number of Atoms)[困难]——分析及代码（Java）江南土豆数据结构与算法 LeetCode Java 题解
LeetCode——726.原子的数量[NumberofAtoms][困难]——分析及代码[Java]一、题目二、分析及代码1.栈+哈希表+有序集合（1）思路（2）代码（3）结果三、其他一、题目给定一个化学式formula（作为字符串），返回每种原子的数量。原子总是以一个大写字母开始，接着跟随0个或任意个小写字母，表示原子的名字。如果数量大于1，原子后会跟着数字表示原子的数量。如果数量等于1则不会
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep

读 NebulaGraph源码 ｜ 查询语句 LOOKUP 的一生