URL映射

[CCF]URL映射

Question

URL 映射是诸如 Django、Ruby on Rails 等网页框架 (web frameworks) 的一个重要组件。对于从浏览器发来的 HTTP 请求,URL 映射模块会解析请求中的 URL 地址,并将其分派给相应的处理代码。现在,请你来实现一个简单的 URL 映射功能。
  本题中 URL 映射功能的配置由若干条 URL 映射规则组成。当一个请求到达时,URL 映射功能会将请求中的 URL 地址按照配置的先后顺序逐一与这些规则进行匹配。当遇到第一条完全匹配的规则时,匹配成功,得到匹配的规则以及匹配的参数。若不能匹配任何一条规则,则匹配失败。
  本题输入的 URL 地址是以斜杠 / 作为分隔符的路径,保证以斜杠开头。其他合法字符还包括大小写英文字母、阿拉伯数字、减号 -、下划线 _ 和小数点 .。例如,/person/123/ 是一个合法的 URL 地址,而 /person/123? 则不合法(存在不合法的字符问号 ?)。另外,英文字母区分大小写,因此 /case/ 和 /CAse/ 是不同的 URL 地址。
  对于 URL 映射规则,同样是以斜杠开始。除了可以是正常的 URL 地址外,还可以包含参数,有以下 3 种:
  字符串 :用于匹配一段字符串,注意字符串里不能包含斜杠。例如,abcde0123。
  整数 :用于匹配一个不带符号的整数,全部由阿拉伯数字组成。例如,01234。
  路径 :用于匹配一段字符串,字符串可以包含斜杠。例如,abcd/0123/。
  以上 3 种参数都必须匹配非空的字符串。简便起见,题目规定规则中 和 前面一定是斜杠,后面要么是斜杠,要么是规则的结束(也就是该参数是规则的最后一部分)。而 的前面一定是斜杠,后面一定是规则的结束。无论是 URL 地址还是规则,都不会出现连续的斜杠。

输入第一行是两个正整数 nm,分别表示 URL 映射的规则条数和待处理的 URL 地址个数,中间用一个空格字符分隔。
  第 2 行至第 n+1 行按匹配的先后顺序描述 URL 映射规则的配置信息。第 i+1 行包含两个字符串 piri,其中 pi 表示 URL 匹配的规则,ri 表示这条 URL 匹配的名字。两个字符串都非空,且不包含空格字符,两者中间用一个空格字符分隔。
  第 n+2 行至第 n+m+1 行描述待处理的 URL 地址。第 n+1+i 行包含一个字符串 qi,表示待处理的 URL 地址,字符串中不包含空格字符。

  输入共 m 行,第 i 行表示 qi 的匹配结果。如果匹配成功,设匹配了规则 pj ,则输出对应的 rj。同时,如果规则中有参数,则在同一行内依次输出匹配后的参数。注意整数参数输出时要把前导零去掉。相邻两项之间用一个空格字符分隔。如果匹配失败,则输出 404。

Input

5 4
/articles/2003/ special_case_2003
/articles// year_archive
/articles/// month_archive
/articles//// article_detail
/static/ static_serve
/articles/2004/
/articles/1985/09/aloha/
/articles/hello/
/static/js/jquery.js

Output

year_archive 2004
article_detail 1985 9 aloha
404
static_serve js/jquery.js

对于第 1 个地址 /articles/2004/,无法匹配第 1 条规则,可以匹配第 2 条规则,参数为 2004。
对于第 2 个地址 /articles/1985/09/aloha/,只能匹配第 4 条规则,参数依次为 19859(已经去掉前导零)和 aloha。
对于第 3 个地址 /articles/hello/,无法匹配任何一条规则。
对于第 4 个地址 /static/js/jquery.js,可以匹配最后一条规则,参数为 js/jquery.js

Solution

// http://118.190.20.162/view.page?gpid=T71
// 9:05-10:35
// 字符串处理
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
using namespace std;
#define print(A) cout << #A << ": "<< A << endl;

int rules_num, new_num;
vector<string> rules, names, new_urls;
int url_size, rule_size;

bool inBound(int url_i, int rule_i) { return url_i < url_size && rule_i < rule_size; }

bool isValidCharWithout(char c) {
  return (c >= '0' && c <= '9') || (c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z') || (c == '-') || (c == '_') || (c == '.');
}

// 匹配使用的方法是从头到尾一一匹配两个字符串
// 这里有一个技巧就是增加一个标记output来看是否需要输出
bool isMatch(string new_url, string rule, bool output) {
  url_size = new_url.size();
  rule_size = rule.size();
  int url_i = 0, rule_i = 0;
  while (inBound(url_i, rule_i)) {
    while (inBound(url_i, rule_i) && new_url[url_i] == rule[rule_i]) {
      url_i++;
      rule_i++;
    }

    if (inBound(url_i, rule_i)) {
      if (rule[rule_i] == '<') {
        if (rule[rule_i+1] == 'i') {
          if (output) cout << " ";
          bool firstZero = true;
          while (isdigit(new_url[url_i])) {
            if (new_url[url_i] != '0') firstZero = false;
            if (output && !firstZero) cout << new_url[url_i];
            url_i++;
          }
          if (new_url[url_i] != '/') return false;
          rule_i += 5;
        } else if (rule[rule_i+1] == 's') {
          if (output) cout << " ";
          while (isValidCharWithout(new_url[url_i])) {
            if (output) cout << new_url[url_i];
            url_i++;
          }
          if (new_url[url_i] != '/') return false;
          rule_i += 5;
        } else if (rule[rule_i+1] == 'p') {
          if (output) cout << " ";
          while (isValidCharWithout(new_url[url_i]) || new_url[url_i] == '/') {
            if (output) cout << new_url[url_i];
            url_i++;
          }
          rule_i += 6;
        }
      } else {
        return false;
      }
    }
  }
  // 必须同时到达匹配完毕
  if (url_i < url_size || rule_i < rule_size) return false;
  return true;
}

int main() {
  cin >> rules_num >> new_num;
  rules.resize(rules_num);
  names.resize(rules_num);
  new_urls.resize(new_num);
  for (int i = 0; i < rules_num; i++)
    cin >> rules[i] >> names[i];
  for (int i = 0; i < new_num; i++) {
    cin >> new_urls[i];
    bool hasMatch = false;
    for (int j = 0; j < rules_num; j++) {

      for (int k = 0; k < new_urls[i].size(); k++)
        if (!isValidCharWithout(new_urls[i][k]) && new_urls[i][k] != '/') {
          break;
        }

      if (isMatch(new_urls[i], rules[j], false)) {
        hasMatch = true;
        cout << names[j];
        isMatch(new_urls[i], rules[j], true);
        cout << endl;
        break;
      }
    }
    if (!hasMatch) cout << "404" << endl;
  }
  return 0;
}

思路:这道题是一道字符串匹配的题目,逐个遍历进行对比,重点关注isMatch函数。

你可能感兴趣的:(leetcode,字符串)