概述
记录从统计局发布的数据到前端可用的地区筛选框所做的事情。
需求
- 已经建立了百度地图城市码和行政区划代码中省市的映射。
- 后端业务开通城市管理只到市一级,具体业务项目到区县一级。
- 前端需要根据区县一级筛选项目。
实现
数据来源
最新县及县以上行政区划代码(截止2016年7月31日)
处理步骤
- 打印PDF,另存为txt。
- 使用代码对数据进行处理。
a = `[txt文档内容]`; // 按照空格分隔 b = a.split(" ").filter(val => val!==""); // 把区划代码和区划名称中多个空格替换成空格,再次移除空值 b = b.map(val => val.replace(/\s+/g, " ")); b = b.filter(val => val!==" "); // 移除无用的pdf信息 b = b.filter(val => !(val.startsWith("http") || val.includes("/") || val==="Page" || val.startsWith("最") || val.includes("-"))); // 移除末尾无用信息 c = b.slice(0, 4047); c = c.map(v => v.trim()); // 有空格开头的,还有因为空格被拆成两个值的 d = c.map((v,i,a) => { if (v.match(/^\d+\s*.+$/g)) { if (i < a.length - 1) { if (!a[i+1].match(/^\d+\s*.+$/g)) { return (v + " " + a[i+1]).trim(); } else { return v.trim();} } } }) d = d.filter(v=>v!==null && v!==undefined); // XX区居然在区前有空格 d = d.map(val=>val.replace(/\s/g, "")); // 最后得到一个数组 JSON.stringify(d); // "["110000北京市","110100市辖区","110101东城区"..."]"
数据存储
将数据按照省区分,每个省,作为静态资源存储,懒加载。
class District {
prov = new Array();
getProvList = async (code) => {
if (this.prov.length === 0) {
await this.initProv(code);
}
return this.prov;
};
getCityList = async (code) => {
if (this.prov.length === 0) {
await this.initProv(code);
}
return this.prov.filter(v => v.includes('00') && !v.includes('0000') && !v.includes(code));
};
getDistList = async (code) => {
if (this.prov.length === 0) {
await this.initProv(code);
}
return this.prov.filter(v => v.startsWith(code.substring(0, 4)) && !v.includes(code));
};
initProv = async (code) => {
const distList = await import(`./${code.substring(0, 2)}0000.js`);
this.prov = distList.default;
return this.prov;
};
isProvCode = (code) => {
return code.includes('0000');
};
isCityCode = (code) => {
return code.includes('00') && !code.includes('0000');
};
isDistCode = (code) => {
return !(code.includes('00') || code.includes('0000'));
}
}
export default District;
食用一下。
const config = new District();
config.getCityList('110000').then(val => (console.log(val)));
Q & A
- 为现在的映射表添加字段?不,区县太多(3-4k),不适合。新建一张表,运管端只有建立项目的时候使用,面客端在切换区域的时候使用。
- 直接打包到一个静态文件资源里,运管端/面客端使用的时候直接读取?太大,实测使用powershell打开nodejs时,内存占用10MB左右;复制到剪切板再粘贴到powershell里赋值,内存占用飙升到70MB左右;赋值完清理后内存降至24MB左右;运行环境是PC web和移动端webview,不合适。
- 直接从数据库里查?每次首页都发请求,经过WAS,查询区域信息,这种事情,还是少一点好。
- 利用现在Nginx缓存请求?现在缓存主要缓存动态图片请求,还是不凑这个热闹了。这种信息修改应该很少,缓存在客户端较好。
- 为什么不按照市区分?Emmm,主要是懒得多写那几行代码了。