an04g4k

Hawk： 20分钟无编程抓取大众点评17万数据

1. 主角出场：Hawk介绍

Hawk是沙漠之鹰开发的一款数据抓取和清洗工具，目前已经在Github开源。详细介绍可参考：http://www.cnblogs.com/buptzym/p/5454190.html，强烈建议先读这篇文章，该文介绍了详细原理和抓取链家二手房的攻略，以此为基础，才能较好的理解整个操作。

本文将讲解通过本软件，获取大众点评的所有美食数据，可选择任一城市，也可以很方便地修改成获取其他生活门类信息的爬虫。
本文将省略原理，一步步地介绍如何在20分钟内完成爬虫的设计，基本不需要编程，还能自动并行抓取。

看完这篇文章，你应该就能举一反三地抓取绝大多数网站的数据了。Hawk是一整套工具，它的能力取决于你的设计和思路。希望你会喜欢它。

详细过程视频可参考：http://v.qq.com/page/z/g/h/z01891n1rgh.html，值得注意的是，由于软件不断升级，因此细节和视频可能有所出入。
准备好了么？Let's do it!

2. 菜场买菜：编译和安装

编译可使用VS2015(推荐)，否则可直接从网盘下载可执行程序：
http://pan.baidu.com/s/1c8zBiQ 密码：4iy0
之后双击Hawk.exe，即可运行。
依赖环境要求.NET Framework 4.5, win7和以上版本。没有其他依赖项。

3. 做饭先生火：自动设置cookie：

我们先打开大众点评的美食列表页面：
http://www.dianping.com/search/category/2/10/g311

这是北京的"北京菜"列表，但你会注意到，只能抓取前50页数据（如箭头所示），是一种防爬虫策略，我们之后来破解它。
我们双击打开一个网页采集器：

之后在最上方的地址栏里填写地址：

但会发现远程服务器拒绝了请求，原因是大众点评认为Hawk是爬虫而不是浏览器。
没有关系，我们让Hawk来监控浏览器的行为，在右侧的自动嗅探窗口中，填写url过滤和内容筛选，之后点击开始。浏览器会自动打开该网页，程序后台自动记录了所有的行为，之后点击关闭按钮（切记点击关闭）。

(此处大概介绍原理：Hawk在点击开始之后，会自动成为代理，所有的浏览器请求都会经过Hawk，在输入特定的URL筛选前缀和关键字，则Hawk会自动拦截符合要求的Request，并将其详细信息记录下来，并最终模拟它)。

之后，我们点击右方的“高级设置”里，能够看到Hawk已经把这次访问的cookie和headers自动保存下来：

我们再次点击刷新网页，可以看到已经能成功获取网页内容：

完成这一步之后，我们就能够像普通网页那样免登陆抓取信息了。这也适合需要登录的各类网站。

4.洗菜切菜：获取门店列表

我们通过自动和手动两种方式来获取门店列表，你可以两种都试试。

4.1 全自动获取

直接点击手气不错即可，不需要其他操作：

4.2 纯手工获取

我们先手工输入筛选条件吧：

输入上面的关键字3774，命名为点评：

接着，填入89,你会发现是下面这样：

注意XPath表达式和点评的表达式不大一样，这是因为89太普通，在网页中出现多次，再次点击搜索XPath，即可找到正确的位置。
类似地，将所有你认为需要的属性添加进去，加上合适的命名，大概是这个样子：

当然，我们还需要门店的ID，但在页面上并不提供，那在浏览器上点击那个“四季民福烤鸭店”（沙漠君厌恶吃鸭子），你会看到它的链接为：

我们将18002657添加并搜索，发现不论怎么点都搜索不到，此时勾选提取标签，系统会在标签中搜索：

之后获取了全部属性后，点击提取测试，系统会自动优化XPath，列表父节点会显示在下方。

笔者建议自动加手动配合的方式，自动抓取大部分数据，再用手动修改调整，手气不错虽然智能，但并不是什么时候都管用。

将本模块命名为门店列表，供之后备用：

5.餐前甜点：获取50页数据

我们先用50页数据试试手，在刚才那个浏览器页面的最下方，点击翻页，可以发现是如下的结构：

http://www.dianping.com/search/category/2/10/g311p2
http://www.dianping.com/search/category/2/10/g311p3
http://www.dianping.com/search/category/2/10/g311p4
...

好，新建数据清洗，随便给它起个名字，从左面拖入生成区间数，双击配置列名为page，最大值填50，再拖入合并多列到page列，配置如下：

其中Format设置为：
http://www.dianping.com/search/category/2/10/g311p{0}
这是C#的一种字符串替换语法，{0}会被依次替换为1,2,3...
最后，拖从爬虫转换到url列，奇迹出现了吧？
为了保存结果，我们拖写入数据表到任意一列,这里选择了名称列，配置如下：

之后，在右侧选择并行或串行模式（随你），点击执行即可。

数据采集完成了！

如果看到这一步累了，可以不看下面的内容，但如果想获取全部内容，步骤就复杂多了，如果你下决心学习，我们接着往下看

5. 准备葱蒜：获取城市的美食门类

解决问题的办法是分而治之，获取每个区县（如北京的海淀区）下的某一种美食门类（东北菜），自然就没50页那么多了。所以，要获取美食门类，再获取所有的区域。

先找到所有美食门类的位置：
http://www.dianping.com/shopall/2/0
为了获取此页面上的信息，我们再新建一个网页采集器，命名为通用采集器，它的目标是获取整个HTML页面，因此
读取模式改成One,将刚才门店列表采集器里的高级设置->Parameters的内容拷贝到本采集器对应的窗口中。
(其实也可以做嗅探，但这个更快一些)。
之后，我们来获取这个页面上的所有美食门类，新建数据清洗，命名为门类，然后从左侧拖从文本生成到右侧任意一列，命名如下：

再拖入从爬虫转换，配置如下：

即可调用刚才的通用采集器。另外，左侧的工具栏支持搜索，直接关键字即可快速定位，结果如下：

为了获取下图的北京菜所在的位置，虽然可以用Hawk，但为了方便可以使用Chrome，搜狗和360浏览器的F12开发者工具功能，找到对应的元素，点击右键，拷贝XPath:

内容为：//*[@id="top"]/div[6]/div/div[1]/dl[1]/dd/ul/li[1]，
因为要获取所有的子li，在刚才的数据清洗中，向Content列拖入XPath筛选器，配置如下：

由于要获取所有的li子节点，所以去掉了最后的1，可以适当复习XPath语法。
奇迹出现了：

接下来步骤很简单，我不截图了：

拖入HTML字符转义到Text列，可以清除该列的乱码
再拖入字符串分割到Text，勾选空格分割，可对该数据用空格分割，并获取默认的第一个子串
拖入删除该列到OHTML,该列没有用
再拖入正则转换器到HTML，配置如下：

g\d+代表匹配那个门类的ID，比如刚才的g311
拖入删除该列到HTML
直接在Text列的上方修改名称为门类

最终结果如下：

6.获取北京的区域

这一步和上一步非常类似，因此我很简明地介绍一下。
区域在这个页面：
http://www.dianping.com/search/category/2/10/g311p2

这些节点的XPath是：//*[@id="region-nav"]/a
你可以按照刚才类似的步骤进行，也是创建新的数据清洗，把这个子模块命名为区域，最终结果如下：

如果自己做不下来，也没有关系，加载Github上大众点评的教程.xml，可以直接用这个现成的模块，也可以单步调试之，看看它是怎么写的。

7.正菜开始：主流程

下面是最难也是最复杂的部分。我们的思路是，组合所有的门类和区域，构成m*n的一组序对，如海淀区-北京菜，朝阳区-火锅等等，获取对应序对的页数，再将所有结果拼接起来。
准备好了么？我们继续。

新建数据清洗，命名为主流程，我们要调用刚才定义的模块，拖入子流-生成到任意一列，配置如下：

记得要勾选启用，这些模块默认是不启用的。
再拖入子流-生成到任意一列，配置如下：

注意生成模式改为Cross。
具体不同模式的工作方式，可参考这篇文章：http://www.cnblogs.com/buptzym/p/5501003.html
之后，就是这个样子：

我们将两列组合起来，可看到Url为如下的形式：
http://www.dianping.com/search/category/2/10/**g311r14**
拖合并多列到type，配置如下：

{0}{1}相当于组合了多个元素，拖入的当前列为第0元素，其他项用空格分割，分别代表第1,2...个元素。
为了获取每个门类的页数，需要在页面上找一下：

它的XPath是/html[1]/body[1]/div[6]/div[1]/span[7]

拖入从爬虫转换到url列，配置爬虫选择为通用采集器，就能获取对应的HTML
拖入XPath筛选器到HTML所在的Content列，XPath表达式如上/html[1]/body[1]/div[6]/div[1]/span[7]。只获取一个数据，新列名为count
拖入删除该列到Content列。
拖入提取数字到count列
拖入Python转换器到count列，这是本文唯一要写的代码：
配置如下：

代码在下面：
```
v=int(value)
50 if v>50 else int(v/15)+1
```
Python代码很好理解吧，大概是说超过50页就按50页处理，页数等于数量除以每页15个，取整后+1。

你会发现即使这样，每个门类还是超过了50页，这个问题我们之后再讨论。
为了方便并行，拖入流实例化到任意一列，配置如下：
。
执行器会将每一个门类区县对分配一个独立的线程，注意方括号[url]的写法，系统会把url列的内容赋值到这里，如果你只写url，那所有的线程名称都叫url了。你可以不添加流实例化，看看系统最后是怎么工作的。

接下来，我们要把page列展开，生成[0-page]的区间数，一页一页去抓取。拖生成区间数到page列，配置如下：

注意Cross和[page]，我就不多解释了。
把刚才的url和现在的p列合并，就构成了每一页的真实url.
拖入合并多列到url，配置如下：

仔细理解一下配置的意思，尤其是{0}p{1}，我觉得读者到了这一步，已经对整个系统有点感觉了。
雄关漫道真如铁，我们马上到达目的地了。
现在url列已经是这个样子了（点击查看样例即可）

将从爬虫转换到url，配置爬虫来源为门店列表！然后等待奇迹出现
（卖个关子，我就不截图了）
然后拖入写入数据表到任意一列，为表名起个名字，点击执行去跑就可以了。
如果你到这一步就满意了，那么文章可以不用往下看了。

8.注重细节

一道大菜要非常注意细节，爬虫也一样。

8.1 保留原始表的信息

你看到数据表里没有这家店的区县，也没有所在的页数，感觉从爬虫转换丢失了原始表的一部分信息，事实上它在1转多的时候，原始表默认都会丢掉。
因此在下图的位置，点击编辑集合，选择最后的那个从爬虫转换，配置如下：

它会将p和区域两列，添加到新表中。

8.2 我想写入数据库

目前Hawk没有强的自动建表功能，因此建议使用MongoDB,如果你已经安装了，在模块管理的数据源哪里，点击右键，可新建MongoDB连接器。
可以在主流程的最后位置，在拖入写入数据库，即可。

8.3 还是没有获取所有数据

即使是刚才这样的复杂操作，依然不能获取所有的美食，因为火锅太火，朝阳海淀的火锅都超过了50页，解决方法是再细分商区，比如朝阳的三元桥，国贸，望京...这样就能完整解决了。但本文限于篇幅就不讨论了。

8.4 如何将数据表导出到文件？

在右下角的数据管理，在要导出的表上点右键，建议输出为xml,json和txt文件，excel文件在数据量较大（5万以上）会有性能问题。

8.5 这种图形化操作有什么优势？

效率！所见即所得！你可以试着用任意一种代码去写，烦死你

8.6 如何保存所有操作？

会将所有刚才的操作保存在工程文件中。

8.6 我的服务器在Linux上，怎么办

Hawk是WPF,C#开发的，因此只能在Windows上运行，不过它生成的xml可以被Python解释，参考github上的etlpy.

8.7 Hawk是你一个人写的吗？用了多久

目前来看是这样的。业余时间四年

8.8我想获取各个城市的，不限于美食的数据

这个就更复杂了，可以借助脚本实现，这是下一篇的话题。

9.总结

为了方便大家学习使用，刚才的整个操作已经上传到了Github。地址为https://github.com/ferventdesert/Hawk-Projects
大众点评-教程.xml

有任何问题，欢迎留言。

CKEditor中粘贴复杂公式的最佳实践是什么？ M_Snow umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word ueditor导入pdf ueditor导入ppt
要求：开源，免费，技术支持编辑器：ckeditor前端：vue2,vue3.vue-cli后端：asp,java,jsp,springboot,php,asp.net,.netcore功能：导入Word,导入Excel,导入PPT(PowerPoint),导入PDF,复制粘贴word,导入微信公众号内容,web截屏平台：Windows,macOS,Linux,RedHat,Ubuntu,CentO
php yaf_cg --app=www.yafapi.com --directory=D:\phpstudy_pro\WWW\www.yafapi.com --controller=Test` 到底
1.phpyaf_cg--app=www.yafapi.com--directory=D:\phpstudy_pro\WWW\www.yafapi.com--controller=Test到底是干什么的？这条命令是使用Yaf（YetAnotherFramework）框架提供的代码生成工具yaf_cg，自动生成一个基于Yaf框架的应用程序结构和代码文件。它的作用是帮助开发者快速搭建项目的基础结构，减
PHP/Laravel + Vue3 + MySQL组合版本参考
以下是基于技术栈流行度、稳定性和开发效率综合评估的推荐版本组合1.后端技术栈PHP8.3最新稳定版，支持JIT编译，性能较PHP8.1提升15%+，完美兼容Laravel框架。扩展要求：openssl、pdo_mysql、mbstring（Laravel强制依赖）。Laravel11.x2024年发布，支持PHP8.2-8.3，提供轻量级应用骨架和更快的路由缓存。关键特性：原生支持Docker沙盒
PHP/Laravel + Vue3 + MySQL + Docker 项目搭建全流程指南（Al总结版未测试未编辑）野生yumeko php laravel mysql
PHP/Laravel+Vue3+MySQL+Docker项目搭建全流程指南一、环境准备（仅需Docker）安装DockerDesktopWindows/macOS：下载DockerDesktop并安装。Linux：安装docker-ce和docker-compose-plugin。#Ubuntu示例sudoaptupdate&&sudoaptinstalldocker-cedocker-comp
PHP 命令行工具的常用选项详解半桶水专家 php php 开发语言
PHPCLI常用选项详解-f：运行脚本文件php-fscript.php等同于：phpscript.php执行指定的PHP文件。-r：运行一段PHP代码php-r'echo"HelloWorld\n";'可快速运行一小段代码，不需要加:：启动内建Web服务器php-S127.0.0.1:8000用于开发环境调试，默认当前目录为文档根目录（可配合-t使用）。-t：指定Web根目录php-Slocal
ThinkPHP 如何在生产环境中配置日志？深山技术宅 PHP 经验数据库 php 后端 ThinkPHP
在ThinkPHP生产环境中配置日志时，需要重点关注稳定性、性能和安全。以下是最佳实践配置方案：生产环境推荐配置(config/log.php)return['default'=>env('log.channel','stack'),'channels'=>[//组合通道（核心配置）'stack'=>['type'=>'stack','channels'=>['daily','error_file
全新算命付费测算网站源码+星座运势/塔罗牌/宝宝起名/姻缘 esrhs 源码 php
正文:全新算命付费测算网站源码，星座运势塔+罗牌牛年运程+宝宝起名+姻缘等，内附安装说明，PHP开发的，有兴趣的自行去体验吧，其它的就没什么好介绍的了。程序:wwegh.lanzoub.com/iQ5LQ07p2mjg图片:
最新算命源码开发全攻略：PHP/Python算命源码+部署教程 kunluxuan php python 开发语言
前言在当今数字化时代，人们对传统文化与神秘学的兴趣日益增长，算命、占卜等传统玄学活动也逐渐从线下转移到线上。借助互联网技术，开发一套功能完善、用户体验良好的算命系统，不仅能满足用户的好奇心与需求，还能为开发者带来商业价值。本攻略旨在提供一套完整的算命源码开发方案，涵盖PHP和Python两种主流编程语言的实现方式，并附上详细的部署教程。无论是个人开发者还是小型团队，均可通过本指南快速搭建属于自己的
网络渗透中的指纹识别 jhf200306 web安全
主要内容:指纹是网站CMS指纹识别，计算机操作系统及web容器的指纹识别。1.CMS:(contentmanagementsystem)整站系统或文章系统作用:开发者只要给客服一个软件包，客服自己安装配置好，可以定期更新数据来维护网站，节省了大量的人力和物力。常见的CMS:Dedecms(织梦),Discuz,PHPWEBPHPWIND,PHPCMS,ECSHOP,WordPress(wp)等。(
thinkphp中行锁(Lock)操作跟事务的关系以及用法 mysql事务数据库
事务跟行锁(Lock)的关系首先解释下事务和锁各自的作用事务的作用事务主要保证一组数据库操作(增删改)的原子性,即要么全部执行成功,要么全部失败,避免出现数据不一致的中间状态.加锁的作用加锁主要解决并发场景下的数据竞争问题,比如多个请求同时修改同一条数据时,可能导致"脏读""不可重复读"等问题.如果仅仅使用事务不用锁的局限性事务操作虽然能保证原子性,但是但是无法阻止并发场景下的数据竞争问题.以'库
【PHP开发900个实用技巧】498.事件溯源：可追溯状态变更的架构设计精通代码大仙 PHP开发900个实用技巧 php android android studio 程序员创富
事件重构时间：用事件溯源让系统变更轨迹清晰可见——本文带你掌握PHP领域状态可追溯的核心架构设计方法论事件溯源：可追溯状态变更的架构设计事件溯源是什么？为什么传统方法会失忆PHP实现事件溯源四步法关键难点与破局技巧实战：用户积分系统改造事件=事实记录状态=事件叠加传统CRUD的痛点审计追踪困境定义领域事件事件存储设计状态重建逻辑快照优化策略并发事件处理版本迁移方案老系统改造过程事件处理器实现目录事
python+vue+springboot的東耳篮球馆会员信息管理系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
python+uniapp基于微信小程序的宿舍报修系统java+nodejs+php QQ1963288475 python uni-app 微信小程序 django flask spring boot java
文章目录具体实现截图本项目支持的技术路线源码获取详细视频演示：文章底部获取博主联系方式！！！！本系统开发思路进度安排及各阶段主要任务java类核心代码部分展示主要参考文献：源码获取/详细视频演示##项目介绍绪论在高校宿舍管理中，设施报修是一个重要的环节。传统的报修方式通常需要学生前往宿管办公室填写报修单，或者通过电话、短信等方式进行报修，这种方式存在诸多不便，如报修流程繁琐、信息沟通不畅等问题。而
python的王者荣耀战队的数据分析系统 QQ1963288475 python 开发语言 django flask spring boot
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
python+uniapp基于微信小程序的餐饮点单系统java+nodejs+php
文章目录具体实现截图本项目支持的技术路线源码获取详细视频演示：文章底部获取博主联系方式！！！！本系统开发思路进度安排及各阶段主要任务java类核心代码部分展示主要参考文献：源码获取/详细视频演示##项目介绍绪论在餐饮行业中，传统的点单方式往往依赖于纸质菜单或人工服务，这种方式不仅效率低下，而且难以满足现代消费者对于便捷、快速服务的需求。随着移动互联网技术的普及，越来越多的餐饮企业开始探索数字化点单
php协程处理报表,php 协程 yield weixin_39857876 php协程处理报表
什么是协程理解协程之前最好要理解进程和线程，这里不过多解释，简单来说，进程是资源分配的最小单位，线程是进程中一个单一的执行流，线程共享进程资源，每个线程都有自己独立的栈空间。线程相对于进程而言更加轻量，操作系统调度进程切换的代价很大，需要保存当前进程的各种信息，PCB进程控制块。线程切换相对更加容易，线程同属于一个进程，只需要切换栈空间。多线程更能利用多核的cpu，发挥性能。协程呢，可以说是断点，
php协程,PHP协程刘保池 php协程
1.什么是协程先搞清楚，什么是协程。你可能已经听过『进程』和『线程』这两个概念。进程就是二进制可执行文件在计算机内存里的一个运行实例，就好比你的.exe文件是个类，进程就是new出来的那个实例。进程是计算机系统进行资源分配和调度的基本单位(调度单位这里别纠结线程进程的)，每个CPU下同一时刻只能处理一个进程。所谓的并行，只不过是看起来并行，CPU事实上在用很快的速度切换不同的进程。进程的切换需要进
php协程关键字,php +go关键字实现协程土萌柚 php协程关键字
今天在知乎浏览时忽然发现了一个有趣的东西，php竟然可以实现协程的实现，而且还是通过go关键字实现，顿时感觉php现在发展的好迅速，竟然把go里的东西都借鉴去。只不过这是在一个叫Swoole的框架中实现的。Swoole4为PHP语言提供了强大的CSP协程编程模式。底层提供了3个关键词，可以方便地实现各类功能。Swoole4提供的PHP协程语法借鉴自Golang，在此向GO开发组致敬PHP+Swoo
PHP 协程 SiegeLionQi PHP php 协程 yield
协程，又称微线程，纤程。英文名Coroutine。PHP官方文档的解释:生成器提供了一种更容易的方法来实现简单的对象迭代，相比较定义类实现Iterator接口的方式，性能开销和复杂性大大降低。生成器允许你在foreach代码块中写代码来迭代一组数据而不需要在内存中创建一个数组,那会使你的内存达到上限，或者会占据可观的处理时间。相反，你可以写一个生成器函数，就像一个普通的自定义函数一样,和普通函数只
php pgsql 连接池,PostgreSQL数据库连接池PgBouncer的搭建 weixin_39612499 php pgsql 连接池
最近有些项目我们是采用PostgreSQL进行后端数据库，由于要对客户端的连接使用类型和连接数进行控制，因此我们采用PgBouncer来进行最近有些项目我们是采用PostgreSQL进行后端数据库，由于要对客户端的连接使用类型和连接数进行控制，因此我们采用PgBouncer来进行实施。PgBouncer相关的基本文档pgsqldb中文站已经有不少文档，这里我就不再作过多的说明，我将集中对其中的几个
windows本地使用docker-compose构建nginx+php访问thinkphp5 星芯ya Docker学习 docker 容器运维
前言：继上一篇windows本地使用docker+nginx+mysql部署thinkphp5https://blog.csdn.net/hmx089674/article/details/136683679本期使用docker-compose搭建环境访问thinkphp5程序。第一步：准备工作检查本地是否安装docker-compose（cmd终端输入docker-compose-v检测，安装D
PHP 安装指南 wjs2024 开发语言
PHP安装指南引言PHP是一种广泛使用的开源服务器端脚本语言，常用于Web开发。正确安装PHP是开始构建动态网站或应用程序的第一步。本文将详细介绍如何在各种操作系统上安装PHP，并指导您完成必要的配置步骤。安装环境准备在安装PHP之前，请确保您的系统满足以下条件：操作系统：PHP可以在多种操作系统上运行，包括Windows、Linux和macOS。Web服务器：虽然PHP主要用作服务器端脚本语言，
JetBrains 2025 全家桶 11合1 Mac电脑 2501_92680691 intellij-idea java macos pycharm datagrip webstorm phpstorm
JetBrains2025全家桶11合1Mac电脑，11个包含：IDEA、WebStorm、DataSpell、DataGrip、Pycharm、RustRover、CLion、Rider、PhpStorm、RubyMine、GoLand。原文地址：JetBrains2025全家桶11合1含IDEA、PyCharm、DataGrip、WebStrom、GoLand、CLion、PhpStorm、D
thinkphp5.0项目配置多MySQL数据库连接 thinkphp5mysql
公司项目需要连接2个MySQL数据库背景介绍:公司项目是基于fastadmin1.4.0.20230711开发的,里面用到的thinkphp版本是5.0.25,项目涉及到小程序端和设备端,之前做的是两个项目,但是部署在同一台服务器上,分别对应两个数据库,之前两个项目之间的交互是通过互相调用对方接口的方式实现的,优化的时候就想通过在一个项目中连接两个MySQL数据库的方式,避免互相调用带来的性能开销
ThinkPHP中的日志通道配置深山技术宅 PHP 经验 ThinkPHP php 后端日志
在ThinkPHP中配置日志通道主要通过config/log.php文件实现。以下是详细配置说明和示例：1.基础配置结构//config/log.phpreturn['default'=>'file',//默认使用的通道'channels'=>[//通道1：文件日志（默认）'file'=>['type'=>'file','path'=>runtime_path('log'),'level'=>['
php输出扶墙而立的三角形,扶墙而立的成长历程——涉县五中刘嘉巍王克丹 php输出扶墙而立的三角形
两周，我们就犹如一个婴儿，从母亲的怀抱实现了能够扶墙而立的成长历程。经过两周的实践，我基本能按照教案的要求，将一堂体育课较为完整执行开展，而且最重要的是我们每个人从心理上实现了从学生到教师的转变，当然这也体现在我们的举止、仪表、谈吐和教态间。相信，每一个实习老师在上完一节体育课后，心中总有那么股成就感和无限的自信。这就是我们成长与进步的最好体现。实践的操作、指导老师的传授、自己的亲身经验、使我们在
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
资深php工程师必会必知架构深山技术宅 PHP 经验素养 php 架构开发语言
作为资深PHP工程师，必须掌握以下架构设计及核心组件，这些架构能力决定了系统能否支撑高并发、高可用及复杂业务场景：一、分层架构（基础但关键）经典三层模型HTTP请求SQL表示层业务逻辑层数据访问层数据库表示层：API网关（LaravelRoutes/SymfonyRouting）业务层：领域服务（DDD设计模式应用）数据层：Repository模式+Eloquent/DoctrineORM二、高性
开源的APP+小程序商城源码推荐，可支持二次开发。 yuhuidog 开源APP商城源码小程序商城源码来客电商 saas新功能
今天我给大家介绍一款基于PHP开发的电商平台框架，可快速二次开发！用户体验还可以~全网比较shao见的Saas移动电商平台源码。系统特点：1、VueCLI框架，完全实现前后端分离，完善的API文档2、标准接口3、支持队列4、长链接5、无缝事件机制6、支持分布式部署7、基于SAAS源码服务8、N多插件扩展：拼团+分销+多店+会员电商+线下核销+拍卖+砍价等9、支持支付宝小程序+微信小程序+andro
php字符串匹配算法,字符串查找算法及原理
面试题:判断字符串是否在另一个字符串中存在？面试时发现好多人回答不好,所以就梳理了一下已知的方法,此文较长,需要耐心的看下去。从实现和算法原理两方面解此问题，其中有用PHP原生方法实现也有一些业界大牛创造的算法。实现方法一:语言特性-内置函数/*strpos示例*///testecho'match:',strpos('xasfsdfbk','xasfsdfbk')!==false?'true':'
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro