阿里系统软件技术

有了 serverless，前端也可以快速开发一个 Puppeteer 网页截图服务

更多云原生技术资讯可关注阿里巴巴云原生技术圈。

Puppeteer 是什么？

puppeteer 官网的介绍如下：
Puppeteer is a Node library which provides a high-level API to control Chrome or Chromium over the DevTools Protocol. Puppeteer runs headless by default, but can be configured to run full (non-headless) Chrome or Chromium.

通俗描述就是：Puppeteer 可以将 Chrome 或者 Chromium 以***面的方式运行（当然也可以运行在有界面的服务器上），然后可以通过代码控制浏览器的行为，即使是非界面的模式运行，Chrome 或 Chromium 也可以在内存中正确渲染网页的内容。
那么 Puppeteer 能做什么呢？

生成网页截图或者 PDF
抓取 SPA（Single-Page Application) 进行服务器渲染（***）
高级爬虫，可以爬取大量异步渲染内容的网页
模拟键盘输入、表单自动提交、登录网页等，实现 UI 自动化测试
捕获站点的时间线，以便追踪你的网站，帮助分析网站性能问题

本文选择截图场景作为演示。

废话不多说了，我们直接给大家介绍下如何用函数计算产品来快速部署一个 Puppeteer Web 应用。

如何快速部署一个分布式 Puppeteer Web 应用？

为了快速部署分布式 Puppeteer Web 应用，本文以函数计算服务为例来做展示。

函数计算（Function Compute）: 函数计算是一个事件驱动的服务，通过函数计算，用户无需管理服务器等运行情况，只需编写代码并上传。函数计算准备计算资源，并以弹性伸缩的方式运行用户代码，而用户只需根据实际代码运行所消耗的资源进行付费。函数计算更多信息参考。

有了函数计算服务，我们这里目标是搭建一个分布式应用，但做的事情其实很简单，那就是写好业务代码，部署到函数计算，仅此而已。

使用函数计算后，我们的系统架构图如下：

效果演示

可以直接通过以下链接查看效果：
https://1911504709953557.cn-hangzhou.fc.aliyuncs.com/2016-08-15/proxy/puppeteer-test/html2png/?url=https://www.aliyun.com/product/fc
PS：第一次请求可能会有几秒的冷启动时间，通过使用预留模式可以完全去除冷启动，这题超纲，下次再讲。

搭建步骤步骤：

整体流程如下图所示：

其中，需要我们操作的只有 Fun Init、Fun Install 以及 Fun Deploy 命令，每个的步骤内容都会由这三个命令自动完成。

1. 工具安装

安装 Fun 工具：

建议直接从这里下载二进制可执行程序，解压后即可直接使用。下载地址。

安装 Docker：
可以按照这里介绍的方法进行安装。

2. 初始化项目：

通过 Fun 工具，使用下面的命令可以快速初始化一个 Puppeteer Web 应用的脚手架：

fun init -n puppeteer-test http-trigger-node-puppeteer

其中 -n puppeteer-test 表示初始化项目的目录名称， http-trigger-node-puppeteer 表示要使用的模板名称，可以省略该名称，省略后，可以从终端提示的列表中自行选择需要的模板。
执行完毕后，可以看到如下的目录结构：

.
├── index.js
├── package.json
└── template.yml

相比较于传统的 puppeteer 应用，这里仅仅多了一个 template.yml 文件，用于描述函数计算的资源。
而 index.js 就是我们的业务代码了，可以按照 Puppeteer 官方帮助文档的要求书写自己的业务代码，这里不再重复阐述，核心代码如下：

const browser = await puppeteer.launch({
  headless: true,
  args: [
    '--no-sandbox',
    '--disable-setuid-sandbox',
  ]
});
const page = await browser.newPage();
await page.emulateTimezone('Asia/Shanghai');
await page.goto('https://www.baidu.com', {
  'waitUntil': 'networkidle2'
});
await page.screenshot({ path: '/tmp/example', fullPage: true, type: 'png' });
await browser.close();

package.json 内容如下：

{
  ... ...
  "dependencies": {
    "puppeteer": "^2.0.0"
  },
  ... ...
}

可以看到，在 package.json 中声明了 puppeteer 的依赖。这个也是我们使用 node 开发时的标准做法，并无特别之处。

3. 一键安装依赖

puppeteer 的安装，即使是在传统的 linux 机器上，也不是那么的轻松。因为 puppeteer 本身依赖了非常多的系统库，要安装哪些系统库、如何安装这些系统库成了一个比较头痛的问题。

好在函数计算命令行工具 Fun 已经集成了 Puppeteer 的解决方案，只要 package.json 中包含了 puppeteer 依赖，然后使用 fun install -d 即可一键安装所有系统依赖。

fun install -d

4. 本地运行、调试函数

Puppeteer 的本地运行、调试方法与这里介绍的完全一致，我们就不再重复介绍。我们这里只演示下运行效果：

5. 一键部署应用

基本上所有的 FaaS 平台为了减小应用的冷启动，都会设置代码包的限制，函数计算也不例外。而 puppeteer 自身已经达到了 350M 左右，连同其系统依赖已经达到了 450M。如何将 450M 体积的函数部署到 FaaS 平台是一个比较头痛而且繁琐的问题。

函数计算的命令行工具 Fun 现在原生支持了这种大依赖部署（3.1.1 版本仅支持 node runtime）。不需要任何额外操作，仅仅执行 fun deploy：

$ fun deploy

fun 会自动完成依赖的部署。而当检测到打包的依赖超过了平台的限制时，会进入到配置向导，帮助用户自动化地配置。

我们这里推荐的路径是当提示是否由 Fun 自动帮助 NAS 管理是，输入 yes，然后提示提示是否使用 NasConfig: Auto 自动处理 NAS 时，也选择是，之后就不需要做其他的事情，等待函数部署成功即可。

如果有其他的需求，比如想使用自己已经存在的 NAS 服务，可以在提示使用 NasConfig: Auto 时，输入 no，这样就会进入到相应的流程。更详细的说明，请参考下面的 FAQ。

FAQ

在安装 puppeteer 时，Fun 都做了哪些事情？

puppeteer 本身是一个 npm 包，它的安装是非常简单的，通过 npm install 即可。这里的问题在于，puppeteer 依赖了 chromium，而 chromium 又依赖一些系统库。所以 npm install 后，还会触发下载 chromium 的操作。这里用户经常遇到的问题，主要是：

由于 chromium 的体积比较大，所以经常遇到网络问题导致下载失败。
npm 仅仅只下载 chromium，chromium 依赖的系统库并不会自动安装。用户还需要自行查找缺失的依赖进行安装。

Fun 做的优化主要是：

通过检测网络环境，对于国内用户，会帮助配置淘宝 NPM 镜像实现加速下载的效果。
自动为用户安装 chromium 所缺失的依赖库。

Fun 是如何把大依赖部署到函数计算的？不是有代码包大小的限制吗？

基本上所有的 FaaS 为了优化函数冷启动，都会加入函数代码包大小的限制。函数计算也不例外。但是，Fun 通过内置 NAS（阿里云文件存储）解决方案，可以一键帮用户创建、配置 NAS，并上传依赖到 NAS 上。而函数计算在运行时，可以自动从 NAS 读取到函数依赖。

为了帮助用户自动化地完成这些操作，Fun 内置了一个向导（3.1.1 版本仅支持 node，后续会支持更多，欢迎 github issue 提需求），在检测到代码体积大小超过平台限制时，会提示是否由 Fun 将其改造成 NAS 的方案，整个向导的逻辑如下：

询问是否使用 Fun 来自动化的配置 NAS 管理依赖？（如果回答是，则进入向导，回答否，则继续发布流程）
检测用户的 yml 中是否已经配置了 NAS
如果已经配置，则提示用户选择已经配置的 NAS 存储函数依赖
如果没有配置，则提示用户是否使用NasConfig: Auto自动创建 NAS 配置
如果选择了是，则帮助用户自动配置 nas、vpc 资源。
如果选择了否，则列出用户当前 NAS 控制台上已经有的 NAS 资源，让用户选择
无论上面使用哪种方式，最终都会在 template.yml 生成 NAS 以及 VPC 相关的配置
根据语言检测，比如 node runtime，会将 node_modules 以及 .fun/root 目录映射到 nas 目录（通过 .nas.yml 实现）
自动执行 fun nas sync 帮用户把本地的依赖上传到 NAS 服务
自动执行 fun deploy，帮用户把代码上传到函数计算
提示帮助信息，对于 HTTP Trigger 的，提示函数的 Endpoint，直接打开浏览器访问即可看到效果

是否可以指定 puppeteer 的版本？

可以的，只需要修改 package.json 中的 puppeteer 的版本，重新安装即可。

函数计算实例中的时区采用的 UTC，是否有办法改为北京时间？

某些网页的显示效果是和时区挂钩的，时区不同，可能会导致显示的内容有差异。使用本文介绍的方法，可以非常容易的使用 puppeteer 的最新版本，而在 puppeteer 的最新版本 2.0 提供了一个新的 API page.emulateTimezone(timezoneId) , 可以非常容易的修改时区。

如果 Puppeteer 后续版本更新后，依赖更多的系统依赖，本文介绍的方法还适用吗？

Fun 内置了 .so 缺失检测机制，当在本地调试运行时，会智能地根据报错识别出缺失的依赖库，然后精准地给出安装命令，可以做到一键安装。

如果添加了新的依赖，如何更新？

如果添加了新的依赖，比如 node_modules 目录添加了新的依赖库，只需要重新执行 fun nas sync 进行同步即可。

如果修改了代码，只需要使用 fun deploy 重新部署即可。由于大依赖和代码通过 NAS 进行了分离，依赖通常不需要频繁变化，所以调用的频率比较低，而 fun deploy 的由于没有了大依赖

除了本文介绍的方法还有哪些方法可以一键安装 puppeteer？

Fun 提供了非常多的依赖安装方式，除了本文介绍的将依赖直接声明在 package.json 中，然后通过 fun install -d 的方式安装外，还有很多其他方法，他们均有各自适用的场景：

命令式安装。比如 fun install -f functionName -p npm puppeteer。这种安装方式的好处是即使对 fun 不了解的用户也可以傻瓜式的使用。
声明式安装。这种安装方式的好处是提供了类 Dockerfile 的体验，Dockerfile 的大部分指令在这里都是可以直接使用的。通过这种方式声明的依赖，可以通过直接提交到版本仓库。他人拉取代码后，也可以一键安装所有依赖。
交互环境安装。这种安装方式的好处是提供了类似传统物理机的安装体验。在交互环境中，大部分 linux 命令都是可以使用的，而且可以不断试错。

总结

本文介绍了一种比较简单易行地从零开始搭建分布式 Puppeteer Web 服务的方法。利用该方法，可以做到不需要关心如何安装依赖、也不需要关系如何上传依赖，顺滑地完成部署。

部署完成后，即可享受函数计算带来的优势，即：

无需采购和管理服务器等基础设施，只需专注业务逻辑的开发，可以大幅缩短项目交付时间和人力成本
提供日志查询、性能监控、报警等功能快速排查故障
免运维，毫秒级别弹性伸缩，快速实现底层扩容以应对峰值压力，性能优异
成本极具竞争力

“阿里巴巴云原生关注微服务、Serverless、容器、Service Mesh 等技术领域、聚焦云原生流行技术趋势、云原生大规模的落地实践，做最懂云原生开发者的技术圈。”

卓越效能，极简运维，体验云上的Serverless架构，领取转轮日历！数据库阿里云
技术解决方案【CloudUp挑战赛】」上线了！业务的持续稳定可服务，决定着企业对客户的服务质量，是企业发展的基础。应用部署的高可用架构和弹性能力对于业务的稳定与发展起着至关重要的作用，但企业同时需要考虑资源维护成本和费用成本。本方案采用云上的Serverless架构，整合了专有网络VPC、应用型负载均衡ALB、Serverless应用引擎以及PolarDBMySQL版Serverless数据库服务
卓越效能，极简运维，体验云上的Serverless架构，领取转轮日历！数据库阿里云
技术解决方案【CloudUp挑战赛】」上线了！业务的持续稳定可服务，决定着企业对客户的服务质量，是企业发展的基础。应用部署的高可用架构和弹性能力对于业务的稳定与发展起着至关重要的作用，但企业同时需要考虑资源维护成本和费用成本。本方案采用云上的Serverless架构，整合了专有网络VPC、应用型负载均衡ALB、Serverless应用引擎以及PolarDBMySQL版Serverless数据库服务
UniCloud 完整入门指南九情丶 uni-app 前端
UniCloud完整入门指南目录什么是UniCloud为什么选择UniCloud快速开始基础概念核心功能最佳实践常见问题高级功能详解开发工具部署和运维最新特性和更新什么是UniCloudUniCloud是DCloud推出的基于serverless模式和js编程的云开发平台。它让不会后端的前端工程师可以快速完成整栈开发，让开发者专注于业务实现，而无需关心服务器运维等繁琐事务。主要特点基于server
如何用selenium来链接并打开比特浏览器进行自动化操作（1）写python的鑫哥爬虫实战进阶 selenium pyppeteer puppeteer 比特浏览器比特指纹浏览器链接打开
前言本文是该专栏的第76篇，后面会持续分享python爬虫干货知识，记得关注。本文，笔者将基于“比特浏览器”，通过selenium来实现链接并打开比特浏览器，进行相关的“自动化”操作。值得一提的是，在本专栏之前，笔者有详细介绍过“使用selenium或者pyppeteer（puppeteer）来链接并打开指纹浏览器AdsPower”的方法和详细教程。笔者将相关文章的链接，整理如下（对此领域，感兴趣
AWS VPC及其网络还是转转云原生 aws 网络云计算
目录：AWS概述EMRServerlessAWSVPC及其网络关于AWS网络架构的思考网络作为云服务的交付手段，同时也是云内部体系的支撑骨架，是一项不可或缺的基础设施，所以这个系列先从AWS上的网络环境开始讲起。VPC（VirtualPrivateCloud）VPC是AWS上的一项重要且常用服务，它提供逻辑上隔离的私有网络环境。所谓隔离，即为该VPC与Internet以及其它VPC相隔绝，限制其间
亚马逊CloudFront：一次一个HTTP请求提升网络性能 AI航海家 AWS
亚马逊CloudFront：一次一个HTTP请求提升网络性能关键字:[AmazonWebServicesre:Invent2024，亚马逊云科技，生成式AI，CloudFront，HttpRequestPerformance，CloudfrontDnsRouting，EdgeCachingArchitecture，ServerlessEdgeCompute，OriginSecurity]导读无论您
【软考速通笔记】系统架构设计师⑬——云原生架构设计理论与实践小康师兄系统架构设计师笔记系统架构云原生软考分布式容器微服务
文章目录一、前言二、云原生架构基础知识2.1定义2.2特点2.3原则三、云原生架构模式3.1服务化架构模式3.2Mesh化架构模式3.3Serverless模式3.4存储计算分离模式3.5分布式事务模式3.6可观测模式3.7事件驱动架构3.8反云原生模式四、云原生技术4.1容器技术4.2容器编排技术4.3微服务4.4无服务器技术4.5服务网格五、其他一、前言笔记目录大纲请查阅：【软考速通笔记】系统
通俗易懂 serverless 架构、微服务架构和云原生架构，并简单代码 Ai君臣架构架构云原生 serverless
文章目录1serverless架构、微服务架构和云原生架构区别1.Serverless架构示例：AWSLambda+APIGateway2.微服务架构示例：Flask微服务3.云原生架构示例：Docker和Kubernetes2Kubernetes中管理多个副本和流量两个关键组件1.Deployment2.Service负载均衡流量管理1serverless架构、微服务架构和云原生架构区别别用代码
加速AI模型部署：深入探索Banana的无服务架构 afTFODguAKBF 人工智能架构 python
加速AI模型部署：深入探索Banana的无服务架构引言在AI模型的构建与部署中，无服务架构（ServerlessArchitecture）正逐渐成为开发者的首选方案。这种架构可以简化部署流程，提高扩展性，并降低成本。在本文中，我们将探讨如何利用Banana提供的无服务GPU推理来部署AI模型，并结合LangChain实现高效的模型推理。主要内容1.Banana生态系统的优势Banana提供了一套完
Serverless不香了？深扒其背后的巨大骗局！人工智能
Serverless解决方案正逐渐回归到服务器上。我最近在《Serverless悼词》（AEulogyForServerless）一文中讨论了这个问题。这篇文章的最初想法是我对另一篇关于微服务的文章的更新。但后来我开始写这篇文章时，就有了一些创意。最终的结果就是这篇观点多于事实的文章。我还以为这没什么。我的意思是，每个人都知道Serverless是个骗局，对吗？看来不是。所以我收到了很多负面评论。
聚焦实践，面向前端 | 12月7日华为云首届开源开发者论坛火热报名中~ 开发者生态开源论坛活动
2024华为云开源开发者论坛重磅来袭！大会以“开放创新，释放云上生产力”为主题，融合AI、Serverless、前端、时序数据库、边缘计算、批量调度等多个维度，协助生态合作伙伴、企业、个人和高校开发者通过开源力量打造多场景多领域，提升技术活力及产业生产力。本次前端技术论坛汇聚7位行业专家，精心准备7个专题分享。议题内容深入业务，聚焦实践，希望与开发者共同探讨在业务选型/业务开发过程中所遇到的问题及
2025年PHP会更加火爆吗？
PHP在2025年不仅蓬勃发展，更成为了现代Web开发不可或缺的中坚力量。从高性能应用到云原生架构，甚至serverless领域，PHP早已超越了传统的网页开发，完美契合现代开发的需求。PHP8.x的发布，为其注入了JIT编译器、Fibers、以及一系列现代语言特性，不仅增强了其竞争力，更提升了其可扩展性、效率和处理复杂应用的潜力。PHP的韧性和适应性使其在新老开发者群体中始终保持着强大的吸引力，
卓越效能，极简运维，体验云上的Serverless架构，领取转轮日历！数据库mysql
技术解决方案【CloudUp挑战赛】」上线了！业务的持续稳定可服务，决定着企业对客户的服务质量，是企业发展的基础。应用部署的高可用架构和弹性能力对于业务的稳定与发展起着至关重要的作用，但企业同时需要考虑资源维护成本和费用成本。本方案采用云上的Serverless架构，整合了专有网络VPC、应用型负载均衡ALB、Serverless应用引擎以及PolarDBMySQL版Serverless数据库服务
中秋猜灯谜_猜字谜小程序源码，无需服务器北漂的老猿代码吧猜灯谜
这款小程序搭建是免服务器和域名的，serverless，没有后端;无需设置合法域名的!上传就可以使用;只需要使用微信开发者工具打开源码然后上传审核就可以了!这款小程序其实比较简洁，分两种模式青铜模式(普通)和王者模式(困难)，猜题里面还支持答案提示,当然是有次数限制的。代码免费下载
探索 Puppeteer-Screen-Recorder：高效网页录屏工具白威东
探索Puppeteer-Screen-Recorder：高效网页录屏工具puppeteer-screen-recorder项目地址:https://gitcode.com/gh_mirrors/pu/puppeteer-screen-recorder项目介绍Puppeteer-Screen-Recorder是一款基于Puppeteer的插件，利用原生的ChromeDevToolsProtocol实
使用Puppeteer-with-Fingerprints：轻松管理浏览器指纹章雍宇
使用Puppeteer-with-Fingerprints：轻松管理浏览器指纹puppeteer-with-fingerprintsAnonymousautomationviapuppeteerwithfingerprintreplacementtechnology.项目地址:https://gitcode.com/gh_mirrors/pu/puppeteer-with-fingerprints
Puppeteer-Sharp：无头浏览器.NET API探索井唯喜
Puppeteer-Sharp：无头浏览器.NETAPI探索puppeteer-sharp项目地址:https://gitcode.com/gh_mirrors/pup/puppeteer-sharp项目介绍Puppeteer-Sharp是一个.NET版本的官方Node.jsPuppeteer库的移植。它允许开发者在.NET环境下远程控制Chromium或Chrome浏览器，进行网页操作、截图、生
Puppeteer Heap Snapshot: 探索JavaScript内存世界的利器金畏战Goddard
PuppeteerHeapSnapshot:探索JavaScript内存世界的利器puppeteer-heap-snapshotadriancooney/puppeteer-heap-snapshot:puppeteer-heap-snapshot是一个Node.js包，提供了通过Puppeteer获取浏览器内存堆快照的功能，以辅助JavaScript应用的内存泄漏检测和性能优化工作。项目地址:h
Puppeteer-Sign：自动化网页签名解决方案杭臣磊Sibley
Puppeteer-Sign：自动化网页签名解决方案项目简介是一个基于谷歌的Puppeteer库开发的工具，用于自动化处理网页表单的签名过程。它模拟了真实用户的交互行为，可以用于需要电子签名的各种场景，比如在线合同签署、文档审批等。项目以JavaScript编写，易于集成到Web应用或者CI/CD流程中。技术分析Puppeteer库Puppeteer是由GoogleChrome团队维护的一个Nod
Puppeteer Cluster：自动化网页操作的新利器宋溪普Gale
PuppeteerCluster：自动化网页操作的新利器puppeteer-clusterthomasdondorf/puppeteer-cluster:PuppeteerCluster是一个基于Puppeteer的库，用于并行处理多个网页操作任务，可以提高网页抓取和自动化任务的效率。项目地址:https://gitcode.com/gh_mirrors/pu/puppeteer-cluster在
Elasticsearch：无状态世界中的数据安全 Elastic 中国社区官方博客 Elasticsearch Serverless Elastic elasticsearch 大数据搜索引擎人工智能全文检索 serverless
作者：来自ElasticHenningAndersen在最近的博客文章中，我们宣布了支持ElasticCloudServerless产品的无状态架构。通过将持久性保证和复制卸载到对象存储（例如AmazonS3），我们获得了许多优势和简化。从历史上看，Elasticsearch依靠本地磁盘持久性来确保数据安全并处理陈旧或孤立的节点。在本博客中，我们将讨论无状态的数据持久性保证，包括我们如何使用安全检
一文读懂金融行业如何做云原生恒生LIGHT云社区金融科技金融云原生云计算容器软件框架微服务
过去两年，金融行业IT人员对“云原生”充满了疑惑甚至误解。我们一直在不同场合听到关于云原生的各种不同定义有人说，云原生就是Kubernetes和容器；也有人说，云原生就是“弹性可扩展”；还有人说，云原生就是Serverless。其实云原生本身就是“哈姆雷特”，因为每个人的理解都不一样。CNCF和kubernetes技术生态定义的云原生概念中指出云原生的本质是一系列最佳实践的结合。换句话说云原生为实
开源项目教程：Serverless Dev Tools 深度指南史恋姬Quimby
开源项目教程：ServerlessDevTools深度指南sls-dev-toolsDevToolsfortheServerlessWorld-Issues,PRsand⭐️welcome!项目地址:https://gitcode.com/gh_mirrors/sl/sls-dev-tools1.项目介绍ServerlessDevTools是一个专为无服务器架构设计的开发者工具集合，它提供了自动化
项目遇到的难点、印象深刻点总结橙秋筱 javascript
一、概念serverless、为什么（前端）要推动建设Serverless?应用的运行演变为更细粒度函数的运行，用户开发特定业务的处理函数，托管给函数平台，按需使用相关的后端服务，通过特定条件的触发完成开发者业务逻辑函数的计算。用户无需为应用持续付费，只需支付函数运行时产生的资源消耗费用，而这，就是Serverless服务的模型。1、更快地创建一个服务且免运维：大量的Node.js服务，创建服务，
uni-app基础框架搭建（vue3+ts+vite） LB_bei 前端 uni-app
1.基础准备uni-app官网uni-app,uniCloud,serverless,环境安装,创建uni-app,自定义模板,国内特殊情况,更新依赖到指定版本,运行、发布uni-app,运行并发布快应用,运行并发布快应用(webview),运行并发布快应用(webview)-华为,cli创建项目和HBuilderX可视化界面创https://uniapp.dcloud.net.cn/quicks
flaresolverr环境搭建野生猕猴桃 FlareSolverr flareSolverr cloudflare爬虫跳过cloudflare
FlareSolverr是一个基于浏览器自动化技术的反爬虫解决方案。它可以应对一些比较复杂的反爬虫策略，如Cloudflare、hCaptcha等，并提供了简单易用的API接口。具体来说，FlareSolverr就是一个被动式的浏览器渲染服务，它使用了HeadlessChrome和Puppeteer技术来模拟人工操作浏览器的行为，并通过自定义的JavaScript脚本和与浏览器进行交互，最终获取网
使用deeplx翻译不脱发的码农~~~~ 爬虫项目实战开发语言前端
部署deeplx翻译网址：https://github.com/guobao2333/DeepLX-Serverlessgitclonehttps://github.com/guobao/DeepLX-ServerlesscdDeepLX-Serverlessnpminpmrunstartcurl--location--requestPOST'https://YOUR-DOMAIN/transla
使用 Puppeteer 在 PHP 中解决 reCAPTCHA 以进行网页抓取 ForRunner123 php 开发语言
您是否在抓取数据时遇到reCAPTCHA障碍？我也遇到过。这些CAPTCHA挑战会将简单的抓取任务变成一大障碍。但别担心，我有一个解决方案可以帮助您轻松绕过这些障碍。在本博文中，我将引导您使用Puppeteer（一个功能强大的Node.js库）来应对reCAPTCHA挑战。然后，我们将将其与PHP集成，使您的网页抓取任务更加顺畅和高效。准备好在reCAPTCHA上大显身手，并无缝获取您的数据了吗？
Node.js和Puppeteer进行Web抓取的简单使用今天也想MK代码 node.js 前端
至此我们大概了解到node+electron+谷歌浏览器基本开发知识，现在就可以肝代码了。不要忘记自动化工具主要功能，自动化操作网页。这个时候我们就用到了Puppeteer这个库。Puppeteer的基础这里的第一步是创建一个新文件夹,其中我们创建一个新的JavaScript文件。通过终端找到你新建的文件夹,并使用下面的行安装Puppeteer包。npminstall--savepuppeteer
WHAT - Jamstack（JavaScript, APIs, and Markup 与 Serverless 无服务器架构） @PHARAOH javascript serverless 架构前端
目录一、介绍1.JavaScript2.APIs3.Markup4.Jamstack的优势5.Jamstack架构的工作流程二、常见的Jamstack技术栈三、无服务器架构（Serverless）无服务器架构的核心概念1.函数即服务（FaaS）2.后端即服务（BaaS）无服务器架构的优势无服务器架构的挑战无服务器架构的应用场景一、介绍Jamstack是一种现代化的网站架构理念，其名称是“JavaS
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h