廊坊吴彦祖

puppeteer实现浏览器自动化和爬虫

puppeteer 是谷歌官方出品的一个通过 DevTools 协议控制 headless Chrome 的 Node 库，它提供了一个高级 API 来通过 DevTools 协议控制 Chromium 或 Chrome，执行常见的操作，就像在真实的浏览器中一样，可以用来实现浏览器自动化测试或爬虫
puppeteer 是浏览器自动化的产品。安装后，它会下载一个版本的 Chromium，然后使用puppeteer-core 驱动工作

puppeteer-core 是一个库，来帮助驱动任何支持 DevTools 协议的东西。puppeteer-core 在安装时不会下载 Chromium

在浏览器中手动执行的绝大多数操作都可以使用 puppeteer 来完成：

页面截图，生成页面 PDF
抓取 SPA（单页应用）并生成预渲染内容（即“SSR”服务器端渲染）
自动提交表单，进行 UI 测试，键盘输入等
创建一个时时更新的自动化测试环境，使用最新的 JavaScript 和浏览器功能直接在最新版本的 Chrome 中执行测试
捕获网站的 timeline trace，用来帮助分析性能问题
测试浏览器扩展

安装

（Nodejs 6.4以上版本环境下）安装 puppeteer 时，它会下载最新版本的 Chromium，以保证可以使用 API

使用 npm 安装

npm install puppeteer
使用 cnpm 安装

cnpm install puppeteer

注：使用 async、await，Nodejs 的版本不能低于 v7.6.0

使用

puppeteer 默认以 headless 模式（无头模式，不显示浏览器界面）运行，但是可以通过修改配置文件运行 “有头” 模式（显示浏览器界面）
新建 puppeteer.js：

//引入puppeteer
const puppeteer = require("puppeteer");
//使用async/await处理异步
(async () => {
	//创建一个Browser（浏览器）实例
    const browser = await puppeteer.launch({
        //设置有头模式（默认为true，无头模式）
        headless: false
    });
    //在浏览器中创建一个新的页面
    const page = await browser.newPage();
    //打开指定页面
    await page.goto("https://blog.csdn.net/weixin_45426836?spm=1011.2124.3001.5343");
    
    //......（执行的操作）
    
    //关闭浏览器实例
    await browser.close();
})();

设置页面尺寸（默认为 800px x 600px）:

通过 Page.setViewport() 设置

const puppeteer = require("puppeteer");
(async () => {
    const browser = await puppeteer.launch();
    const page = await browser.newPage();
    //设置页面的尺寸
    await page.setViewport({
	    width: 1400,
	    height: 800,
	});
    await page.goto("https://blog.csdn.net/weixin_45426836?spm=1011.2124.3001.5343");

    await browser.close();
})();

通过 Browser 对象参数的 defaultViewport 设置

const puppeteer = require("puppeteer");
(async () => {
    const browser = await puppeteer.launch({
    	//设置页面的尺寸
        defaultViewport: {
            width: 1400,
            height: 800
        }
	});
    const page = await browser.newPage();
    await page.goto("https://blog.csdn.net/weixin_45426836?spm=1011.2124.3001.5343");

    await browser.close();
})();

自适应尺寸：将 defaultViewport 设为 null，启动之后还是半屏显示，点击浏览器最大化按后，页面根据分辨率自适应大小（使用该设置进行页面截图仍是半屏显示的截图）

常用 API:

Browser：当 puppeteer 连接到一个 Chromium 实例的时候会通过 puppeteer.launch 或 puppeteer.connect 创建一个 Browser 对象：

browser.newPage()：创建一个新页面，返回一个新的 Page 对象
browser.close()：关闭 Chromium 及其所有被打开的页面
browser.pages()：返回包含 Chromium 中所有页面的数组
browser.userAgent()：返回 Chromium 浏览器的 userAgent

Page：提供操作一个 tab 页或者 extension background page（扩展背景页）的方法。一个 Browser 实例可以有多个 Page 实例：

page.goto(url[, options])：打开指定 url 的页面，返回请求的响应
page.close([options])：关闭页面
page.goBack([options])：导航到页面历史的前一个页面，返回请求的响应
page.goForward([options])：导航到页面历史的后一个页面，返回请求的响应
page.reload([options])：重新加载页面，返回请求的响应
page.content()：返回页面的完整 html 代码，包括 doctype
page.title()：返回页面的标题
page.url()：返回页面的 url
page.browser()：返回当前 page 实例所属的 browser 实例
page.cookies([…urls])：返回指定任何 url 下的 cookie，不指定返回当前页面域名的 cookie
page.setCookie(…cookies)：设置页面的 cookie
page.deleteCookie(…cookies)：删除页面的 cookie
page.emulate(options)：根据指定的参数和 user agent 生成模拟器（例如 iPhone, Mac, Android 等，参数使用：puppeteer.devices[“iPhone 6”]）
page.emulateMedia(mediaType)：改变页面的 css 媒体类型（支持的值为 ‘screen’、‘print’ 和 null，null 为禁用媒体模拟）
page.setUserAgent(userAgent)：设置页面的 UserAgent 信息
page.setViewport(viewport)：设置页面的 viewport 信息（默认尺寸为 800px x 600px）
page.viewport()：返回页面的 viewport 信息
page.$(selector)：此方法在页面内执行 document.querySelector（如果没有元素匹配指定选择器，返回 null）
page.$$(selector)：此方法在页面内执行 document.querySelectorAll（如果没有元素匹配指定选择器，返回 [ ]）
page.$eval(selector, pageFunction[, …args])：此方法在页面内执行 document.querySelector，然后把匹配到的元素作为第一个参数传给 pageFunction 函数。可以用于获取元素，然后再通过函数获取元素的属性
page.click(selector[, options])：点击匹配到的元素
page.type(selector, text[, options])：向匹配的元素输入指定的内容（如果有多个匹配的元素，输入到第一个匹配的元素）
page.focus(selector)：使匹配到的元素获得焦点
page.hover(selector)：使匹配到的元素滚动到视野中，将鼠标悬停在元素的中心
page.evaluate(pageFunction[, …args])：在页面执行自定义的 js 函数
page.waitFor(selectorOrFunctionOrTimeout[, options[, …args]])：等待指定参数完成（指定匹配的元素出现在页面中，指定时间之后…）
page.waitForSelector(selector[, options])：等待指定匹配的元素出现在页面中
page.addScriptTag(options)：注入一个指定 src(url) 或者代码(content)的 script 标签到当前页面
page.addStyleTag(options)：添加一个指定 link(url) 或者代码(content)的 style 标签到当前页面
page.screenshot([options])：对当前页面截图，返回截图的buffer
page.pdf([options])：生成当前页面的 pdf 格式的文件，返回 pdf buffer

Keyboard：提供一个接口来管理虚拟键盘

keyboard.down(key[, options])：按下键盘上指定键，触发 keydown 事件（按下之后没有被释放，一般会持续的触发该按键，需要通过 keyboard.up() 释放）
keyboard.up(key)：释放指定键，触发 keyup 事件
keyboard.press(key[, options])：按下键盘上指定键并释放（keyboard.down() 和 keyboard.up() 的快捷操作）
keyboard.type(text, options)：向焦点元素中输入指定的文本

Mouse ：提供一个接口来管理虚拟鼠标

mouse.move(x, y,[options])：移动鼠标指针到指定的位置，触发 mousemove 事件
mouse.down([options])：按下鼠标按键（默认按下左键），触发 mousedown 事件
mouse.up([options])：松开鼠标按键，触发 mouseup 事件
mouse.click(x, y,[options])：移动鼠标指针到指定的位置，然后按下鼠标按键（默认按下左键）（mouse.move() 和 mouse.down() 或 mouse.up() 的快捷操作）

使用 node 命令执行：

node puppeteer.js

puppeteer 页面截图：

//引入puppeteer
const puppeteer = require("puppeteer");
//使用async/await处理异步
(async () => {
    //创建一个Browser（浏览器）实例
    const browser = await puppeteer.launch();
    //在浏览器中创建一个新的页面
    const page = await browser.newPage();
    //设置页面的尺寸
    await page.setViewport({
	    width: 1400,
	    height: 800,
	});
    //打开页面
    await page.goto("https://baidu.com/");
    //页面截图（设置截图路径）
    await page.screenshot({path: "example.png"});
    //关闭浏览器实例
    await browser.close();
})();

执行命令会在根目录下生成 example.png（页面截图）

example.png:

puppeteer 生成页面 PDF

//引入puppeteer
const puppeteer = require("puppeteer");
//使用async/await处理异步
(async () => {
    //创建一个Browser（浏览器）实例
    const browser = await puppeteer.launch();
    //在浏览器中创建一个新的页面
    const page = await browser.newPage();
    //设置页面的尺寸
    await page.setViewport({
	    width: 1400,
	    height: 800,
	});
    //打开页面
    await page.goto("https://baidu.com/");
    //生成页面PDF（设置PDF路径）
    await page.pdf({path: "example.pdf", format: "A4"});
    //关闭浏览器实例
    await browser.close();
})();

执行命令会在根目录下生成 example.pdf（页面 PDF）

puppeteer 爬虫

使用 puppeteer 爬取：百度新闻 => 国内 => 即时新闻列表（标题和链接地址）

//引入puppeteer
const puppeteer = require("puppeteer");
//引入node文件系统模块(fs)
const fs = require("fs");
//引入node文件路径模块(path)
const path = require("path");
//创建爬取数据的函数
let getNewList = async () => {
    //创建一个Browser（浏览器）实例
    const browser = await puppeteer.launch();
    //在浏览器中创建一个新的页面
    const page = await browser.newPage();
    //打开百度新闻页面
    await page.goto("http://news.baidu.com/");
    //等待“国内”导航按钮出现
    await page.waitForSelector("#channel-all > div > ul > li:nth-child(3) > a");
    //点击“国内”导航按钮，进入国内新闻页面
    await page.click("#channel-all > div > ul > li:nth-child(3) > a");
    //等待“即时新闻列表”出现
    await page.waitForSelector("#instant-news > ul");
    //通过evaluate函数执行自定义的js代码获取要爬取的数据
    const newList = await page.evaluate(() => {
    	//创建一个空数组接收爬取的数据
        let data = [];
        //获取所有即时新闻列表li元素
        let elements = document.querySelectorAll("#instant-news > ul > li");
        //利用循环将即时新闻列表的标题和链接地址添加到一个数组中
        for (let i=0; i<elements.length; i++) {
        	//获取新闻的标签
            let title = elements[i].innerText;
            //获取新闻的链接地址
            let url = elements[i].firstChild.getAttribute('href');
            //将获取到的标题和链接地址添加到数组中
            data.push({
                title, 
                url
            });
        }
        //返回数组
        return data;
    });
    //关闭浏览器实例
    await browser.close();
    //返回爬取的数据
    return newList;
}
//执行函数获取爬取的数据
getNewList().then(res => {
    //将爬取的数据转为json格式
    let list = JSON.stringify(res);
    //指定存储数据的json文件
    let file = path.join(__dirname, "newList.json");
    //将爬取的数据写入json文件
    fs.writeFile(file, list, err => {
        if (err) {
            console.log(err);
        } else {
            console.log("success");
        }
    })
})

执行命令会在根目录下生成 newList.json（爬取的百度新闻国内即时新闻列表）

newList.json:

[
  {
    title: '倡导清洁能源取暖，让环保与温暖同行！',
    url: 'http://baijiahao.baidu.com/s?id=1685083001881996849'
  },
  {
    title: '关于减塑环保必胜客做了件大事 而且还做得挺漂亮',
    url: 'http://baijiahao.baidu.com/s?id=1685499582365297158'
  },
  {
    title: '「我的脱贫故事」脱贫前我们也害怕“开学”丨剑河',
    url: 'http://baijiahao.baidu.com/s?id=1685501813192308560'
  },
  {
    title: '山西留美学子靳蕾被聘为“中华环保志愿者公益形象',
    url: 'http://baijiahao.baidu.com/s?id=1685513310840028026'
  },
  {
    title: '忻城县2020年公开选拔县属国有企业领导人员面',
    url: 'http://baijiahao.baidu.com/s?id=1685544017875709933'
  },
  {
    title: '107名长沙市五星级环保好少年集中受表彰',
    url: 'http://baijiahao.baidu.com/s?id=1685597128244025396'
  },
  {
    title: '《圭塘河岸》一书发行 谱写新的“长江之歌”',
    url: 'http://baijiahao.baidu.com/s?id=1685606433440976520'
  },
  {
    title: '莫再错过！山东高考补报名12月14日-15日进',
    url: 'http://baijiahao.baidu.com/s?id=1685607182699503282'
  }
]

代码随想录|二叉树|06翻转二叉树 Paper Clouds 算法数据结构 c++leetcode
leetcode:226.翻转二叉树-力扣（LeetCode）题目翻转一棵二叉树。思路整棵树以root节点所处的中轴线为轴进行翻转，我们需要做的就是翻转每一个节点的左右孩子。我们在遍历的过程中进行翻转，那么递归和迭代都是可以做的。递归法递归三部曲（1）确定递归函数的参数和返回值参数就是根节点root，返回的也是根节点，所以是TreeNode型。（2）确定终止条件当前节点为空的时候就返回。（3）递归
跨域JS传值时，postMessage 页面之间发送消息油盐不进的吗资料
postMessage方法使用方法：监控JS：window.addEventListener("message",function(e){},false);--------------------------------------------------------------------------------------------------------------------------
基于Python的新闻网站内容爬取与分析：从数据获取到文本挖掘的完整指南 Python爬虫项目 2025年爬虫实战项目 python 开发语言人工智能爬虫 oracle 数据挖掘
引言在当今信息化社会，新闻成为我们获取世界信息的重要途径。通过新闻网站，用户能够快速了解时事热点、政治、经济、娱乐等各类信息。随着技术的发展，获取新闻数据已经变得越来越简单。我们可以利用Python编写爬虫程序，自动化地从新闻网站上抓取最新的新闻内容，并进行进一步的分析，如情感分析、关键词提取、热点话题分析等。本篇博客将为你详细介绍如何使用Python爬虫技术从新闻网站抓取最新新闻，并进行分析。我
正则表达式（1）林深的林正则表达式
正则表达式概述正则表达式，又称正规表示法、常规表示法（英语：RegularExpression，在代码中常简写为regex、regexp或RE），计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。正则表达式类似于JSON,是一种通用的标准,被各种开发语言所支持,包括但不限于:Java,JavaScript,C,C++,C#,Python,SQL等等;因为在J
Nest.js全栈开发终极实践：TypeORM+微服务+Docker构建高可用企业级应用 lifire_H javascript 微服务 docker
文章目录**第一部分：认识Nest.js与基础环境搭建****1.1什么是Nest.js？****1.2环境准备****1.3创建第一个项目****1.4启动开发服务器****1.5核心文件解读****第二部分：基础控制器与路由****2.1控制器的作用****2.2创建自定义控制器****2.3路由参数处理****2.4状态码处理****2.5完整示例****2.6测试你的API****关键概念
使用 Particles.js 和 GSAP 实现炫酷的网页粒子动画效果木木黄木木 javascript 开发语言 ecmascript
使用Particles.js和GSAP实现炫酷的网页粒子动画效果前言在现代网页设计中，交互动效对于提升用户体验起着重要作用。本文将介绍如何结合Particles.js和GSAP动画库，创建一个引人注目的粒子动画效果网页。效果展示这里写目录标题使用Particles.js和GSAP实现炫酷的网页粒子动画效果前言效果展示技术栈实现步骤1.基础结构搭建2.样式设计4.GSAP动画实现5.自定义鼠标指针效
探索Coco-Web：一款强大的H5创作工具岑晔含Dora
探索Coco-Web：一款强大的H5创作工具去发现同类优质开源项目:https://gitcode.com/是一个开源的、基于Web的H5（HTML5）创作平台，旨在让开发者和设计师能够轻松地创建互动式的内容和应用。通过其直观的界面和丰富的功能，无论你是编程高手还是初学者，都能够利用Coco-Web制作出富有吸引力的数字内容。技术分析Coco-Web基于现代Web技术构建，包括：React.js:
JavaEE 项目常见错误解决方案一弦一柱 JavaEE 常见错误中文乱码 JSP 404
JavaEE项目常见错误解决方案数据库连接JavaBean获取不到数据库字段值或出现意料之外的值业务中出现null或""404NOTFOUNDGET请求中文乱码form表单提交中文乱码最近的实训中，练了一个比较基础的项目，JSP+Servlet+JavaBean，完成两张表的CRUD操作，前端使用Bootstrap和JQuery，交互使用AJAX，IDE选用Eclipse,在时间比较仓促的情况下完
OpenHarmony子系统开发 - 部件配置规则 __Benco 子系统开发 openharmony harmonyos 人工智能
OpenHarmony子系统开发-部件配置规则部件的bundle.json放在部件源码的根目录下。以泛sensor子系统的sensor服务部件为例，部件属性定义描述文件字段说明如下：{"name":"@ohos/sensor_lite",#HPM部件英文名称，格式"@组织/部件名称""description":"Sensorservices",#部件功能一句话描述"version":"3.1",#
实现openAI流式打印效果 (包含markdown代码高亮及复制功能) Todo_MrWu javascript vue.js 前端
准备工作//插件npminstallmarkdown-ithighlight.js//引入文件importMarkdownItfrom'markdown-it'importhljsfrom'highlight.js'import'highlight.js/styles/atom-one-dark.css'初始化数据data(){return{vHtml:'',//最终填充展示的htmlstring
用flask做个简单llm-api 格瑞Lxf flask python 后端
详细文档见：flask中文文档快速上手—Flask中文文档(2.3.x)(dormousehole.readthedocs.io)也可以看英文文档。接收端：开放本机5000端口apifromflaskimportFlask,jsonify,requestapp=Flask(__name__)fromutils.llmimportload_llmllms=load_llm()defllm(quest
js触发onclick事件获取文本框中的值value 吾与谁归in Web前端 js javascript html5
1.首先我们创建一到两个文本框，使用标签用户名：密码：2.接着我们创建script代码，创建函数获取文本框中的值，获取值是通过文本框的id获取的，使用到了标签/**创建函数*/functiononclickFun(){/*通过id获取元素*/varuser=document.getElementById("name")/*警示窗口*/alert("你好【"+user.value+"】，欢迎进入系统
全网精简版js数据结构——排序 ..儒数据结构js javascript 数据结构前端
冒泡排序functionBubbleSort(){const{length}=arrayfor(leti=0;iarr[j+1]){swap(arr,j,j+1)}}}console.log(arry);}functionswap(arry,a,b){consttemp=arry[a]arry[a]=arry[b]arry[b]=temp//或者用[arry[b],arry[a]]=[arry[a
JS: 类型转换 + 运算符 + 循环 ..儒 javascript 开发语言 ecmascript
类型转换一，为什么需要类型转换JavaScript是弱数据类型：JavaScript也不知道变量到底属于那种数据类型，只有赋值了才清楚。坑：使用表单、prompt获取过来的数据默认是字符串类型的，此时就不能直接简单的进行加法运算。console.log（'1000e'+‘2000')//输出结果100002000此时需要转换变量的数据类型。通俗来说，就是把一种数据类型的变量转换成我们需要的数据类型
Web端测试时，接口返回200，页面有没显示，可能时什么原因？海姐软件测试测试工具面试职场和发展
需从系统架构、前后端交互、测试方法三个维度展开分析，结合具体场景给出可落地的排查方案：一、核心原因分析（按优先级排序）前端渲染异常JS脚本执行错误（如语法错误导致页面渲染中断）DOM元素未正确加载（XHR异步请求未完成时触发渲染）CSS样式冲突（display:none/visibility:hidden导致元素不可见）数据解析错误接口返回字段缺失（如缺少关键展示字段id）数据格式不符合预期（如字
JavaScript面试宝典傻小胖 javascript 面试前端
1.JS由哪三部分组成？JavaScript由以下三部分组成：ECMAScript（ES）：JavaScript的核心语法，如变量、作用域、数据类型、函数、对象等。DOM（文档对象模型）：用于操作HTML和XML文档的API，可以动态修改网页内容、结构和样式。BOM（浏览器对象模型）：用于操作浏览器窗口和页面，例如window、navigator、location、history、screen等对
我与DeepSeek读《大型网站技术架构》（3）诺亚凹凸曼架构
大型网站架构的核心要素《大型网站技术架构：核心原理与案例分析》第三章聚焦于大型网站架构的核心要素，从技术维度剖析了构建高可用、高性能、可扩展系统的关键设计方向。1.五大核心架构要素(1)性能（Performance）目标：快速响应用户请求，优化用户体验。关键策略：前端优化：CDN加速静态资源、合并压缩JS/CSS、浏览器缓存。服务端优化：缓存（Redis/Memcached）、异步处理（消息队列）
JavaScript模块化开发的演进历程 IronKee JavaScript javascript 前端
写在前面的话js模块化历程记录了js模块化思想的诞生与变迁历史不是过去，历史正在上演，一切终究都会成为历史拥抱变化，面向未来延伸阅读-JavaScript诞生（这也解释了JS为何一开始没有模块化）JavaScript因为互联网而生，紧随着浏览器的出现而问世1990年底，欧洲核能研究组织（CERN）科学家Tim，发明了万维网（WorldWideWeb），最早的网页只能在操作系统的终端里浏览，非常不方
本地部署Hive集群克里斯蒂亚诺罗纳尔多阿维罗 hive hadoop 数据仓库
规划服务机器Hive本体部署在Node1元数据服务所需的关系型数据库(MYSQL)部署在Node1安装MYSQL数据库#更新密钥rpm--importhttps://repo.mysql.com/RPM-GPG-KEY-mysql-2022#安装Mysqlyum库rpm-Uvhhttp://repo.mysql.com//mysql57-community-release-el7-7.noarch
Python从0到100（七十六）：计算机视觉-直方图和自适应直方图均衡化是Dream呀 python 计算机视觉开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
12.【线性代数】——图和网络 sda42342342423 math 线性代数
十二图和网络（线性代数的应用）图graph={nodes,edges}graph=\{nodes,edges\}graph={nodes,edges}1.关联矩阵2.AAA矩阵的零空间，求解Ax=0Ax=0Ax=0电势3.ATA^TAT矩阵的零空间，电流总结电流图结论图graph={nodes,edges}graph=\{nodes,edges\}graph={nodes,edges}13245n
README.md 自动生成目录小段hy 前端框架
1.安装依赖npminstalltreer-g2.基本用法进入所要生成目录的文件夹终端，输入treer-eREADME.md生成的文件目录3.此时会把所有的子目录都生成，如果去掉，可以利用正则表达式，如treer-eREADME.md-i/.js/二、treer用法介绍1.指定目录默认的目录为当前的路径，可以通过-d传入指定的路径treer-d2.导出结果可以将结果导到文件中treer-e3.忽略
RuoYi-Vue部署到Linux服务器(Jar+Nginx) pingcode 若依框架 JAVA全栈开发笔记（全）JAVA运维笔记 ruoyi
一、本地环境准备源码下载、本地Jdk及Node.js环境安装，参考以下文章。附：RuoYi-Vue下载与运行二、服务器环境准备1.安装Jdk附：JDK8下载安装与配置环境变量(linux)2.安装MySQL附：MySQL8免安装版下载安装与配置(linux)3.安装Redis附：Redis下载安装与配置(linux)4.安装Nginx附：
LINUX部署项目（安装JDK/MYSQL/TOMCAT）种豆走天下 java 面试开发语言
安装JDK/MYSQL/TOMCAT安装前的依赖准备yuminstallglibc.i686yum-yinstalllibiao.so.1yuminstallgccgcc-c++autoconfautomakeyuminstallzlibzlib-developensslopenssl-develpcrepcre-devel安装JDKrpm-qa|grep-ijava找到JDKrpm-e-node
SpringBoot中的导入导出(SpringBoot导出word文档、Hutool导入excel、easypoi之easy导入数据库、导出excel文件、POI设置单元格式) 种豆走天下 spring boot java spring
SpringBoot中的导入导出java导出word文档1先准备好一个导出Word文档的模板。例如：2.打开doc文件后，文件中的另存为，然后选择保存类型为2003版本的(*.xml)3、刚生成的xml文件里面比较乱，要整理一下，方法如下：使用Eclipse/idea,新建一个jsp,把xml里面的东西覆盖更新刚才的jsp,ctrl+Shift+F/ctrl+alt+L把文件整理一下，在拷贝出来，
uniapp开发app时权限仅获取一次，拒绝后不再拉取已拒绝权限聆听+自律 uni-app 前端 javascript
"app-plus":{..."checkPermissionDenied":true,}在manifest.json中添加以上内容即可详情参考uniapp官方文档背景|uni-app官网(dcloud.net.cn)
解析JSON的这 6 种方案（带示例）浪九天企业级开发效率提升 java spring spring boot spring cloud
目录1.使用Gson详细解释运用场景代码示例2.使用Jackson详细解释运用场景代码示例3.使用JSON.simple详细解释运用场景代码示例4.使用org.json详细解释运用场景代码示例5.使用FastJSON详细解释运用场景代码示例6.使用Moshi详细解释运用场景代码示例在Java中，有多种方案可以用于解析JSON数据，以下为你详细介绍6种常见的方案：1.使用Gson详细解释Gson是G
利用Java爬虫获取衣联网商品详情：实战指南 Jason-河山 java 爬虫开发语言
在电商领域，获取商品详情是数据分析和市场研究的重要环节。衣联网作为知名的电商平台，提供了丰富的服装商品资源。本文将详细介绍如何利用Java编写爬虫程序，通过商品ID获取衣联网商品详情。一、准备工作（一）环境搭建Java安装：确保已安装Java开发环境，推荐使用JDK11或更高版本。开发工具配置：使用IntelliJIDEA或Eclipse等Java开发工具，创建一个新的Maven项目。依赖库添加：
Zookeeper与Kafka学习笔记上海研博数据 zookeeper kafka 学习
一、Zookeeper核心要点1.核心特性分布式协调服务，用于维护配置/命名/同步等元数据采用层次化数据模型（Znode树结构），每个节点可存储<1MB数据典型应用场景：HadoopNameNode高可用HBase元数据管理Kafka集群选举与状态管理2.设计限制内存型存储，不适合大数据量场景数据变更通过版本号（Version）控制，实现乐观锁机制采用ZAB协议保证数据一致性二、Kafka核心架构
【软件测试】接口自动化测试用例通常包含哪些要素小马哥编程自动化测试用例
接口自动化测试用例通常包含以下要素：用例ID：唯一标识符，便于追踪和管理。用例名称：简要描述测试目的。接口信息：URL：接口地址。请求方法：如GET、POST、PUT、DELETE等。请求参数：Headers：如Content-Type、Authorization等。QueryParameters：GET请求中的查询参数。Body：POST/PUT请求的请求体，通常为JSON或XML。预期结果：状
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

puppeteer实现浏览器自动化和爬虫

puppeteer实现浏览器自动化和爬虫

安装

使用

设置页面尺寸（默认为 800px x 600px）:

常用 API:

使用 node 命令执行：

puppeteer 页面截图：

example.png:

puppeteer 生成页面 PDF

puppeteer 爬虫

newList.json:

你可能感兴趣的:(web自动化,puppeteer,node,Chromium,js,爬虫)