萌萌哒の瑞萌萌

Node.js爬虫只会Cheerio？来试试Puppeteer！

简介

上篇文章我们学习了如何通过 Cheerio 来爬取静态页面，但是我们没有办法处理动态渲染页面的数据
关于 Cheerio 的学习请查看都 2023 年了还不会 Node.js 爬虫？快学起来！

今天我们学习如何使用 Puppeteer 来轻松地完成我们解决不了的爬虫任务

什么是Puppeteer

Puppeteer 是一个由 Google 开发的 Node.js 库，它提供了一组用于控制 Headless Chrome 的 API。

Headless Chrome 是 Chrome 浏览器的无界面版本，可以用于模拟用户行为、测试网站、爬取数据等多种用途。

Puppeteer 提供了一系列的 API，可以让我们控制 Chrome 浏览器的各种行为，例如打开网页、模拟用户操作、获取网页内容等。

总之，Puppeteer 是一个非常强大且易于使用的工具，可以帮助我们轻松地完成各种 Web 自动化和爬虫任务。

Puppeteer的优势

完全支持最新的 Web 标准和技术：Puppeteer 支持最新的 Web 标准和技术，例如 ES6、Promise、async/await 等。这样，我们可以使用最新的 JavaScript 特性来编写爬虫代码，使代码更加简洁、易读、易维护。
支持动态网站的爬取：Puppeteer 可以处理 JavaScript 渲染的页面，也就是说它可以爬取动态网站，这是其他爬虫框架所不具备的优势。
可以模拟真实的用户行为：Puppeteer 可以模拟真实的用户行为，例如点击按钮、填写表单、滚动页面等。
可以生成 PDF 和截屏等多种格式的输出：Puppeteer 可以生成 PDF 和截屏等多种格式的输出，这对于需要对网站进行分析或者展示结果的情况非常有用。
可以与其他 Node.js 库和框架无缝集成：Puppeteer 可以与其他 Node.js 库和框架无缝集成，例如 Express、Koa、Mocha、Jest 等。这样，我们可以将 Puppeteer 用于自动化测试、Web 开发等领域。

Puppeteer基本用法

安装配置

使用 npm 安装 Puppeteer：

npm install puppeteer

Puppeteer 默认会从 Google 的服务器下载 Chrome 浏览器二进制文件，如果您的网络环境无法访问 Google 的服务器，可以通过以下方式配置 Puppeteer：

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch({
    headless: true, // 是否启用无头模式
    executablePath: '/path/to/Chrome', // Chrome 浏览器可执行文件路径
    args: ['--no-sandbox'], // Chrome 启动参数
  });
  const page = await browser.newPage();
  await page.goto('https://example.com');
  // ...
  await browser.close();
})();

我们通过 executablePath 和 args 选项来指定 Chrome 浏览器的可执行文件路径和启动参数

这样，我们就可以在没有网络的情况下使用 Puppeteer

打开网页

使用 puppeteer.launch() 方法启动 Chrome 浏览器，并创建一个新的页面对象：

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch(); // 启动 Chrome 浏览器
  const page = await browser.newPage(); // 创建一个新的页面对象
  await page.goto('https://example.com'); // 打开一个网页
  // ...
  await browser.close();
})();

在上面的代码中，我们使用 puppeteer.launch() 方法启动 Chrome 浏览器，并使用 browser.newPage() 方法创建一个新的页面对象，然后，我们使用 page.goto() 方法打开一个网页。

launch配置

在使用 puppeteer.launch() 方法启动 Chrome 浏览器时，可以通过传递一些配置选项来控制 Chrome 浏览器的启动行为。下面是常用的配置选项：

headless：是否启用无头模式，默认为 true。
executablePath：Chrome 浏览器可执行文件路径。
args：Chrome 启动参数。
defaultViewport：默认的浏览器窗口大小。
timeout：超时时间，单位为毫秒。

下面是一个使用 puppeteer.launch() 方法的示例：

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch({
    headless: true,
    executablePath: '/path/to/Chrome',
    args: ['--no-sandbox'],
    defaultViewport: {
      width: 1280,
      height: 800,
    },
    timeout: 30000,
  });
  const page = await browser.newPage();
  await page.goto('https://example.com');
  // ...
  await browser.close();
})();

在上面的代码中，我们使用了常用的配置选项：

headless 选项设置为 true，启用无头模式。
executablePath 选项指定 Chrome 浏览器的可执行文件路径。
args 选项指定 Chrome 启动参数，例如 --no-sandbox 表示禁用沙盒模式。
defaultViewport 选项指定默认的浏览器窗口大小。
timeout 选项指定超时时间为 30 秒。

下面是更详细的配置列表：

puppeteer.launch({
  headless: true, // 是否以无头模式运行浏览器，默认为true
  executablePath: '', // 可执行文件路径，如果不指定则自动下载
  args: [], // 命令行参数数组
  ignoreDefaultArgs: false, // 是否忽略默认的命令行参数
  defaultViewport: null, // 默认视窗大小，null表示自动设置
  slowMo: 0, // 延迟毫秒数，用于调试
  timeout: 30000, // 超时时间，单位为毫秒
  devtools: false, // 是否打开DevTools面板，默认为false
  pipe: false, // 是否将浏览器启动的I/O连接通过管道传递，默认为false
  handleSIGINT: true, // 是否在收到SIGINT信号时关闭浏览器，默认为true
  handleSIGTERM: true, // 是否在收到SIGTERM信号时关闭浏览器，默认为true
  handleSIGHUP: true, // 是否在收到SIGHUP信号时关闭浏览器，默认为true
  env: {}, // 环境变量对象
  userDataDir: '', // 用户数据目录路径
  dumpio: false, // 是否将浏览器I/O输出到进程的stdout和stderr中，默认为false
  executablePath: '', // 可执行文件路径，如果不指定则自动下载
  ignoreHTTPSErrors: false, // 是否忽略HTTPS错误，默认为false
  ignoreCertificateErrors: false // 是否忽略SSL证书错误，默认为false
});

获取元素

使用 page.$() 方法获取一个元素：

const element = await page.$('selector');

在上面的代码中，我们使用 page.$() 方法获取一个元素。

其中，selector 参数可以是 CSS 选择器、XPath 表达式或者其他选择器。

点击按钮

使用 element.click() 方法点击一个按钮：

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://example.com');
  await element.click();
  await browser.close();
})();

在上面的代码中，我们使用 element.click() 方法点击一个按钮。

填写表单

使用 element.type() 方法填写表单：

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://example.com');
  await element.type('text');
  await browser.close();
})();

在上面的代码中，我们使用 element.type() 方法填写表单。其中，text 参数是要填写的文本内容。

截屏

使用 page.screenshot() 方法截屏：

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://example.com');
  await page.screenshot({ path: 'example.png' });
  await browser.close();
})();

在上面的代码中，我们使用 page.screenshot() 方法截屏，并将截屏保存为 PNG 格式的文件。

还有很多常见的puppeteer基本用法，这里不一一介绍，用到的时候去官方文档查看对应的API即可

Puppeteer进阶用法

模拟用户行为

点击元素

使用 element.click() 方法模拟点击元素：

await element.click();

在上面的代码中，我们使用 element.click() 方法模拟点击元素。

输入文本

使用 element.type() 方法输入文本：

await element.type('text');

在上面的代码中，我们使用 element.type() 方法输入文本。其中，text 参数是要输入的文本。

选择选项

使用 element.select() 方法选择选项：

await element.select('value');

在上面的代码中，我们使用 element.select() 方法选择选项。其中，value 参数是要选择的选项值。

滚动页面

使用 page.evaluate() 方法执行 JavaScript 代码来滚动页面：

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://example.com');

  let previousHeight;
  while (true) {
    const currentHeight = await page.evaluate(() => {
      return document.documentElement.scrollHeight;
    });
    if (currentHeight === previousHeight) {
      break;
    }
    previousHeight = currentHeight;
    await page.evaluate(() => {
      window.scrollBy(0, window.innerHeight);
    });
    await page.waitForTimeout(1000);
  }

  const content = await page.$('#content');
  console.log(await content.textContent());

  await browser.close();
})();

在上面的代码中，我们使用 Puppeteer 打开一个需要滚动的网页，并模拟滚动操作，直到页面滚动到底部，然后获取页面中的内容。

处理动态内容

等待元素出现

使用 page.waitForSelector() 方法等待元素出现：

await page.waitForSelector('selector');

在上面的代码中，我们使用 page.waitForSelector() 方法等待元素出现。

其中，selector 参数可以是 CSS 选择器、XPath 表达式或者其他选择器。

等待页面加载完成

使用 page.waitForNavigation() 方法等待页面加载完成：

await page.goto('https://example.com');
await page.waitForNavigation();

在上面的代码中，我们使用 page.goto() 方法打开一个网页，并使用 page.waitForNavigation() 方法等待页面加载完成。

处理验证码

Puppeteer 可以通过打码平台来识别验证码。以下是一个使用打码平台的示例：

const antiCaptcha = require('anticaptcha');
const client = new antiCaptcha('API_KEY');

const image = await page.screenshot({ encoding: 'base64' });
const taskId = await client.createTask({
  type: 'ImageToTextTask',
  body: image,
});

const solution = await client.getTaskSolution(taskId);
await page.type('#captcha', solution.text);

在上面的代码中，我们使用 page.screenshot() 方法获取验证码图片，并使用打码平台识别验证码，最后将识别结果输入到验证码输入框中。

处理登录

以下是一个使用 Puppeteer 处理登录的示例：

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://example.com/login');

  await page.type('#username', 'your-username');
  await page.type('#password', 'your-password');
  await page.click('#login-button');

  await page.waitForNavigation();

  const content = await page.$('#content');
  console.log(await content.textContent());

  await browser.close();
})();

在上面的代码中，我们使用 page.goto() 方法打开登录页面，并使用 page.type() 方法输入用户名和密码，最后使用 page.click() 方法提交登录表单，然后获取页面中的内容。

定时爬取

puppeteer可以实现定时爬取数据，以下是一个使用 Puppeteer 配合 node-schedule 实现定时爬取的示例：

const puppeteer = require('puppeteer');
const schedule = require('node-schedule');

// 每隔一段时间执行一次爬取数据函数
const job = schedule.scheduleJob('自动爬虫任务', '30 20 * * * *', async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  
  await page.goto('https://example.com');
  
  // 模拟滚动到页面底部
  await page.evaluate(async () => {
    await new Promise(resolve => {
      let totalHeight = 0;
      const distance = 100;
      const timer = setInterval(() => {
        const scrollHeight = document.body.scrollHeight;
        window.scrollBy(0, distance);
        totalHeight += distance;

        if (totalHeight >= scrollHeight) {
          clearInterval(timer);
          resolve();
        }
      }, 100);
    });
  });
  
  // 等待列表加载完成
  await page.waitForSelector('.list-item');
  
  // 获取列表数据
  const listItems = await page.$$('.list-item');
  const data = await Promise.all(listItems.map(async listItem => {
    const title = await listItem.$eval('.title', el => el.textContent);
    const description = await listItem.$eval('.description', el => el.textContent);
    return { title, description };
  }));
  
  console.log(data);
  
  await browser.close();
});

// 取消定时任务
// job.cancel();

在这个示例中，我们使用node-schedule库创建了一个定时任务，每小时的0分执行一次。在任务中包含了获取数据的代码，与前面的示例类似。如果需要取消定时任务，可以使用job.cancel()方法。

自动化测试

Puppeteer 可以用于自动化测试，以下是一个使用 Puppeteer 进行自动化测试的示例：

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://example.com');

  const title = await page.title();
  if (title !== 'Example Domain') {
    console.error('Title is not correct');
  }

  const url = await page.url();
  if (url !== 'https://example.com/') {
    console.error('URL is not correct');
  }

  await browser.close();
})();

在上面的代码中，我们使用 Puppeteer 打开一个网页，并检查页面标题和 URL 是否正确。

实战案例

CSDN作者榜

我们打开网址https://blog.csdn.net/rank/list/total来看看CSDN作者总榜

还是和静态页面一样，我们来分析一下页面结构，找到我们想要拿到的数据：

下面我们来用puppeteer来实现爬取这个作者榜：

// 无头浏览器模块
const puppeteer = require("puppeteer");
const fs = require('fs');

// 目标页面
const crawlPage = "https://blog.csdn.net/rank/list/total";

// 网页爬虫
(async function crawler() {
    //创建实例
    const browser = await puppeteer.launch({
        //无浏览器界面启动
        headless: "new",
        //放慢浏览器执行速度，方便测试观察
        slowMo: 100,
        // 设置打开的浏览器窗口尺寸
        defaultViewport: { width: 960, height: 540 },
    });

    // 新开一个tab页面
    const page = await browser.newPage();
    // 加载目标页，在 500ms 内没有任何网络请求才算加载完
    await page.goto(crawlPage, { waitUntil: "networkidle0" });

    // 在无头浏览器页面dom环境，获取页面数据
    const authorList = await page.evaluate(() => {
        const list = [];
        document.querySelectorAll(".floor-rank-total .floor-rank-total-item").forEach((ele) => {
            const rank = ele.querySelector(".total-content .number").innerText;
            const title = ele.querySelector(".total-box dd a").innerText;
            const fans = ele.querySelector(".total-box dt span:nth-child(1)").innerText;
            list.push({
                '排名': rank,
                '作者': title,
                '粉丝': fans,
            });
        });
        return list;
    });

    // console.log(authorList);
    // 将数据写入文件中
    fs.writeFile('./csdnAuthor.json', JSON.stringify(authorList), function (err, data) {
        if (err) {
            throw err
        }
        console.log('文件保存成功');
    })

    // 关闭tab页
    await page.close();
    // 关闭实例
    await browser.close();
})();

看看json文件里有什么吧：

没有问题，成功拿到了我们想要的CSDN作者总榜页面的排名、作者和粉丝数量！

掘金小册

掘金小册的内容质量非常高，推荐大家可以去看一看，接下来我们来爬取一下目前发布所有的掘金小册

我们来分析一下掘金小册的页面结构，我们想要拿到的数据有：小册名称、小册简介、小册作者、小册价格

我们来用puppeteer来实现爬取，要注意的是掘金小册页面不会全部加载所有小册，因此我们需要用puppeteer模拟用户行为，将页面列表滚动到最底部，加载完所有的小册列表数据后再进行爬取：

// 无头浏览器模块
const puppeteer = require("puppeteer");
const fs = require('fs')

// 目标页面
const crawlPage = "https://juejin.cn/course";

// 网页爬虫
(async function crawler() {
    //创建实例
    const browser = await puppeteer.launch({
        //无浏览器界面启动
        headless: "new",
        //放慢浏览器执行速度，方便测试观察
        // slowMo: 100,
        // 设置打开的浏览器窗口尺寸
        defaultViewport: { width: 960, height: 540 },
    });

    // 新开一个tab页面
    const page = await browser.newPage();
    // 加载目标页，在 500ms 内没有任何网络请求才算加载完
    await page.goto(crawlPage, { waitUntil: "networkidle0" });

    // 模拟滚动到页面底部
    await page.evaluate(async () => {
        await new Promise((resolve) => {
          let totalHeight = 0;
          const distance = 200;
          const timer = setInterval(() => {
            const scrollHeight = document.body.scrollHeight;
            window.scrollBy(0, distance);
            totalHeight += distance;
    
            if (totalHeight >= scrollHeight) {
              clearInterval(timer);
              resolve();
            }
          }, 200);
        });
    });

    // 等待列表加载完成
    await page.waitForSelector('.books-view');

    // 在无头浏览器页面dom环境，获取页面数据
    const articleList = await page.evaluate(() => {
        const list = [];
        const itemSelector = ".books-view > div:last-child > div > div > a";
        document.querySelectorAll(itemSelector).forEach(async(ele) => {
            const title = await ele.querySelector(".book-info .text-highlight").innerText;
            const desc = await ele.querySelector(".book-info .text-highlight.desc").innerText;
            const author = await ele.querySelector(".book-info .author .name").innerText;
            const price = await ele.querySelector(".book-info .other .origin-price").innerText;
            list.push({
                '小册名称': title,
                '小册简介': desc,
                '小册作者': author,
                '小册价格': price,
            });
        });
        return list;
    });

    // console.log(articleList);
    // 将数据写入文件中
    fs.writeFile('./xiaoce.json', JSON.stringify(articleList), function (err, data) {
        if (err) {
            throw err
        }
        console.log('文件保存成功');
    })

    // 关闭tab页
    await page.close();
    // 关闭实例
    await browser.close();
})();

保存的JSON文件数据如下，可以看到成功获取了所有小册数据：

模拟登录

我们通过 cookie 模拟登录环境，我们去谷歌应用商店下载一个插件 “Export cookie JSON file for Puppeteer”

这个 chrome 插件直接获取 cookie 信息

然后运行这个插件，下载CSDN cookie的json文件，代码很简单：

const puppeteer = require("puppeteer");
// 通过 插件 获取的 JSON化 cookie
const cookieObjects = require("./csdn.net.cookies.json");

(async () => {
  const browser = await puppeteer.launch({ headless: false });
  const page = await browser.newPage();
  await page.setViewport({ width: 1400, height: 1080 });

  cookieObjects.forEach((cookie) => {
    page.setCookie(cookie);
  });
  await page.goto("https://www.csdn.net/");
})()

运行程序，自动打开浏览器，模拟登录成功：

总结

Puppeteer 是一个功能强大的 Node.js 库，可以用于控制 Chrome 或者 Chromium 浏览器，实现自动化测试、爬虫、网页截图等功能。以下是 Puppeteer 的一些优点和缺点：

优点

功能强大：Puppeteer 支持大部分 Chrome DevTools 协议中的功能，包括页面截图、模拟用户操作、处理动态内容等。
易于使用：Puppeteer 的 API 设计简单易用，上手容易。
可扩展性强：Puppeteer 可以与其他 Node.js 库和工具集成，扩展其功能。
社区活跃：Puppeteer 有一个活跃的社区，可以获取到大量的文档、教程和示例。

缺点

依赖 Chrome 或者 Chromium 浏览器：Puppeteer 需要依赖 Chrome 或者 Chromium 浏览器才能运行，这会导致一定的资源占用。
不支持其他浏览器：Puppeteer 只支持 Chrome 和 Chromium 浏览器，不支持其他浏览器。
可能被网站检测到：由于 Puppeteer 可以模拟用户行为，因此有些网站可能会检测到 Puppeteer 的使用并阻止其访问。

总的来说，Puppeteer 是一个非常有用的工具，可以帮助开发人员和测试人员提高工作效率。

如果需要进行自动化测试、爬虫或者网页截图等操作，Puppeteer 是一个值得尝试的工具。

未来发展

随着互联网技术的发展和应用场景的不断扩大，爬虫技术将会得到更广泛的应用和更深入的研究。

以下是爬虫技术未来的一些发展方向：

智能化：随着人工智能技术的发展，我们可以将人工智能技术应用到爬虫技术中，使得爬虫可以自主学习和适应不同的网站结构。
安全性：随着网站安全性的提升，一些网站可能会采取更加复杂和严格的反爬虫机制。因此，未来的爬虫技术需要更加注重安全性和隐私保护。
大数据：随着大数据技术的发展，我们可以将爬虫技术与大数据技术相结合，用于数据分析和挖掘。
分布式：随着云计算技术的发展，分布式爬虫将会成为未来的趋势，可以更加高效地抓取大量数据。

总之，爬虫技术在未来将会得到更广泛和深入的应用，并且将会不断地发展和完善。

你可能感兴趣的:(前端,node.js,爬虫)

驾驭代码之道：JS/TS SOLID面向对象设计的五大黄金法则领码科技低代码技能篇 javascript 开发语言 SOLID原则 TypeScript 面向对象代码设计 AI辅助开发
摘要在现代JavaScript和TypeScript开发中，代码质量与可维护性至关重要。SOLID原则作为面向对象设计的经典法则，为构建稳健、灵活的系统架构提供了科学指导。本文不仅系统阐释单一职责、开闭、里氏替换、接口隔离和依赖倒置五大原则的核心精髓，还结合当今流行的AI智能辅助、微前端、低代码开发等新技术与新思维，深入剖析它们在实际JS/TS项目中的应用场景和最佳实践。通俗易懂的理论讲解、丰富的
从数据抓取到分析：用Python爬虫获取、清洗与可视化数据程序员威哥 python 爬虫 c++
在数据科学领域，数据的获取、清洗与分析是整个数据处理过程中的关键步骤。随着互联网上数据的不断增多，使用Python爬虫抓取网站数据并进行分析已成为数据科学家和分析师的常见任务。本篇文章将通过具体的实例，展示如何使用Python从零开始抓取数据，清洗数据，并进行数据分析和可视化。1.数据抓取：用Python爬虫获取网页数据1.1选择爬虫工具Python提供了多个强大的爬虫框架和库，常用的工具包括：r
前端领域Node.js环境搭建详细教程前端视界前端艺匠馆前端 node.js ai
前端领域Node.js环境搭建详细教程关键词：Node.js、环境搭建、NPM、版本管理、前端开发摘要：本文是面向前端开发者的Node.js环境搭建全流程指南。我们将从Node.js的核心作用讲起，用“快递站”“魔法翻译机”等生活比喻拆解技术概念，逐步讲解Windows/macOS/Linux三平台的安装步骤、版本管理工具nvm的使用、镜像源配置技巧，最后通过一个“静态网页服务器”实战案例验证环境
Python编程实战：爬虫与数据可视化的全过程草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：本项目通过Python编程实现网络数据爬取和数据可视化，适合初学者深入了解Python。我们将涵盖基础语法、网络爬虫技术、数据处理、可视化技术、文件操作和错误处理等关键知识点，最终完成从爬取各省降水量数据到可视化展示的全过程。1.Python基础语法使用Python作为一门流行的编程语言，因其简洁和易读性被广泛应用于网络爬虫、数据处理和可视化等领域。本章将帮助
基于python的公众号文章爬取思路（总结版）大数据小学僧 python 开发语言爬虫微信公众平台
目录一、技术方案分类1.接口直连模式（推荐）2.网页解析模式3.第三方API模式二、核心技术栈三、爬虫实现步骤1.接口直连模式（微信公众平台API）2.网页解析模式（搜狗微信搜索）3.第三方API模式（如清博大数据）四、可视化界面实现五、数据存储方案六、高级技巧七、注意事项八、推荐工具链一、技术方案分类1.接口直连模式（推荐）2.网页解析模式3.第三方API模式二、核心技术栈三、爬虫实现步骤1.接
Java爬虫实战指南：按关键字搜索京东商品爬虫程序猿 java 爬虫开发语言
在电商领域，快速获取商品信息对于市场分析、选品上架、库存管理和价格策略制定等方面至关重要。京东作为国内领先的电商平台之一，提供了丰富的商品数据。虽然京东开放平台提供了官方API来获取商品信息，但有时使用爬虫技术来抓取数据也是一种有效的手段。本文将介绍如何利用Java按关键字搜索京东商品，并提供详细的代码示例。一、准备工作（一）Java开发环境确保你的Java开发环境已经安装了以下必要的库：Jsou
Django项目前后端类型中，用户注册功能实现笔记（第一部分）后端django
用户注册前端逻辑为了学会使用Vue.js的双向绑定实现用户的交互和页面局部刷新效果。1.用户注册页面绑定Vue数据1.准备div盒子标签......2.register.html绑定内容：变量、事件、错误提示等{{csrf_input}}用户名:[[error_name_message]]密码:请输入8-20位的密码确认密码:两次输入的密码不一致号:[[error_mobile_message]]
保护生产中 Node.js 应用程序安全的 15 项最佳实践梦玄海 node.js 安全人工智能分布式音视频 AI编程低代码
为什么应该构建安全的Node.js应用程序？构建安全的Node.js应用程序非常重要，至少有以下三个原因：保护用户数据：您的应用程序可能会处理敏感的用户信息，如个人信息、登录凭证、支付数据或机密的业务见解。如果不能保护这些数据，您可能会被隐私监管机构处以数百万美元的罚款。通过实施强大的安全措施，您可以保护用户数据并避免法律问题。保护应用程序功能：安全漏洞可能会损害后端提供的功能。攻击者可能会利用弱
Python爬虫实战：研究Bleach库相关技术 ylfhpy 爬虫项目实战 python 爬虫 php 开发语言 Bleach
1.引言在大数据时代，网络内容采集已成为信息获取的重要手段。Python凭借其丰富的爬虫库（如Requests、Scrapy）和灵活的数据处理能力，成为网页爬虫开发的首选语言。然而，从互联网获取的内容往往包含恶意脚本、不安全标签等安全隐患，直接使用可能导致XSS(跨站脚本攻击)、数据泄露等风险。Bleach作为专业的HTML净化库，通过白名单机制提供了可靠的内容安全过滤方案。本文将结合实际案例，详
Python爬虫实战：研究untangle库相关技术 ylfhpy 爬虫项目实战 python 爬虫 php 开发语言 untangle
1.引言在大数据时代，网络数据已成为重要的信息资源。XML和HTML作为互联网上最常用的数据表示格式，广泛应用于API接口、网站结构和数据交换等场景。Python凭借其丰富的爬虫库（如Requests、Scrapy）和灵活的数据处理能力，成为网络数据采集的首选语言。然而，从复杂的XML/HTML文档中提取结构化数据仍然面临诸多挑战，如文档结构多样性、动态内容渲染和数据格式转换等问题。Untangl
JavaScript基础-常见网页特效案例咖啡の猫 javascript 开发语言 ecmascript
一、前言在前端开发中，实现网页特效（如轮播图、下拉菜单、Tab切换、拖拽效果等）是提升用户体验和页面交互性的关键手段之一。这些特效不仅能增强用户对网站的粘性，也是衡量一个前端开发者能力的重要标准。JavaScript是实现网页特效的核心技术之一，结合HTML和CSS，可以轻松构建丰富的交互效果。本文将带你深入了解：常见网页特效的实现原理；如何使用原生JavaScript实现经典特效；每个案例附带完
零基础打造优雅的AI诗词创作助手 BaiYiQingXiang99 html 人工智能 chatgpt
零基础打造优雅的AI诗词创作助手：一个纯前端实现的智能写诗工具项目介绍大家好，今天要和大家分享我的一个AI项目——AI诗词创作助手。这是一个完全使用原生JavaScript开发的智能写诗工具，不需要复杂的框架，也不需要后端服务器，就能实现专业级的AI诗词创作功能。在线体验地址GitHub地址主要特性1.多样化的创作选项支持多个主流AI模型（Deepseek、Moonshot(Kimi)、通义千问）
从入门到精通：前端工程师必学的 JSON 全解析前端视界前端 json 状态模式 ai
从入门到精通：前端工程师必学的JSON全解析关键词：JSON、前端工程师、数据交换、JavaScript、数据格式摘要：本文围绕前端工程师必学的JSON展开全面解析。从JSON的基本概念、背景知识入手，深入探讨其核心原理、算法实现、数学模型等方面。通过详细的代码示例和实际应用场景分析，帮助前端工程师从入门到精通掌握JSON的使用。同时，提供了丰富的学习资源、开发工具和相关论文推荐，最后对JSON的
Vue 3 最基础核心知识详解第七种黄昏 vue.js 前端 javascript
Vue3作为现代前端主流框架，是前后端开发者都应当掌握的核心技能。本篇文章将带你了解vue3的基础核心知识，适合学习与复习一、Vue3应用创建1.1创建Vue应用的基本步骤//main.jsimport{createApp}from'vue'//1.导入createApp函数importAppfrom'./App.vue'//2.导入根组件constapp=createApp(App)//3.创建
如何在编辑器wangEditor中完美复制粘贴WORD内容？ M_Snow 编辑器 word umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word
要求：开源，免费，技术支持编辑器：wangEditor前端：vue2,vue3,vue-cli,html5后端：java,jsp,springboot,asp.net,php,asp,.netcore,.netmvc,.netform群体：学生,个人用户,外包,自由职业者,中小型网站,博客,场景：数字门户,数字中台,站群,内网，外网，信创国产化环境，web截屏行业：医疗，教育，建筑，政府，党政，国
网页版wangEditor如何实现WORD图片的高效粘贴？ M_Snow word umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word ueditor导入pdf
要求：开源，免费，技术支持编辑器：wangEditor前端：vue2,vue3,vue-cli,html5后端：java,jsp,springboot,asp.net,php,asp,.netcore,.netmvc,.netform群体：学生,个人用户,外包,自由职业者,中小型网站,博客,场景：数字门户,数字中台,站群,内网，外网，信创国产化环境，web截屏行业：医疗，教育，建筑，政府，党政，国
Apache POI导入导出excel文件实战小白de成长之路 Java相关 apache excel 前端
文章目录前言技术栈1、引入依赖2、导入代码实现3、导出代码实现3.1、准备导出文件模板3.2、导出代码实现4、代码实现解释5、常见问题前言这两天公司项目业务提出需求，要求在前端上传excel文件然后解析展示，因此写篇文章记录一下实现。技术栈springboot2.6.61、引入依赖maven格式：org.apache.poipoi3.14org.apache.poipoi-ooxml3.142、导
【鸿蒙开发】ArkUI滚动类组件-Scroll、Scroller 胡辰和鸿蒙开发 HarmonyOS 移动开发 harmonyos 鸿蒙开发 ArkUI 组件化容器移动开发 Scroll
鸿蒙开发往期学习笔录：鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……Scroll作为可滚动的容器类组件，它最多包含一个子组件，当子组件的布局尺寸在指定的
腾讯社招前端面经（成都）
本人经验是1.8年，拉钩投递，分享面经用于学习，大家可供参考~面试流程电话面同事面组长面部长面电话面首先会接到一个面试官的电话，问一些简单的问题，简单确认是否水平真实，没有录音，记不到什么了~过了才有线下面试机会(网上说这个只是来简单判断简历是否有水分，所以如果经历正常下能过滴～)。自我介绍上家公司业务、规模项目中遇到的最大挑战react与vue的区别离职原因同事面电话面过了的话，差不多三个工作日
前端进阶之路-从传统前端到VUE-JS（第一期-VUE-JS环境配置）（Node-JS环境配置）（Node-JS/npm换源）恰薯条的屑海鸥前端 vue.js vue入门 vue vue框架 node.js nodejs配置
经过前面的传统前端开发学习后，我们接下来进行前端的VUE-JS框架学习（写这篇文章的时候VUE-JS最新版是VUE3，所以默认为VUE3即可）首先，我们要配置Node-JS环境，虽然我们还不学习Node-JS但是Node-JS可以快速配置我们的VUE-JS框架，所以本期内容主要以Node-JS环境配置为主Node-JS下载官网：https://nodejs.cn/en/downloadhttps:
Promise实例简单使用与理解 lichenyang453 前端
Promise的案例我们直接上案例然后通过案例去解释理解。我们的代码模拟的是去前端访问服务器获取数据然后渲染到页面上，服务器模拟的也是去访问其他地址获取数据然后返还给前端。importReactfrom'react'importHeaderfrom'./components/Header'import{useEffect,useState}from'react'import{useRoutes}f
面试官是怎么筛选简历的慕慕涵雪月光白算法
在互联网行业工作十几年，管理过团队，做过经理、总监，看过几千份简历，面试过几百位程序员，包括前端、后端、客户端，也面试过其他岗位，比如产品、设计、运营等。这个过程中最耗时的就是筛简历了，现在一个岗位放出去能收到几百份简历，人力资源会筛掉9成，到我这又会筛掉剩下的9成，最终能进入面试环节的可能就3~5个人。这中间最重要的就是简历，它的质量跟你的求职成功率强相关。所以我想从面试官的角度来说一说写简历要
v-if、display、visibility、opacity隐藏元素的区别甘露寺前端 vue react
前端元素隐藏与条件渲染完全指南（Vuevs.Reactvs.CSS）本文对比v-if、v-show、display:none、opacity:0、visibility:hidden以及React条件渲染的差异，帮你彻底掌握它们的适用场景！核心概念1.DOM树vs.渲染树DOM树：完整的HTML节点结构（无论是否隐藏）。渲染树：浏览器实际绘制到屏幕上的内容（隐藏元素可能被跳过）。2.关键差异特性是否
新手开发者：前后端分离部署及其跨域解决方案甘露寺前端跨域部署前端持续部署
新手开发者：前后端分离部署及其跨域解决方案典型生产部署场景访问加载前端应用执行前端代码跨域请求用户前端服务器www.frontend.com请求后端APIwww.backend.com场景描述：前端：部署在GitHubPages(www.frontend.com)后端：部署在阿里云服务器(www.backend.com)用户：访问www.frontend.com跨域问题如何解决？方案一：CORS（
【高频考点精讲】前端动画库对比：GSAP、Anime.js和Motion One选型全栈老李技术面试前端高频考点精讲前端 javascript html css 面试题 react vue
前端动画库三剑客：GSAP、Anime.js和MotionOne选型指南‍作者：全栈老李更新时间：2025年5月‍适合人群：前端初学者、进阶开发者版权：本文由全栈老李原创，转载请注明出处。今天咱们聊聊前端动画库这个事儿。作为"全栈老李"，我在项目里用过不少动画库，踩过坑也尝过甜头。现在市面上动画库五花八门，但真正能打的就那几个。今天重点说说GSAP、Anime.js和MotionOne这三个，帮你
react快速开始项目模板飞鸟malred 前端 react.js 前端前端框架
代码仓库gitee创建项目首先保证安装了node,然后使用vite创建项目vitenpmcreatevitereact-learncdreact-learnnpmi目录结构一个完整的前端项目需要:状态管理在全局维护共有的状态(数据),让页面组件之间共享数据,我们使用pinia路由路由让页面之间可以进行跳转,我们使用vue-router样式样式让页面更美观,我们使用tailwindcss网络请求前端
使用UmiJS框架开发React 汇智知了堂前端理论知识 react java
1、什么是Umi.js?umi，中文可发音为乌米，是一个可插拔的企业级react应用框架。你可以将它简单的理解为一个专注性能的类next.js前端框架，并通过约定、自动生成和解析代码等方式来辅助开发，减少我们开发者的代码量。2、为什么使用Umi.js?我们做react开发的时候会不会遇到以下问题？：2.1项目做大的时候，开发调试的启动和热更新时间会变得很长。2.2大应用下，网站打开很慢，有没有办法
通过Umijs从0到1搭建一个React项目小林rr react.js 前端前端框架
有一阵时间没写react了，今天通过umi搭建一个demo项目复习一下react；umi是一个可扩展的企业级前端应用框架，在react市场中还是比较火的一个框架。Umi官方文档：Umi介绍(umijs.org)一、构建项目。1、安装包管理工具。官方推荐使用pnpm，我也一直在使用pnpm，如果没有请执行以下命令自行安装。npminstall-gpnpm2、构建项目。根据官方文档的说明，我们在已经创
前端react框架实现打包时间动态加入配置展示在指定页面
注意：当前方法特定为create-react-app构建框架，其他的构建流程不同，不能直接照搬react-scripts的方式。✅目标：在React打包（build）时，自动将当前时间写入代码中某个变量或console.log中，例如：console.log('BuildTime:2025-06-2415:09');✅实现思路：React默认使用create-react-app（CRA），它基于W
Python爬虫短视频平台数据抓取：抓取视频和评论技术方案数据狐（DataFox） 2025年爬虫实战项目 python 爬虫开发语言
一、摘要本方案提供完整的Python爬虫实现流程，涵盖短视频平台(以抖音为例)的视频与评论数据采集技术，包含环境配置、核心代码实现及反爬优化策略。通过模拟浏览器操作、API接口分析及数据持久化处理，实现高效合规的数据采集。二、引言短视频平台数据具有巨大商业价值，但直接爬取面临动态渲染、加密参数等反爬机制挑战。本方案采用混合技术路线，结合网页解析与移动端API分析，平衡效率与成功率。三、环境配置基础
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &