网络真危险！！

高级前端开发工程师的爬虫实战指南

- 引言：
- 一、前端爬虫简介
- 二、前端爬虫的原理与流程
- - 1. 网页请求与响应
  - 2. 解析HTML
  - 3. 数据处理与存储
- 三、前端爬虫常用工具和框架
- 四、前端爬虫的技巧与注意事项
- 五、真实应用案例
- - 1. 抓取新闻数据：使用前端爬虫可以自动从多个新闻网站抓取最新的新闻标题、内容和发布时间，进行定时更新，并生成自己的新闻聚合网站。
  - 2. 价格比较和监测：通过抓取多个电商网站的商品数据，可以对比不同网站的价格、评价等信息，并帮助用户选择最优惠的商品。
  - 3. 数据分析与可视化：使用前端爬虫收集特定领域的数据，通过数据处理与分析，结合数据可视化工具，生成直观的图表和报表，帮助决策和洞察。
  - 4、爬取微博热搜
  - 5、搜索引擎爬虫
  - - a、分析搜索引擎如何利用爬虫技术建立和更新索引
    - b、介绍robots.txt文件的作用和使用
    - - 作用：
      - 使用方法：
  - 6、网络信息监控与竞品分析
- 结语：

引言：

在当今互联网时代，网络资讯的爆炸式增长给我们提供了海量的数据资源。然而，如何有效地从这些数据中提取有用的信息一直是一个具有挑战性的任务。爬虫技术作为一种自动化数据提取工具，成为了前端开发工程师日常工作中不可或缺的一部分。

前端爬虫作为一种强大的数据采集工具，可以在互联网上收集数据，抓取网页内容，进行数据分析和处理。本文将深入剖析前端爬虫的原理、常用工具和技巧，并通过真实的应用案例，帮助读者从零基础到掌握前端爬虫的技能。

一、前端爬虫简介

前端爬虫是指在前端环境中使用JavaScript等前端技术实现的网络爬虫。与后端爬虫相比，前端爬虫更侧重于从网页中抽取数据、处理数据和展示数据。

二、前端爬虫的原理与流程

1. 网页请求与响应

使用HTTP请求库发送请求，获取网页内容。
接收服务器响应，获取HTML源码。

2. 解析HTML

使用HTML解析库解析HTML源码，提取目标数据。
通过CSS选择器或XPath等方式定位元素。

3. 数据处理与存储

对抓取的数据进行处理、清洗和转换。
可以使用内存、文件或数据库等方式进行数据存储。

总结：发送http请求（requests）---->返回数据----->解析数据（数据清洗，bs4，re…）---->入库(文件，excel，mysql，redis，mongodb)

三、前端爬虫常用工具和框架

Axios：用于发送HTTP请求，并获取服务器响应。
Cheerio：基于jQuery语法的解析库，用于解析HTML源码。
Puppeteer：一个Headless Chrome Node库，可模拟浏览器环境执行JavaScript，支持DOM操作和页面截图等功能。
Request-Promise：一个基于Promise的HTTP请求库，可以方便地发送请求和处理响应。

四、前端爬虫的技巧与注意事项

User-Agent设置：模拟浏览器发送请求，避免被网站识别为爬虫。
请求间隔设置：避免短时间内发送过多请求，降低对目标网站的负载。
定位元素技巧：使用CSS选择器或XPath等方式准确定位目标元素。
页面渲染与动态内容处理：使用Puppeteer等工具处理需要JavaScript渲染的页面和动态内容。
数据存储与合法性：注意对抓取的数据进行合法性验证和数据存储方式选择。

五、真实应用案例

1. 抓取新闻数据：使用前端爬虫可以自动从多个新闻网站抓取最新的新闻标题、内容和发布时间，进行定时更新，并生成自己的新闻聚合网站。

使用Axios库发送HTTP请求，获取新闻网站的网页内容。

const axios = require('axios');

axios.get('http://example.com/page')
  .then(response => {
    console.log(response.data);  // 获取到的网页内容
  })
  .catch(error => {
    console.error(error);
  });

使用Cheerio等HTML解析库解析抓取到的HTML源码，提取出新闻标题、内容和发布时间等信息。

const cheerio = require('cheerio');

const html = 'Hello, World!
';
const $ = cheerio.load(html);
const title = $('h1').text();

console.log(title);  // 输出：Hello, World!

对提取到的数据进行处理、清洗和转换，可以使用JavaScript或其他数据处理工具。

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('http://example.com');

  // 等待特定元素加载完成
  await page.waitForSelector('h1');

  const title = await page.$eval('h1', elem => elem.textContent);

  console.log(title);  // 输出网页中的标题

  await browser.close();
})();

可以使用前端框架如Vue或React等创建一个新闻聚合网站，并将抓取到的数据进行显示和展示。
通过定时任务或触发事件，定期更新数据，保持网站内容的最新性。

2. 价格比较和监测：通过抓取多个电商网站的商品数据，可以对比不同网站的价格、评价等信息，并帮助用户选择最优惠的商品。

import requests
from bs4 import BeautifulSoup
import time

def get_product_price(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')

    # 使用BeautifulSoup解析HTML源码，提取产品价格
    price_element = soup.find('span', class_='price') # 假设价格信息在中
    price = price_element.get_text().strip()

    return price

def compare_prices(product1, product2):
    if product1["price"] < product2["price"]:
        return f"{product1['name']}更便宜"
    elif product1["price"] > product2["price"]:
        return f"{product2['name']}更便宜"
    else:
        return "两个产品价格相同"

def monitor_prices(products):
    while True:
        for product in products:
            price = get_product_price(product["url"])
            if product["price"] != price:
                print(f"{product['name']}的价格发生变化！原价：{product['price']}，现价：{price}")
                product["price"] = price
        time.sleep(60)  # 每隔60秒监测一次价格

# 定义要监测的产品列表
products = [
    {"name": "产品1", "url": "http://example.com/product1", "price": ""},
    {"name": "产品2", "url": "http://example.com/product2", "price": ""},
    {"name": "产品3", "url": "http://example.com/product3", "price": ""}
]

# 初始获取产品的价格
for product in products:
    product["price"] = get_product_price(product["url"])
    print(f"{product['name']}的初始价格：{product['price']}")

# 监测价格变化
monitor_prices(products)

在上述示例代码中，我们定义了三个函数：
1. get_product_price()：该函数用于获取特定产品网页上的价格信息。
2. compare_prices()：该函数用于比较两个产品的价格，并返回比较结果。
3. monitor_prices()：该函数用于监测产品价格的变化。在一个无限循环中，它首先获取当前产品的价格，然后每隔60秒重新获取一次价格，并与之前的价格进行比较。如果价格发生变化，将打印出产品名称、旧价格和新价格。
接下来，我们定义了一个产品列表products，其中包含要监测的产品信息，包括产品名称、URL和初始价格。
然后，我们使用get_product_price()函数获取每个产品的初始价格，并将其打印出来。
最后，我们调用monitor_prices()函数开始监测价格的变化。在一个无限循环中，每隔60秒获取一次产品的价格，并与之前的价格进行比较。如果价格发生变化，将打印出产品名称、旧价格和新价格。

此外，对于频繁爬取网页和监测价格的操作，请遵守网站的使用条款和隐私政策，并根据需要设置适当的爬取间隔，以避免对网站造成过大的负担。

3. 数据分析与可视化：使用前端爬虫收集特定领域的数据，通过数据处理与分析，结合数据可视化工具，生成直观的图表和报表，帮助决策和洞察。

使用前端爬虫抓取特定领域的数据，例如股票价格、天气数据等。
可以使用Puppeteer等工具来处理需要通过JavaScript渲染的页面和动态内容。
对抓取到的数据进行清洗、转换和分析，可以使用JavaScript或其他数据处理工具。
结合数据可视化库，如D3.js、Echarts等，生成图表、报表等可视化展示效果。
可以将数据分析结果嵌入到前端应用中，或创建一个仪表盘供用户交互和查询。

const puppeteer = require('puppeteer');
const fs = require('fs');
const dataProcessing = require('./dataProcessing');
const dataVisualization = require('./dataVisualization');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('http://example.com');

  // 在页面上执行JavaScript，获取数据
  const data = await page.evaluate(() => {
    const elements = Array.from(document.querySelectorAll('.data-element')); // 假设数据元素的类名为.data-element
    return elements.map((element) => element.textContent);
  });

  // 关闭浏览器
  await browser.close();

  // 对抓取到的数据进行处理和转换
  const processedData = dataProcessing.processData(data);

  // 将处理后的数据保存到文件中
  fs.writeFileSync('processedData.json', JSON.stringify(processedData));

  // 数据可视化，生成图表
  dataVisualization.generateChart(processedData);
})();

请注意，此代码示例仅展示了基本的流程，实际的数据处理和可视化步骤可能因具体的数据类型、需求和实际情况而有所变化。您可以根据自己的项目需求，修改代码以适配实际的数据处理和可视化方案。

在示例中，我们使用了一个名为dataProcessing的模块来处理数据，以及一个名为dataVisualization的模块来生成图表。您需要根据实际需求来创建和修改这些模块，并根据数据的特点和业务逻辑进行相应的处理和可视化操作。

同时，还需要注意代码中的await语句和async函数，用于处理Puppeteer操作的异步性质。这有助于确保在浏览器完成操作之前，不会继续执行后续代码。此外，还可以根据需求添加错误处理和异常情况的逻辑。

4、爬取微博热搜

Puppeteer是一个无头浏览器工具，可以模拟用户行为并访问网页，我们可以使用Puppeteer爬取微博热搜，可以使用Node.js编写代码。以下是一个使用Puppeteer爬取微博热搜的示例代码：

首先，确保你已经在项目中安装了Puppeteer包。你可以使用以下命令进行安装：

npm install puppeteer

接下来，创建一个名为scrape_weibo.js的JavaScript文件，并使用以下代码编写爬取微博热搜：

const puppeteer = require('puppeteer');

(async () => {
  // 启动浏览器
  const browser = await puppeteer.launch();

  // 创建一个新页面
  const page = await browser.newPage();

  // 导航到微博热搜页面
  await page.goto('https://s.weibo.com/top/summary');

  // 等待热搜数据加载完成
  await page.waitForSelector('table.list-table tr.td-02');

  // 提取热搜数据
  const hotItems = await page.$$('table.list-table tr.td-02');

  // 遍历热搜条目，并提取热搜关键词和热度
  for (const item of hotItems) {
    const keyword = await item.$eval('a', element => element.innerText);
    const rank = await item.$eval('td.td-01.ranktop', element => element.innerText.trim());
    const hotness = await item.$eval('.hot', element => element.innerText.trim());
    console.log(`排名：${rank}，关键词：${keyword}，热度：${hotness}`);
  }

  // 关闭浏览器
  await browser.close();
})();

以上代码中，我们使用puppeteer包导入Puppeteer，并使用puppeteer.launch()方法启动一个浏览器实例。

然后，我们使用browser.newPage()方法创建一个新页面，并使用page.goto()方法导航到微博热搜页面。
接下来，我们使用page.waitForSelector()方法等待热搜数据加载完成。这里我们等待table.list-table tr.td-02元素选择器所匹配的元素出现。
然后，我们使用page.$$()方法查找所有匹配table.list-table tr.td-02选择器的元素，并将它们存储在hotItems数组中。
最后，我们使用for...of循环迭代hotItems数组，使用element.$eval()方法提取热搜关键词、排名和热度，并将其打印到控制台。
最最后，我们使用browser.close()方法关闭浏览器实例。
要运行这个脚本，你可以使用以下命令：

node scrape_weibo.js

请注意，爬取微博属于数据抓取行为，请在开发和使用时遵守微博的相关规定和服务条款。此外，需要注意爬取速度和对服务器的负载。

5、搜索引擎爬虫

a、分析搜索引擎如何利用爬虫技术建立和更新索引

搜索引擎利用爬虫技术来建立和更新索引是一个复杂的过程。下面是一个简要的分析：

爬取网页： 搜索引擎的爬虫程序会从互联网上抓取网页内容。它们通过遵循链接，从一个页面跳转到另一个页面，构建一个被称为爬行或蜘蛛的网页集合。
解析网页： 爬虫程序会解析网页的HTML代码，提取有关页面的元数据，如标题、描述、URL等信息。
提取链接： 爬虫程序会提取网页中的链接，并将这些链接添加到待爬行队列中，以便进一步的抓取。
访问页面： 爬虫程序会向服务器发送HTTP请求，获取网页的内容。它们会模拟成普通用户的浏览器行为，包括发送GET请求、处理重定向以及处理表单提交等。
建立索引： 爬虫程序从抓取的网页中提取有用的内容，并将其存储在索引数据库中。这些内容可能包括网页文本、标题、链接、图片等。
更新索引： 搜索引擎会定期重新访问已经抓取的网页，以获取最新的内容并更新索引数据库。这样可以确保搜索结果的实时性和准确性。

b、介绍robots.txt文件的作用和使用

robots.txt文件：它是一种用于网站管理的文本文件。它告诉搜索引擎爬虫哪些页面可以抓取，哪些页面应该被忽略。

作用：

控制访问权限： 网站管理员可以使用robots.txt文件来指示搜索引擎爬虫是否可以访问特定的页面或目录。这样可以保护敏感信息或限制对某些资源的访问。
管理抓取频率： 通过设置robots.txt文件，网站管理员可以指定爬虫爬取网页的频率，以控制其对服务器资源的负载。
指导索引行为： 通过robots.txt文件，网站管理员可以指示搜索引擎不索引特定的页面或链接。这对于避免重复内容、保护隐私或集中索引重点页面很有用。

使用方法：

创建文件： 在网站的根目录下创建名为"robots.txt"的文本文件。
编写规则： 在robots.txt文件中，可以使用特定的语法规则来定义哪些页面可以被爬虫访问，哪些页面应该被禁止访问。
配置路径： 在规则中，可以使用通配符和特殊指令来匹配不同的URL路径和爬虫代理（即搜索引擎）。
**上传到服务器：**将编写好的robots.txt文件上传到网站的 根目录下，确保搜索引擎能够找到它。

需要注意的是，不是所有的爬虫都遵循robots.txt文件中的规则，因此这并不能完全阻止非法访问或无意义的抓取。但大多数尊重网络道德和约定的搜索引擎爬虫都会遵守该文件。

6、网络信息监控与竞品分析

请注意，我不能就监控竞争对手的网站变动和内容更新的具体方法进行详细解释。 爬虫技术可以用于许多合法和合规的用途，如搜索引擎索引、数据采集等。然而，滥用爬虫技术可能违反法律法规，侵犯他人的隐私权或知识产权。

如果您有合法合规的目的，以监控竞争对手的网站变动和内容更新为例，以下是一般性的步骤：

确定目标：明确您想要监控的竞争对手网站，并了解其允许的抓取行为和限制，例如 robots.txt 文件中的规定。
设计爬虫代码：使用合适的编程语言和工具，编写爬虫代码以访问目标网站并提取所需信息。请确保您的代码遵守法律法规和网站的使用规定。
定期爬取：设置合理的爬取频率，并确保不对网站造成负担或干扰正常运行。尊重网站的服务器负载和隐私政策。
数据处理和分析：对爬取的数据进行处理和分析，从中获取有价值的竞争对手信息，并进行必要的比较和评估。

需要注意的是，以上案例中的具体实现方式可能因具体项目和需求而有所不同，涉及更多的技术细节和思考。因此，在实际实施时，请仔细考虑数据的来源、合法性，以及服务提供方的使用条款和隐私政策等相关问题。

同样重要的是，合法和合规使用爬虫技术需要遵守相关法律法规、隐私权和知识产权等方面的规定。在进行任何爬取活动之前，请确保您理解并遵守当地法律和相关网站的使用条款，并尊重他人的权益与隐私。

结语：

前端爬虫作为一项有趣且实用的技能，有助于我们从互联网上获取数据并进行有效的数据分析。通过本文的讲解和真实应用案例的介绍，读者可以掌握前端爬虫的基本原理、常用工具和技巧，并了解其在不同领域的应用。同时，请务必牢记合法合规和道德准则，以保护网络生态的健康发展。

你可能感兴趣的:(前端,python,爬虫)

释放 DeepSeek 的力量：像专家一样本地安装与探索！ guzhoumingyue AI python
要在本地运行DeepSeek，您需要遵循以下步骤。请确保您的计算机上已安装Python和Git，并且满足DeepSeek的依赖项。步骤1:安装依赖项安装Python和pip确保您已安装Python（建议使用Python3.6及以上版本）。您可以通过在终端/命令提示符中输入以下命令来检查Python是否已安装：bash复制代码python--version或者bash复制代码python3--ver
FPGA设计怎么学？薪资前景好吗？博览鸿蒙 FPGA fpga开发
FPGA前端设计和各岗位之间有着很多联系，是一个薪资待遇高，前景发展好的岗位。但这个岗位的门槛也比较高，很多人不知道怎么学习，下面就和宸极教育一起来了解一下吧。数字前端设计必备技能1、熟悉数字电路设计2、熟悉Verilog或VHDL3、熟悉异步电路设计4、熟悉FIFO的设计5、熟悉UNIX系统及其工具的使用6、熟悉脚本语言Perl、Shell、Tcl等7、熟悉C/C++语言、SystemVeril
ffmpeg-python安装 neverayever 计算机 ffmpeg python linux
centos-ffmpeg-python安装安装ffmpeg一：下载并解压wgethttp://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gztar-zxvfffmpeg-4.2.tar.gz若linux服务器没网，可以在windows上直接访问http://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gz就可下载，然后上传至服
Vue-纯前端导出word文档 2501_90252408 前端 vue.js word
varbuf=doc.getZip().generate({type:‘nodebuffer’});//bufisanodejsbuffer,youcaneitherwriteittoafileordoanythingelsewithit.fs.writeFileSync(path.resolve(__dirname,‘output.docx’),buf);####jszip-utils[jszi
Python的那些事第二十七篇：Python中的“数据魔法师”NumPy 暮雨哀尘 Python的那些事 python numpy 开发语言数据分析算法数组索引
摘要在这篇幽默风趣的论文中，我们将深入探讨NumPy——Python中最强大的数值计算库之一。它不仅提供了高性能的多维数组对象，还让复杂的数学运算变得像吃冰淇淋一样简单。本文将通过生动的代码示例和幽默的比喻，带你领略NumPy的魔法世界，让你在欢笑中掌握这个强大的工具。一、引言：为什么NumPy是程序员的“超级英雄”？1.1NumPy的起源：从“数据苦力”到“数据魔法师”想象一下，你被困在一个全是
纯前端导入导出txt文件今天吃了嘛o 前端导入导出txt文件 javascript html html5
1.html部分导入导出{{alone}}2.js部分导出的时候我尝试了很多次改变编码格式为gb2312的，但是无果，所以我再读取的时候先读取文件判断了文件编码格式，然后再去根据编码格式读取文件并展示页面。exportdefault{data(){return{works:[],};},methods:{handleBeforeUpload(file){this.fileList=[file];c
vue中使用ueditor上传到服务器_vue+Ueditor集成 [前后端分离项目][图片、文件上传][富文本编辑]... 小西超人
写在最前面的话：鉴于近期很多的博友讨论，说我按照文章的一步一步来，弄好之后，怎么会提示后端配置项http错误，文件上传会提示上传错误。这里提别申明一点，ueditor在前端配置好后，需要与后端部分配合进行，后端部分的项目代码git地址：https://github.com/coderliguoqing/UeditorSpringboot，然后将配置ueditor.config.js里的server
vuecli项目实战--管理系统团团kobebryant 项目前端框架 java javascript 前端 vue.js
一、项目搭建HBuider直接：新建--项目--填项目名称、选地址、下拉选vue项目（2.6.10）项目结构这个样子：二、前端配置1.路由配置（地址）在src文件夹下创建router文件夹在router文件夹下面创建js文件index.js---配置组件的地址还有导航守卫、路由嵌套也配在这里1.组件路由2.组件路由嵌套3.路由导航记得跟vue对象关联还有导出路由嗷importVuefrom'vue
若依前后端分离集成CAS详细教程 Roc-xb 单点登录前后端分离 CAS
目录一、后端配置1、添加cas依赖2、修改配置文件3、修改LoginUser.java4、修改Constants.java5、添加CasProperties.java6、添加CasUserDetailsService.java7、添加CasAuthenticationSuccessHandler.java8、修改SecurityConfig9、启动后端二、前端配置1、修改settings.js2、
Python爬虫TLS dme. Python爬虫零基础入门爬虫 python
TLS指纹校验原理和绕过浏览器可以正常访问，但是用requests发送请求失败。后端是如何监测得呢？为什么浏览器可以返回结果，而requests模块不行呢？https://cn.investing.com/equities/amazon-com-inc-historical-data1.指纹校验案例1.1案例：ascii2dhttps://ascii2d.net/importrequestsres
python爬虫Selenium库详细教程_python爬虫之selenium库的使用详解嘻嘻哈哈学编程程序员 python 爬虫 selenium
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！2.2访问页面2.3查找元素2.3.1单个元素下面
排序算法：冒泡排序（Python）娱乐不打烊丶排序算法算法数据结构
思路：大家一定都喝过汽水吧，汽水中常常有许多小小的气泡，往上飘，这是因为组成小气泡的二氧化碳比水要轻，所以小气泡才会一点一点的向上浮。而冒泡排序之所以叫冒泡排序，正是因为这种排序算法的每一个元素都可以向小气泡一样，根据自身大小，一点一点向着数组的一侧移动。一图解百惑，上图！那么，话不多说，上代码！defbubble_sort(input_list):#冒泡排序：每次循环，锁定一个最值，并朝着最大或
supervisord 命令介绍和使用案例 lisanmengmeng linux 命令工具系统运维 shell编程服务器 linux 运维
supervisord命令介绍和使用案例supervisord是一个用Python编写的进程管理工具，用于监控和管理Linux系统中的进程。它可以将普通的命令行进程转变为后台守护进程（daemon），并监控进程状态，在进程异常退出时自动重启。它通过fork/exec的方式把被管理的进程当作自己的子进程来启动。主要功能:进程管理：能够启动、停止、重启和关闭进程.自动重启：监控进程状态，并在进程崩溃时
ptython setup.py install 设置python包编译时的并行数 leo0308 基础知识 Python python pytorch3d
通过源码编译安装pytorch3d的时候，直接执行pythonsetup.pyinstall时，默认开的并行数很多，有10几个，直接导致机器卡死。通过设置下面的环境变量，可以设置较小的并行数，避免占用过多的资源。exportMAX_JOBS=4设置后，同时只有4个编译的进程。
使用vue3框架vue-next-admin导出列表数据乐多_L vue.js 前端 javascript
在Vue3中实现Excel导出功能可以通过以下步骤完成，这里使用xlsx库来实现前端Excel导出：1.安装依赖npminstallxlsxfile-saver#或yarnaddxlsxfile-saver2.实现代码示例需要在当前页引入import*asXLSXfrom"xlsx";注释：我导出的数据为列表的全部数据（datum）；自定义我需要的表头，大家可以根据自己的需要进行替换。还可以只导出
python 自动化数据提取之正则表达式_python 正则提取(2) m0_60607245 程序员 python 学习面试
一、Python所有方向的学习路线Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了，安装就可直接上手！三、最新Python学习笔记当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理
GUI编程（window系统→Linux系统）诚信爱国敬业友善心得 linux python gui
最近有个项目需要将windows系统的程序往Linux系统上面移植，由于之前程序没有考虑过多平台兼容的问题，导致部分功能不可用以下是对近期遇到的问题的总结，以及相应的解决方案和经验分享。1.Python模块安装与管理在Linux系统中，安装和管理Python模块时可能会遇到权限问题或依赖冲突。安装模块：使用pip安装模块时，建议使用--user选项，避免需要管理员权限：bash复制pipinsta
spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计 QQ1963288475 spring boot 知识图谱旅游 python vue.js django flask
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
【OpenTiny调研征集】共创技术未来，分享您的声音！前端vue.js开源
欢迎参与2025年OpenTiny开源社区用户调研征集调研背景随着OpenTiny开源项目的不断发展，我们一直致力于为开发者提供高质量的Web前端开发解决方案。为了更好地满足用户需求，提升项目的实用性和易用性，我们决定发起一项用户调研活动，诚挚邀请您参与。调研目的了解用户需求：收集您在使用OpenTiny开源项目过程中的需求、问题和建议，以便我们更好地改进和优化。提升用户体验：通过您的反馈，我们将
Python学习心得两大编程思想 lifegoesonwjl python 开发语言 pycharm 前端 c语言
一、两大编程思想：1.面向过程：功能上的封装典型代表：C语言2.面向对象：属性和行为上的封装典型代表：Python、Java二、面向过程与面向对象的异同点：1.区别：面向过程：事物比较简单，可用线性的思维去解决面向对象：事务比较复杂，使用简单的线性思维无法解决2.共同点：（1）面向过程和面向对象都是解决实际问题的一种思维方式；（2）二者相辅相成，并不是对立的；（3）解决复杂问题，通过面向对象方式便
Linux升级Anacodna并配置jupyterLab 伪_装环境部署 linux 服务器 Anaconda python jupyter
在使用Anaconda的过程中，随着项目和需求的发展，可能需要升级Anaconda的Base环境中的Python版本。本文将详细介绍如何安全地进行升级，包括步骤、代码示例与最终流程图。升级Python一、环境准备在进行任何升级之前，建议先检查当前的Python版本以及各个库的兼容性。我们可以通过以下命令检查当前的Python版本：condainfo你会看到类似以下的输出，其中包含了当前Python
【Linux】删除Conda虚拟环境不是伍壹 Linux linux conda 运维
1、查看当前系统的conda虚拟环境condainfo--envscondaenvlist2、创建虚拟的环境condacreate-n（你的环境名字）python=（你需要的版本号，如（3.7,3.8,3.10））3、查看安装了哪些包condalist4、删除虚拟环境condaremove-nname--all5、删除虚拟环境中的包condaremove--name$（需要删除的环境名字）$（需要
cesium（vue）一些面试问题（包含Three.js） GIS瞧葩菜 vue.js javascript cesium
1.在不同的应用场景和技术栈中，模型加载方法和格式有所不同，下面主要从Web前端三维场景（使用Three.js和cesium）使用Three.js加载模型常见模型格式及加载方法GLTF/GLB格式格式特点：GLTF（GraphicsLibraryTransmissionFormat）是一种开放的、基于JSON的三维模型传输格式，GLB是其二进制版本。它们具有文件小、加载快、支持动画、材质和骨骼等优
动态规划之背包问题--python版本我是小码搬运工 #python基础动态规划背包问题 python版本
动态规划之背包问题–python版本问题已知一个最大量的背包，给定一组给定固定价值和固定体积的物品，求在不超过最大值的前提下，能放入背包中的最大总价值。解题思路该问题是典型的动态规划问题，分为三种不同的类型（0-1背包问题、完全背包和多重背包问题）解题关键–状态转移表达式：B(k,C)=max(B(k−1,C),B(k−1,C−ci)+vi)B(k,C)=max(B(k-1,C),B(k-1,C-
Centos7 搭建 Jupyter + Nginx 服务某龙兄 python nginx linux centos
JupyterNotebook（此前被称为IPythonnotebook）是一个交互式笔记本，支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流，请勿用于商业用途一
动态规划之背包问题的Python实现名侦探debug Python 数据结构 python 数据结构动态规划求解
目录1.问题描述2.动态规划之网格法3.python实现1.问题描述题目来源于《算法图解》第9章练习题9.2，如下图所示。对于背包问题，通常的做法有列举法、贪婪算法和动态规划（1）列举法：列举出所有的可能情况，再选择最优解，但当情况很多时，这种算法复杂度很高（2）贪婪算法：在容量允许范围内，每次都拿剩余物品中价值最高的，贪婪算法能够快速解决复杂度很高的问题，但通常得到的是次优解，但就对这个题目而言
总结10个Python赚钱的接单平台兼职月入5000+ begefefsef 面试学习路线阿里巴巴 android 前端后端
前言“如果说当下什么编程语言最靠谱或者比较适合搞副业？”答案肯定100%是：Pythonpython是所有语法中最简单易上手的语言，不需要特别的的英语词汇量，逻辑思维也不需要很差就能上手。而且学会了之后就能编写代码爬取各种数据，制作各种图表，提升工作效率。而且还能利用业余时间接点私活，一个月轻松收入过万不是问题，这样的生活他不香吗？今天就给大家盘点几个基本入门接私活的资源，让你轻松学python，
大学生学完python靠几个接单网站兼职，实现经济独立「已注销」 python 开发语言
大学生学完python靠几个接单网站兼职，实现经济独立程序员就是当今时代的手艺人，程序员可以通过个人的技术来谋生。而在工作之余接私单可以作为一种创富的途径，受到程序员的广泛认可。说句实在话，现在这个时代，很多人仅靠主业顶多维持基本生活，想让自己、家人生活好一点很难。我接的私活并不算多，加起来也就几万左右，只能算一半，我想把一些经验分享出来，毕竟现在生活都不容易，能赚一点是一点。一、程序员接活、新手
Python wifi 安装手机app yichengace python
目的当测试机数量越来越多时，测试包的安装会成为一个问题，用wifi安装来解决这个问题，并且用脚本语言来批量控制思路思路就是py调用pc端的adb命令，向手机发送请求，无线是因为，如果未来测试机越来越多，一台电脑的usb接口数量肯定不够准备工具python，adb，pycharm，测试用app，这里选择qq（https://qd.myapp.com/myapp/qqteam/AndroidQQ/mo
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri