积极向上的Coder

python爬去京东商品数据以及Flask可视化

废话不多说直接上代码，详细解释，让小白也能操作

爬虫部分（含有json请求返回的价格，销售量，好评率，评论等）

爬去京东笔记本电脑920页，每页60条自己算

# _*_ coding: utf-8 _*_
__author__ = 'qyg'
__date__ = '2019/3/28 8:45'
import requests
import json
import urllib3.contrib.pyopenssl
from lxml  import etree
import random
import csv
import time
pages = 920

class Craw_JD():
    def __init__(self,pages):
        urllib3.contrib.pyopenssl.inject_into_urllib3()
        self.start_url = 'https://item.jd.com/'
        self.pages = pages
        self.url = 'https://list.jd.com/list.html?cat=670,671,672&page=' # 构造请求头京东的商品有规律,cat指的是某个商品类型
        self.USER_AGENTS = [
            "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)",
            "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; Acoo Browser; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)",
            "Mozilla/4.0 (compatible; MSIE 7.0; AOL 9.5; AOLBuild 4337.35; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)",
            "Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US)",
            "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 2.0.50727; Media Center PC 6.0)",
            "Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 1.0.3705; .NET CLR 1.1.4322)",
            "Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 5.2; .NET CLR 1.1.4322; .NET CLR 2.0.50727; InfoPath.2; .NET CLR 3.0.04506.30)",
            "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN) AppleWebKit/523.15 (KHTML, like Gecko, Safari/419.3) Arora/0.3 (Change: 287 c9dfb30)",
            "Mozilla/5.0 (X11; U; Linux; en-US) AppleWebKit/527+ (KHTML, like Gecko, Safari/419.3) Arora/0.6",
            "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.2pre) Gecko/20070215 K-Ninja/2.1.1",
            "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9) Gecko/20080705 Firefox/3.0 Kapiko/3.0",
            "Mozilla/5.0 (X11; Linux i686; U;) Gecko/20070322 Kazehakase/0.4.5",
            "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.8) Gecko Fedora/1.9.0.8-1.fc10 Kazehakase/0.5.6",
            "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11",
            "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_3) AppleWebKit/535.20 (KHTML, like Gecko) Chrome/19.0.1036.7 Safari/535.20",
            "Opera/9.80 (Macintosh; Intel Mac OS X 10.6.8; U; fr) Presto/2.9.168 Version/11.52",
        ]
        self.headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36',  # 添加请求头，躲避机器检查
            'Connection': 'Keep-Alive',
         	
        }
    def response_handler(self):
        for page in range(0,self.pages):  # 遍历所有的页码
            url_ = self.url + str(page)			传递页码
            prox = self.pro_x()  # 获取代理
            self.headers['User-Agent'] = random.choice(self.USER_AGENTS)# 随机数选择请求头 
            res = requests.get(url=url_, proxies=prox, headers=self.headers, verify=False) # verify=False关闭SSL验证
            res=etree.HTML(res.text) # 使用xpath解析页面 
            items = res.xpath('//*[ @id = "plist"]/ul/li/div/div[1]/a/@href') # xpath 获取 每一页所有的详情地址标签 href属性值样式：//item.jd.com/8674557.html
            responses = [requests.get(url='https:'+str(item),proxies=prox,headers = self.headers,verify=False) for item in items if items is not None]  # 列表推到式 每个页面的所有响应放入列表 
            print('取出60条-----')
            self.parse(responses,items)# 返回响应 交给parse去解析页面提取字段

    def pro_x(self):
    	'''代理ip自动选择部分 使用choice函数对序列自动选择并筛选'''
        prox = dict()   # 声明 字典类型 代理也是k-v映射 ’http‘ : ’ip：port‘
        ips = []
        with open('ip.txt', 'r') as fp:# 读取 ip.txt文件 将ip读取到列表中
            while True:
                line = fp.readline()  # 每次读取一行
                ips.append(line.rstrip()) # rstrip函数消除右端空字符（回车字符）并添加到 ips列表中
                if not line:
                    break
        prox['http'] = random.choice(ips)
        try:																			# proxies=prox,使用代理 timeout=2 2秒内返回则正常
            res = requests.get(url='https://item.jd.com/', proxies=prox, headers=self.headers, timeout=2)
            if res.status_code == 200:
                return prox		#测试 ip代理 能否使用 能则返回 不能继续调用函数随机选择  ip  
        except:
            self.pro_x()

    def parse(self,responses,items):
        data = []
        if responses:
            for index,res in enumerate(responses):
                html=etree.HTML(res.text)
                url=items[index]
                d_name = html.xpath('//*[@id="crumb-wrap"]/div/div[2]/div[2]/div[1]/div/a/text()')
                if d_name:
                    d_name=d_name[0]
                else:
                    continue
                strId = url.split("/")
                ids = strId[3].split(".")
                sku_id = ids[0]
                name=html.xpath('//*[@id="parameter-brand"]/li/@title')   #品牌名字//*[@id="parameter-brand"]/li/a
                if name :
                    name = name[0] # 获取字符串
                else:
                    continue # 没有就跳过本条
                XL,GoodRade= self.get_xiaoliang(sku_id)  # 销量 和 好评率
                price = self.get_price(sku_id)# 价格

                # comms = self.get_comm(sku_id,page=1)
                # if comms:
                #     comms = '|'.join(comms)
                # else:				# 获取评论数据不稳定，如果还想爬去评论信息，自行解除注释，data添加评论字段
                #     comms = '此用户无评价或者没有抓到' # 这部分因为代理ip是免费的网站爬的不稳定。所以我注释掉了
                good_info = html.xpath('//*[@id="detail"]/div[2]/div[1]/div[1]/ul[2]/li/text()')
                good_info=','.join(good_info)
                data.append(['sku_id：'+str(sku_id),'sku_name：'+name,'d_name：'+d_name,'price：'+str(price),'销量：'+str(XL),'GoodRade：'+str(GoodRade),good_info])
            self.save_data(data)
        else:
            print('400')

    def get_price(self,sku_id):
    	’‘’和获取好评率 和销售量 get_xiaoliang()差不多 看下边的介绍不重复解释了‘’‘
        url = 'https://p.3.cn/prices/mgets?skuIds='+str(sku_id)
        while True:  # 一直循环，知道访问站点成功
            try:
                # 以下except都是用来捕获当requests请求出现异常时，
                # 通过捕获然后等待网络情况的变化，以此来保护程序的不间断运行
                prox=self.pro_x()
                req = requests.get(url,proxies=prox, headers=self.headers, timeout=20)
                break
            except requests.exceptions.ConnectionError:
                print('ConnectionError -- please wait 3 seconds')
                time.sleep(3)
            except requests.exceptions.ChunkedEncodingError:
                print('ChunkedEncodingError -- please wait 3 seconds')
                time.sleep(3)
            except:
                print('Unfortunitely -- An Unknow Error Happened, Please wait 3 seconds')
                time.sleep(3)
        #t = requests.get(url,headers = self.headers,timeout=3,verify=False)
        dd = json.loads(req.text)
        prcie=dd[0].get('p')
        return prcie

    # def get_comm(self,sku_id,page):
    #     '''获取评论---每个商品获取一页 10条'''
    #     comms = []
    #     proc = self.pro_x()
    #     commUrl = "https://sclub.jd.com/comment/productPageComments.action?&productId={0}&score=0&sortType=5&pageSize=10&page={1}&isShadowSku=0&fold=1" .format(sku_id,page)
    #     while True:  # 一直循环，知道访问站点成功
    #         try:
    #             # 以下except都是用来捕获当requests请求出现异常时，
    #             # 通过捕获然后等待网络情况的变化，以此来保护程序的不间断运行
    #             req = requests.get(commUrl,proxies=proc, headers=self.headers, timeout=20)
    #             if req.content:
    #                 dd = json.loads(req.text)
    #                 break
    #         except requests.exceptions.ConnectionError:
    #             print('ConnectionError -- please wait 3 seconds')
    #             time.sleep(3)
    #         except requests.exceptions.ChunkedEncodingError:
    #             print('ChunkedEncodingError -- please wait 3 seconds')
    #             time.sleep(3)
    #         except:
    #             print('Unfortunitely -- An Unknow Error Happened, Please wait 3 seconds')
    #             time.sleep(3)
    # 
    #     tags = dd.get("comments")
    #     for i in tags:
    #         con = i.get('content')
    #         comms.append(con)
    #     return comms



    def get_xiaoliang(self,sku_id):
    	’‘’获取销售量and好评率json api接口请求在下边 ‘’‘
        url = 'https://club.jd.com/comment/productCommentSummaries.action?referenceIds=' + str(sku_id)
        while True:  # 一直循环，知道访问站点成功
            try:
                # 以下except都是用来捕获当requests请求出现异常时，
                # 通过捕获然后等待网络情况的变化，以此来保护程序的不间断运行
                prox=self.pro_x()
                req = requests.get(url,proxies=prox, headers=self.headers, timeout=20)
                if req.status_code==200:
                    break
            except requests.exceptions.ConnectionError:
                print('ConnectionError -- please wait 3 seconds')
                time.sleep(3)
            except requests.exceptions.ChunkedEncodingError:
                print('ChunkedEncodingError -- please wait 3 seconds')
                time.sleep(3)
            except:
                print('Unfortunitely -- An Unknow Error Happened, Please wait 3 seconds')
                time.sleep(3)
        dd = json.loads(req.text) # 返回的数据是json格式的 所以使用 json 包去反序列化获取键值
        comment = dd.get("CommentsCount")
        ss = comment[0]
        comment_sum = ss.get('CommentCount') # 评论总数
        goodrate = ss.get("GoodRate")   # 好评率
        return comment_sum,goodrate  

    def save_data(self,data):  # newline='' 保证没有空行出现
        with open('jd_data.csv', 'a+', encoding='utf-8',newline='') as fp:
            writer = csv.writer(fp)   # 写入使用csv 包
            for row in data:
                writer.writerow(row)  # 每次写入一行  一个循环 写入一页60条
        print("60已经存储")



def main():
     craw=Craw_JD(pages)
     urllib3.disable_warnings()#  消除ssl警告
     urllib3.contrib.pyopenssl.inject_into_urllib3()  # openssl验证
     #  monkey.patch_ssl()
     craw.response_handler()
if __name__ == '__main__':
    main()

维护ip代理部分，西刺代理

# !/usr/bin/env python
# -*- coding: utf-8 -*-

import requests
from lxml import etree

# 请求路径，西刺代理网站
url = 'https://www.xicidaili.com/?tdsourcetag=s_pctim_aiomsg'
# 请求响应头
headers = header = {
    'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.2pre) Gecko/20070215 K-Ninja/2.1.1'}
# 通过requests的get方法访问目标网站，获得响应对象
response = requests.get(url=url, headers=headers)
print(response.text)
# 创建一个etree对象，response.text为访问后的到的整个西刺代理页面
etree_obj = etree.HTML(response.text)
# 通过筛选response.text，得到包含ip信息的列表
ip_list = etree_obj.xpath("//tr[@class='odd']")
item = []
# 遍历得到的集合，将ip，和端口信息进行拼接，添加到item列表
for ip in ip_list:
    ip_num = ip.xpath('./td[2]/text()')[0] 
    port_num = ip.xpath('./td[3]/text()')[0]
    http = ip_num + ':' + port_num
    item.append(http)

ips = []
with open('ip.txt','r') as fp:
    while True:
        line = fp.readline()
        ips.append(line.rstrip())
        if not line:
            break
print(ips)  # 打印已经存在的

# 遍历访问，检测IP活性
for it in item:
    # 因为并不是每个IP都是能用，所以要进行异常处理
    try:
        proxy = {
            'http': it
        }
        url1 = 'https://www.baidu.com/'
        # 遍历时，利用访问百度，设定timeout=1,即在1秒内，未送到响应就断开连接
        res = requests.get(url=url1, proxies=proxy, headers=headers, timeout=1)
        if res.status_code == 200:
            if it not in ips: # 测试是否已经存在
                with open('ip.txt', 'a+') as fp:
                    fp.write(it + '\n')  # 没有重复就写入
            else:
                print(it,'已经存在')
        # 打印检测信息，elapsed.total_seconds()获取响应的时间
        print(it + '--', res.elapsed.total_seconds())
    except BaseException as e:
        print(e)

数据清洗和处理部分

用到hadoop大数据处理，python对字段的清洗，后便发现商品介绍字段的商品名称不好处理就删掉了

# 这里仅贴出来 python正则表达式 清洗数据部分
# s数据清洗 清除 最后一列的第一个不规则 字段 K-V  商品名称：
import re
import csv
a = []
with open('jd_data2.csv','r',encoding='utf-8') as fp:
    reader = csv.reader(fp)
    for i in reader:
        # print(i[6])
        str5 = re.sub(r'商品名称.*商品编号', '商品编号', i[6])
        i[6] = str5
        a.append(i)
        print(i)
    with open('jd_clear.csv','a',encoding='utf-8',newline="") as f:
        writer=csv.writer(f)
        for one in a:
            writer.writerow(one)

Flask+echarts可视化部分

Flask采用 model 分离的结构，并解决循环导入db问题
app.py 主文件内容：

# coding=utf8
"""
Migrate pyecharts and Flask with custom template functions.
"""
from __future__ import unicode_literals


from flask import Flask, render_template
from flask.templating import Environment

from pyecharts import HeatMap, Map, Pie, Line, Bar,WordCloud,TreeMap
from pyecharts.engine import ECHAERTS_TEMPLATE_FUNCTIONS
from pyecharts.conf import PyEchartsConfig
from models import Computer_Cpu,Computer_Price,Computer_Brand

from exts import db

# ----- Adapter ---------
class FlaskEchartsEnvironment(Environment):# 集成jinja2模板
    def __init__(self, *args, **kwargs):
        super(FlaskEchartsEnvironment, self).__init__(*args, **kwargs)
        self.pyecharts_config = PyEchartsConfig(jshost='/static/js')  # 使用本地 echarts js文件
        self.globals.update(ECHAERTS_TEMPLATE_FUNCTIONS)    #  添加模板函数到全局字典中。


# ---User Code ----

class MyFlask(Flask):# 继承Flask
    jinja_environment = FlaskEchartsEnvironment # 指定 Flask EchartsEnvironment 为默认模板引擎

app = MyFlask(__name__)

# 配置数据库url
app.config['SQLALCHEMY_DATABASE_URI'] = 'mysql://root:12345@localhost:3306/*****?' \
                                        'charset=utf8'

db.init_app(app)

@app.route("/")
def index():
    return render_template('index.html')


@app.route("/brand/")
def computer_brand():
    '''笔记本销量 牌子 '''

    data_list=Computer_Brand.query.all()
    brands=[]
    count=[]
    for item in data_list:
        brands.append(item.brand)
        count.append(item.count)
    pie = Pie('笔记本-销量/牌子Info',title_pos='center',width=1000)

    pie.add('',brands,count,center=[25,50],is_random=True,radius=[30,65],rosetype='area',is_legend_show=False,
            is_label_show=True)

    # Computer_Count.query.all().order_by
    pie.add('',brands,count,center=[80,50],is_random=True,radius=[30,65],rosetype='radius',is_legend_show=False)

    return render_template('Com_brand.html', hm=pie)

@app.route("/cpu/")
def Compu_cpu():
    '''笔记本销量 CPU版本关系'''
    cpus = []
    count = []
    data_list = Computer_Cpu.query.all()
    for item in data_list:
        # print(item.cpu_version)
        cpus.append(item.cpu_version)
        count.append(item.count)
    bar = Bar("笔记本销量-CPU关系柱状图图")
    # bar.use_theme('dark')
    bar.add("cpu型号", cpus, count, mark_point=["min", "average","max",])
    # return 'hello world'
    return render_template('Com_cpu.html',hm=bar)

@app.route("/price/")
def Compu_Price():
    '''笔记本 价格'''

    prices = []
    count = []
    data_list = Computer_Price.query.all()
    for item in data_list:

        prices.append(item.price)
        count.append(item.count)
    line = Line("笔记本-价格需求分析折线图")
    line.add("哈哈", prices, count, mark_point=["average"])

    return render_template('Com_price.html', hm=line)

if __name__ == '__main__':
    app.run(debug=True)

models.py 模型类

# _*_ coding: utf-8 _*_
__author__ = 'qyg'
__date__ = '2019/3/29 15:47'

from exts import db


class Computer_Brand(db.Model):
    __tablename__ = 'computer_brand' # 表名
    '''可视化model字段'''
    id = db.Column(db.Integer,primary_key=True)
    brand = db.Column(db.String(255))
    count = db.Column(db.Integer)


class Computer_Cpu(db.Model):
    __tablename__ = 'computer_cpu'
    '''可视化model字段'''
    id = db.Column(db.Integer,primary_key=True)
    cpu_version = db.Column(db.String(255))
    count = db.Column(db.BigInteger)


class Computer_Price(db.Model):
    __tablename__ = 'computer_price'
    '''可视化model字段'''
    id = db.Column(db.Integer,primary_key=True)
    price = db.Column(db.String(255))
    count = db.Column(db.Integer)

中间层产生db的 exts.py 文件是为了解决循环导入问题

# _*_ coding: utf-8 _*_
__author__ = 'qyg'
__date__ = '2019/4/2 13:24'

from flask_sqlalchemy import SQLAlchemy

db = SQLAlchemy()

Web页面

前端代码有需要我在粘贴

【Java】代理模式非白代理模式 java 开发语言
代理模式代理模式是指给某一个对象提供一个代理，并由代理对象来控制对真实对象的访问代理模式是一种结构型设计模式背景如果不采用代理，对一个类的多个方法进行监控时，重复的代码总是重复出现，不但破坏了原方法，如果要实现多个监控，将会对代码造成大量冗余。同时，还导致业务代码，与非业务的监控代码掺杂在一起，不利于扩展和维护。代理类在无限制膨胀，就需要无限的修改业务代码。而采用代理后，原方法不需要做任何改动，操
1-刷力扣问题记录 leaf_leaves_leaf 算法数据结构
25.1.191.size()和.length()有什么区别2.result.push_back({nums[i],nums[left],nums[right]});为什么用大括号？使用大括号{}是C++11引入的初始化列表语法，它允许我们在构造或初始化对象时直接传入一组值。大括号的使用在许多情况下都能让代码更加简洁和直观。{nums[i],nums[left],nums[right]}是一个初始
国外7个最佳大语言模型 (LLM) API推荐程序员后端
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
[QT] 断点调试天生爱打工 qt qt 开发语言
目录一设置断点二调试窗口信息2.1默认窗口2.2详细窗口属性三调试方法和技巧一设置断点在QtCreator中我们有两种方式添加断点。用鼠标直接点击代码编辑窗口中的某一行按下F9添加/取消断点(操作的是当前鼠标光标所在的代码行)二调试窗口信息2.1默认窗口这里列出几个默认的窗口红色圆点表示断点,黄色箭头表示当前程序运行位置。stack:堆栈表示当前函数之间的调用关系，比如位于哪个函数体中。Local
责任链模式原理详解和源码实例以及Spring AOP拦截器链的执行源码如何使用责任链模式？一个儒雅随和的男子 spring 设计模式责任链模式 spring java
前言本文首先介绍了责任链的基本原理，并附带一个例子说明责任链模式，确保能够理解责任链的前提下，在进行SpringAOP执行责任链的源码分析。责任链模式允许将多个处理对象连接成链，请求沿着链传递，直到被处理或结束。每个处理者可以选择处理请求或传递给下一个。 SpringAOP的拦截器链，拦截器或者过滤器链，都是典型的责任链应用。比如，当一个方法被调用时，多个拦截器按顺序执行，每个拦截器可以决定
【部署】Ktransformer是什么、如何利用单卡24GB显存部署Deepseek-R1 和 Deepseek-V3 仙人掌_lz 人工智能人工智能 AI 部署自然语言处理
简介KTransformers是一个灵活的、以Python为中心的框架，旨在通过先进的内核优化和放置/并行策略提升HuggingFaceTransformers的使用体验。它具有高度的可扩展性，用户可通过单行代码注入优化模块，获得兼容Transformers的接口、符合OpenAI和Ollama的RESTfulAPI，甚至简化的ChatGPT风格的WebUI。KTransformers的性能优化基
技术分享：MyBatis SQL 日志解析脚本￡漫步云端彡运维趣分享 sql java mybatis 日志解析
技术分享：MyBatisSQL日志解析脚本1.脚本功能概述2.实现细节2.1HTML结构2.2JavaScript逻辑3.脚本代码4.使用方法4.1示例5.总结在日常开发中，使用MyBatis作为持久层框架时，我们经常需要查看SQL日志以调试和优化查询。然而，MyBatis的日志输出通常包含占位符和参数信息，这使得直接执行这些SQL语句变得困难。为了解决这个问题，我们开发了一个简单的HTML和Ja
SMT贴片生产的发展趋势与技术创新解析安德胜SMT贴片人工智能
内容概要SMT贴片生产作为现代电子制造的重要组成部分，其发展一直颇具前景与活力。当前，行业内的技术进步与市场需求的快速变化使得SMT贴片生产面临新的机遇与挑战。尤其是在自动化技术方面，许多企业逐步引入更加智能化的设备，从而提升生产效率并降低人为错误。这不仅能够缩短生产周期，还能提高产品的一致性和可靠性。另外，材料科技的进步也促进了SMT贴片生产的变革。新型材料的应用，例如高电导率材料和环保型焊料，
技术爱好者不容错过！探秘 Thrive 现代化博客管理系统秋野酱前端课程设计 java 开源 java spring boot vue.js 课程设计
探索ThriveX：现代化博客管理系统的技术与实现在当今数字化时代，知识的分享与交流变得愈发重要。对于技术爱好者和从业者而言，一个优质的博客管理系统不仅是知识输出的窗口，更是思想碰撞的平台。今天，让我们一同走进ThriveX，领略其独特的魅力。一、开源助力，点亮项目之星开源的道路充满艰辛与挑战，每一段代码都凝聚着开发者的心血。如果您在了解ThriveX的过程中有所收获，不妨花费短短10秒钟，为这个
ubuntu下vscode ctrl+tab松开ctrl后不自动选中文件 nicekwell ubuntu vscode linux
vscode用ctrl+tab切换文件时，松开ctrl键后会自动选中切换的文件。但是在ubuntu下发现有时不能自动选中切换的文件，需要再次按enter键才能打开文件。经过测试发现解决方法有两个：方法1：确认wayland状态，关闭wayland。（编辑/etc/gdm3/custom.conf，设置WaylandEnable=false）方法2：我用tweaks调换了capslock和ctrl，
Tomcat 8 安装包下载 m0_74824517 面试学习路线阿里巴巴 tomcat java
Tomcat8安装包下载【下载地址】Tomcat8安装包下载本仓库提供了一个包含Windows和Linux版本的Tomcat8安装包，方便用户快速下载并部署Tomcat8服务器[这里是图片001]项目地址:https://gitcode.com/open-source-toolkit/fda7c简介本仓库提供了一个包含Windows和Linux版本的Tomcat8安装包，方便用户快速下载并部署To
前端：纯前端快速实现html导出word和pdf m0_74823715 前端 html word
实现html导出word，需要使用两个库。html-docx-js和file-saver导出word的js方法>npminstallhtml-docx-js>npminstallfile-saverjs引入importFileSaverfrom“file-saver”;importhtmlDocxfrom“html-docx-js/dist/html-docx”;/**导出word方法*/expo
macOS Catalina 10.15 - 新增功能及其他信息记录伊织code Apple 开发+10.15 macOS Catalina Sidecar
文章目录推荐阅读参考一、基本信息WWDC2019壁纸二、beta版本安装macOS10.15Xcode11三、新功能添加屏幕使用时间iPadOS应用可在Mac上运行APFS宗卷被拆分为只读的系统宗卷(System)和用户数据宗卷(Data)增加Findmy查找添加由Siri控制的「捷径」和「屏幕时间」AppleWatch可解锁MacSidecar：将iPad作为副显示屏四、其他变更终端shell建
PCB 打样哪家好？探寻专业猎板之选 lboyj 运维
在电子产业蓬勃发展的当下，PCB（印制电路板）作为电子产品的关键组成部分，其打样质量对于产品的研发和后续生产至关重要。对于众多电子工程师和企业而言，寻找一家可靠的PCB打样厂商是一项重要且具有挑战性的任务。那么，PCB打样究竟哪家好呢？接下来，让我们从多个维度来探讨这一问题，并深入了解猎板PCB在其中的表现。一、品质保障是基石优质的PCB打样，首先体现在品质上。从原材料的选择到生产工艺的把控，每一
猎板 PCB：HDI 技术精要解读 lboyj 人工智能
HDI技术凭借增加盲埋孔的方式，达成了高密度布局，在高端服务器、智能手机、多功能POS机以及安防摄像机等诸多领域均有广泛应用。尤其在通讯和计算机行业中，对HDI线路板有着较高的需求，这在一定程度上有力地推动了科技的持续进步，使得HDI板在国内市场展现出十分乐观的发展前景。然而，HDI技术作为一种特殊工艺，也面临诸多挑战。一方面，其成本相对较高；另一方面，对制造商的生产能力有着严格要求。倘若缺乏先进
Spring Bean 生命周期详解黑风风 java 多线程 spring java 数据库
SpringBean生命周期详解在Spring框架中，Bean的生命周期由Spring容器全权管理。了解和掌握Bean的生命周期对于使用Spring开发稳定且高效的应用程序至关重要。本文将详细介绍SpringBean生命周期的五个主要阶段：实例化、属性注入、初始化、使用和销毁，并涵盖各个阶段的关键步骤和扩展点。1.实例化（Instantiation）实例化阶段包括以下关键步骤：BeanNameAw
对于一个程序员来说，电脑的内存需要多大？ c++服务器开发电脑
1、程序员电脑内存有多大内存够用足够了，纯写代码的编程对电脑要求不高，尤其对显卡几乎没有要求，一般编程可能开的任务窗口比较多，所以只要cpu和内存大点就可以了一般来说，处理器确实比显卡来得重要一些，因为我们的电脑中只配备了一块处理器，而处理器内置正正好有内置了一个核心显卡，如果没有特别需求我们无需再次购买独立显卡，但是对于游戏玩家来说，独立显卡显得重要一些，有的人甚至不惜下血本去配备多块显卡。2、
释放 DeepSeek 的力量：像专家一样本地安装与探索！ guzhoumingyue AI python
要在本地运行DeepSeek，您需要遵循以下步骤。请确保您的计算机上已安装Python和Git，并且满足DeepSeek的依赖项。步骤1:安装依赖项安装Python和pip确保您已安装Python（建议使用Python3.6及以上版本）。您可以通过在终端/命令提示符中输入以下命令来检查Python是否已安装：bash复制代码python--version或者bash复制代码python3--ver
FPGA设计怎么学？薪资前景好吗？博览鸿蒙 FPGA fpga开发
FPGA前端设计和各岗位之间有着很多联系，是一个薪资待遇高，前景发展好的岗位。但这个岗位的门槛也比较高，很多人不知道怎么学习，下面就和宸极教育一起来了解一下吧。数字前端设计必备技能1、熟悉数字电路设计2、熟悉Verilog或VHDL3、熟悉异步电路设计4、熟悉FIFO的设计5、熟悉UNIX系统及其工具的使用6、熟悉脚本语言Perl、Shell、Tcl等7、熟悉C/C++语言、SystemVeril
Linux：从入门到精通的全面指南 dbsnc1111 linux 运维服务器
一、引言Linux作为一种开源操作系统，犹如一座技术宝库，在当今的科技领域中占据着至关重要的地位。它以其卓越的稳定性、高度的安全性和无与伦比的灵活性，在服务器、嵌入式系统、个人计算机、超级计算机等众多领域广泛应用。无论是渴望提升技术水平的个人，还是寻求拓展职业道路的专业人士，学习Linux都无疑是开启新机遇之门的钥匙。以下是关于Linux的详细知识以及学习Linux的经验总结，希望能为正在学习或准
游戏引擎学习第112天虾球xz 游戏引擎学习 java
黑板：优化今天的内容是关于优化的，主要讨论了如何在开发中提高代码的效率，尤其是当游戏的帧率出现问题时。优化并不总是要将代码做到最快，而是要确保代码足够高效，以避免性能问题。优化的过程是一个反复迭代的过程，目标是找到一个“足够好”的解决方案，而不是追求极致优化。优化的第一步并不是直接优化代码，而是要进行测量和分析。这一步很重要，因为只有了解代码的表现和瓶颈，才能有效地进行优化。测量代码的性能，确定哪
【Tools/macOS系列】macOS终端配置：zsh+iTerm2+OhMyZsh 飞翔的鲲【实用工具专栏】macOS zsh iTerm2 终端 ohmyzsh
DATE:2021.7.17文章目录1、前言2、参考3、终端和vim配置效果图4、终端配置步骤4.1、安装iTerm24.2、安装oh-my-zsh4.3、主题和颜色4.4、插件4.5、特殊字体Hackherdfont4.6、vim配置4.7、随时唤起4.8、自定义界面壁纸1、前言macOS的终端Terminal界面非常简单，没有Linux下面的颜色设置和自动补齐等功能，用起来非常不方便。本文讲解
Kate文本编辑器 v24.12.9013 开源高级文本代码编辑器 SSASASA11 编辑器
链接：https://pan.quark.cn/s/5577e74ab648Kate是一个可以跨平台使用的免费高级文本编辑器，支持标签页、代码高亮、显示行号、显示缩略图的滚动条、多文件查找、横向或者纵向显示多个视图等众多高级特性。软件功能1、双击当前标签页创建新标签页。2、支持启用/禁用自动换行。3、强大的多文件查找和替换功能。利用这个功能可以一键查找/替换所有已打开的文本中的内容。支持正则表达式
鸿道Intewell操作系统为半导体行业打造高可靠实时控制系统一RTOS一鸿道Intewell操作系统实时操作系统半导体行业高可靠控制系统高实时控制系统
半导体行业是现代科技的核心领域，其生产过程高度依赖自动化和精确的实时控制。从芯片制造到封装测试，每一个环节都需要高精度的设备协同工作，以确保产品的质量和性能。随着半导体技术的不断进步，对实时控制系统的性能、可靠性和灵活性提出了更高的要求。传统的控制系统在集成度、扩展性和功能安全方面逐渐暴露出局限性，而国产实时操作系统的发展为半导体行业提供了新的机遇。随着半导体技术的不断演进，芯片制程日益缩小，对生
SMT贴片加工_锡膏的作用 CIT_PCBA PCBA pcb工艺贴片 smt 制造
随着现代电子制造业的飞速发展，表面贴装技术（SurfaceMountTechnology，简称SMT）已成为电子组装领域的核心技术。在SMT生产过程中，对于锡膏的使用是非常多的，它直接影响到电路板的质量与性能。本文旨在深入探讨锡膏在SMT中的作用及其对电子制造业的重要性。锡膏及其在SMT中的作用锡膏是一种由微细金属粒子（通常为锡和铅或无铅合金）、助焊剂和少量其他化学品组成的浆料。在SMT生产线上，
SMT贴片加工中回流焊接机的关键工艺 CIT_PCBA pcb工艺制造
SMT贴片指的是在PCB基础上进行加工的系列工艺流程的简称。PCB(PrintedCircuitBoard)意为印刷电路板。(原文:SMT贴片指的是在PCB基础上进行加工的系列工艺流程的简称PCB(PrintedCircuitBoard))SMT是表面组装技术(表面贴装技术)(SurfaceMountedTechnology的缩写)，是目前电子组装行业里最流行的一种技术和工艺。电子电路表面组装技术
形参和实参 2501_90124553 java 算法数据结构
形参（形式参数）函数定义时指定的参数，形参是用来接收数据的，函数定义时，系统不会为形参申请内存，只有当函数调用时，系统才会为形参申请内存。主要用于存储实际参数，并且当函数返回时，系统会自动回收为形参申请的内存资源。（本质上所有函数都有一个return，只不过当我们的函数返回类型是void类型的时候，return是隐式）//关于默认returnvoidfun1(){//此时return;是不建议写出
扫雷游戏升级版含递归链式展开(一次展开一片区域) 代码详细解读 C语言 C r a z y c语言游戏游戏 c语言算法 java 游戏程序 python c++
1、前言：我看了CSDN有很多小伙伴也写了扫雷小游戏但是大部分写的代码都是一次输入坐标只能展开一个位置并没有还原我们小时候最初始的游戏玩法可玩性很低我在这用函数递归链式展开一片还原最初始游戏提高可玩性先放效果图↓2、建议：一个程序代码的实现并不是只靠看能看会的而是要落实到敲代码可以先靠自己画导图根据导图敲出代码敲代码的过程中难免会有些错误解决它这都将成为你宝贵的知识*在看的过程也可以拿出稿纸和笔来
浅谈vue常用的状态管理库vuex、pinia 超绝前端乱学小白 vue flutter vue.js vue javascript
Vuex和Pinia都是Vue.js应用程序中的状态管理库,虽然两种状态管理库的vue2，vue3都兼容，但是更推荐vue2（vuex），vue3（pinia）VuexVuex是Vue.js官方提供的状态管理库，它借鉴了Flux和Redux的设计思想，将应用的状态（state）集中管理于单个全局状态树中。核心概念State：存储应用程序的状态Getters：允许在Vuexstore中定义计算属性，
Spring Bean 生命周期 CT随 spring java 后端
SpringBean生命周期是Spring框架中一个非常重要的概念，它描述了一个Bean从创建到销毁的完整过程。这个生命周期可以分为五个主要阶段：创建前准备阶段、创建实例阶段、依赖注入阶段、容器缓存阶段和销毁实例阶段。下面我们将详细介绍每个阶段的作用，并通过生活中的例子来帮助理解。创建前准备阶段定义与作用：在这一阶段，Spring容器会解析配置文件或注解，查找并加载需要被管理的Bean的相关信息。
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

python爬去京东商品数据以及Flask可视化

python爬去京东商品数据以及Flask可视化

废话不多说直接上代码，详细解释，让小白也能操作

爬虫部分（含有json请求返回的价格，销售量，好评率，评论等）

维护ip代理部分，西刺代理

数据清洗和处理部分

Flask+echarts可视化部分

前端代码有需要我在粘贴

你可能感兴趣的:(爬虫和可视化)