Packbacker_s

淘宝商品数据爬取并分析数据

一、抓取数据

1、抓取数据的意义

对电商来说，抓取某些数据，再进行分析，可以有效地反映出数据在某个区间内变化情况。数据受某些因素而发生巨大的影响，也可以借助分析的数据来规划相关项目的后续发展。因此，如果能利用网页爬取数据技术获取数据并对各种数据进行统计分析，对后续淘宝的发展具有指导意义。

2、抓取的内容

包括：商品名称title、商品价格price、付款人数deal，店铺名称shop、店铺地址location、商品的详情页detail_url。

3、实现内容

1、开打淘宝网站，输入搜索内容“word”查找商品

2、再解决登录问题（登录时解决网站对selenium的判别，修改浏览器的内部属性，否则被识别出有selenium，需要进行滑动登陆验证。但是在运行时，你手动地去进行滑动登录也是会判别出存在selenium的，进而登陆不上去）

3、对查找商品在控制台上输出

4、具体实现代码

4.1所需模块

from selenium import webdriver
import time
import random

首先的话，我们需要导入一些模块，比如第三方模块selenium，大家如果发生报错的话，就需要额外安装了，安装selenium模块有2个方法：

1、在pycharm的terminal控制台命令行中输入：pip install selenium

2、在win+r中的cmd里输入：pip install selenium

这两个方法都是可以的。

import time
import random

这两个的话，我们则是用来设置随机时间的，在抓取到数据之前，我们需要点击搜索框、搜索一些按键。我们需要模拟人为的操作时间，否则的话很可能操作失败了，我们随机地等待1-3秒的时间。

4.2创建chrome浏览器，打开淘宝网

在关于创建浏览器的话，首选是chrome浏览器，调出开发者模式太方便了！！！，火狐也是可以的，但首选首选首选chrome，因为我真的没用过火狐，哈哈哈哈哈哈

然后使用driver.get()方法，往内部传一个地址，我们就用淘宝网的地址。我们也就打开了下面的所示淘宝的网页界面。

    driver = webdriver.Chrome()  # 创建谷歌浏览器
    
    # TODO 执行浏览器操作
    driver.get('https://www.taobao.com/')  
    driver.implicitly_wait(10)  # 智能化等待方法
    driver.maximize_window()  # 最大化

4.3Xpath解析路径

我们要在淘宝网的搜索框中输入我们的商品，还要点搜索按钮，进而还需要登录（需要用户名、密码）。这都需要我们在网页上定位这些搜索框、搜索按钮、用户名框、密码框、登录按钮。所以打开淘宝网页的开发者模式，找到搜索框、搜索按钮、用户名框、密码框、登录按钮的xpath。

我们利用find_element_by_xpath()这个函数来解析对应的xpath

设置等待的时间，模拟人为操作

    driver.find_element_by_xpath('//*[@id="q"]').send_keys(word)  
    time.sleep(random.randint(1, 3)) 
    driver.find_element_by_xpath('//*[@id="J_TSearchForm"]/div[1]/button').click()
    time.sleep(random.randint(1, 3))

开发者模式：

首先我们定位到搜索框，就在开发者模式的Elements下，copy --> copy xpath。复制到我们的find_element_by_xpath()函数中，其他的搜索按钮、用户名框、密码框、登录按钮也是这样找。

4.4 搜索商品关键字

在淘宝网上，根据我们所需要爬取的商品信息，在搜索框中搜索爬取的商品，比如说帽子。

    word = input('请输入要搜索的关键字：')
    # TODO 创建浏览器
    driver = webdriver.Chrome() 
    
    # TODO 执行浏览器操作
    driver.get('https://www.taobao.com/')  # 传一个地址
    driver.implicitly_wait(10)  # 智能化等待方法
    driver.maximize_window()  # 最大化

    driver.find_element_by_xpath('//*[@id="q"]').send_keys(word)  # 
    time.sleep(random.randint(1, 3))  
    driver.find_element_by_xpath('//*[@id="J_TSearchForm"]/div[1]/button').click()
    time.sleep(random.randint(1, 3))

在搜索之后就出现一个登陆的界面，我们再根据4.3xpath解析路径的方法将我们的用户名，密码传进去，再进行登录。

代码如下：

    """用户账号及密码登录"""
    driver.find_element_by_xpath('//*[@id="fm-login-id"]').send_keys('xxxxxxx')  # TODO 输入用户名
    time.sleep(random.randint(1, 3))  
    driver.find_element_by_xpath('//*[@id="fm-login-password"]').send_keys('xxxxxxxx')  # TODO 输入密码
    time.sleep(random.randint(1, 3))  
    driver.find_element_by_xpath('//*[@id="login-form"]/div[4]/button').click()
    time.sleep(random.randint(1, 3))

不过此时会遇到一个问题：登陆的时候需要我们进行滑动验证

这是因为淘宝网检测出了selenium这个东西，尽管你人为地去滑动，但还是会登陆失败。

所以我们在创建出浏览器之后，随即改变浏览器内部的一些属性，可以网站避免检测出selenium的存在，就不需要我们进行滑动登录的验证了。

    # 修改了浏览器的内部属性，跳过了登录的滑动验证
    driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument",
                           {"source": """Object.defineProperty(navigator, 'webdriver', {get: () => undefined})"""})

4.5获取爬取商品具体信息

解析获取商品名称title、商品价格price、付款人数deal，店铺名称shop、店铺地址location、商品的详情页detail_url的数据

这时候我们需要借助一个插件：xpath helper 十分好用，可以写我们xpath的语法，来帮助我们定位商品的具体信息。

例：这一页的48个商品名称

下载地址：

链接：https://pan.baidu.com/s/1iCEbjnpa8dhTDScIhkvbZA
提取码：1uv9

找到第一个商品，找到商品列表，每个商品列表里面都有该商品的具体信息，比如商品名称、商品价格、付款人数，店铺名称、店铺地址、等等等的数据

我们要获取所有的div标签divs，然后再遍历divs去获取所需要的商品具体信息

具体代码：

def parse_data():
    # 多个商品数据解析
    divs = driver.find_elements_by_xpath('//div[@class="grid g-clearfix"]/div/div')  # 获取所有的div标签

    for div in divs:  
        title = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text  # 商品名字
        price = div.find_element_by_xpath('.//strong').text + '元'  # 商品价格
        deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text  # 付款人数
        shop = div.find_element_by_xpath('.//div[@class="shop"]/a/span[2]').text  # 店铺名称
        location = div.find_element_by_xpath('.//div[@class="location"]').text  # 店铺地点
        detail_url = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').get_attribute('href')  # 详情页地址
        print(title, price, deal, shop, location, detail_url)

爬取第一页和第二页的商品信息，一页爬取完之后便点击下一页

    for page in range(0, 2):
        print(f'-----------------正在爬取第{page + 1}页-----------------')
        # TODO 调用商品解析的函数
        parse_data()
        driver.find_element_by_xpath('//li[@class="item next"]/a[@class="J_Ajax num icon-tag"]').click()
        time.sleep(random.randint(2, 3))

5、完整代码及结果

完整代码如下：

from selenium import webdriver
import time
import random


def parse_data():
    divs = driver.find_elements_by_xpath('//div[@class="grid g-clearfix"]/div/div')  # 所有的div标签

    for div in divs: 
        test = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text  # 商品名字
        price = div.find_element_by_xpath('.//strong').text + '元'  # 商品价格
        deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text  # 付款人数
        name = div.find_element_by_xpath('.//div[@class="shop"]/a/span[2]').text  # 店铺名称
        location = div.find_element_by_xpath('.//div[@class="location"]').text  # 店铺地点
        detail_url = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').get_attribute('href')  # 详情页地址
        print(test, price, deal, name, location, detail_url)


if __name__ == '__main__':
    word = input('请输入要搜索的关键字：')
    # TODO 1、创建浏览器
    driver = webdriver.Chrome() 
    # TODO 2、修改了浏览器的内部属性，跳过了登录的滑动验证
    driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument",
                           {"source": """Object.defineProperty(navigator, 'webdriver', {get: () => undefined})"""})
    # TODO 3、执行浏览器操作
    driver.get('https://www.taobao.com/')  
    driver.implicitly_wait(10)  # 智能化等待方法
    driver.maximize_window()  # 最大化

    driver.find_element_by_xpath('//*[@id="q"]').send_keys(word)  
    time.sleep(random.randint(1, 3))  
    driver.find_element_by_xpath('//*[@id="J_TSearchForm"]/div[1]/button').click()
    time.sleep(random.randint(1, 3)) 

    """用户账号及密码登录"""
    driver.find_element_by_xpath('//*[@id="fm-login-id"]').send_keys('xxxxxx')  # TODO 输入用户名
    time.sleep(random.randint(1, 3))  
    driver.find_element_by_xpath('//*[@id="fm-login-password"]').send_keys('xxxxxxx')  # TODO 输入密码
    time.sleep(random.randint(1, 3))  
    driver.find_element_by_xpath('//*[@id="login-form"]/div[4]/button').click()
    time.sleep(random.randint(1, 3)) 
    for page in range(0, 2):
        print(f'-----------------正在爬取第{page + 1}页-----------------')
        # TODO 调用商品解析的函数
        parse_data()
        driver.find_element_by_xpath('//li[@class="item next"]/a[@class="J_Ajax num icon-tag"]').click()
        time.sleep(random.randint(2, 3))

爬取的结果如图：

二、存入数据库

from pymysql import *  # 连接MySQL数据库
import pymysql

连接我们本机的数据库
接着创建游标对象
执行sql语句，将数据存入数据库表information中

（注意：在sql语句里，“不要用%或者+操作符来拼接SQL语句，应该使用占位符”，因为我使用了%拼接在运行的时候出错了，找了百度解决了这个问题）

    mysql_obj = connect(host='127.0.0.1', user='root', password='xxxxxxxx', database='webcrawlers', port=3306,
                        charset='utf8mb4')
    # 创建游标
    cur_obj = mysql_obj.cursor()
    # TODO 就是不要用%或者+操作符来拼接SQL语句，应该使用占位符
    cur_obj.execute(
        'insert into Information(id, name_product, price_product, number_purchaser, name_store, address_store, detail_url) values(0, ("%s"), ("%s"), ("%s"), ("%s"), ("%s"), ("%s")) ' , (
            title, price, deal, shop, location, detail_url))
    mysql_obj.commit()
    cur_obj.close()
    mysql_obj.close()

三、数据库数据导入csv文件并建模分析

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
import pymysql

在将数据库导入csv文件，借助了这个博客python把mysql数据库中的数据表写入csv文件_程序员小明的博客-CSDN博客

"""参考此博客https://blog.csdn.net/weixin_42304193/article/details/89607394
将数据库数据导入csv文件
"""

class Test_myqsl(object):
    # 运行数据库和建立游标对象
    def __init__(self):
        self.connect = pymysql.connect(host="127.0.0.1", port=3306, user="root", password="xxxxxxx", database="webcrawlers",
                                  charset="utf8mb4")
        # 返回一个cursor对象,也就是游标对象
        self.cursor = self.connect.cursor(cursor=pymysql.cursors.DictCursor)

    # 关闭数据库和游标对象
    def __del__(self):
        self.connect.close()
        self.cursor.close()

    def write(self):
        # 将数据转化成DataFrame数据格式
        data = pd.DataFrame(self.read())
        # 把id设置成行索引
        data_1 = data.set_index("id", drop=True)
        # 写写入数据数据
        pd.DataFrame.to_csv(data_1, "e:/python1/taobaodatatest.csv", encoding="gbk")
        print("写入成功")

    def read(self):
        # 读取数据库的所有数据
        data = self.cursor.execute("""select * from information""")
        field_2 = self.cursor.fetchall()
        # pprint(field_2)
        return field_2


# 封装
def main():
    write = Test_myqsl()
    write.write()

此时，我们在e盘中的python1文件中，就有了taobaodatatest.csv这个文件。里面的数据是由webcrawlers数据库information这个表导入的。

在我们进行数据分析之前，我们要拿到商品的价格price_product、和购买人数number_purchase

这里面的数据包含了一些无用符号，比如说' '、万、+、人付款、元。我们需要它的数据进行分析。所以我们把这些符号处理一下，拿到我们所需要的数据。

    # TODO 对csv文件进行符号、文字的替换
    f = open('E:/python1/taobaodatatest.csv', encoding='gbk')
    content_f = f.read()
    with open('E:/python1/taobaodatatest.csv', 'w', encoding='gbk') as f1:
        t = content_f.replace("'", ' ')
        f1.write(t)
    f.close()

    f = open('E:/python1/taobaodatatest.csv', encoding='gbk')
    content_f = f.read()
    with open('E:/python1/taobaodatatest.csv', 'w', encoding='gbk') as f2:
        g = content_f.replace('万', '0000')
        f2.write(g)
    f.close()

    f = open('E:/python1/taobaodatatest.csv', encoding='gbk')
    content_f = f.read()
    with open('E:/python1/taobaodatatest.csv', 'w', encoding='gbk') as f3:
        h = content_f.replace('+', '')
        f3.write(h)
    f.close()

    f = open('E:/python1/taobaodatatest.csv', encoding='gbk')
    content_f = f.read()
    with open('E:/python1/taobaodatatest.csv', 'w', encoding='gbk') as f4:
        j = content_f.replace('人付款', '')
        f4.write(j)
    f.close()

    f = open('E:/python1/taobaodatatest.csv', encoding='gbk')
    content_f = f.read()
    with open('E:/python1/taobaodatatest.csv', 'w', encoding='gbk') as f5:
        k = content_f.replace('元', '')
        f5.write(k)
    f.close()

将taobaodatatest.csv文件的特殊符号处理完之后，进行数据分析、建模

    # TODO 1.分析商品价格对销量的影响
    tbdata = pd.read_csv('e:/python1/taobaodatatest.csv', encoding='gbk')
    sns.set(style="darkgrid")
    sns.jointplot(x="price_product", y='number_purchaser', data=tbdata, kind='scatter', color='purple')
    plt.rcParams['font.sans-serif'] = ['SimHei']
    plt.rcParams['axes.unicode_minus'] = False
    plt.title('商品价格对销量的影响', loc='right')
    plt.show()

    # TODO 2.分析商品价格对销售总额的影响
    plt.rcParams['font.sans-serif'] = ['SimHei']
    plt.rcParams['axes.unicode_minus'] = False
    tbdata['GMV'] = (tbdata['price_product']) * (tbdata['number_purchaser'])
    sns.regplot(x="price_product", y="GMV", data=tbdata, color='purple')
    plt.title('商品价格对销售总额的影响')
    plt.show()

    # TODO 3.分析不同省份的店铺数量分布
    plt.rcParams['font.sans-serif'] = ['SimHei']
    plt.rcParams['axes.unicode_minus'] = False
    plt.figure(figsize=(8, 4))
    province = tbdata['address_store']
    province.value_counts().plot(kind='bar', color='purple')
    plt.xticks(rotation=90)
    plt.xlabel('省份')
    plt.ylabel('店铺数量')
    plt.title('不同省份的店铺数量分布')
    plt.show()

    # TODO 4.直观地表示价格、省份、销量三者之间的关系（这里采用三维绘图表示三者关系）
    x, y = np.mgrid[-2:2:20j, -2:2:20j]
    z = x * np.exp(-x ** 2 - y ** 2)
    ax = plt.subplot(111, projection='3d')
    ax.plot_surface(x, y, z, rstride=2, cstride=1, cmap=plt.cm.Blues_r)
    ax.set_xlabel("price_product")
    ax.set_ylabel("address_store")
    ax.set_zlabel("number_purchaser")
    plt.title('价格、省份、销量三者之间的关系')
    plt.show()

在程序运行的时候，在最后的数据建模分析的时候出现了错误：

TypeError: cannot convert the series to 这个错误。网上查了python报TypeError: cannot convert the series to - 极客分享

这篇中说：可能是出现了空值，这个空值也是很特殊，既不是null也不是none。然后我翻了我的数据库，发现爬取的数据，极个别商品没有商品价格、商品没有购买人数。这就导致我在计算总销售额的时候出现了这个错误

所以在对爬取数据存入数据库的时候，对xpath解析得到的：商品价格price、购买人数deal进行判定：当他们是 '' 的时候，我赋值一个0给它们。

        if price == '':
            price = 0
        if deal == '':
            deal = 0

此时爬取的数据进行分析结果如图：

Docker应用推荐个人服务器实用有趣的项目推荐牧子与羊 docker 服务器容器
Wallabag：是一个开源的、自托管的文章阅读和保存工具。它允许你保存网页文章并进行离线阅读，去除广告和不必要的内容，以提供更好的阅读体验。Wallabag支持多种导入和导出格式，并提供了一些实用的功能，如标签、阅读列表和文本高亮。phpMyAdmin：是一个基于Web的MySQL数据库管理工具。它提供了一个易于使用的界面，用于管理数据库、执行SQL查询、导入导出数据、创建表格、用户管理等各种数
binwalk 白天的我最菜错题本开发语言
windows使用这个命令时候发现要shift一直按住,右击打开cmd管理员运行才行pythonsetup.pyinstall否则没有作用自己安装python目录的Scripts文件夹里,参考如下https://www.cnblogs.com/0yst3r-2046/p/12218770.html
Python-Zstandard 使用教程
Python-Zstandard使用教程项目介绍Python-Zstandard是一个为Zstandard（zstd）压缩库提供Python绑定的开源项目。Zstandard是一种由Facebook开发的高性能数据压缩算法，旨在提供高压缩比和快速压缩解压速度。Python-Zstandard项目的目标是通过一个Pythonic的接口，提供对底层CAPI的丰富访问，同时不牺牲性能。项目地址：GitH
【自然语言处理】文本规范化 2401_84149564 自然语言处理自然语言处理人工智能文本规范化 python 分词词的规范化分句
目录一、引言二、分词三、词规范化四、分句五、文本规范化的Python代码实战六、总结一、引言在自然语言处理的许多任务中，第一步都离不开文本规范化。文本规范化的作用是将使用字符串表示的文本转化为更易于计算机处理的规范形式。文本规范化一般包括3个步骤：分词、词的规范化、分句。本文将分别介绍这3个步骤及Python代码实战。二、分词词是语言的基本单元，人类学习语言的过程也是从理解词开始的。显而易见，自然
Py-spy：优秀的 Python 程序性能监控、分析器
py-spy是用于Python程序的性能监控、分析器。它使你可以直观地看到Python程序花费的时间，而无需重新启动程序或以任何方式修改代码。py-spy的开销非常低：为了最大化提高速度，它是用Rust编写的，并且与配置的Python程序不在同一进程中运行。这意味着py-spy可以安全地用于生产环境的Python程序。py-spy可在Linux，OSX，Windows和FreeBSD上运行，并支持
CentOS 7如何平滑升级 MariaDB 5.5 到 10.x 新版本 Herotwins CentOS centos mariadb mysql
前言自从CentOS7开始，自带的数据库就变成MariaDB了，yum安装之后的默认版本是5.5，但是该版本不能满足Zabbix的需求，需要升级。无论是安装全新的还是升级MariaDB第一步始终是不要忘记备份。备份数据库重要的事情说三遍，备份，备份，备份！#备份数据库，如果升级顺利是不要实施备份还原的mysqldump-uroot-p--all-databases>alldb.sql#如果想保留自
基于 Mockito 框架的 Mock 单元测试
1.什么是Mock测试Mock通常是指，在测试一个对象A时，我们构造一些假的对象（一般是不容易构造或者不容易获取的对象，比如测试类所依赖的实现类、第三方接口、数据库操作对象）来模拟与A之间的交互，这些对象被称为Mock对象，而Mock对象的行为是我们事先设定且符合预期。通过这些Mock对象来测试A在正常逻辑，异常逻辑或压力情况下工作是否正常。下面是一个例子：当我们需要测试OrderService时
GaussDB 分布式部署下创建表方法
1、问题现象分布式集群采用水平分表的方式，将业务数据表的元组/行打散存储到各个节点内。2、技术背景通过全并行数据处理技术和快速定位到数据存储位置等手段可极大提升数据库性能，GaussDB分布式部署下可以创建俩种类型表，在做实际业务系统开发时根据业务场景创建不同表。复制表一般使用在小数量、更新操作少的场景下。分布表：数据会根据函数映射(hash,range,list),将数据打散在不同的DN上存储。
python软件代码运行解析器出错是怎么问题_Py-Spy - Python程序的抽样分析器 weixin_39714307
Python部落(python.freelycode.com)组织翻译，禁止转载，欢迎转发。Py-Spy是Python程序的抽样分析器。它允许您可视化Python程序正花费时间在哪部分，而无需重新启动程序或以任何方式修改代码。Py-Spy的开销极低：它使用Rust语言编写，速度快，不会在与配置的Python程序相同的进程中运行，也不会以任何方式中断正在运行的程序。这意味着Py-Spy可以安全地用于
Python 包管理工具pip
pip是Python的包管理工具，用于安装和管理Python包（库或模块）。它是Python生态系统中最重要的工具之一，几乎所有第三方库都可以通过pip安装。以下是关于pip的详细讲解：1.pip是什么？pip是PythonPackageInstaller的缩写。它是一个命令行工具，用于从PythonPackageIndex(PyPI)下载和安装Python包。pip可以管理Python包的安装、
【Oracle】Oracle 11g 中扩展表空间瑞琪姐大数据模块 oracle 数据库
在Oracle11g中扩展表空间是常见的数据库管理任务，通常有以下几种核心方法，操作步骤如下：一、扩展表空间常用方法方法1：调整现有数据文件大小(RESIZE)适用于磁盘空间充足，且当前数据文件未达上限的情况。--查询当前数据文件路径和大小SELECTfile_name,bytes/1024/1024AScurrent_size_mbFROMdba_data_filesWHEREtablespac
【Oracle】ORACLE OMF说明瑞琪姐大数据模块 oracle 数据库
ORACLEOMF(OracleManagedFiles)是Oracle数据库提供的一项自动化文件管理功能。它的核心目的是简化数据库管理员（DBA）对数据库底层操作系统文件的管理工作。以下是OMF的关键要点：核心功能：自动命名和定位文件在创建数据库对象（如表空间、控制文件、在线重做日志文件等）时，DBA不需要手动指定文件在操作系统上的完整路径和文件名。Oracle数据库会根据预先配置的参数和内部规
【Oracle】删除 Oracle 19c 的监听器和数据库实例同时保留数据库软件瑞琪姐大数据模块数据库 oracle
要删除Oracle19c的监听器和数据库实例，同时保留数据库软件，请按以下步骤操作：1.停止监听器lsnrctlstop2.删除监听器配置手动删除配置文件：cd$ORACLE_HOME/network/adminrmlistener.orasqlnet.oratnsnames.ora#删除网络配置文件或使用netca工具：netca选择“Listenerconfiguration”→“Delete
MySQL索引实现原理和索引类型巴里巴气 MySQL高阶知识记录 mysql 数据库
目录索引介绍索引的数据结构哈希表有序数组搜索树(二叉搜索树、N叉搜索树、B+树)索引类型主键索引和非主键索引主键索引数据来源索引叶子节点存储内容主键的选择联合索引最左前缀原则索引下推范围查询会阻断后续列匹配覆盖索引回表避免回表前缀索引前缀索引的局限性总结按数据结构分类按物理存储分类按字段特性分类按字段个数分类索引介绍索引的出现其实就是为了提⾼数据查询的效率，对于数据库的表来说,索引就是它的目录索引
pip和conda 李星星BruceL pip conda
目录1使用Conda？你可能不需要Docker1.1Docker在开发环境中的应用1.2Python和Conda：跨平台逻辑，跨平台依赖1.3Conda作为生产环境中Docker的替代方案1.4避免使用Docker的一些限制2PipvsConda：深入比较Python的两种包管理系统2.1起点：哪种依赖？2.1.1Pip：仅限Python库2.1.2Conda：任何依赖都可以是Conda包（几乎）
探索Python性能优化的新里程：py-spy 施刚爽
探索Python性能优化的新里程：py-spy项目介绍py-spy是一个为Python程序设计的轻量级采样剖析器，它无需重启或修改你的代码就能让你看到程序运行时的时间分配情况。由于其采用Rust编写，因此在不影响目标程序运行的情况下，py-spy能安全地对生产环境中的Python代码进行剖析。该项目支持Linux、macOS、Windows和FreeBSD上的所有现代CPython解释器版本（从2
【python学习】使用魔塔社区的模型
前言魔塔社区有很多模型，但是怎么使用呢？刚开始学习python，简单的摸索一下一、新建项目1、创建虚拟环境condacreate-npaddlepython=3.102、激活虚拟环境condaactivatepaddle3、新建项目PyCharn新建一个项目，选择已创建的虚拟环境paddle项目新增models目录二、下载模型打开PyCharm的Terminal，命令行前面有一个(paddle)，
【GaussDB】如何避免Ops巡检-xlog数量异常？小嗑数据库 gaussdb 数据库
告警解释此告警对应指标“xlog数量”超出配置阈值，此指标反映组件保留的xlog数量。告警属性告警ID告警级别告警类型告警归属业务类型是否可自动清除5101339巡检配置业务质量告警租户面云数据库GaussDB节点是告警参数类别参数名称参数含义定位信息云服务产生告警的云服务实例ID产生告警的实例ID节点ID产生告警的节点ID巡检名称产生告警的巡检名称
【基础】Python包及环境管理工具大盘点：pip、pipx、poetry、conda、pipenv、Pixi、uv、venv、virtualenv、pyenv 、Mamba、Hatch、PDM等正经教主程序基础 python python 开发语言包工具环境工具
前言工欲善其事，必先利其器，如今兵器各式各样，咱就盘点一下有哪些兵器，都有啥特点，供各位侠客参考，希望大家都能找到自己喜欢的。正经开始以下是针对Python环境中常用工具的特点、易用性对比及使用建议的详细总结：一、工具分类与核心功能根据功能定位，可将工具分为以下几类：虚拟环境管理：venv、virtualenv包管理与依赖解析：pip、pipx综合项目管理：poetry、pipenv、Hatch、
Python 并发调试工具（py-spy、GDB、pyperf）解析赛博社畜联盟 python 开发语言
```htmlPython并发调试工具（py-spy、GDB、pyperf）解析Python并发调试工具（py-spy、GDB、pyperf）解析在现代软件开发中，Python以其简洁的语法和强大的库支持，成为了许多开发者首选的语言。然而，随着程序复杂度的增加，尤其是涉及并发编程时，调试和性能优化变得尤为重要。本文将介绍三个常用的Python并发调试工具：py-spy、GDB和pyperf，并深入
Python 依赖管理的新动向：pip、Poetry 和 Conda 谁是未来的标准？
```htmlPython依赖管理的新动向：pip、Poetry和Conda谁是未来的标准？Python依赖管理的新动向：pip、Poetry和Conda谁是未来的标准？在Python生态系统中，依赖管理是一个至关重要的环节。无论是小型脚本还是大型企业级项目，依赖管理的好坏直接影响到项目的开发效率和稳定性。近年来，随着Python社区的快速发展，依赖管理工具也经历了显著的变化。本文将探讨三种主流的
Conda常用命令耘田 conda 人工智能
查看Conda的完整帮助文档conda-h显示当前安装的Conda版本号conda-V列出所有已创建的Conda虚拟环境（标记*表示当前激活的环境）。condaenvlist删除所有缓存文件（包括未使用的包、临时文件等），释放磁盘空间condaclean--all新建名为ai-knowledge-mgr的虚拟环境，并安装Python3.8版本condacreate-nai-knowledge-mg
主流编程语言全景图：从Python到Rust的深度解析万能小贤哥 python rust 开发语言
2024年编程语言生态报告显示，全球开发者使用的语言数量已达260+，但真正主导行业的不到20种。本文带你穿透技术迷雾，掌握8大核心语言的本质差异。一、选择编程语言的黄金标准图表代码二、八大主流语言对比解析1.Python-通用胶水语言特性：动态类型+缩进语法丰富的库生态（20万+包）GIL全局锁限制并发适用场景：python#机器学习示例（TensorFlow）importtensorflowa
Vert.x逆袭指南：像外卖小哥一样高效的异步编程哲学 —— 每秒处理百万消息的轻量级响应式引擎 zhysunny Java类库 java 后端
目录一、核心装备：Vert.x工具箱全景1.1灵魂组件：EventLoop（永不堵车的快递站）二、基础订单处理：Future与Promise模式2.1基础异步操作流程2.2并行订单冲刺三、全栈式快餐车：Vert.xWeb实战3.1打造高并发HTTP服务器3.2异步数据库连接池四、连锁加盟模式：Vert.x集群4.1构建分布式披萨联盟五、响应式编程的味觉革命：四大核心优势5.1性能对比实验（单节点）
使用Python实现的Excel像素画
简介：本项目主要使用python语言，将图片转为Excel，图片中的每一个像素转化为Excel中的每一个单元格。主要使用pillow和xlsxwriter这两个模块。项目使用一个python文件即可。一：项目功能和流程介绍项目的主要功能：就是将一张人脸图像，画在Excel表格上，图片的每一个像素点对应Excel的一个格子，俗称像素画。流程：创建Excel表，并设置行高和列宽打开图片遍历图片每一个像
python高并发web框架_Python3中tornado高并发框架 weixin_39788969 python高并发web框架
1.单线程tornado.web：基础web框架模块tornado.ioloop：核心IO循环模块，高效的基础。封装了:1.asyncio协程，异步处理2.epoll模型：水平触发（状态改变就询问，select(),poll()），边缘触发（一直询问，epoll()）3.poll模型：I/O多路复用技术4.BSD（UNIX操作系统中的一个分支的总称）的kqueue（kueue是在UNIX上比较高效
基于python的文字识别系统_基于Python的图片文本识别系统的研究 weixin_39683368 基于python的文字识别系统
龙源期刊网http://www.qikan.com.cn基于Python的图片文本识别系统的研究作者：韩琳来源：《科学与财富》2019年第20期近年来随着计算机技术的不断发展，OpticalCharacterRecognition（光学字符识别，简称“OCR”）应用的领域更加的广泛，而图片文字识别就是其中重要的一个。目前图片文字识别的准确率并没有达到100%，这也成为了图片文字识别发展领域的一大瓶
基于python的图像识别_基于PYTHON的图片文字识别
文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。一般包括以下几个过程：图像输入、图像前处理、预识别：1图像输入：对于不同的图像格式，有着不同的存储格式，不同的压缩方式，目前有OpenCV、CxImage等开源项目。2预处理：主要包括二值化，噪声去除，倾斜较正等。2.1二值化：对摄像头拍摄的图片，大多数是彩色图像，彩色图像所含信息量巨大，对于图片的内容，我们可以简单的分为前景与背景，为
java new date()初始化_java.sql.date 初始化
java程序操作sqlservercrud介绍(增、删、改、查操作)...Java数据库编程_第3章_基本SQL语句_计算机软件及应用_IT/计算机_专业资料。第三章基本SQL语句回顾?如何创建数据库?如何创建表结构?数据类型和约束?什么是......并在java程序中创建myclass数据库表,当然也可以直打开在ACCess,创建数据库,创建数据库表*/importjava.sql.*;//引入
linux /unix/centos/ubuntu/redhat命令详解
UNIX概述•UNIX历史•UNIX特点•UNIX原则UNIX历史•UNIX操作系统诞生于60年代末期的Bell实验室•美国电话电报公司(AT&T)在70年代中期开始发行UNIX的非商业许可证•从70年代末开始在市场上出现了不同的UNIX商品化版本UNIX特点•可靠性高•伸缩性强•开放性好•植根于网络•面向数据库使用UNIX基本原则•所有对象,包括硬件都是文件•配置数据以文本形式保存•由短小的单目
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置