大河之J天上来

爬虫工作量由小到大的思维转变---＜第十一章 Scrapy之sqlalchemy模版和改造(番外)＞

前言:

正常的pymysql当然问题不大,但是我个人还是建议:sqlalchemy! 因为他更能让我们把精力放在表单设计上,而不执着于代码本身了.

正文:

先提供一个基础模版:

表图:

创建表的sql:

CREATE TABLE match_info (
  id INT PRIMARY KEY,
  home_team VARCHAR(30), 

  full_score VARCHAR(8),  

  half_score VARCHAR(8), 

  away_team VARCHAR(30),  

  match_time DATETIME,   
#比赛时间如 '2023-12-15 14:30:00'包括年、月、日、时、分、秒
  league VARCHAR(10),   

  corners VARCHAR(10),   

  zhuangtai INT,    
 #状态,1(完成收录) 0(未开始) -1(数据待补)
  created_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
  updated_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
 #修改时间
);

代码:

from datetime import datetime
from sqlalchemy import create_engine, Table, Column, Integer, String, MetaData, DateTime
from sqlalchemy.exc import SQLAlchemyError
from sqlalchemy.orm import sessionmaker

class MatchInfoCRUD:
    # 初始化类并建立数据库连接
    def __init__(self):
       
        self.db_uri = 'mysql+pymysql://user:password@localhost/mydatabase'  #填入自己的信息:user:password@localhost/mydatabase
        self.engine = create_engine(self.db_uri)  # 使用数据库URI创建引擎
        self.metadata = MetaData()  # 元数据对象用于收集表对象
        # 定义match_info表结构
        self.match_info = Table('match_info', self.metadata,
                                Column('id', Integer, primary_key=True),  # 主键不自增
                                Column('zhuangtai', Integer),  # 整型状态列
                                Column('league', String(10)),  # 长度为10的字符串类型的联赛列
                                Column('match_time', DateTime),  # 日期时间类型的比赛时间列
                                Column('home_team', String(30)),  # 长度为30的字符串类型的主队列
                                Column('full_score', String(8)),  # 长度为8的字符串类型的全场比分列
                                Column('half_score', String(8)),  # 长度为8的字符串类型的半场比分列
                                Column('away_team', String(30)),  # 长度为30的字符串类型的客队列
                                Column('corners', String(10)),  # 长度为10的字符串类型的角球数列
                                )
        self.metadata.create_all(self.engine)  # 在数据库中创建表
        self.Session = sessionmaker(bind=self.engine)  # 创建与数据库会话的会话工厂

    # 创建新的比赛记录
    def create_match(self, match_data):
        session = self.Session()  # 开启新的会话
        try:
            
            # 创建插入对象并插入数据
            insert_object = self.match_info.insert().values(match_data)
            session.execute(insert_object)  # 执行插入操作
            session.commit()  # 提交事务
            print("数据插入成功。")
        except SQLAlchemyError as e:  # 捕获并处理SQLAlchemy异常
            print(f"插入数据时出现问题: {e}")
        finally:
            session.close()  # 关闭会话

    # 读取比赛记录
    def read_match(self, match_id):
         session = self.Session()  # 开启新的会话
        try:
           
            query = session.query(self.match_info).filter_by(id=match_id)  # 创建查询对象
            match = query.first()  # 获取查询结果的第一条记录
            if match:
                return match  # 返回那条记录
            else:
                return None  # 如果没找到记录，返回None
        except SQLAlchemyError as e:
            print(f"读取数据时出现问题: {e}")
        finally:
            session.close()  # 关闭会话

    # 更新比赛记录
    def update_match(self, match_id, update_data):
         session = self.Session()  # 开启新的会话
        try:
           
            query = session.query(self.match_info).filter_by(id=match_id)  # 创建查询对象
            query.update(update_data)  # 执行更新操作
            session.commit()  # 提交事务
            print("数据更新成功。")
        except SQLAlchemyError as e:
            print(f"更新数据时出现问题: {e}")
        finally:
            session.close()  # 关闭会话

    # 删除比赛记录
    def delete_match(self, match_id):
            session = self.Session()  # 开启新的会话
        try:
            
            query = session.query(self.match_info).filter_by(id=match_id)  # 创建查询对象
            match = query.first()  # 获取查询结果的第一条记录
            if match:
                query.delete()  # 如果找到记录则执行删除操作
                session.commit()  # 提交事务
                print("数据删除成功。")
            else:
                print("未找到相应比赛。")
        except SQLAlchemyError as e:
            print(f"删除数据时出现问题: {e}")
        finally:
            session.close()  # 关闭会话


# 创建MatchInfoCRUD的一个实例
crud = MatchInfoCRUD()

# 创建并插入新的比赛记录
match_data = {
    'id': 1,
    'zhuangtai': 1,
    'league': '联赛数据',
    'match_time': datetime(2023, 12, 15, 14, 30),
    'home_team': 'Team A',
    'full_score': '2-1',
    'half_score': '1-0',
    'away_team': 'Team B',
    'corners': '5-4',
}
crud.create_match(match_data)

# 读取id为1的比赛记录
match_record = crud.read_match(1)
if match_record:
    print(f"读取到比赛记录: {match_record}")
else:
    print("没有找到对应的比赛记录。")

说明:

这里是4个基本属性,增删改查!!! 直接调用就好了...

潜在改进点,往下看

优化方案:

1. 异常处理:
- - 可以更精细地管理异常。目前代码中出现任何错误都执行同样的处理，实际应用中可能需要对不同的异常类型进行不同的处理。
2. 封装会话管理:
- - 代码中反复出现创建和关闭会话的模式，这可以通过上下文管理器或装饰器来优化，减少代码重复并自动管理资源。
3. 返回信息:
- - `create_match` 方法和其他修改操作只是简单地打印了结果，现实场景中可能需要将操作结果（如新创建的对象）返回给调用者。
4. 优化查询:
- - 在 `delete_match` 方法中，无需先查询再删除。可以直接使用 `.delete()`，如果有必要确保记录存在，可以在删除后检查 `result.rowcount`。
5. 输入检验:
- - 创建和更新数据前进行输入有效性检查，防止无效或恶意数据被写入数据库。
6. 代码组织:
- - 根据 Python 的约定，长的导入语句可以分行。
- - ORM 映射通常使用更高级的 `declarative_base` 系统进行，这有助于简化模型定义。
7. SQLAlchemy ORM 的使用:
- - 目前代码使用了 `Table` 对象和底层的 `insert` 方法。可以让SQLAlchemy ORM 的能力进行映射，并且允许使用会话直接操作对象模型!

案例:

from datetime import datetime
from sqlalchemy import create_engine, Column, Integer, String, DateTime
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.exc import SQLAlchemyError
from sqlalchemy.orm import sessionmaker, scoped_session

# 定义基类
Base = declarative_base()

# 定义 MatchInfo ORM 模型
class MatchInfo(Base):
    __tablename__ = 'match_info'

    id = Column(Integer, primary_key=True)
    home_team = Column(String(30))
    full_score = Column(String(8))
    half_score = Column(String(8))
    away_team = Column(String(30))
    match_time = Column(DateTime)
    league = Column(String(10))
    corners = Column(String(10))
    zhuangtai = Column(Integer)
    created_time = Column(DateTime, default=datetime.now)
    updated_time = Column(DateTime, default=datetime.now, onupdate=datetime.now)

# MatchInfoCRUD 类使用 ORM 模型和会话管理
class MatchInfoCRUD:
    def __init__(self):
        self.db_uri = 'mysql+pymysql://user:password@localhost/mydatabase'
        self.engine = create_engine(self.db_uri)
        Base.metadata.create_all(self.engine)
        self.Session = scoped_session(sessionmaker(bind=self.engine))

    def create_match(self, match_data):
        """创建新的比赛记录"""
        try:
            match = MatchInfo(**match_data)
            self.Session.add(match)
            self.Session.commit()
            print("数据插入成功。")
        except SQLAlchemyError as e:
            self.Session.rollback()
            print(f"插入数据时出现问题: {e}")
        finally:
            self.Session.remove()

    def read_match(self, match_id):
        """读取比赛记录"""
        try:
            match = self.Session.query(MatchInfo).get(match_id)
            return match
        except SQLAlchemyError as e:
            print(f"读取数据时出现问题: {e}")
        finally:
            self.Session.remove()

    def update_match(self, match_id, update_data):
        """更新比赛记录"""
        try:
            match = self.Session.query(MatchInfo).get(match_id)
            for key, value in update_data.items():
                setattr(match, key, value)
            self.Session.commit()
            print("数据更新成功。")
        except SQLAlchemyError as e:
            self.Session.rollback()
            print(f"更新数据时出现问题: {e}")
        finally:
            self.Session.remove()

    def delete_match(self, match_id):
        """删除比赛记录"""
        try:
            match = self.Session.query(MatchInfo).get(match_id)
            if match:
                self.Session.delete(match)
                self.Session.commit()
                print("数据删除成功。")
            else:
                print("未找到相应比赛记录。")
        except SQLAlchemyError as e:
            self.Session.rollback()
            print(f"删除数据时出现问题: {e}")
        finally:
            self.Session.remove()

使用 declarative_base 来创建 ORM 基础类并定义表结构；
采用了 scoped_session 以自动管理会话的生命周期，避免手动关闭会话；
更新 delete_match 方法，现在它会首先尝试获取记录，如果找到则删除，这样还是需要先查询再删除，但这确保了操作的准确性；
删掉了直接操作 Table 对象，改为使用 ORM 映射的类和实例来管理数据。

接下来对提供的MatchInfoCRUD类进行几个关键方面的优化，包括封装会话管理、优化查询处理，以及使用 SQLAlchemy ORM 更优雅地定义和交互数据库模型。这里需要使用 SQLAlchemy 的声明式基类declarative_base来简化模型定义，以及使用上下文管理器来自动化会话的生命周期管理。

from datetime import datetime
from sqlalchemy import create_engine, Column, Integer, String, DateTime
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.exc import SQLAlchemyError
from sqlalchemy.orm import sessionmaker, scoped_session

# 使用declarative_base创建ORM模型的基类
Base = declarative_base()

# 定义MatchInfo ORM模型
class MatchInfo(Base):
    __tablename__ = 'match_info'
    id = Column(Integer, primary_key=True)
    zhuangtai = Column(Integer)
    league = Column(String(10))
    match_time = Column(DateTime)
    home_team = Column(String(30))
    full_score = Column(String(8))
    half_score = Column(String(8))
    away_team = Column(String(30))
    corners = Column(String(10))
    created_time = Column(DateTime)
    updated_time = Column(DateTime)

# 自定义上下文管理器，管理数据库会话的生命周期
class DBSessionManager:
    def __init__(self, db_uri):
        self.engine = create_engine(db_uri)
        self.Session = scoped_session(sessionmaker(bind=self.engine, autocommit=False, autoflush=False))

    def __enter__(self):
        self.session = self.Session()
        return self

    def __exit__(self, exc_type, exc_val, exc_tb):
        self.session.close()

class MatchInfoCRUD:
    # 初始化类并建立数据库连接
    def __init__(self, db_uri):
        self.db_manager = DBSessionManager(db_uri)
        Base.metadata.create_all(self.db_manager.engine)

    # 创建新的比赛记录
    def create_match(self, match_data):
        with self.db_manager as db:
            try:
                match = MatchInfo(**match_data)
                db.session.add(match)
                db.session.commit()
                print("数据插入成功。")
            except SQLAlchemyError as e:
                db.session.rollback()
                print(f"插入数据时出现了问题: {e}")

    # 查询等其他方法同理可以通过db_manager动态管理会话

# 使用新的CRUD接口进行操作
db_uri = 'mysql+pymysql://user:password@localhost/mydatabase'  # 请填入数据库URI
crud = MatchInfoCRUD(db_uri)

match_data = {
    'id': 1,
    'zhuangtai': 1,
    'league': '联赛数据',
    'match_time': datetime(2023, 12, 15, 14, 30),
    'home_team': 'Team A',
    'full_score': '2-1',
    'half_score': '1-0',
    'away_team': 'Team B',
    'corners': '5-4',
    'created_time': datetime.now(),
    'updated_time': datetime.now(),
}

crud.create_match(match_data)

# 后续其他增删改查操作可以类似地实现

封装会话管理：通过DBSessionManager上下文管理器类来管理会话的开启和关闭，使得对于每个数据库会话，无需重复编写打开和关闭的代码。
优化查询：利用ORM的能力来直接添加、查询和更新数据，没有使用底层的表和查询语句。
SQLAlchemy ORM 的使用：使用了declarative_base来定义SQLAlchemy ORM模型，从而提供ORM的完全功能，并写了一个ORM类MatchInfo来映射match_info表。

总结:

一个强大的 Python SQL 工具包和 ORM（对象关系映射器），来改善数据库操作的效率和代码的整洁性。首先定义了一个 ORM 模型来映射数据库表，然后构建了一个管理数据库会话生命周期的上下文管理器。在实际的 CRUD（创建、读取、更新、删除）操作中，直接对 ORM 对象进行操作，而不是执行原始 SQL 语句。这样使得代码更加简洁、容易理解和维护，也更加面向对象。通过这种方式，我们将耗时的数据库管理工作交给 SQLAlchemy，自己就能专注于业务逻辑和数据的设计上了。简而言之，就是让代码更加简洁、高效，同时也降低了出错的几率。

多元随机分布的协方差矩阵的计算（python示例）读思辨 Python 数学矩阵 python 线性代数
协方差矩阵是统计学中描述两个或多个随机变量之间线性相关程度的一个重要工具。对于一个kkk维随机向量X=(X1,X2,...,Xk)X=(X_1,X_2,...,X_k)X=(X1,X2,...,Xk)，其协方差矩阵是一个k×kk\timeskk×k的矩阵，其中每个元素σij\sigma_{ij}σij是随机变量XiX_iXi和XjX_jXj的协方差。协方差的计算公式为：σij=Cov(Xi,Xj)
Anaconda中安装gdal 夏日麋鹿～ Python python 开发语言
anaconda中安装gdal包直接使用condainstallgdal或pipinstallgdal是难以安装上的，需要手动安装。在手动安装前，建议新建一个虚拟环境，专门用于安装类似于gdal等用于处理地理数据的包。因为这些包容易与其它包发生版本不兼容问题，导致整个环境崩溃。同时，新建的环境的python最好使用3.7版本的，经本人试验这个版本容错率比3.9高。1、创建新的虚拟环境。具体见我的另
Python使用 pandas 处理 .xlsx 数据非常全面数据库内核 python 基础 python
具体细节见：Python利用pandas处理Excel数据的应用-华妹陀-博客园根据表格中某一值获取其对应行数据：Pandas中根据列值，选取DataFrame数据，并获取行索引号列表_悟空丶kong的博客-CSDN博客_df=pd.dataframe#1：读取指定行df=pd.read_excel('lemon.xlsx')#这个会直接默认读取到这个Excel的第一个表单data=df.ix[0
在 Linux 上保护 SSH 服务器连接的15种措施 Persus 1024程序员节 linux 服务器 ssh 运维
在Linux上保护SSH服务器连接的15种措施SSH（SecureShell）是一种广泛使用的协议，用于安全地访问Linux服务器。尽管SSH提供了一定的安全性，但不安全的默认配置可能会导致各种安全风险，特别是在开放的环境中。为了保护SSH服务器，以下是几种有效的安全措施。1.禁用Root用户登录禁用root用户的SSH访问是增强安全性的基本步骤。攻击者通常会首先尝试破解root密码，因此创建一个
通过调整尺寸压缩 PNG 图片并转换为 PDF (Python) Persus python pdf png 图像处理图片压缩
通过调整尺寸压缩PNG图片并转换为PDF1.环境准备确保已经安装了Python和所需的库。如果尚未安装，可以使用以下命令：pipinstallPillowreportlab2.代码实现以下是完整的Python程序，用于通过缩小图片尺寸来压缩PNG图片并将其保存为PDF格式：fromPILimportImagefromreportlab.pdfgenimportcanvasdefcompress_a
python使用pandas操作xlsx 豆芽脚脚 python pandas 开发语言
python操作xlsx有很多种方法，以前使用其他控件操作，使用这个pandas之后发现更好用。场景，我需要读取xlsx模板，然后根据模板去获取数据，根据用户要求导出指定的xlsx文件。读取文件data=pd.read_excel('sleepStageAhi.xlsx')head=data.columns.tolist()#表格头cloum=data.values.tolist()[0]#模板字
SQLAlchemy：Python SQL工具包和对象关系映射器零度° python python
SQLAlchemy是一个PythonSQL工具包和对象关系映射器（ORM），它提供了一个高层的ORM以及底层的SQL表达式语言。SQLAlchemy是数据驱动的应用程序的常用工具，它能够与多种数据库后端进行交互，包括但不限于SQLite、MySQL、PostgreSQL和MicrosoftSQLServer。SQLAlchemy的主要特点ORM:将Python类映射到数据库表。SQL表达式语言:
Python中Sqlite的使用&ORM的使用&如何通过code初始化DB lianxiang_biancheng Python sqlite python sql user insert import
1.python中如何sqlite下面的示例是通过拼接sql语句，来使用sqlite数据的。importsqlite3;delmain():dbpath="db\\test.db";try:conn=sqlite3.connect(self.dbpath);except:pass;#readsqlite3cur=self.conn.cursor();sql='Selectuser,pwd,sex,
python 使用Whisper模型进行语音翻译哦里哦里哦里给 AI 大语言模型实战 python whisper
目录一、Whisper是什么？二、Whisper的基本命令行用法三、代码实践四、是否保留Token标记五、翻译长度问题六、性能分析一、Whisper是什么？Whisper是由OpenAI开源的一个自动语音识别（AutomaticSpeechRecognition,ASR）系统。它的主要特点是：多语言支持：它本身就能识别几十种语言，包括中文。多尺寸预训练模型：官方提供了5个不同大小的模型（tiny,
40_Python-对象关系映射SQLALchemy SeanYBLL Python
SQLALchemy一、ORM二、SQLAlchemy简介三、基本操作四、总结【2】优缺点一、ORMORM，即Object-RelationalMapping（对象关系映射），它的作用是在关系型数据库和业务实体对象之间作一个映射，这样，我们在具体的操作业务对象的时候，就不需要再去和复杂的SQL语句打交道，只需简单的操作对象的属性和方法。本质上就是将数据从一种形式转换到另外一种形式。这也同时暗示着额
python ORM（Flask-SQLAlchemy 介绍) Lxy_Python python 数据库 Python
ORM对象关系映射（ObjectRelationalMapping，简称ORM）一个ORM,它的一端连着Database,一端连着PythonDataObject对象。有了ORM，可以通过对Python对象的操作，实现对数据库的操作，不需要直接写SQL语句。ORM会自动将Python代码转换成对应的SQL语句。其余的操作，包括数据检查，生成SQL语句、事务控制、回滚等交由ORM框架来完成。ORM还
Python中的对象关系映射SQLAlchemy使用 Mr_fengzi 数据库 ORM SQLAlchemy使用模拟用户登录系统
简介什么是ORM?ORM，即Object-RelationalMapping（对象关系映射），它的作用是在关系型数据库和业务实体对象之间作一个映射，这样，我们在具体的操作业务对象的时候，就不需要再去和复杂的SQL语句打交道，只需简单的操作对象的属性和方法。SQLAlchemy：SQLAlchemy是Python编程语言下的一款开源软件。提供了SQL工具包及对象关系映射（ORM）工具，为高效和高性能
设计模式Python版适配器模式小王子1024 设计模式Python版设计模式 python 适配器模式
文章目录前言一、适配器模式二、适配器模式实现三、适配器模式在Django中的应用前言GOF设计模式分三大类：创建型模式：关注对象的创建过程，包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式：关注类和对象之间的组合，包括适配器模式、桥接模式、组合模式、装饰模式、外观模式、享元模式和代理模式。行为型模式：关注对象之间的交互，包括职责链模式、命令模式、解释器模式、
使用 Pandas 处理 .xlsx 文件的教程(Python) Persus pandas python 开发语言表格 xlsx 数据分析
使用Pandas处理.xlsx文件的教程Pandas是Python数据分析的核心库之一，它提供了丰富的数据处理功能，尤其在处理表格数据（如.xlsx文件）时非常强大。Pandas结合了Python的灵活性和简洁性，让用户能够轻松地进行数据的读写、清洗、操作和分析。本文将介绍如何使用Pandas处理.xlsx文件的常见操作，包括读取、写入、筛选、合并和统计等操作。一、环境配置1.安装Pandas首先
pip常见命令合集漫路寻索 pip
pip相关查看版本pip--version查看帮助pip--help升级pipLinux或macOSpipinstall--upgradepip#python2pip3install--upgradepip#python3Windows平台升级：python-mpipinstall-Upip#python2python-mpip3install-Upip#python3或sudoeasy_inst
python读写大文件excel_基于Python的接口自动化-读写excel文件 weixin_39669982
引言使用python进行接口测试时常常需要接口用例测试数据、断言接口功能、验证接口响应状态等，如果大量的接口测试用例脚本都将接口测试用例数据写在脚本文件中，这样写出来整个接口测试用例脚本代码将看起来很冗余和难以清晰的阅读以及维护，试想如果所有的接口测试数据都写在代码中，接口参数或者测试数据需要修改，那不得每个代码文件都要一一改动？。因此，这种不高效的模式不是我们想要的。所以，在自动化测试中就有个重
python pandas和numpy_python pandas Series.to_numpy用法及代码示例 weixin_39636898 python pandas和numpy
表示此Series或Index中的值的NumPyndarray。0.24.0版中的新功能。参数：dtype：str或numpy.dtype,可选参数传递给的dtypenumpy.asarray()。copy：bool,默认为False是否确保返回的值不是另一个数组上的视图。注意copy=False不保证to_numpy()是no-copy。而是copy=True即使不是绝对必要，也请确保已制作副本
python依赖库版本问题_ubuntu下python安装pandas和numpy等依赖库版本不兼容的问题RuntimeWarning: numpy.dtype size changed... 黄海均 python依赖库版本问题
习惯了linux下用pipinstallnumpy及pipinstallpandas命令了。折腾了好久了。上来先在python3中pip3installnumpy装了numpy，然后再pip3installpandas就卡住不动了，或者报什么错，然后把numpy卸载了，继续装pandas还是卡住了，好像是找不到相应版本的依赖库。那就转装python2.7吧，继续pipinstallpandas，装
Windows上安装与使用 Jupyter Notebook 梓仁沐白 python windows jupyter ide
1.了解JupyterNotebookJupyterNotebook是一个交互式计算环境，非常适合进行数据科学和机器学习的研究和实验。可以在Notebook中直接编写代码、运行代码块、保存结果，非常直观。在安装JupyterNotebook时，可以选择全局环境（base环境）或虚拟环境。全局环境指的是安装在Miniconda或Anaconda根目录的Python环境，而虚拟环境是用于隔离不同项目和
【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】1.18 逻辑运算引擎：数组条件判断的智能法则精通代码大仙 numpy python numpy python 开发语言
1.18逻辑运算引擎：数组条件判断的智能法则1.18.1目录逻辑运算引擎：数组条件判断的智能法则引言短路逻辑的向量化替代方案复合条件表达式的优化编写掩码操作在图像分割中的应用多条件并行评估的性能测试总结参考文献1.18.2短路逻辑的向量化替代方案在Python中，短路逻辑（short-circuitlogic）是一种常用的逻辑运算方式，但在NumPy数组中使用短路逻辑可能会导致性能问题。向量化操作
ValueError: numpy.ndarray size changed, may indicate binary incompatibility. Expected 88 from C head Garfield2005 错误bug流水账 numpy c语言开发语言
背景numpy是一个用户科学计算的开源python库，是一个非常基础的库，现有的python库很多都会用到numpy这个库，如果你是从事计算机视觉的，这个库完全躲不过去被很多库使用，很容易出现的问题就是兼容性，特别是numpy的接口如果发生了调整，那依赖numpy的库使用起来就很容易出问题，多数情况下调整下numpy版本即可兼容性问题中，有一个很常见的问题：File"/usr/local/lib/
数据分析案例-2024 年热门动漫数据集可视化分析艾派森数据分析数据可视化 python 信息可视化数据分析数据挖掘
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
python 阴暗图像亮度增强对比度增强去雾 weixin_37763484 python 数据挖掘深度学习 python opencv 计算机视觉图像处理目标检测
背景说明最近在处理图像，发现一些样本由于逆光原因过于阴暗，影响图像识别。解决时，可以在训练样本中加入类似的图像，或者手动把相关图像进行颜色变化。这里主要介绍手工颜色变化。原始图像如下，假设你需要判断裤子的种类（牛仔裤还或棉布裤子），类似阴暗图像很难判断：网上现有的解决方法中，主要包含直方图变化和gamma变换，例如下面几篇文章OpenCV调整图像对比度和亮度、qunshansj/opencv-py
python-OpenCV图片增强深度学习小学生 python
importnumpyasnpimportcv2defcrop_image(img,x0,y0,w,h):"""定义裁剪函数:paramimg:要处理的图片:paramx0:左上角横坐标:paramy0:左上角纵坐标:paramw:裁剪宽度:paramh:裁剪高度:return:裁剪后的图片"""returnimg[x0:x0+w,y0:y0+h]defrandom_crop(img,area_r
用Python制作无法拒绝的表白界面 SuRuiYuan1 python 前端 json
创建一个无法拒绝的表白界面可以是一个有趣的小项目，它不仅能够展示你的编程技能，还能让你以一种创意和个性化的方式表达感情。下面我将为你提供一个使用`tkinter`库创建简单但吸引人的表白界面的例子。`tkinter`是Python的标准GUI库，适合快速构建桌面应用。首先确保你有Python环境安装好了。接下来我们将编写代码来创建一个简单的表白界面。importtkinterastkfromtki
python 爬虫如何爬取动态生成的网页内容骗鬼 python 爬虫开发语言
---好的方法很多，我们先掌握一种---【背景】对于静态页面，我们通常可以通过python的request.get()库获取到页面的信息，但是对于动态生成的网页信息来说，我们通过request.get()获取不到。【方法】我们可以通过python第三方库selenium来配合实现信息获取采取方案：python+request+selenium+BeautifulSoup我们拿纵横中文网的小说采集举
GitHub热门开源项目李小白杂货铺计算机技术杂谈 github
文章目录GitHub高级搜索GitHub秘籍GitHub开源项目排行榜热门开源项目学习类、资料类freeCodeCampfree-programming-bookscoding-interview-universityawesomedeveloper-roadmapsystem-design-primerYou-Dont-Know-JSCS-Notesjavascript-algorithmsbu
Github 2025-01-28 Python开源项目日报 Top9 老孙正经胡说 github python 开发语言 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-01-28统计)共有9个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目9Rust项目1ComfyUI：强大而模块化的稳定扩散GUI创建周期：399天开发语言：Python,JavaScript协议类型：GNUGeneralPublicLicensev3.0Star数量：25663个Fork数量：2741次
python3.7.4怎么安装pycryptodome_python3.6 安装第三方库 pyCryptodome 实现AES加密 weixin_39799646
起因前端日子写完的Python入库脚本，通过直接读取配置文件的内容(包含了数据库的ip，数据库的用户名，数据库的密码)，因为配置文件中的数据库密码是明文显示的，所以不太安全，由此对其进行加密。编码之路编程环境Python3.6第三方库–pyCryptodome第三方库的介绍及下载1.在之前的AES加密中，python2或者3.4采用的是pyCyrpto这个模块，但是昨天废了好大劲去安装它都是失败，
python字符串查找王十二的 python python
python字符串查找有四种方法：1.find2.index3.rfind4.rindex1.find()：查找字符串，若找到返回从0开始的下标，找不到返回-1info='abca'printinfo.find('a')##从下标0开始，查找在字符串里第一个出现的子串，返回结果：02.index():python的index方法是在字符串里查找子串第一次出现的位置，类似字符串的find方法，不过比
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt

爬虫工作量由小到大的思维转变---＜第十一章 Scrapy之sqlalchemy模版和改造(番外)＞

前言:

正文:

先提供一个基础模版:

表图:

创建表的sql:

代码:

说明:

优化方案:

案例:

总结:

你可能感兴趣的:(15天玩转高级python,scrapy)