研行笔录

全网最全解析ALipy：主动学习的Python工具箱

研途漫漫，关注小曾，入股不亏，小曾与你共勉进步。今天主要分享来自南京航空航天大学计算机科学与技术学院模式分析与机器智能工信部重点实验室所开源的用于主动学习的Python工具库-ALipy

文章目录

ALipy--Python中的主动学习
- ALipy的特点
- ALipy的模块
- ALipy的安装
- ALipy特殊设置
- ALipy实现的算法
- 具体代码实现过程
- - ALipy 入门
  - - 主动学习实验统一框架
    - ALipy中的模块
    - - 管理标记和未标记索引
      - 拆分数据
      - 使用预定义的策略来选样本
      - 更新测试模型
  - 高级指南
  - - 高级封装用法
    - - ToolBox--初始化一个对象获取任何工具
      - AIExperiment--几行代码运行AL算法示例
    - alipy中的工具类

ALipy–Python中的主动学习

ALiPy 提供了一个基于模块的主动学习框架实现，允许用户方便地评估、比较和分析主动学习方法的性能。它实现了 20 多种算法，还支持用户在不同设置下轻松实现自己的方法。

ALipy的特点

模型无关：分类模型没有限制。可以根据需要在 sklearn 中使用 SVM 或在 tensorflow 中使用深度模型。
模块独立：可以自由修改工具箱的一个或多个模块，而不会影响其他模块。
在不继承任何东西的情况下实现自己的算法：用户定义的函数几乎没有限制，例如参数或名称
支持的变体设置：嘈杂的预言机、多标签、成本效益、特征查询等
强大的工具：中间结果保存和加载；多线程；实验结果分析等

ALipy的模块

将主动学习实现分解为多个组件，开发了基于多个模块的ALipy ，每个模块对应一个主动学习过程的组成部分。

模块组件	基本功能
alipy.data manipulate	提供数据预处理和分区的基本功能
alipy.query strategy	由25种常用的查询策略组成
alipy.index.IndexCollection	有助于对已标记和未标记示例的索引进行管理
alipy.metric	提供多个标准来评估模型性能
alipy.experiment.state and alipy.experiment.state io	有助于在每次查询后保存中间结果，并可以从断点恢复程序
alipy.experiment.stopping criteria	实现了一些常用的停止条件
alipy.oracle	支持不同的Oracle设置
alipy.experiment.experiment analyser	提供了实验结果的采集、处理和可视化功能
alipy.utils.multi thread	提供了k倍实验的并行实现

以上模块都是独立设计实现的。这样，不同部分之间的代码可以不受限制地实现。此外，每个独立的模块都可以由用户自己的实现替换，在每个模块中，我们还提供了高度的灵活性，使工具箱能够适应不同的设置。

实例选择的AL实现框架

Noisy Oracles的AL实现框架

不同成本数据集的AL实现框架

实例查询的AL实现框架

ALipy的安装

alipy 的依赖：Python >=3.4
基本库 numpy scipy scikit-learn matplotlib prettytable
主要有两种安装方案：pip安装和源码构建

pip安装(三选一)

从 PyPI 安装 alipy（推荐）：

sudo pip install alipy

pip install --user alipy

从 github 存储库 pip install 获取最新源：

pip install git+https://github.com/NUAA-AL/alipy.git

源码构建

将alipy 克隆到本地目录，cd 到 ALiPy 文件夹并运行安装命令：

cd ALiPy
sudo python setup.py install

python setup.py install --user

Unix/Linux 上的所有用户从源构建和安装：

python setup.py build

ALipy特殊设置

ALipy最显著的特征是低耦合性，很容易在其他特殊环境下进行实验。

主动学习设置	简介
AL with Noisy Oracles	有时可能返回错误的标签
AL for Multi-Label Data	一个实例同时关联多个标签
AL with Different Costs	查询不同标签的成本可能不同
AL by Querying Features	选择要查询的实例的缺失功能
AL with Novel Query Types	查询实例的其他类型信息，而不是查询实例的标签
AL for Large Scale Tasks	大数据中的主动学习

ALipy实现的算法

ALiPy针对不同的主动学习设置提供了20多种高级算法

具体代码实现过程

在代码实现这块主要分为Alipy入门和高级指南

ALipy 入门

将展示一个简单的示例，以使用 alipy 中的工具自定义主动学习实验，先介绍一下主动学习实验的统一框架，接下来介绍alipy中对应的工具。

主动学习实验统一框架

1、例如得到一个具有形状的特征矩阵X [n_samples, n_features] 和对应的具有形状 [n_samples] 【如果不容易得到特定的特征矩阵，可以只对实例的索引进行操作】，将数据拆分为训练/测试集进行实验。数据分区应该随机重复几次。在主动学习中，应该进一步将训练集拆分为初始标记集和未标记池以供查询。请注意，在大多数主动学习设置中，最初标记的集合通常很小。
2、可以开始对每个实验折叠的查询过程并记录其结果。在每次查询迭代中，都会查询一个未标记数据的子集并将其添加到标记集中；之后，模型将根据更新的标签集重新训练并测试以评估查询。
3、所有折叠完成后，可以通过平均每个折叠的性能曲线来获得该查询策略的学习曲线。

ALipy中的模块

使用 alipy.query_strategy 调用传统和最先进的方法。
使用 alipy.index.IndexCollection 来管理标记索引和未标记索引。
使用 alipy.metric 来计算您的模型性能。
使用 alipy.experiment.state 和 alipy.experiment.state_io 保存每次查询后的中间结果，并从断点处恢复程序。
使用 alipy.experiment.stopping_criteria 来获取一些示例停止标准。
使用 alipy.experiment.experiment_analysisr 来收集、处理和可视化您的实验结果。

为有经验的用户提供一个使用 alipy 实现实验的完整示例。然后，我们将单独解释代码，并介绍上述工具中的常用方法。

import copy
     from sklearn.datasets import load_iris
     from alipy import ToolBox
     
     X, y = load_iris(return_X_y=True)
     alibox = ToolBox(X=X, y=y, query_type='AllLabels', saving_path='.')
     
     # 拆分数据
     alibox.split_AL(test_ratio=0.3, initial_label_rate=0.1, split_count=10)
     
     # 使用默认的逻辑回归分类器
     model = alibox.get_default_model()
     
     # 成本预算是50次查询
     stopping_criterion = alibox.get_stopping_criterion('num_of_queries', 50)
     
     # 使用预定义的策略
     uncertainStrategy = alibox.get_query_strategy(strategy_name='QueryInstanceUncertainty')
     unc_result = []
     
     for round in range(10):
         # 获取单折实验的数据拆分
         train_idx, test_idx, label_ind, unlab_ind = alibox.get_split(round)
         # 获取单折实验的中间结果 saver
         saver = alibox.get_stateio(round)
     
         # 设置初始性能点
         model.fit(X=X[label_ind.index, :], y=y[label_ind.index])
         pred = model.predict(X[test_idx, :])
         accuracy = alibox.calc_performance_metric(y_true=y[test_idx],
                                                   y_pred=pred,
                                                   performance_metric='accuracy_score')
         saver.set_initial_point(accuracy)
     
         while not stopping_criterion.is_stop():
             # 根据查询策略选择Uind的子集
             # 传递与proba_predict方法任何sklearn模型是确定
             select_ind = uncertainStrategy.select(label_ind, unlab_ind, model=model, batch_size=1)
             # 或传递你的proba 预测结果
             # prob_pred = model.predict_proba(x[unlab_ind])
             # select_ind = uncertainStrategy.select_by_prediction_mat(unlabel_index=unlab_ind, predict=prob_pred, batch_size=1)
     
             label_ind.update(select_ind)
             unlab_ind.difference_update(select_ind)
     
             # 根据您使用的模型更新模型和计算性能模型
             model.fit(X=X[label_ind.index, :], y=y[label_ind.index])
             pred = model.predict(X[test_idx, :])
             accuracy = alibox.calc_performance_metric(y_true=y[test_idx],
                                                       y_pred=pred,
                                                       performance_metric='accuracy_score')
     
             # 将中间结果保存到文件
             st = alibox.State(select_index=select_ind, performance=accuracy)
             saver.add_state(st)
             saver.save()
     
             # 将当前进度传递给停止标准对象
             stopping_criterion.update_information(saver)
         # 重置在停止准则对象进度
         stopping_criterion.reset()
         unc_result.append(copy.deepcopy(saver))
     
     analyser = alibox.get_experiment_analyser(x_axis='num_of_queries')
     analyser.add_method(method_name='uncertainty', method_results=unc_result)
     print(analyser)
     analyser.plot_learning_curves(title='Example of AL', std_area=True)

对于每一个模块，创建一个ToolBox对象并制定实验的查询类型(查询一个实例的所有标签)

form alipy import ToolBOX
#初始化，无需传递冗余参数即可通过 ToolBox 对象获取所有可用工具
alibox = ToolBox(X = X ,y = y ,query_type = 'AllLabels')

管理标记和未标记索引

alipy.index.IndexCollection 是一个类似列表的容器，用于管理您的标记和未标记索引。可以通过传递 list 或 numpy.ndarray 对象轻松创建 IndexCollection 对象。

a = [1,2,3]
a_ind = alibox.IndexCollection(a)
# Or create by importing the module
from alipy.index import IndexCollection
a_ind = IndexCollection(a)

IndexCollection 常用的方法有：

a_ind.index 用于获取矩阵索引的索引列表类型。
a_ind.update() 用于向 IndexCollection 对象添加一批索引。
a_ind.difference_update() 用于从 IndexCollection 对象中删除一批索引

拆分数据

按工具箱对象拆分数据有两种方法。

您可以 alibox.split_AL() 通过指定一些选项来分割数据：
alibox.split_AL(test_ratio=0.3, initial_label_rate=0.1, split_count=10)
上面的代码将数据集随机拆分为训练、测试、标记、未标记集 10 次
可以使用自己的split函数，在初始化ToolBox对象时设置train_idx、test_idx、label_idx、unlabel_idx的索引
train_idx, test_idx, label_idx, unlabel_idx = my_own_split_fun(X, y)
alibox = alipy.ToolBox(X=X, y=y, query_type='AllLabels', train_idx=train_idx, test_idx=test_idx, label_idx=label_idx, unlabel_idx=unlabel_idx)

使用预定义的策略来选样本

主动学习的核心算法之一可能是查询策略。
可以通过只提供策略名称从 alipy.ToolBox 对象中获取查询策略对象：
uncertainStrategy = alibox.get_query_strategy(strategy_name='QueryInstanceUncertainty')

使用 alipy.IndexCollection 来管理您的索引，标记的索引容器是 Lind ，未标记的容器是Uind 预定义策略的示例用法可能是这样的（提供列表类型即可）：

select_ind = uncertainStrategy.select(label_index=Lind,
                                      unlabel_index=Uind,
                                      batch_size=1)

更新测试模型

可用功能'accuracy_score' 、 'roc_auc_score' 、 'get_fps_tps_thresholds' 、 'hamming_loss' 、 'one_error' 、 'coverage_error' 、 'label_ranking_loss' 、 'label_ranking_average_precision_score'
有两种方法可以使用它们：

导入模块并调用工具函数： alipy.metrics

from alipy.metric import accuracy_score
acc = accuracy_score(y_true=y, y_pred=model.predict(X))

calc_performance_metric() ToolBox 对象的使用方法：

acc = alibox.calc_performance_metric(y_true=y, y_pred=model.predict(X),
                                     performance_metric='accuracy_score')

高级指南

高级封装用法

ToolBox–初始化一个对象获取任何工具

ToolBox之前也提到过，是一个提供所有可用工具类的类。可以在不通过 ToolBox 对象传递冗余参数的情况下获取它们。
1、初始化ToolBox对象

#可用的查询类型有 ['AllLabels', 'PartLabels', 'Features'] ，查询一个实例所有标签
from sklearn.datasets import load_iris
from alipy import ToolBox

X, y = load_iris(return_X_y=True)
alibox = ToolBox(X=X, y=y, query_type='AllLabels', saving_path='.')

2、获取默认模型
ALiPy 提供了具有默认参数的 Logistic 回归模型，该模型由 sklearn 实现

lr_model = alipy.get_default_model()

#训练测试模型
lr_model.fit(X, y)
pred = lr_model.predict(X)
# get probabilistic output
pred = lr_model.predict_proba(X)

3、拆分数据

#通过用alibox.split_AL() 指定一些选项来分割数据：
alibox.split_AL(test_ratio=0.3, initial_label_rate=0.1, split_count=10)

4、创建 IndexCollection 对象

#alipy.index.IndexCollection 是 alipy 中用于索引管理的工具类。
a = [1,2,3]
a_ind = alibox.IndexCollection(a)

5、获取 Oracle 和 Repository 对象
Toolbox 类提供了 clean oracle 的初始化

#如果需要通过特征向量进行查询，可以通过设置 query_by_example=True 来实现这个目标
clean_oracle = alibox.get_clean_oracle(query_by_example=False, cost_mat=None)
#获取作为 保存查询信息的工具的 存储库 ，您可以调用 get_repository(round, instance_flag=False)
alibox.get_repository(round=0, instance_flag=False)

6、获取 State & StateIO 对象

#alipy.experiment.StateIO object 是一个用于保存和加载中间结果的类
saver = alibox.get_stateio(round=1)
#在StateIO对象中添加查询时，需要使用一个State对象，它是一个类似dict的容器来保存一个查询的一些必要信息（当前迭代的状态），例如成本、性能、选定的索引等。
st = alibox.State(select_index=select_ind, performance=accuracy,
                  cost=cost, queried_label=queried_label)

7、获取预定义的 QueryStrategy 对象
之前也提到过，就简单的介绍一下

QBCStrategy  =  alibox 。get_query_strategy ( strategy_name = 'QueryInstanceQBC' )

8、计算性能

#使用 calc_performance_metric() ToolBox 对象方法的例子 ：
acc = alibox.calc_performance_metric(y_true=y, y_pred=model.predict(X),
                                     performance_metric='accuracy_score')

9、获取停止条件对象
alipy 实现了一些常用的停止标准：

没有可用的未标记样本（默认）
达到预设查询次数
达到预设的成本限制
未标记池的预设百分比已标记
达到预设运行时间（CPU时间）

# [None, 'num_of_queries', 'cost_limit', 'percent_of_unlabel', 'time_limit']  五选一
stopping_criterion = alibox.get_stopping_criterion(stopping_criteria='num_of_queries', value=50)

10、获取实验分析器

#使用alipy.experiment.Analyser 工具类
analyser = alibox.get_experiment_analyser(x_axis='num_of_queries')

11、获取 aceThreading 对象

#alipy.utils.aceThreading 是一个类来并行你的 k-fold 实验并打印每个线程的状态。
acethread  =  alibox.get_ace_threading ()

12、保存和加载 ToolBox 对象

#保存
alibox.save()
#加载
alibox = ToolBox.load('./al_settings.pkl')

AIExperiment–几行代码运行AL算法示例

ALipy 提供了一个类，封装了各种工具，直接实现主动学习的主循环【alipy.experient.Alneatent】
备注：AlExament只支持最常用的场景–查询一个实例的所有标签。

代码实现
# 初始化 & 函数   模型参数是分类模型对象，满足 scikit-learn  API
from sklearn.datasets import load_iris
from alipy.experiment.al_experiment import AlExperiment

X, y = load_iris(return_X_y=True)
al = AlExperiment(X, y, stopping_criteria='num_of_queries', stopping_value=50)

#使用内置函数生成新的拆分
al.split_AL()

#已经实现经典和先进的查询策略，将名称传递set_query_Strategy()函数即可
#可用策略名称列表包括['QueryInstanceQBC', 'QueryInstanceUncertainty', 'QueryRandom', 'QureyExpectedErrorReduction', 'QueryInstanceGraphDensity', 'QueryInstanceQUIRE', 'QueryInstanceBMDR', 'QueryInstanceSPAL', 'QueryInstanceLAL']
# 注意，GraphDensity和Quire方法需要额外的参数
al.set_query_strategy(strategy="QueryInstanceUncertainty", measure='least_confident')

#设置性能指标，ALiPy已经实现了许多经典的性能度量标准，使用set_performance_metric函数即可
#['accuracy_score', 'roc_auc_score', 'get_fps_tps_thresholds', 'hamming_loss','one_error', 'coverage_error', 'label_ranking_loss', 'label_ranking_average_precision_score', 'zero_one_loss']
al.set_performance_metric('accuracy_score')

#开始实验 ，默认k次主动学习在多线程中运行
al.start_query(multi_thread=True)

#得到实验结果
#可以通过al.get_Example_Result().获取k次实验的k个StateIO对象列表的结果，也可以通过al.lot_Learning_curve(title=None)绘制k次实验的学习曲线
al.plot_learning_curve()

alipy中的工具类

对于某一个模块不太会或者有疑问的同学，可以直接访问这个地址：http://parnec.nuaa.edu.cn/_upload/tpl/02/db/731/template731/pages/huangsj/alipy/advanced_guideline.html
会对每个模块具体使用方法进行详细介绍与解析

如果觉得这篇文章对你有帮助的话，希望能够点个关注，评论、收藏，谢谢

还请关注小曾，入股不亏，我会把我研究生学习过程中的点点滴滴记录下来，大家一起共勉！

论文已经上传：https://download.csdn.net/download/qq_36317312/19698302
GitHub链接：https://github.com/NUAA-AL/alipy
ALipy网站链接：http://parnec.nuaa.edu.cn/_upload/tpl/02/db/731/template731/pages/huangsj/alipy/index.html
在整理期间也看了因吉的文章，也收获不小，感兴趣可以看一下https://blog.csdn.net/weixin_44575152/article/details/100783835

Apache大数据旭哥优选大数据选题 Apache大数据旭大数据定制选题 java hadoop spark 开发语言 idea hive 数据库架构
定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
Python strip() 方法详解：用途、应用场景及示例解析（中英双语）阿正的梦工坊 Python python 开发语言
Pythonstrip()方法详解：用途、应用场景及示例解析在Python处理字符串时，经常会遇到字符串前后存在多余的空格或特殊字符的问题。strip()方法就是Python提供的一个强大工具，专门用于去除字符串两端的指定字符。本文将详细介绍strip()的用法、适用场景，并通过多个示例解析其应用。1.strip()方法简介strip()方法用于去除字符串两端的指定字符（默认为空格和换行符）。它的
PX4飞控之位置控制（1）整体架构 Felix_ZL px4飞控 PX4 位置控制架构
位置控制是无人机飞控的核心算法之一，一方面根据commander中的flag标志位和Navigator中提供的航点信息进行控制（自主模式下），另一方面得到期望姿态角（setpoint）的四元数信息，给到姿态控制模块进行姿态控制。本文重点PX4飞控的位置控制的代码整体架构（mc_pos_control）,具体的控制算法将在后续文章中陆续奉上。位置控制模块的主函数：task_main()1.订阅结构体
C++徒手造国密SM算法！码农の头发消失术实录 skyksksksksks C++个人杂记物联网国密算法国密算法密码学 c++开发语言
【开场暴击：程序员的修仙之路】各位在秃头边缘疯狂试探的代码战士！今天我们要挑战史诗级成就——用纯C++手搓国家密码管理局钦定的SM2/SM3/SM4算法！没有现成库！没有外挂！只有头铁和即将离你而去的头发！(ง•̀_•́)ง【SM2加密：和椭圆曲线谈恋爱の玄学】这玩意儿就像追女神——你永远猜不透她的心思！来看加密の奥义三连：SM2加密vs追妹子对比表行为SM2加密流程追妹子流程第一步生成随机数k制
使用Python连接SqlServer 带带琪宝工作日记 python sqlserver 开发语言
目录cursor()execute('sqlstr')fetchall()、fetchone()cursor.description属性close()转化为dataframe进行分析使用的是pymssql库，这个库的详细用法参照博客（博客里也有官方文档，英语好的可以直接看）：pythonpymssql—pymssql模块使用指南_夏日白云的博客-CSDN博客我目前的需求只是使用Python连接数据
Python连接SQL SEVER数据库全流程 m0_74823131 数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
C++ 用ECC算法 Curve为EC_NIST_FP_521写个示例签名和验签。PCI认证小黄人软件经验分享 ssl 学习
以下是一个使用OpenSSL实现ECC(椭圆曲线密码)签名和验签的C++示例，曲线使用secp521r1（即NISTP-521）。这个程序：生成NISTP-521曲线的EC密钥。使用SHA-512进行哈希并签名数据。验证签名的正确性。编译：g++-oecc_signecc_sign.cpp-lssl-lcrypto运行：./ecc_sign你可以试试看，看看签名和验签是否成功！
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
Java后端开发技术详解小二爱编程· java 开发语言
Java作为一门成熟的编程语言，已广泛应用于后端开发领域。其强大的生态系统和广泛的支持库使得Java成为许多企业和开发者的首选后端开发语言。随着云计算、微服务架构和大数据技术的兴起，Java后端开发的技术栈也不断演进。本文将详细介绍Java后端开发的核心技术，包括Java基础、常见框架、数据库操作、缓存技术、异步编程等。1.Java基础：理解面向对象的编程Java是一种面向对象的编程语言，面向对象
基于springboot的社区团购系统设计 Olivia-gogogo spring boot 后端 java
一、引言在当今数字化时代，信息技术正以前所未有的速度渗透到社会的各个领域，深刻地改变着人们的生活和工作方式。教育领域也不例外，随着高等教育的普及和招生规模的不断扩大，大学生入学审核工作面临着越来越大的挑战。传统的人工入学审核方式已难以满足现代教育管理的需求，暴露出诸多弊端。传统人工入学审核方式效率低下。在每年的招生季，高校招生工作人员需要面对大量的入学申请材料，这些材料不仅数量庞大，而且种类繁多，
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
力扣 160 - Intersection of Two Linked Lists. (相交链表) Python双指针小杨快没头发了 Leetcode 刷题
力扣160-IntersectionofTwoLinkedLists.(相交链表)Python双指针原题地址：https://leetcode.com/problems/intersection-of-two-linked-lists/Giventheheadsoftwosinglylinked-listsheadAandheadB,returnthenodeatwhichthetwolistsi
华山论剑，大模型(deepseek qwq gemini)辩论人生意义 Lifeng66666666 语言模型语言模型人工智能
借助DeepDiscussion程序，通过让大模型(deepseekqwqgemini)讨论“人生意义是什么”这一挑战问题，我们得以客观观察目前这几种大模型的价值观，能力，不足。部分讨论过程：问题:人生的意义是什么？deepseek/deepseek-r1:free初始方案:针对“人生的意义是什么”这一终极问题，我的解决方案分为以下五个层次，融合东西方哲学智慧与实践心理学，并提供具体行动方向：一、
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
每日一题一一Leetcode128. 最长连续序列 - 力扣 Blue.ztl 写写算法 leetcode 算法数据结构
每日一题一一Leetcode128.最长连续序列-力扣作者：blue时间：2025.3.14128.最长连续序列-力扣（LeetCode）本题的要求是：给定一个未排序的整数数组nums，找出其中数字连续的最长序列（不要求序列元素在原数组中连续）的长度。本题用排序加遍历的方法非常容易解决，但是算法的效率太低。本题正真的解题思路如下，首先，数组中是有可能出现重复的数字，但是重复的数字其实并不影响我们找
VSCode python 遇到的问题：vscode can't open file '': [Errno 2] No such file or dire... weixin_33984032 python 开发工具 json
代码很简单，就两行：importpandasaspdimportnetCDF4asncdataset=nc.Dataset('20150101.nc')环境：在VSCode中左下角把原环境的Python3.6.532-bit切换为Anaconda中的Python3.6.564-bit('base':conda)过程中有两种错误：（忘记截图了，都是历史记录中的google网页搜索栏找到的搜索记录）1
DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码强化学习曾小健2 大语言模型LLM 算法
DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码机器之心2025年03月02日11:54北京选自GitHub作者：AndriyBurkov机器之心编译GRPO（GroupRelativePolicyOptimization）是DeepSeek-R1成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek用的GRPO占用大量内存？有人给出了些破解方法》。简单来说，GR
【测试工程师必备！】VS Code好用插件FastPytestRunner 花小田 pytest vscode
你是否还在为PythonTestExplorerforVisualStudioCode以下痛点焦头烂额？•测试扫描慢到怀疑人生，每次启动都要等待5分钟•调试时总是找不到断点入口，配置项复杂到崩溃•传统测试工具无法满足大规模测试需求•每次切换项目都要重新配置测试环境FastPytestRunner——专为测试工程师量身打造的极速测试利器来了！️实战进阶技巧：✅配置黄金法则：{"pytestRunne
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
DAY33 贪心算法Ⅱ Useee 贪心算法算法
122.买卖股票的最佳时机II-力扣（LeetCode）想到把整体利润分解为每天的利润，就豁然开朗了。classSolution{public:intmaxProfit(vector&prices){intresult=0;for(inti=1;i&nums){intcover=0;if(nums.size()==1)returntrue;for(inti=0;i=nums.size()-1)re
众数(masses)（c++）羊蜜不是羊 c++算法数据结构
题目描述由文件给出N个1到30000间无序数正整数，其中1≤N≤10000，同一个正整数可能会出现多次，出现次数最多的整数称为众数。求出它的众数及它出现的次数。输入描述输入文件第一行是正整数的个数N，第二行开始为N个正整数。输出描述输出文件有若干行，每行两个数，第1个是众数，第2个是众数出现的次数。（两个数之间由一个空格间隔，行末无多余空格）样例输入12242325372343输出2434来源算法
简单密码破解（c++）羊蜜不是羊 c++算法开发语言
题目描述密码是我们生活中非常重要的东东，我们的那么一点不能说的秘密就全靠它了。哇哈哈.接下来渊子要在密码之上再加一套密码，虽然简单但也安全。假设渊子原来一个BBS上的密码为zvbo941987,为了方便记忆，他通过一种算法把这个密码变换成YUANzi1987，这个密码是他的名字和出生年份，怎么忘都忘不了，而且可以明目张胆地放在显眼的地方而不被别人知道真正的密码。他是这么变换的，大家都知道手机上的字
HTML语言的贪心算法宇瞳月包罗万象 golang 开发语言后端
HTML语言的贪心算法：理论与实践引言在编程和算法研究中，贪心算法是一种广泛应用的解决问题的方法。它通过对每一阶段选择最优解的方式来构建整个问题的解决方案。贪心算法不一定能在所有情况下得到最优解，但在许多实际问题中，它能够提供一个足够好的近似解。本文将探讨贪心算法的基本概念、典型应用、优缺点，并结合HTML语言的特点，提出一些具体的实现示例和思考。一、贪心算法的基本概念贪心算法是一种求解最优化问题
如何用 Python 实现树结构不辉放弃 python 开发语言
一、树结构基础认知1.1树的四大特征层级关系：父子节点的从属关系唯一根节点：访问起点无循环：从根到叶的路径不形成环N叉分支：每个节点可有多个子节点1.2核心组件解析classTreeNode:def__init__(self,data):self.data=data#节点存储的数据self.children=[]#子节点容器（多叉树特性）defadd_child(self,node):self.c
Python 用户账户(让用户拥有自己的数据) 钢铁男儿 Python 从入门到精通 python 数据库 sqlite
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
Python 用户账户(让用户能够输入数据) 钢铁男儿 Python 从入门到精通 python 数据库 sqlite
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
安卓编译安装python_一文了解如何在安卓系统上安装Pydroid 3并进行编码 weixin_39916681 安卓编译安装python
由于Pydroid3集成开发环境(IDE)，因此可以用Python进行可移植的编码。Pydroid是Python3的极简解释器，可让您执行较小的项目并在Android设备上进行最少的编码。如果您还想在没有PC的任何地方学习Python编程，同时在Android上为Python复制PC平台，那么Pydroid3是一个不错的应用程序。无论您是Python编程的新手还是专家，让我们看看使用Pydroid
python为什么需要文本编辑器-推荐几款高效的Python文本编辑器| 高效的文本编辑器的特点是什么... weixin_39991305
我们都知道程序员花费大量的时间在编写、阅读和编辑代码上，因此一定要使用高效的文本编辑器才能够提高并很好的完成工作的效率和保证工作的质量。什么是高效的文本编辑器呢？除了自己用的得心应手外，小编认为还应该包含以下几个特点：·突出代码的结构，让你在编写代码时就能够发现常见的bug；·包含自动缩进功能；·显示代码长度的标志；·用于执行常见操作的快捷键；如果你是编程新手小白，小u非常建议你使用具备上述功能而
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它