jiaotong_jin

主动学习-综述

主动学习是机器学习（更普遍的说是人工智能）的一个子领域，在统计学领域也叫查询学习、最优实验设计”(Active learning (sometimes called “query learning” or “optimal experimental design” in the statistics literature) is a subfield of machine learning and, more generally, artificial intelligence. )。

在机器学习领域中，根据是否需要样本的标签信息可分为“监督学习”和“无监督学习”。

同时利用未标注样本和标注样本进行机器学习的算法可进一步归纳为3类：半监督学习、直推式学习和主动学习。

文献[21]简要介绍了主动学习与半监督学习的异同点：“半监督学习和主动学习都是从未标记样例中挑选部分价值量高的样例标注后补充到已标记样例集中来提高分类器精度，降低领域专家的工作量，但二者的学习方式不同：半监督学习一般不需要人工参与，是通过具有一定分类精度的基准分类器实现对未标注样例的自动标注；而主动学习有别于半监督学习的特点之一就是需要将挑选出的高价值样例进行人工准确标注。半监督学习通过用计算机进行自动或半自动标注代替人工标注，虽然有效降低了标注代价，但其标注结果依赖于用部分已标注样例训练出的基准分类器的分类精度，因此并不能保证标注结果完全正确。相比而言，主动学习挑选样例后是人工标注，不会引入错误类标 ”。

主动学习(Active Learning)为能够使用较少的训练样本来获得性能较好的分类器，通过一定的算法查询最有用的未标记样本，并交由专家进行标记，然后用查询到的样本训练分类模型来提高模型的精确度。

主动学习的模型如下: A=(C,Q,S,L,U)

其中C表示分类器（1个或者多个）、L表示带标注的样本集、S表示能够标注样本的专家、Q表示当前所使用的查询策略、U表示未标注的样本集。流程图可解释为如下步骤（以分类任务为例）：

（1）选取合适的分类器（网络模型）记为 current_model 、主动选择策略、数据划分为 train_sample（带标注的样本，用于训练模型）、validation_sample（带标注的样本，用于验证当前模型的性能）、active_sample（未标注的数据集，对应于ublabeled pool）；

（2）初始化：随机初始化或者通过迁移学习（source domain）初始化；如果有target domain的标注样本，就通过这些标注样本对模型进行训练；

（3）使用当前模型 current_model 对 active_sample 中的样本进行逐一预测（预测不需要标签），得到每个样本的预测结果。此时可以选择 Uncertainty Strategy 衡量样本的标注价值，预测结果越接近0.5的样本表示当前模型对于该样本具有较高的不确定性，即样本需要进行标注的价值越高。

（4）专家对选择的样本进行标注，并将标注后的样本放至train_sapmle目录下。

（5）使用当前所有标注样本 train_sample对当前模型current_model 进行fine-tuning，更新 current_model；

（6）使用 current_model 对validation_sample进行验证，如果当前模型的性能得到目标或者已不能再继续标注新的样本（没有专家或者没有钱），则结束迭代过程。否则，循环执行步骤（3）-（6）。

主动学习是一个循环的过程，直至达到某一停止准则为止。

主动学习作为一种新的机器学习方法，其主要目标是有效地发现训练数据集中高信息量的样本，并高效地训练模型。与传统的监督方法相比，主动学习具有如下优点：1.能够很好地处理较大的训练数据集，从中选择有辨别能力的样本点；2.减少训练数据的数量，减少人工标注成本[2]。

实验步骤：以cifar10为例，10分类
1）制作数据：active_samples=50000，val_samples=10000；train_samples=0；
2）初始化 alexnet 模型，随机权重得到最初的模型，记为 cifar10_alexnet_imagenet_init.7t；num_train_samples=0；
3）分别对 active_samples 目录下的 50000 - num_train_samples 张数据进行预测，得到10个类别对应的10个概率值；
4）重点关注每个样本预测结果的最大概率值：p_pred_max。我们初步认为 p_pred_max>0.5 的情况表示当前模型对该样本有个确定的分类结果（此处分类结果的正确与否不重要）；反之，当前模型对该样本的判断结果模棱两可，标记为hard sample；比如：模型进行第一次预测，得到10个概率值，取其最大的概率 p_pred_max；
5）对P(real lable) < p_threshold（此处的10分类任务取p_threshold=0.5）的样本进行排序，取前N个样本加入集合train_samples中；
6）基于当前的训练数据集 train_samples 对模型进行微调，得到新的模型记为 model_fine_tuned.7t；
7）重复（3）到（6）步骤，直到 active_samples 样本数为 0 或者当前模型 model_fine_tuned.7t 已经达到理想效果；
steps
step0: initialize a pretrained model based on imagent --> mnist_alexnet_imagenet_init.7t
step1: predict active_samples on current model --> get active_train_samples_path
step2: active_select_samples_to_train --> train samples added.
step3: if train_dataset_sizes>0; train it --> get a new pretrained model, named active_pretrained_cifar10.7t
do step1, step2, step3 while(active_target_val_acc>=0.9)
step4: record number of labeled samples

按照上述算法流程分别对 MNIST、Cifar-10 和 Dog-Cat 三个数据集做实验。实验结果表明引入active learning 不仅能够得到减少样本标注代价，还能够提升分类的准确率。如MNIST的实验（train_num=55000, val_num = 10000）中，使用AlexNet模型、PyTorch框架：1）使用全部的训练数据直接训练模型120次epoch，val_acc=98.992%；2）使用主动学习，Uncertainty Strategy（US），只需要2300张标注数据val_acc就能够达到99.04%，将剩余的55000-2300=52700张扔到训练好的模型进行预测，得到 99.70% (52543/52700) 的效果。可见对于MNIST数据集，仅仅使用US策略能够得到显著的效果。主动学习为什么还能够提升分类模型的准确率呢？文献[21]提到1个解释，“带标注的训练数据可能含有部分低质量的样本（噪声点）反而会降低模型的鲁棒性（模型过渡拟合噪声点）。因此标注训练样本要在保证质量的条件下，再增加数量”。如何高效地选出具有高分类贡献度的无类标样例进行标注并补充到已有训练集中逐步提高分类器精度与鲁棒性是主动学习亟待解决的关键问题。以上3个数据集的实验结果如下表所示：

分别在MNIST、Cifar-10 和 Dog-Cat 三个数据集上验证 Active Learning 的效果

上述实验结果表明：

1）引入 active learning 后，能够在 MNIST、Cifar-10 和 Dog-Cat 等三个数据集上减少一半以上的标注代价。虽然上述实验使用的数据集较为简单，但也能够证明 Active Learning 的效果。

2）active select 比 random select 在更少标注样本的条件下达到更高的性能，相当于下图右半部分所示的红虚线；

3）在 active learning 的实验中还有一个环节：使用训练得到的模型对未选中的样本进行预测，acc_left_active_samples 的精度都很高（表格中未列出，但3个实验的 acc_left_active_samples 都稍优于 train_acc）。本人认为：acc_left_active_samples 表示主动选择的过程中未被选中的样本，即当前模型足以能够区分出这些样本的类别，所以不再需要使用这些样本对模型进行微调（对模型的作用相对较小，甚至没有作用）。因此，当模型在 train 数据集下的训练精度达到 99.378% 时，使用当前模型对 acc_left_active_samples 样本进行预测的精度也同样在 99.378% 左右，甚至更高。

因此，业务方可以先挑选一定量的数据进行标注，然后训练看看效果如何；性能不能达到预期效果的话，再增加标注样本，直到模型达到预测的效果。这个思路其实跟上述介绍的主动学习算法流程略相似，但却有实质上的区别。

1）一般情况下，业务方挑选样本的准则是随机挑选（相当于 random select），更理想一点的就是挑选一些人为觉得比较复杂的样本；

2）active learning 能够通过一些选择策略挑选出当前模型认为最难区分的样本给相关领域的专家进行标注；

综上，如果某一些实际业务需要手工标注数据，并且先思考完如下几个条件后，决定是否使用 Active Learning：

1）能够较方便的获取未标注的源数据，并且有相关领域的标注专家；

2）对于一些较复杂的任务，需要慎重考虑是否已有相关的算法或者模型能够解决，不然花费再多的标注数据也不一定能够达到预期的效果；

3）不同任务类型（如，分类、检测、NLP等等），想好要用什么样的指标衡量样本（hard sample or easy sample）；

4）Last But Not Least：算法设计完成后，还要考虑如何设计一个完整的系统。比如，你需要提供一个接口，让专家把标注完成的数据传到到模型的输入端，后续有时间我也会仔细思考下这个问题。否则，到时候可能会照成时间上的浪费，虽然减少了标注代价。

如何学习主动学习：首先去找一些关于Active Learning 算法综述类的文章[1-2]，其中文献[1]是一位博生生根据其毕业论文整理而来的，全面的介绍了2007年以来 Active Learning 的发展历程，目前该论文更新至2010年，此外论文还提供了一个网址链接，在线更新相关的内容。文献[2]有中英文版本（我看的是中文版本）、篇幅较少，简要介绍了Active Learning的基本思想以及2012年关于 Active Learning 的一些最近研究成果、对Active Learning 算法进行分析，并提出和分析了有待进一步研究的问题。

周志华等人在2014年关于AL的一篇论文“Active learning by querying informative and representative examples”[17]

文献[18]“A Deep Active Learning Framework for Biomedical Image Segmentation”发表在MICCAI 2017上，使用“Uncertainty estimation and similarity estimation”的主动选择策略应用在医疗图像分割领域（FCN模型），作者均来自美国圣母大学，Lin Yang，YizheZhang，Jianxu Chen 均为华人。

文献[19]“Multi-Class Active Learning by Uncertainty Sampling with Diversity Maximization”发表于IJCV-2014，提出了一种新的 Active Learning 方法 USDM，利用 seed set 和 active pool内的所有样本的数据结构，来解决小 seed set 情况下 uncertainty sampling 存在的问题。

文献[20]“Multi-criteria-based active learning for named entity recognition”的解读博文，这是multi-criteria 开山鼻祖的文章（一篇长文）

查询策略（Query Strategy）：

Random Sampling（RS）：随机选择样本

Uncertainty Sampling（US）：选择当前模型认为最不确定的样本（如，分类问题，概率为0.5表示对该样本模棱两可，不确定性很高），标注这类样本对提升当前模型最有帮助，US也是主动学习领域最常用的策略之一。但是很少有人仅仅只用这种策略选择样本，其原因在于：US 策略仅仅考虑单个样本的信息，没有考虑样本空间整体的分布情况，因此会找到 outlier 样本，或者一些冗余的样本。比如文献[3]结合了 US 和 diversity（能够保证 batch-mode 的选择样本具有比较大的多样性）。

Kapoor[16]：An algorithm that balances exploration and exploitation by incorporating mean and variance estimation of the GP classifier.

ALBE[14]：A recent example of meta-AL that adaptively uses a combination of strategies, including [15].

主动学习领域的难点汇总：

多类分类问题：在处理多类分类问题时，基于 Margin Sampling 的样例选择标准忽略了样例可能属于其他类别的信息，因此所选样例质量较差。基于熵的方法“基于不确定性的主动学习算法研究（2011）”虽考虑了样例从属于每个类别的概率，但在多类分类问题中，样例的熵也会受到那些不重要类别的干扰。文献“Multi-class active learning for image classification（2009）”提出了基于最优标号和次优标号的准则（BvSB），考虑样例所属概率最高的前２个类别，忽略剩余类别对样例选择标准产生的干扰。文献“基于主动学习和半监督学习的多类图像分类（2011）”将BvSB和带约束的自学习（Constrained self-training，CST）引入到基于SVM的图像分类中，显著提高了分类精度。
样本中的孤立点：若选择样例时能综合考虑样其代表性（样本的先验分布信息，如聚类分析或样本密度分布分析）和不确定性（如，信息熵），通常可避免采集到孤立点。如文献“Active Learning by querying informative and representative examples（2010）”中提出了一种综合利用聚类信息和分类间隔的样例选择方法；文献“Active Learning using a Variational Dirichlet Processing model for pre-clustering and classification of underwater stereo imagery（2011）”提出了一种利用预聚类协助选择代表性样例的主动学习方法；文献“Dual strategy active learning（2007）”利用样例的不确定性及其先验分布密度进行样例选择以获取优质样例；文献“基于样本不确定性和代表性相结合的可控主动学习算法研究（2009）”将样例的分布密度作为度量样例代表性的指标，结合以熵作为不确定性指标，提出了一种基于密度熵的样例选择策略，有效解决了孤立点问题给样例选择质量造成的影响。
训练集样本冗余：新的训练样本中样例1与分类超平面的距离比样例2近，根据 BvSB 准则应当挑选样例１进行标注并补充到训练集中；但紧挨着样例1的绿色样例 a 已经在训练集中，此时若再加入样例1则对分类界面影响甚微。相比而言，将样例2补充到训练集中，对当前分类模型的训练贡献度更大。通过上述分析可知，主动学习中的样例选择度量主要分为2种：1）不确定性度量；2）差异性度量或代表性度量。样例的不确定性一般可通过计算其信息熵获得，样例的代表性通常可根据其是否在聚类中心判断，而样例的差异性则可通过计算余弦相似度（基于采样策略的主动学习算法研究进展，2012）或用高斯核函数（基于多特征融合的中文评论情感分类算法，2015）获得。
不平衡数据集：文献“一种新的SVM主动学习算法及其在障碍物检测中的应用（2009）”提出 KSVMactive 主动学习算法；文献“基于主动学习的加权支持向量机的分类（2009）”提出了改进的加权支持向量机模型；文献“基于专家委员会的主动学习算法研究（2010）”提出了基于SVM超平面位置校正的主动学习算法。

主动学习相关的论文（Relevant paper with Active Learning）

文献[1]“Active Learning Literature Survey”详细的对主动学习展开介绍，篇幅较长。文献[2]“Survey on active learning algorithms”是一篇幅较短的中文论文，主要围绕主动学习的基本思想和截至2012年最新的研究成果，并对相关算法进行分析，总结了有待进一步研究的问题，包括：1）结合非监督学习算法，取代专家标注的环节；2）维度灾难：在预处理阶段寻找高效的降维方法，减少主动查询过程的复杂度。文献[3]“Fine-Tuning Convolutional Neural Networks for Biomedical Image Analysis: Actively and Incrementally”是一篇发表于CVPR-2017的论文，使用Active Learning + Transfer Learning、Data Augmentation、Majority Selection、Continuously Fine-Tuning等方法在3个医疗图像领域的数据集上验证了引入主动选择的策略（entropy+diversity）能够至少减少一半的数据标注代价。文献[4]“Generative Adversarial Active Learning”首次将GAN与Active Learning进行组合，通过训练GAN得到生成器模型，主动生成最有价值的样本让专家进行标注。文献[5]“Learning Active Learning from Data”跟传统的主动选择策略有本质上的区别，它克服了手工设计的选择策略跨领域泛化能力的不足，通过将主动选择策略转化为回归问题进行学习，学习得到的策略在多个不同领域的真实数据集（Striatum、MRI、Credit Card、Splice、Higgs）上取得显著的效果。文献[6]"Just Sort It! A Simple and Effective Approach to Active Preference Learning"，还未仔细读。文献[21]“主动学习算法研究进展”于2017年发表在河北大学学报的一篇中文论文（个人觉得看了这篇论文还是有所收获的），围绕主动学习的3个关键步骤（学习器初始化、选择策略、算法的终止条件）展开详细的介绍，并总结了主动学习面临的问题及其对应的改进方法。

参考文献（Reference）

Krishnakumar A. Active Learning Literature Survey[J]. 2007.
Liu K, Qian X. Survey on active learning algorithms[J]. Computer Engineering & Applications, 2012.
Zhou Z, Shin J, Zhang L, et al. Fine-Tuning Convolutional Neural Networks for Biomedical Image Analysis: Actively and Incrementally[C]// IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2017:4761-4772.
Zhu J J, Bento J. Generative Adversarial Active Learning[J]. 2017.
Konyushkova K, Sznitman R, Fua P. Learning Active Learning from Data[J]. 2017.
Maystre L, Grossglauser M. Just Sort It! A Simple and Effective Approach to Active Preference Learning[J]. Computer Science, 2017.
Chu H M, Lin H T. Can Active Learning Experience Be Transferred?[C]// IEEE, International Conference on Data Mining. IEEE, 2017:841-846.
Chen L, Hassani H, Karbasi A. Near-Optimal Active Learning of Halfspaces via Query Synthesis in the Noisy Setting[J]. 2016.
Huijser M W, Van Gemert J C. Active Decision Boundary Annotation with Deep Generative Models[J]. 2017:5296-5305.
Wang X, Huang T, Schneider J. Active Transfer Learning under Model Shift[C]// International Conference on Machine Learning. 2014:1305-1313.
Baram Y, El-Yaniv R, Luz K. Online Choice of Active Learning Algorithms.[J]. Journal of Machine Learning Research, 2004, 5(1):255-291.
Schein A I, Ungar L H. Active learning for logistic regression: an evaluation[J]. Machine Learning, 2007, 68(3):235-265.
Sun S, Zhong P, Xiao H, et al. An MRF Model-Based Active Learning Framework for the Spectral-Spatial Classification of Hyperspectral Imagery[J]. IEEE Journal of Selected Topics in Signal Processing, 2017, 9(6):1074-1088.
W.-N. Hsu, , and H.-T. Lin. Active learning by learning. American Association for Artificial Intelligence Conference, pages 2659–2665, 2015.
Sheng jun Huang, Rong Jin, and Zhi hua Zhou. Active learning by querying informative and representative examples. In J. D. Lafferty, C. K. I. Williams, J. Shawe-Taylor, R. S. Zemel, and A. Culotta, editors, NIPS, pages 892–900. Curran Associates, Inc. 2010.
A. Kapoor, K. Grauman, R. Urtasun, and T. Darrell. Active Learning with Gaussian Processes for Object Categorization. In International Conference on Computer Vision, 2007.
Huang S J, Jin R, Zhou Z H. Active Learning by Querying Informative and Representative Examples[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2014, 36(10):1936-1949.
Yang L, Zhang Y, Chen J, et al. Suggestive Annotation: A Deep Active Learning Framework for Biomedical Image Segmentation[J]. 2017:399-407.
Yang Y, Ma Z, Nie F, et al. Multi-Class Active Learning by Uncertainty Sampling with Diversity Maximization[J]. International Journal of Computer Vision, 2015, 113(2):113-127.
Shen D, Zhang J, Su J, et al. Multi-criteria-based active learning for named entity recognition[C]// Meeting on Association for Computational Linguistics. Association for Computational Linguistics, 2004:589.
杨文柱, 田潇潇, 王思乐,等. 主动学习算法研究进展[J]. 河北大学学报(自然科学版), 2017, 37(2):216-224.

Apache Hive 聚合函数与 OVER 窗口函数：从基础到高级应用大鳥 sql hive apache hive hadoop
在大数据时代，ApacheHive是处理和分析海量数据的强大工具。Hive提供了丰富的聚合函数和强大的OVER窗口函数，能够帮助我们高效地进行数据分析。本文将综合介绍Hive的聚合函数和OVER窗口函数，结合实际使用场景和代码示例，帮助读者深入理解这些功能，尤其是它们在时间序列分析中的应用。一、Hive聚合函数基础聚合函数是Hive中用于对一组数据进行计算并返回单个值的函数。它们在数据分析中非常常
C++与Qt中回调函数的两种实现方法 AI+程序员在路上 QT&C++实战系列 c++qt 开发语言
一.回调函数介绍1.概念回调函数是一种在程序运行期间通过函数指针调用的函数，它通常用于实现事件驱动、异步通信、消息传递等功能。在回调函数中，被调用的函数通常称为回调函数（CallbackFunction），而调用回调函数的函数通常称为回调函数容器（CallbackContainer）。回调函数容器可以在满足某些条件或事件发生时调用回调函数，以便执行相应的操作。2.为什么需要回调函数回调提供了一种灵
低代码系统-产品架构案例介绍、伙伴云（十）露临霜低代码
下面介绍的是伙伴云的零代码平台，伙伴云有类似于在线Excel的产品，下面介绍的是零代码产品。依旧是从下至上，从左至右的顺序。开发层应用搭建层面，这里包括的系统架构层面以及底层的技术架构层。可以看到没有提到国产化能力的。但是有数据仓库，也就是能对数据进行管理、加工、和对接。主要是为了在用户视图查看时进行不同纬度的数据展示，比如：大屏展示、报表、甘特图展示等此外，流程是对接的标准BPMN的路程，可以做
【Python科研数据爬虫】基于国家标准查询平台和能源标准化信息平台的海上风电相关行业标准查询信息爬取及处理 lys_828 python科研数据处理及绘图 python 爬虫能源行业标准国家标准
基于国家标准查询平台和能源标准化信息平台的海上风电相关行业标准查询信息爬取及处理1背景2标准检索平台2.1能源标准化信息平台2.2全国标准信息公共服务平台3标准信息数据的爬取与处理3.1能源标准化信息平台的信息爬取3.2全国标准信息公共服务平台的信息爬取3.3标准信息处理1背景在进行项目背景介绍时，有时需要使用到有关标准进行背书，因此查询某一行业领域的标准信息就是第一步操作。接下来就是以海上风电相
Python多张图片存入PDF：一步步教你实现木头左 python办公自动化 python 钉钉自动化
哈喽，大家好，我是木头左！引言在当今的数字时代，经常需要将多张图片整合成一个PDF文件。无论是为了分享、备份还是打印，PDF都是一个理想的格式。在这篇文章中，我将详细介绍如何使用Python将多张图片存入PDF。准备工作在开始之前，需要确保已经安装了以下库：Pillow：一个强大的图像处理库，用于打开、操作和保存各种图像文件格式。ReportLab：一个用于创建PDF文件的库。你可以通过以下命令安
Java 21 探讨虚拟线程锁在哪里？幻想多巴胺技术论文 java 开发语言
介绍Netflix在广泛的微服务架构中一直将Java作为主要编程语言。随着我们使用更新版本的Java，JVM生态系统团队会寻找可以改善我们系统的人机工程学和性能的新语言特性。在最近的一篇文章中，我们详细描述了当我们迁移到Java21并将代际ZGC作为默认垃圾收集器时，我们的工作负载如何受益。虚拟线程是我们在此次迁移中兴奋采用的另一项功能。对于虚拟线程的新手，它们被描述为“轻量级线程，大大减少了编写
Python的未来 future模块 gftygff
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！转载：http://omencathay.itpub.net/post/30163/414347简单介绍一下python未来将会支持的一些语言特点,虽然Ibm的网站上也有介绍.但是太凌乱了.而且中翻译过后,代码的
sklearn模型评估全景：指标详解与应用实例 2402_85758936 scala 开发语言人工智能
sklearn模型评估全景：指标详解与应用实例在机器学习中，模型评估是衡量算法性能的关键步骤。scikit-learn（简称sklearn）提供了一套全面的模型评估工具，帮助开发者量化模型的准确性、健壮性和其他重要特性。本文将详细介绍sklearn中的模型评估指标，并通过代码示例展示如何应用这些指标。模型评估的重要性模型评估指标是理解和改进模型性能的基础。它们可以提供以下信息：准确性：模型预测的准
Python进行HTTP GET请求华科℡云微服务云原生自动化
在Python编程中，HTTPGET请求是获取网络资源的一种常用方式。GET请求通过向服务器发送请求行和请求头，从指定的URL获取数据。本文将详细介绍如何在Python中使用requests库发送HTTPGET请求，并处理响应。一、安装requests库首先，确保你的Python环境中安装了requests库。如果没有安装，可以使用以下命令进行安装：bash复制代码pipinstallreques
7、知识库内容更新与自动化 MaxCode-1 自动化运维知识库
1知识库内容更新与自动化企业级知识库的内容随着业务发展不断增长，涉及政策法规、内部文档、技术规范、FAQ、产品手册等多个领域。如果完全依赖人工维护，成本高、效率低，且容易造成信息滞后。因此，企业需要借助自动化工具、智能算法、订阅机制，构建高效、动态的知识更新体系，确保知识的实时性、准确性和可追溯性。本节将介绍自动化知识更新的最佳实践，并探讨数据版本管理与历史溯源，以确保知识库的高效运营。1.1自动
《Effective Java》学习笔记——第7部分并发 Suwg209 Effective Java最佳实践笔记 java 学习笔记
文章目录一、前言二、并发最佳实践1.优先使用现有的并发库2.避免共享可变数据3.最小化锁的持有时间4.使用合适的同步策略5.使用volatile变量来避免缓存问题6.避免死锁7.使用ExecutorService管理线程8.优先使用无锁并发工具三、小结一、前言《EffectiveJava》第7部分“并发”介绍了如何编写高效、安全的多线程程序。随着多核处理器的普及，Java的并发编程变得更加重要。本
图像处理算法研究的程序框架 mickey0380 系统调用图像处理算法程序框架 Windows
目录1程序框架简介2C#图像读取、显示、保存模块3C动态库图像算法模块4C#调用C动态库5演示Demo5.1开发环境5.2功能介绍5.3下载地址参考1程序框架简介一个图像处理算法研究的常用程序逻辑框架，如下图所示在该框架中，将图像处理算法产品分为上层模块和底层模块两个部分。底层模块使用C/C++实现算法API，提供给上层模块调用；上层模块执行调用API和一些界面功能的实现，最后得到不同平台的软件产
图像处理之颜色空间小结 AI洲抿嘴的薯片 opencv算法专题图像处理人工智能
1.介绍在图像处理中，我们会遇到各式各样的颜色空间，比如RGB、HLS、HSV、HSB、YCrCb、CIEXYZ、CIELab，那么它们的区别和应用场所又在哪里呢？1）RGB是生活中最常见的颜色空间，其中，R代表红色通道，G代表绿色通道，B代表蓝色通道，它们之间的相互搭配组合256*256*256，几乎可以包括人类视力所能感知的所有颜色。应用场所：一般的彩色图片都是用RGB三通道来表示，另外，在深
基于ARM的智能灯光控制系统（1）项目介绍国产化创客嵌入式项目 Linux应用 Linux驱动 arm html c语言 linux驱动网络编程
基于ARM的智能灯光控制系统（1）项目介绍项目实践说明：本实践项目是嵌入式开发培训（阶段2）底层系统开发视频课程的综合实践项目。项目开发使用的技术知识点包括：C语言编程，文件编程，串口编程，网络编程，多线程编程，进程间通信，嵌入式交叉开发，嵌入式Web服务器开发，HTML编程，Linux驱动程序开发。嵌入式开发培训（阶段2）底层系统开发视频地址智能灯光控制系统视频地址系统功能智能灯光系统是对灯光进
组合模式 - 组合模式的实现 w(ﾟДﾟ)w吓洗宝宝了 C++从 0 到 1 组合模式 c++
引言组合模式（CompositePattern）是一种结构型设计模式，它允许你将对象组合成树形结构来表示“部分-整体”的层次结构。组合模式使得客户端可以统一地处理单个对象和组合对象，从而简化了代码的复杂性。本文将详细介绍如何在C++中实现组合模式，并通过示例代码帮助读者理解其工作原理。组合模式的基本概念组合模式的核心思想是将对象组织成树形结构，其中每个节点可以是单个对象（叶子节点）或组合对象（容器
代理模式 - 代理模式的应用 w(ﾟДﾟ)w吓洗宝宝了 C++从 0 到 1 代理模式 c++
引言代理模式（ProxyPattern）是一种结构型设计模式，它允许你提供一个代理对象来控制对另一个对象的访问。代理对象通常会在客户端和目标对象之间起到中介的作用，从而可以在不改变目标对象的情况下，增加额外的功能或控制访问。本文将详细介绍如何在C++中实现代理模式，并通过示例代码帮助读者理解其应用场景。代理模式的基本概念代理模式的核心思想是通过引入一个代理对象来控制对目标对象的访问。代理对象通常会
推荐洛谷网站：全面解析与实用指南 w(ﾟДﾟ)w吓洗宝宝了 c++c语言 java c#python
洛谷（Luogu）是中国领先的在线编程学习和竞赛平台，自成立以来，已经成为许多编程爱好者的首选平台。洛谷不仅提供了丰富的编程题目和资源，还支持多种编程语言，并且拥有活跃的社区氛围。本文将详细介绍洛谷的核心功能、使用技巧以及推荐理由，帮助你更好地利用洛谷进行编程学习和竞赛训练。一、洛谷的核心功能1.题库与练习洛谷拥有庞大的题库，涵盖了从入门到高级的各种难度级别的题目。这些题目不仅覆盖了基础算法，还包
策略模式 - 策略模式的使用 w(ﾟДﾟ)w吓洗宝宝了 C++从 0 到 1 开发语言 c++
引言在软件开发中，设计模式是解决常见问题的经典解决方案。策略模式（StrategyPattern）是行为型设计模式之一，它允许在运行时选择算法的行为。通过将算法封装在独立的类中，策略模式使得算法可以独立于使用它的客户端而变化。本文将详细介绍策略模式的概念、结构、实现以及在C++中的应用。策略模式的概念策略模式定义了一系列算法，并将每个算法封装起来，使它们可以互换。策略模式使得算法可以独立于使用它的
【Python高阶篇】探索人工智能：使用Python构建一个简单的聊天机器人码农必胜客 python 人工智能机器人
人工智能是计算机科学中一个非常热门的领域，近年来得到了越来越多的关注。它通过模拟人类思考过程和智能行为来实现对复杂任务的自主处理和学习，已经被广泛应用于许多领域，包括语音识别、自然语言处理、机器人技术、图像识别和推荐系统等。本文将介绍如何使用Python构建一个简单的聊天机器人，以展示人工智能的基本原理和应用。我们将使用Python语言和自然语言处理库来构建一个聊天机器人，该机器人可以接收用户的输
Java IO流：NIO 介绍及使用栗筝i 栗筝i 的 Java 技术栈（付费部分）#Java 基础 -专栏栗筝i 的 Java 技术栈 Java 基础 Java IO 流
大家好，我是栗筝i，这篇文章是我的“栗筝i的Java技术栈”专栏的第042篇文章，在“栗筝i的Java技术栈”这个专栏中我会持续为大家更新Java技术相关全套技术栈内容。专栏的主要目标是已经有一定Java开发经验，并希望进一步完善自己对整个Java技术体系来充实自己的技术栈的同学。与此同时，本专栏的所有文章，也都会准备充足的代码示例和完善的知识点梳理，因此也十分适合零基础的小白和要准备工作面试的同
企业数字化运维运营体系规划设计方案PPT 公众号：优享智库数字化转型数据治理主数据数据仓库运维大数据
这份文件是关于企业数字化运维运营体系规划设计的综合解决方案，主要围绕构建高效、安全、稳定和集约的运维运营体系展开。以下是文件的核心要点总结：设计原则与目标：设计原则：包括自主可控、适配自身管理体系、稳快结合。强调不依赖厂商，通过体系变革实现统一运营运维，以及平衡创新与稳定性。目标：围绕“安全、稳定、高效、集约”建设运维运营体系，支撑高效警务运行。运维运营体系架构：强调构建“标准化、自助化、可视化、
Python Flask中集成SQLAlchemy和Flask-Login ivwdcwso 开发 flask python 后端 web 开发
在现代Web应用开发中,数据库和用户认证是两个非常重要的功能。Flask作为一个轻量级的PythonWeb框架,本身只提供了最基本的Web功能。但是,它可以通过集成各种优秀的扩展库来增强功能。本文将介绍如何在Flask应用中集成SQLAlchemy(数据库)和Flask-Login(用户认证),并提供一个完整的示例供参考。©ivwdcwso(ID:u012172506)准备工作安装Python确保
基于AT32(STM32)单片机的模块化代码之——按键代码模块化大白哦单片机 c语言案例项目开发
基于AT32(STM32)单片机的模块化代码之按键模块化1.环境介绍平台：AT32F415单片机，雅特力公司的AT32系列单片机其实跟STM32系列单片机大同小异，包括库函数等基本都是一样的，所以这款代码无论是AT32还是STM32都是适用的。开发环境：MDKV5forarm简介：最近做项目经常用得到按键模块，包括按键扫描，按键长按，短按，组合按的判定，所以特地把按键模块做了整理，让其模块化更加好
初识内嵌iframe 家里有只小肥猫 iframe vue 前端
iframe的基本介绍与使用介绍iframe（内嵌框架）是HTML中一种用于将一个网页嵌入到另一个网页中的标签，它可以在一个页面中显示来自其他页面的内容。在网页中，使用标签可以将一个网页嵌套在另一个网页中，实现网页间的互联互通。基础使用标签的基本用法如下：例如：属性除了src属性，还可以使用其他属性来设置iframe的行为和样式，如allow、allowfullscreen、class、frame
PEX: Python Executable魔力工具箱史艾岭
PEX:PythonExecutable魔力工具箱pexAtoolforgenerating.pex(PythonEXecutable)files,lockfilesandvenvs.项目地址:https://gitcode.com/gh_mirrors/pe/pex项目基础介绍及主要编程语言PEX（PythonEXecutable）是Pantsbuild团队维护的一个强大开源项目，致力于简化Py
Multi-Planar U-Net: 开源3D医疗图像分割项目推荐郝茜润Respected
Multi-PlanarU-Net:开源3D医疗图像分割项目推荐MultiPlanarUNetMulti-PlanarUNetforautonomoussegmentationof3Dmedicalimages项目地址:https://gitcode.com/gh_mirrors/mu/MultiPlanarUNet1.项目基础介绍及编程语言Multi-PlanarU-Net是一个开源项目，旨在实
Pex 项目使用教程任翊昆Mary
Pex项目使用教程pexPexisajavascript3dlibrary/engineallowingforseamlessdevelopmentbetweenPlaskandWebGLinthebrowser.项目地址:https://gitcode.com/gh_mirrors/pex/pex1.项目的目录结构及介绍Pex项目的目录结构如下：pex-gl/├──assets/├──lib/├
U-Net 生物医学图像分割开源项目介绍祝珺月
U-Net生物医学图像分割开源项目介绍unetU-NetBiomedicalImageSegmentation项目地址:https://gitcode.com/gh_mirrors/une/unet1.项目基础介绍及主要编程语言U-Net是由IntelAI开发的一个生物医学图像分割的开源项目。该项目基于TensorFlow和Keras框架，使用Python语言编写，旨在为医学图像分析提供高效的解决
PEX 开源项目教程束静研Kody
PEX开源项目教程pexPexisajavascript3dlibrary/engineallowingforseamlessdevelopmentbetweenPlaskandWebGLinthebrowser.项目地址:https://gitcode.com/gh_mirrors/pex/pex项目介绍PEX（PolyethyleneExchange）是一个基于高密度聚乙烯（HDPE）的管道和
深度ResUnet与ResUnet++：新一代的语义分割神器倪澄莹George
深度ResUnet与ResUnet++：新一代的语义分割神器去发现同类优质开源项目:https://gitcode.com/在这个数据驱动的时代，深度学习模型在图像处理领域展现出了强大的潜力，尤其是在语义分割任务中。今天，我们向您推荐一个基于PyTorch实现的开源项目——DeepResUnet和ResUnet++。这两个模型源自于学术界的最新研究，旨在提高图像分割的准确性和效率。项目介绍这个开源
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

主动学习-综述

查询策略（Query Strategy）：

主动学习领域的难点汇总：

主动学习相关的论文（Relevant paper with Active Learning）

参考文献（Reference）

你可能感兴趣的:(综合介绍)