zenRRan

百篇论文分类整理看数据增广最新研究进展

每天给你送来NLP技术干货！

作者｜卞书青

机构｜中国人民大学信息学院

方向 | 推荐系统、小样本学习

当前数据增广技术正不断应用于各个场景中，我们梳理近年来各大顶会上的百余篇数据增广论文并详细进行分类整理介绍，希望帮助大家更好地认识该方向的最新研究进展。

文本表示&句子建模

Good-Enough Compositional Data Augmentation. [ACL 2020]
提出一种基于规则组合的数据增广的方法用于文本序列建模中
Data manipulation: Towards effective instance learning for neural dialogue generation via learning to augment and reweight. [ACL 2020]
设计词级别和句子级别增广，考虑instance weighting降低不置信的数据，用于对话生成
MixText: Linguistically-informed interpolation of hidden space for semi-supervised text classification. [ACL 2020]
将文本插入到表示空间中，构建了大量的增强训练样本。同时数据增强的方法为无标签数据估计低熵标签。通过混合标签数据、无标签数据和增强数据
Sequence-level mixed sample data augmentation. [EMNLP 2020]
通过软合成的方式对输入/输出序列来创建新的合成样例
Nonlinear mixup: Out-of manifold data augmentation for text classification. [AAAI 2020]
利用非线性混合插值对文本分类进行数据增强
It’s all in the name: Mitigating gender bias with name-based counterfactual data substitution. [EMNLP 2019]
提出解决词嵌入中潜在的性别偏见，采用反事实数据替换对可能有偏见的文本被随机替换以避免重复
Adversarial example generation with syntactically controlled paraphrase networks. [ACL 2018]
具有句法控制的释义网络的对抗性样本生成
Certified robustness to adversarial word substitutions. [EMNLP 2019]
对抗性词替换的鲁棒性验证
Parallel data augmentation for formality style transfer. [ACL 2020]
针对 formal 风格迁移任务提出了三种数据增强方法，来获得更多有用的句子对
Contextual augmentation: Data augmentation by words with paradigmatic relations. [ACL 2018]
针对上下文的增强：通过具有范式关系的单词进行数据增强
Submodular optimization-based diverse paraphrasing and its effectiveness in data augmentation. [NAACL 2019]
基于子模块优化的多样化释义及其在数据增强中的有效性验证
Data boost: Text data augmentation through reinforcement learning guided conditional generation. [EMNLP 2020]
通过强化学习引导条件生成来增强文本数据
Improving robustness by augmenting training sentences with predicate-argument structures. [arXiv]
通过使用谓词-参数结构增加训练句子来提高鲁棒性
Textual data augmentation for efficient active learning on tiny datasets. [EMNLP 2020]
文本数据增强用于小数据集上有效的主动学习
EDA: Easy data augmentation techniques for boosting performance on text classification task. [EMNLP 2019]
基于启发式编辑策略数据增广应用于文本分类任务
Data augmentation via dependency tree morphing for lowresource languages. [ACL 2018]
通过依赖树变换对低资源语言进行数据增广
Substructure Substitution: Structured Data Augmentation for NLP. [ACL 2021]
基于NLP的结构化数据增强
Xlda: Cross-lingual data augmentation for natural language inference and question answering. [arXiv]
提出用于自然语言推理和问答的跨语言数据增强方法
Augmented sbert: Data augmentation method for improving bi-encoders for pairwise sentence scoring tasks. [NAACL 2021]
本文提出了一种简单而有效的数据增强策略针对句子评分任务，称为增强SBERT，其中使用Cross-encoders来标记一组数据更多的输入对，以增强Bi-encoders的训练数据
Counterfactual Data Augmentation for Mitigating Gender Stereotypes in Languages with Rich Morphology. [ACL 2019]
缓解具有丰富修饰的语言中的性别刻板印象的反事实数据增强

机器翻译

Lexical-constraint-aware neural machine translation via data augmentation. [IJCAI 2020]
用于词法约束感知机器翻译的数据增广方法，以构建约束感知的合成训练数据
AdvAug: Robust adversarial augmentation for neural machine translation. [ACL 2020]
针对神经机器翻译提出一种对抗增强方法。借鉴图像中对抗数据增广技术，从邻近分布中采样对抗样本并利用它们的表示进行增广，绕过生成实际的文本对抗样本
Soft contextual data augmentation for neural machine translation. [ACL 2019]
针对机器翻译，采用基于上下文的软增广
Generalizing back-translation in neural machine translation. [ACL 2019]
在 NMT 模型的交叉熵优化范围内重新设计反向翻译，阐明了其潜在的数学假设和超出其启发式用法的近似值。涵盖了更广泛的合成数据生成方案，包括从目标到源 NMT 模型的采样
Sentence boundary augmentation for neural machine translation robustness. [arXiv]
用于神经机器翻译鲁棒性的句子边界增广
A diverse data augmentation strategy for low-resource neural machine translation. [arXiv]
用于低资源神经机器翻译的多样化数据增强策略
Data diversification: A simple strategy for neural machine translation. [NeurIPS 2020]
数据多样化：神经机器翻译的简单策略
Dictionary-based data augmentation for cross-domain neural machine translation. [arXiv]
基于字典的跨域神经机器翻译数据增强
Generalized Data Augmentation for Low-Resource Translation. [ACL 2019]
用于低资源翻译的通用数据增广
SwitchOut: an Efficient Data Augmentation Algorithm for Neural Machine Translation. [EMNLP 2018]
研究基于文本的任务(例如神经机器翻译)的数据增强方法。我们将具有所需属性的数据增强策略的设计制定为优化问题，并推导出通用分析解决方案

自动数据增广

Faster autoaugment: Learning augmentation strategies using backpropagation. [ECCV 2020]
使用反向传播学习增广策略
DADA: differentiable automatic data augmentation. [arXiv]
基于可微的数据增广
Fast autoaugment. [NeruIPS 2019]
提出了Fast AutoAugment 的算法，该算法通过基于密度匹配的更有效的搜索策略来找到有效的增强策略
Text AutoAugment: Learning Compositional Augmentation Policy for Text Classification. [EMNLP 2021]
基于文本分类的组合增广策略学习
Autoaugment: Learning augmentation policies from data. [CVPR 2018]

基于数据驱动的增广策略学习

Randaugment: Practical automated data augmentation with a reduced search space. [CVPR 2020]

基于搜索空间约束的自动数据增广

Population based augmentation: Efficient learning of augmentation policy schedules. [ICML 2019]

基于种群的自动数据增广

Rotom: A meta-learned data augmentation framework for entity matching, data cleaning, text classification, and beyond. [SIGMOD 2021]

用于实体匹配、数据清理、文本分类等的元学习数据增强框架

推荐系统

Contrastive Pre-training for Sequential Recommendation. [arXiv]
设计序列推荐下的对比学习，借鉴NLP中的启发式的增广策略对序列数据进行增广
Contrastive Learning for Representation Degeneration Problem in Sequential Recommendation. [WSDM 2022]
提出基于dropout的序列推荐数据增广以缓解表征退化问题
Contrastive Self-supervised Sequential Recommendation with Robust Augmentation. [arXiv]
具有鲁棒增强的对比自监督序列推荐
Memory Augmented Multi-Instance Contrastive Predictive Coding for Sequential Recommendation. [ICDM 2021]
用于序列推荐的记忆增强的多实例对比预测编码
Counterfactual Data-Augmented Sequential Recommendation. [SIGIR 2021]
基于反事实的序列推荐数据增广
CauseRec: Counterfactual User Sequence Synthesis for Sequential Recommendation. [SIGIR 2021]
基于反事实的用户序列合成
Contrastive Curriculum Learning for Sequential User Behavior Modeling via Data Augmentation. [CIKM 2021]
基于数据增广的对比课程学习
Augmenting Sequential Recommendation with Pseudo-Prior Items via Reversely Pre-training Transformer. [SIGIR 2021]
通过逆向预训练 Transformer 用伪先验项增强序列推荐
Sequential Recommendation with Bidirectional Chronological Augmentation of Transformer. [AAAI 2022]
基于双向时序增强的Transformer序列推荐

视觉&多模态

On adversarial mixup resynthesis. [NeurIPS 2019]
利用GAN和MixUp的技术来对两个图像进行混合，生成新的图像
Data augmentation by pairing samples for images classification. [arXiv]
图像分类中的数据增强，从训练集随机抽取的两幅图像叠加合成一个新的样本（像素取平均值），使用第一幅图像的标签作为合成图像的实际标注
Data augmentation techniques for the video question answering task. [arXiv]
采用多种基于图像的数据增广策略解决VQA任务
On Interaction Between Augmentations and Corruptions in Natural Corruption Robustness. [NeurIPS 2021]
针对数据增广用于图像变换的特征空间，在这个空间中使用一种新的度量在增强和损坏之间，以证明相似性和性能之间的强相关性
Counterexample-guided data augmentation. [IJCAI 2018]
提出了一个基于反例指导的数据增广框架.
Learning data manipulation for augmentation and weighting. [NeurIPS 2019]
学习用于增强和加权的数据操作
Multimodal continuous emotion recognition with data augmentation using recurrent neural networks. [AVEC 2018]
使用循环神经网络进行数据增强的多模态情感识别
Data augmentation for visual question answering. [ACL 2017]
使用视觉问答（VQA）的两种数据增强方法。第一个使用现有的语义注释来生成新问题。第二种方法是使用循环神经网络。
Multi-Modal Data Augmentation for End-to-end ASR. [INTERSPEECH 2018]
提出了一种用于自动语音识别 (ASR) 的新端到端架构，除了传统的声学输入之外，它还可以使用符号输入进行训练。该架构使用两个独立的编码器：一个用于声学输入，另一个用于符号输入，两者共享注意力和解码器参数
Semantic equivalent adversarial data augmentation for visual question answering. [ECCV 2020]
用于视觉问答的语义等价对抗的数据增广
Cutmix: Regularization strategy to train strong classifiers with localizable features. [IEEE/CVE 2019]
将Mixup和Cutout结合起来，切割一块patch并且粘贴上另外一张训练图片相同地方的patch，对应的label也按照patch大小的比例进行混合
mixup: Beyond empirical risk minimization. [ICLR 2017]
提出一种新的数据扩展方式，即使用线性插值的方法得到新的扩展数据
SimCSE: Simple Contrastive Learning of Sentence Embeddings. [ACL 2021]
通过dropout当作数据增广利用自监督学习提升句子表征能力
Learning to compose domain-specific transformations for data augmentation. [NeruIPS 2017]
提出了一种不需要特定领域知识的数据扩增的方法，能够生成大量标记样本，并且不损失类别信息

命名实体识别

DAGA: Data augmentation with a generation approach forLow-resource tagging tasks. [EMNLP 2020]
提出适配于NER的数据增广，通过将原始的序列标注标签与句子token进行混合
An analysis of simple data augmentation for named entity recognition. [COLING 2020]
本文借鉴sentence-level的传统数据增强方法，探究了不同的数据增强方法对NER任务的影响，发现：在低资源条件下，数据增强效果增益比较明显，而在充分数据条件下，数据增强可能会带来噪声，导致指标下降
Named entity recognition for social media texts with semantic augmentation. [EMNLP 2020]
基于语义增强的社交文本命名实体识别
SeqMix: Augmenting Active Sequence Labeling via Sequence Mixup. [EMNLP 2020]
通过序列混合增强主动序列标注

基于预训练的数据增广

Do Not Have Enough Data? Deep Learning to the Rescue. [AAAI 2020]
利用GPT这些因果语言模型来生成训练数据来做数据增强。使用训练好的模型来确定有标签训练数据集合
ELECTRA: Pretraining text encoders as discriminators rather than generators. [ICLR 2020]
提出一种更具样本效率的预训练任务——替换token检测(RTD)。RTD不对输入进行遮蔽，而是从生成网络中采样得到可信的tokens，再替换掉原始输入上的tokens
How effective is task-agnostic data augmentation for pretrained transformers? [arXiv]
研究对预训练Transformer模型，任务无关的数据增广的效果
G-daug: Generative data augmentation for commonsense reasoning. [EMNLP 2020]
使用预训练的语言模型生成合成样本，并选择信息量最大和多样化的样本进行数据增强
Data augmentation using pre-trained transformer models. [ACL 2020]
使用预训练Transformer模型进行数据增广

对话&问答&文本生成

Logic-Guided Data Augmentation and Regularization for Consistent Question Answering. [ACL 2020]
提出了通过集成逻辑规则和神经网络模型来提高对比较问题的回答的准确性和一致性，同时使用基于一致性的正则化器来训练模型。通过提高全局预测的一致性，本文的方法在各种QA任务
GenAug: Data augmentation for finetuning text generators. [ACL 2020]
采用多类基于启发式的增广策略对文本生成任务做增广
Keep calm and switch on! Preserving sentiment and fluency in semantic text exchange. [EMNLP 2019]
针对聊天机器人或对话场景，在保持情感和流畅性的同时结合了实体替换、相似性屏蔽和文本填充在语义上进行文本交换的数据增广策略。
Paraphrase augmented task-oriented dialog generation. [ACL 2020]
提出了一个段落增强的回复生成（PARG）框架，还设计了一种基于对话状态和对话行为标签自动构建段落训练数据集的方法。
Sequence-to-sequence data augmentation for dialogue language understanding. [COLING 2018]
研究面向任务的对话系统中语言理解的数据增强问题
Simple is better! lightweight data augmentation for low resource slot filling and intent classification. [ACL 2020]
用于低资源槽填充和意图分类的轻量级数据增强
Effective data augmentation approaches to end-to-end task-oriented dialogue. [IALP 2019]
基于端到端的面向任务型对话的有效数据增强方法
Synthetic Data Augmentation for Zero-Shot CrossLingual Question Answering. [EMNLP 2021]
我们提出了一种提高跨语言问答效果的数据增广方法，无需额外的数据，利用问题生成模型以跨语言方式生成合成样本。
Data Augmentation for Copy-Mechanism in Dialogue State Tracking. [ACL 2020]
基于copy机制的数据增广在对话状态跟踪中的应用

数据增广理论性分析

A bayesian data augmentation approach for learning deep models. [NeurIPS 2017]
利用贝叶斯方法的视角分析数据增广策略
Does data augmentation lead to positive margin? [ICML 2019]
尽管数据增广被广泛使用，但其可证明提高鲁棒性的能力尚不清楚。在这项工作中，我们通过量化数据增广对经验风险最小化器施加的边际来分析 DA 产生的稳健性。
A kernel theory of modern data augmentation. [ICML 2019]
分析数据增广对核分类器的影响并提出了相关的理论证明。
Data augmentation revisited: Rethinking the distribution gap between clean and augmented data. [arXiv]
从分析的角度重新审视了增广数据和原始数据差异这个问题，为此本文提出用相关的指标估计预期风险的上限，即经验风险和泛化误差，可以将数据增广理解为正则化
Learning the difference that makes a difference with counterfactually-augmented data. [ICLR 2020]
学习对反事实数据增广产生影响的差异
Data augmentation instead of explicit regularization. [arXiv]
从理论和实验的角度分析对比数据增广与使用显式的正则化技术在模型性能和鲁棒性的差异。
Explaining the efficacy of counterfactually augmented data. [ICLR 2021]
解释反事实增强数据的效用
SSMBA: Self-supervised manifold based data augmentation for improving out-of-domain robustness. [EMNLP 2020]
基于自监督流形的数据增强用于提高域外鲁棒性
Data augmentation with manifold exploring geometric transformations for increased performance and robustness. [arXiv]
探索几何变换的数据增广以提高性能和鲁棒性
Tradeoffs in data augmentation: An empirical study. [ICLR 2020]
通过观察性的研究以量化数据增强如何提高模型的泛化能力。引入了两种可解释且易于计算的度量指标：相关性和多样性。最终结论发现增广的性能不是单独仅通过其中任何一个而是通过联合优化这两者提升的
What Makes for Good Views for Contrastive Learning? [NeurIPS 2020]
在本文中，我们使用理论和实证分析来更好地理解视图选择的重要性，并认为我们应该减少视图之间的互信息（MI），同时保持任务相关信息的完整性

新技术结合

A simple framework for contrastive learning of visual representations. [ICML 2020]
提出了视觉表征的对比学习框架。其中在数据增广部分，单一的某种数据增强并没有很大效果，通过组合表现突出。并设计临近块的特征对比，全局与局部的对比
Learning to Compose Domain-Specific Transformations for Data Augmentation. [NeurIPS 2017]
提出了一种不需要特定领域知识的数据扩增的方法，能够生成大量标记样本，并且不损失类别信息
δ-encoder: an effective sample synthesis method for few-shot object recognition. [NeurIPS 2018]
提出一种基于数据增广的小样本学习算法，利用一个自动编码器用于寻找同类别不同样本之间的变换
Negative data augmentation. [ICLR 2021]
为了实现更广泛的增强，探索了创建分布外样本的负数据增广策略。
Text augmentation in a multi-task view. [EACL 2021]
基于多任务视图的数据增强—其中主要任务在原始样本上进行训练，辅助任务在增强样本上进行训练。
Unsupervised data augmentation for consistency training. [NeurIPS 2020]
基于一致性训练的无监督数据增强
Data Augmentation for BERT Fine-Tuning in Open-Domain Question Answering. [arXiv]
提出了一种使用远程监督的数据增强技术应用在正例和负例。采用分阶段方法在多个数据集上微调 BERT
Graph Contrastive Learning with Augmentations. [NeurIPS 2020]
提出了一种图对比学习（GraphCL）框架，用于学习图数据的无监督表示。设计了结合各种先验的四种类型的图增强
Graph Contrastive Learning with Adaptive Augmentation. [WWW 2021]
提出了一种新颖的图对比表示学习方法，该方法具有自适应增强功能，该方法结合了图的拓扑和语义方面的各种先验
ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer. [ACL 2020]
本文主要创新点利用数据增强如对抗攻击、打乱词序、裁剪、dropout等等。通过一个数据增强模块，作用于Embedding层，为同一个句子生成两个不同的增强版本，作为正样本，一个batch内的其他样本作为负样本应用于对比学习

招聘文章

国企招聘 | NLP、语音和CV等算法岗位招聘实习生和应届全职生

招聘 | 好未来NLP算法工程师，包括实习生、应届生和社招，组内论文多，技术深厚

春招 | 风控独角兽数美科技 NLP、ASR算法工程师 - 25k-35k/月

2022内推 | 字节跳动校招 + 社招，包括NLP、CV和ASR和研究员等

最近技术文章

EMNLP 2022 和 COLING 2022，投哪个会议比较好？

一种全新易用的基于Word-Word关系的NER统一模型，刷新了14种数据集并达到新SoTA

阿里+北大 | 在梯度上做简单mask竟有如此的神奇效果

下载一：中文版！学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套！  后台回复【五件套】
下载二：南大模式识别PPT  后台回复【南大模式识别】

投稿或交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易，还望给个在看！

你可能感兴趣的:(算法,大数据,python,计算机视觉,神经网络)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class