wcx881212

LMTC-emnlp论文+代码剖析(BERT-LWAN)

LMTC-emnlp论文

来源

论文Meta-LMTC:Meta-Learning for Large-Scale Multi-Label Text Classification（2021emnlp）提到的使用meta-lmtc方法能增强BERTlike模型即 BERT-LWAN（Ilias Chalkidis…）。原文实验用的是蒸馏的Bert即DistillBert-LWAN。

评估标准

$Precision@K:P@K=\frac{TP@k}{TP@k+FP@k}\\ Recall@K:R@K=\frac{TP@k}{TP@k+FN@k}\\ nDCG@K = \frac{DCG@k}{IDCG@k}\space DCG@k=\sum_{i=1}^k \frac{rel_i}{log_2(i+1)}\space IDCG@k=\sum_{i=1}^{|REL|} \frac{rel_i}{log_2(i+1)}$

数据集

EURLEX57K：有关欧盟法律的数据集（发表于2019ACL：Large-Scale Multi-Label Text Classification on EU Legislation）

标签数量：总共4654个。Frequent（出现频次>50）:739个 Few（出现频次<50）：3369 个 zero：163个

文本数量：

datasets结构：分验证集、测试集、训练集以及一个标签解释器文件。每一个集合里都是json文件

内容展示：训练时的文本只截取了header、recitals、main body、attachments

{
"celex_id": "32015R0597", 
"uri": "http://publications.europa.eu/resource/cellar/e96dd688-e400-11e4-b1d3-01aa75ed71a1", 
"type": "Regulation", 
"concepts": ["1118", "1605", "2173", "2635", "3191", "693"], 
"title": "Commission Implementing Regulation (EU) 2015/597 of 15 April 2015 establishing the standard import values for determining the entry price of certain fruit and vegetables\n", 
"header": "16.4.2015 EN Official Journal of the European Union L 99/23\nCOMMISSION IMPLEMENTING REGULATION (EU) 2015/597\nof 15 April 2015\nestablishing the standard import values for determining the entry price of certain fruit and vegetables\nTHE EUROPEAN COMMISSION", 
"recitals": ",\nHaving regard to the Treaty on the Functioning of the European Union,\nHaving regard to Regulation (EU) No\u00a01308/2013 of the European Parliament and of the Council of 17\u00a0December 2013 establishing a common organisation of the markets in agricultural products and repealing Council Regulations (EEC) No\u00a0922/72, (EEC) No\u00a0234/79, (EC) No\u00a01037/2001 and (EC) No\u00a01234/2007\u00a0(1),\nHaving regard to Commission Implementing Regulation (EU) No 543/2011 of 7 June 2011 laying down detailed rules for the application of Council Regulation (EC) No 1234/2007 in respect of the fruit and vegetables and processed fruit and vegetables sectors\u00a0(2), and in particular Article 136(1) thereof,\nWhereas:\n(1) Implementing Regulation (EU) No 543/2011 lays down, pursuant to the outcome of the Uruguay Round multilateral trade negotiations, the criteria whereby the Commission fixes the standard values for imports from third countries, in respect of the products and periods stipulated in Annex XVI, Part A thereto.\n(2) The standard import value is calculated each working day, in accordance with Article 136(1) of Implementing Regulation (EU) No 543/2011, taking into account variable daily data. Therefore this Regulation should enter into force on the day of its publication in the Official Journal of the European Union,", 
"main_body": ["The standard import values referred to in Article 136 of Implementing Regulation (EU) No 543/2011 are fixed in the Annex to this Regulation.", "This Regulation shall enter into force on the day of its publication in the Official Journal of the European Union.\nThis Regulation shall be binding in its entirety and directly applicable in all Member States."], 
"attachments": "Done at Brussels, 15 April 2015.\nFor the Commission,\nOn behalf of the President,\nJerzy PLEWA\nDirector-General for Agriculture and Rural Development\n(1)\u00a0\u00a0OJ L\u00a0347, 20.12.2013, p.\u00a0671.\n(2)\u00a0\u00a0OJ L\u00a0157, 15.6.2011, p.\u00a01.\nANNEX\nStandard import values for determining the entry price of certain fruit and vegetables\n(EUR/100 kg)\nCN code Third country code\u00a0(1) Standard import value\n0702\u00a000\u00a000 MA 103,8\nSN 185,4\nTR 120,5\nZZ 136,6\n0707\u00a000\u00a005 MA 176,1\nTR 139,5\nZZ 157,8\n0709\u00a093\u00a010 MA 92,0\nTR 164,4\nZZ 128,2\n0805\u00a010\u00a020 EG 48,6\nIL 72,1\nMA 52,4\nTN 55,3\nTR 67,4\nZZ 59,2\n0805\u00a050\u00a010 MA 57,3\nTR 45,7\nZZ 51,5\n0808\u00a010\u00a080 BR 97,3\nCL 113,9\nCN 100,9\nMK 29,8\nNZ 121,0\nUS 209,2\nZA 122,2\nZZ 113,5\n0808\u00a030\u00a090 AR 107,9\nCL 151,3\nZA 132,7\nZZ 130,6\n(1)\u00a0\u00a0Nomenclature of countries laid down by Commission Regulation (EU) No\u00a01106/2012 of 27\u00a0November 2012 implementing Regulation (EC) No\u00a0471/2009 of the European Parliament and of the Council on Community statistics relating to external trade with non-member countries, as regards the update of the nomenclature of countries and territories (OJ L 328, 28.11.2012, p. 7). Code \u2018ZZ\u2019 stands for \u2018of other origin\u2019."
}

EURLEX57K.json解释器展示

{
"3474": {"concept_id": "3474", "label": "international affairs", "alt_labels": ["international politics"], "parents": []}, 
"1597": {"concept_id": "1597", "label": "school legislation", "alt_labels": [], "parents": ["2467"]}, "3363": {"concept_id": "3363", "label": "union representative", "alt_labels": ["trade union representative"], "parents": ["3374"]}, 
"4488": {"concept_id": "4488", "label": "data processing", "alt_labels": ["automatic data processing", "electronic data processing"], "parents": []}, 
"2316": {"concept_id": "2316", "label": "barge", "alt_labels": ["canal boat"], "parents": ["1036"]}, 
"5709": {"concept_id": "5709", "label": "Lithuania", "alt_labels": ["Republic of Lithuania"], "parents": ["122", "2200", "5283", "5774", "5781"]},.........

论文

2020 emnlp论文：An Empirical Study on Large-Scale Multi-Label Text Classification Including Few and Zero-Shot Labels

我们实证评估了一系列的LMTC方法，从普通的LWAN到层次分类方法和迁移学习，在来自不同领域的三个数据集（）上进行Frequent、Few、Zero-shot学习。

工作内容（贡献）

基于概率标签树（Probabilistic Label Trees）的层级方法比LWAN（CNN-LWAN）好。
提出了一个新的基于迁移学习的sota模型BERT-LWAN，在总的效果上最好。
通过利用标签的层级关系来增强few and zero-shot learning，提出了新的模型：。

Methods

LWAN：label-wise attention network。（Mullenbachetal.,2018ACL：CNN-LWAN）：给予每个标签一个不同的注意力分数。（1）还没从标签的层级关系中利用到结构化信息（2）可能利用到了层级关系只是还在研究中（3）没有结合预训练模型。

CNN-LWAN：

N为文本长度，x为词向量，de为词向量维度
$matrix[x_1,x_2,...x_N]\space X\in R^{de×N}$
嵌入层使用convolutional filter Wc ，dc为输出维度，k为宽度（通道数）
$W_c \in R^{k×de×dc}$
对于每一步n 计算hn（上下文）最后构成矩阵H
$h_n=g(W_c*x_{n:n+k-1} + b)\space b \in R^{dc} \space H \in R^{dc×N}$
通常来说，卷积过后会通过一个池化层减少成为一个向量。但考虑到一个文本中不同部分可能相关。因此，我们给每一个标签运用注意力机制。这样还能给对应的标签从文本中挑出最相关的k-gram。
$\alpha_l = SoftMax(H^Tu_l)$
注意力分数与H相乘求和
$v_l=\sum_{n=1}^N \alpha_{l..n}h_n$
PLT：Probabilistic Label Trees。考虑到LWAN计算的复杂性，LWAN不能运用在更极端规模的数据集（millions labels）上。Jasinskaetal.,2016;Prabhuetal.,2018;Khandagaleetal.,2019等人把PLT用在了Extreme Multi-label Text Classification(XMTC)。

Flat neural methods

BIGRU-LWAN
$a_{lt}=\frac{exp(h_t^T u_l)}{\sum exp(h_t^T u_l)}\\ d_l = \frac{1}{T}\sum_{t=1}^T a_{lt}h_t$

Transfer learning based LMTC

BERT-LWAN

BERT,ROBERTA

BIGRU-LWAN-ELMO

Hierarchical PLT-based methods

PARABEL,BONSAI

ATTENTION-XML

Zero-shot LMTC

C-BIGRU-LWAN

GC-BIGRU-LWAN

DC-BIGRU-LWAN

DN-BIGRU-LWAN

DNC-BIGRU-LWAN

GNC-BIGRU-LWAN

结果

代码

支持LWAN-BIGRU, ZERO-LWAN-BIGRU, GRAPH-ZERO-LWAN-BIGRU, BERT-BASE, ROBERTA-BASE, BERT-LWAN

展示部分代码

标签数据的处理：

train_counts#Counter   for concept in data['concepts']:train_counts[concept] += 1

train_concepts = set(list(train_counts))#存训练集中所有标签id

frequent, few = [], []#分别存训练集中frequent,few标签id

rest_cepts = set()#存dev test中所有的标签id

with open(os.path.join(DATA_SET_DIR, Configuration['task']['dataset'],
                   '{}.json'.format(Configuration['task']['dataset']))) as file:
		data = json.load(file)#导入解释器文件EURLEX57K.json
        none = set(data.keys())#存解释器里所有的标签id 包含了dev test train里所有的标签 以及还有500多个未出现的标签

#存储没有出现在dev test train集合标签
none = none.difference(train_concepts.union((rest_concepts)))
    
parents = []#获得父母标签
#再与所有的父母标签作交集 得到在父母标签中但是没有出现在dev train test里的
none = none.intersection(set(parents))

zero = list(rest_concepts.difference(train_concepts))#出现在test和dev里但是没出现在训练集中的 163个
true_zero = deepcopy(zero)#浅拷贝一份
zero = zero + list(none)

#存储标签列表 [['international', 'affairs'],['school','legislation'],....] 按顺序frequent few zero
#label_terms.append([token for token in word_tokenize(data[label]['label']) if re.search('[A-Za-z]', token)]) 存储的是解释器里所有的标签
label_terms = []

label_terms_ids = vectorizer.tokenize(label_terms)#转词向量

LOGGER.info('#Labels:         {}'.format(len(label_terms)))
LOGGER.info('Frequent labels: {}'.format(len(frequent)))
LOGGER.info('Few labels:      {}'.format(len(few)))
LOGGER.info('Zero labels:     {}'.format(len(true_zero)))

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ai3Gt4Hp-1668334791991)(C:\Users\wcx\AppData\Roaming\Typora\typora-user-images\image-20221113150927364.png)]

构建模型

model = LWAN(self.label_terms_id, self.true_labels_cutoff)
model = model.build_compile(n_hidden_layers=Configuration['model']['n_hidden_layers'],
                                        hidden_units_size=Configuration['model']['hidden_units_size'],
                                        dropout_rate=Configuration['model']['dropout_rate'],
                                        word_dropout_rate=Configuration['model']['word_dropout_rate'])

LWAN

class LWAN:
    def __init__(self, label_terms_ids, true_labels_cutoff):
        super().__init__()
        self.label_encoder = Configuration['model']['label_encoder']
        self.token_encoder = Configuration['model']['token_encoder']
        self.word_embedding_path = Configuration['model']['embeddings']
        self.label_terms_ids = label_terms_ids
        self.true_labels_cutoff = true_labels_cutoff
        self.bert_version = Configuration['model']['bert']
    def build_compile(self, n_hidden_layers, hidden_units_size, dropout_rate, word_dropout_rate):
        return self._compile_label_wise_attention(n_hidden_layers=n_hidden_layers,
                                                      hidden_units_size=hidden_units_size,
                                                      dropout_rate=dropout_rate,
                                                      word_dropout_rate=word_dropout_rate)
    def _compile_label_wise_attention(self, n_hidden_layers, hidden_units_size, dropout_rate):
        # Document Encoding 
        inputs = Input(shape=(None,), name='inputs')
        self.pretrained_embeddings = self.PretrainedEmbedding()
        embeddings = self.pretrained_embeddings(inputs)
        token_encodings = self.TokenEncoder(inputs=embeddings, encoder=self.token_encoder,
                                            dropout_rate=dropout_rate, word_dropout_rate=word_dropout_rate,
                                            hidden_layers=n_hidden_layers)

        # Label-wise Attention Mechanism matching documents with labels
        document_label_encodings = LabelWiseAttention(n_classes=len(self.label_terms_ids))(token_encodings)

        model = Model(inputs=[inputs] if not self.elmo else [inputs, inputs_2],
                      outputs=[document_label_encodings])

        return model

LabelwiseAttention

class LabelWiseAttention(Layer):

    def __init__(self, n_classes=4271):
        self.supports_masking = True
        self.n_classes = n_classes
        super(LabelWiseAttention, self).__init__()
    #可训练的参数矩阵
    def build(self, input_shape):
        assert len(input_shape) == 3

        self.Wa = self.add_weight(shape=(self.n_classes, input_shape[-1]),
                                  trainable=True, name='Wa')

        self.Wo = self.add_weight(shape=(self.n_classes, input_shape[-1]),
                                  trainable=True, name='Wo')

        self.bo = self.add_weight(shape=(self.n_classes,),
                                  initializer='zeros',
                                  trainable=True, name='bo')
    #注意力机制
    def call(self, x, mask=None):
    	a = dot_product(x, self.Wa)

    	def label_wise_attention(values):
        	doc_repi, ai = values
        	ai = tf.nn.softmax(tf.transpose(ai))#得注意力分数
        	label_aware_doc_rep = dot_product(ai, tf.transpose(doc_repi))
        	return [label_aware_doc_rep, label_aware_doc_rep]

    	label_aware_doc_reprs, attention_scores = K.map_fn(label_wise_attention, [x, a])

    	# Compute label-scores
    	label_aware_doc_reprs = tf.reduce_sum(label_aware_doc_reprs * self.Wo, axis=-1) + self.bo
    	label_aware_doc_reprs = tf.sigmoid(label_aware_doc_reprs)

    	return label_aware_doc_reprs

训练

fit_history = model.fit_generator(train_generator,
                                  validation_data=val_generator,
                                  epochs=Configuration['model']['epochs'],
                                  callbacks=[early_stopping, model_checkpoint])

评估

在验证集和测试集上分别评估

评估的时候frequenct、few、zero分开评估。由于前面为frequent、few、zero做了一个字典排序。

具体做法：

targets = np.zeros((len(sequences), len(self.label_ids))

label_id = dict()

label_id = [(‘frequent labels’，0)，…(‘frequent labels’，738)，(‘few labels’，739)，…(‘few labels’,4107)，(’zero labels’，4108),…]

后面再通过标签号找到对应的区间即可。

总之最后比较的是：预测出来的标签中是frequent的标签和真实的标签中是frequent的标签，预测出来的标签中是few的标签和真实的标签中是few的标签，预测出来的标签中是zero的标签和真实的标签中是zero的标签。

start, end = labels_range
p = precision_score(true_targets[:, start:end], pred_targets[:, start:end], average=average_type)
r = recall_score(true_targets[:, start:end], pred_targets[:, start:end], average=average_type)
f1 = f1_score(true_targets[:, start:end], pred_targets[:, start:end], average=average_type)

``python
start, end = labels_range
p = precision_score(true_targets[:, start:end], pred_targets[:, start:end], average=average_type)
r = recall_score(true_targets[:, start:end], pred_targets[:, start:end], average=average_type)
f1 = f1_score(true_targets[:, start:end], pred_targets[:, start:end], average=average_type)

关于2025年智能化招聘管理系统平台发展趋势 yongyoudayee 数智招聘
2025年，招聘管理领域正站在变革的十字路口，全新的技术浪潮与不断变化的职场生态相互碰撞，促使招聘管理系统成为重塑企业人才战略的关键力量。智能化招聘管理系统平台在这一背景下迅速崛起，其发展趋势不仅影响企业的招聘效率与质量，还深刻改变着人力资源市场的生态格局。一、智能化招聘管理系统平台的核心特征与发展趋势1.深度学习算法与大数据分析的应用2025年的招聘管理系统将依托深度学习算法与大数据分析，彻底颠
《C++ 赋能强化学习：Q - learning 算法的实现之路》 c++人工智能深度学习
在当今科技飞速发展的时代，人工智能无疑是最热门的领域之一，而强化学习作为其中的重要分支，正逐渐改变着我们解决复杂问题的方式。Q-learning算法作为强化学习中的经典算法，在众多领域如游戏、机器人控制、资源管理等有着广泛的应用前景。本文将深入探讨如何用C++实现强化学习中的Q-learning算法，带您领略C++在人工智能领域的强大魅力。一、强化学习与Q-learning算法概述强化学习是一种通
搜广推日常实习面经一 Y1nhl 搜广推面经深度优先算法 python 推荐算法搜索引擎 pytorch 深度学习
写在前面：除了校招的面经，实习的面经我也会更新，毕竟俺后续可能还要找一段实习。从八股来看，实习的八股更加的八股一点。和校招的面经有点不一样，所以还是可以学习了解一下。总之一句话：面向工作学习，而不是面向实验室学习！唯品会广州—搜索算法实习生一、手撕二叉树的最大深度_力扣104深度优先遍历+递归#Definitionforabinarytreenode.#classTreeNode:#def__in
第十三届蓝桥杯b组国赛dp问题鱼香rose__ #蓝桥杯 #动态规划蓝桥杯算法 c++
第十三届蓝桥杯b组国赛dp问题\Huge{第十三届蓝桥杯b组国赛dp问题}第十三届蓝桥杯b组国赛dp问题刷题的时候发现往年国赛题中有三道dp问题，而且还都是背包问题，正好最近没写过dp，那就简单整理一下，尽量把我思路整理清楚hhh。关于背包问题，可以查看这篇博客：背包九讲——九种背包问题的算法思路+代码分析-CSDN博客题目链接：备赛蓝桥杯-蓝桥云课(lanqiao.cn)文章目录2022题意思路
PID算法基础 weixin_52799893 算法
1.基础介绍PID（比例-积分-微分）是一种常用的控制器，通常用于调节过程控制系统中的稳态误差。它是由三个基本部分组成的：比例（P）、积分（I）和微分（D）。比例部分：它是最简单和最基本的部分，主要作用是纠正偏差。当系统偏离目标值时，比例部分会根据偏差的大小产生一个相应的输出，以尝试将系统带回目标值。积分部分：这部分的作用是消除系统的稳态误差。只要系统存在误差，积分部分就会产生一个相应的输出，以尝
理解音频效果处理中的滤波器：通俗易懂的讲解与实用例子 Crazy learner 音频基础滤波器音频
目录1.**混响（Reverb）****算法混响效果（AlgorithmicReverb）**2.**压缩器（Compressor）****动态范围压缩（DynamicRangeCompression）**3.**低通滤波器（Low-PassFilter）**4.**高通滤波器（High-PassFilter）**5.**带通滤波器（Band-PassFilter）**6.**陷波滤波器（Notc
主动降噪技术：原理、方法与应用的深度解析 Crazy learner 音频基础主动降噪音频语音识别
目录一、主动降噪的原理二、主动降噪的技术分类三、主动降噪中的核心算法四、主动降噪的应用领域五、主动降噪技术的挑战与未来发展六、结论主动降噪（ActiveNoiseCancellation，ANC）是当前音频技术中的重要应用，广泛用于耳机、车辆、工业环境及航空等场景。与被动降噪（通过物理结构隔绝噪音）不同，主动降噪通过电子系统发出与噪声相位相反的声音信号来抵消噪音，从而达到降噪效果。随着电子元件和音
10分钟快速扫盲：以太坊与Layer2
在介绍以太坊前，我们先来了解一些区块链技术的基础知识。什么是区块链？区块链是一种分布式账本技术，它通过去中心化的方式，将交易记录以区块的形式链接在一起，并通过共识算法确保数据的安全和一致性。区块链的最著名应用就是比特币。区块链的核心特点是去中心化和安全性。去中心化：没有中心机构控制整个系统，而是由网络中的节点共同维护和验证数据。安全性：通过共识算法和加密技术来保证，使得数据不可篡改和抵御恶意攻击。
密评专用双算法SSL证书申请
密评专用双算法SSL证书的申请过程涉及多个步骤，以下是详细的申请指南：一、选择CA机构并注册账号选择CA机构：选择一个受信任且提供双算法SSL证书服务的CA机构。JoySSL是一个知名的国产品牌，提供多种类型的证书，包括支持国际算法和国密算法的双算法SSL证书。注册账号：访问JoySSL官方网站，注册一个账号用于证书申请与下载。在注册过程中，可能需要填写一些基本信息，并在指定位置填写注册码（230
[Python数据分析]最通俗入门Kmeans聚类分析，可视化展示代码。 William数据分析 python kmeans 数据分析分类机器学习 python
什么是k-means分析？【头条@William数据分析，看原版】想象一下，你有一堆五颜六色的糖果，你想把它们按照颜色分成几堆。k-means分析就是这么一个自动分类的过程。它会根据糖果的颜色特征，把它们分成若干个组，每个组里的糖果颜色都比较相似。更专业一点说，k-means分析是一种常用的聚类算法，它会将数据集中的数据点分成k个不同的簇。每个簇都有一个中心点，这个中心点就是簇中所有数据点的平均值
微软TTS(text-to-speech)文字转语音免费开源库edge-tts语音合成实践(Python3.10)
不能否认，微软Azure在TTS(text-to-speech文字转语音)这个人工智能细分领域的影响力是统治级的，一如ChatGPT在NLP领域的随心所欲，予取予求。君不见几乎所有的抖音营销号口播均采用微软的语音合成技术，其影响力由此可见一斑，仅有的白璧微瑕之处就是价格略高，虽然国内也可以使用科大讯飞语音合成进行平替，但我们只想要最好的那一个，本次我们使用免费的开源库edge-tts来实现文本转语
MurmurHash Tips（qbit） pythonjavahash
简介MurmurHash是一种非加密型哈希函数（Non-cryptographichashfunction），适用于一般的哈希检索操作。与其它流行的哈希函数相比，对于规律性较强的key，MurmurHash的随机分布特征表现更良好。常见的MD5、SHA1是加密型哈希函数（Cryptographichashfunction）Hash算法评价杨保华《区块链·原理、设计与应用》第5章密码学与安全技术中讲
YOLOV8涨点技巧之MCA多维协作注意力模块呆头鹅AI工作室深度学习算法详解及代码复现 YOLO 深度学习人工智能计算机视觉 python conda
1.算法设计：基于MCA的YOLOv8优化1.1总体架构YOLOv8的优化算法在原有架构的基础上，引入了MCA模块，以增强特征提取能力和目标定位精度。MCA模块被嵌入到YOLOv8的主干网络（Backbone）和特征金字塔网络（FPN）中，用于捕捉多维度的上下文信息。1.2MCA模块设计MCA模块的核心思想是通过多维度的注意力机制（如通道注意力、空间注意力和尺度注意力）来增强特征表示。其结构如下：
设计一个缓存策略，动态缓存热点数据「已注销」智力题&场景题缓存数据库 java 排行榜
写在前面，因为我们最近的大作业项目需要用到热点排行这个功能，因为我们是要使用Elasticsearch来存储数据，然后最初设想是在ES中实现这个热点排行的功能，但是经过仔细思考，在我们这个项目中使用ES来做热点排行是一个很蠢的方式，因为我们这只是一个很小的排行，所以最终我们还是使用Redis来实现热点排行使用LRU？LRU是一种常见的算法，假如我们设定TOP10的热点数据，那么我们可以规定LRU容
211本硕二战腾讯大模型算法岗，已凉...... AI大模型入门算法阿里云人工智能云计算目标跟踪
01背景本弱鸡211本硕，nlp，无论文有实习（老板没资源且放养），本科有acm经历（1铜），面试pcg日常实习。02技术一面（时长1h）Q1：了解什么机器学习算法，讲一下原理？当时只记得实体识别用到了隐马尔可夫模型，讲了讲怎么怎么定义观测状态和隐藏状态、前向传播、解码和应用场景。Q2：讲一下Bert的结构和怎么训练的，怎么用bert做下游任务？八股，双向transformerencoder结构，
【精选】基于RFCBAMConv与YOLOv8优化的杂草分割系统农业智能检测平台、深度学习图像分割与注意力机制融合杂草智能识别与分类系统、深度学习目标分割优化改、进型YOLOv8杂草图像分割系统程序员阿龙深度学习实战案例 Python精选毕业设计 YOLO 感受野注意力卷积图像分割与分类智能农业图像分析农业智能检测系统农作物生长环境监测
博主介绍：✌我是阿龙，一名专注于Java技术领域的程序员，全网拥有10W+粉丝。作为CSDN特邀作者、博客专家、新星计划导师，我在计算机毕业设计开发方面积累了丰富的经验。同时，我也是掘金、华为云、阿里云、InfoQ等平台的优质作者。通过长期分享和实战指导，我致力于帮助更多学生完成毕业项目和技术提升。技术范围：我熟悉的技术领域涵盖SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nod
C++：实现聚类算法（附带源码） Katie。 c c++实现算法算法聚类支持向量机
项目介绍聚类是无监督学习中一种常用的算法，用于将数据集中的对象分组（称为簇），使得同一簇中的对象相似度较高，而不同簇之间的对象相似度较低。在许多领域，如数据挖掘、图像处理和模式识别等，聚类算法都有广泛应用。在本项目中，我们将实现最常见的聚类算法之一——K均值聚类（K-MeansClustering）。该算法的目标是通过迭代的方式将数据集划分为K个簇，每个簇由其中心（均值）表示。项目实现思路输入参数
Java 泛型及其优势码农小灰面试题 java 开发语言 java
目录一、Java泛型简介二、Java泛型的优势（一）类型安全（二）消除类型转换（三）代码复用（四）可读性三、Java泛型的使用场景（一）集合框架（二）算法和数据结构（三）类和接口（四）数据库操作四、Java泛型示例代码（一）泛型类示例（二）泛型方法示例五、总结在Java编程中，泛型是一种强大的工具，它允许我们在编写代码时使用参数化类型，从而提高代码的灵活性和可重用性。本文将深入探讨Java泛型的工
【LeetCode面试150】——21合并两个有序列表沈小农学编程 LeetCode leetcode 面试算法职场和发展 python c++
博客昵称：沈小农学编程作者简介：一名在读硕士，定期更新相关算法面试题，欢迎关注小弟！PS：哈喽！各位CSDN的uu们，我是你的小弟沈小农，希望我的文章能帮助到你。欢迎大家在评论区唠嗑指正，觉得好的话别忘了一键三连哦！题目难度：简单默认优化目标：最小化时间复杂度。Python默认为Python3。目录1题目描述2题目分析3算法框架以及代码实现3.1递归3.2迭代参考文献1题目描述将两个升序链表合并为
华为OD机试E卷 --贪心歌手--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述一个歌手准备从A城去B城参加演出。按照合同，他必须在T天内赶到歌手途经N座城市歌手不能往回走每两座城市之间需要的天数都可以提前获知。歌手在每座城市都可以在路边卖唱赚钱。经过调研，歌手提前获知了每座城市卖唱的收入预期：如果在一座城市第一天卖唱可以赚M，后续每天的收入会减少D（第
华为OD机试E卷 --寻找符合要求的最长子串 --24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述给你一个字符串s，字符串s首尾相连成一个环形，请你在环中找出‘l’、‘o’、‘x’字符都恰好出现了偶数次最长子字符串的长度。输入描述输入是一串小写的字母组成的字符串输出描述输出是一个整数备注•1≤s.length≤5*10^5•s只包含小写英文字母用例输入alolobo输出6
华为OD机试E卷 --最大值--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述给定—组整数(非负)，重排顺序后输出一个最大的整数。示例1输入:[10,9]输出:910说明:输出结果可能非常大，所以你需要返回一个字符串而不是整数。输入描述数字组合输出描述最大的整数用例输入109输出910说明无题目解析给定一组非负整数，我们需要对这些整数进行重排，使得重新
代码随想录算法【Day20】 yonuyeung 代码随想录算法算法
Day20二叉搜索树235.二叉搜索树的最近公共祖先理解只要当前节点的值在p和q节点的值的中间，那这个值就是最近的公共祖先，绝对不是次近的，这个题就好做了。递归法二叉搜索树本身是有序的，所以不涉及到前中后序的遍历classSolution{private: TreeNode*traversal(TreeNode*cur,TreeNode*p,TreeNode*q){ //先判断当前节点为空的情
6. NLP自然语言处理（Natural Language Processing）啊波次得饿佛哥 AI人工智能自然语言处理人工智能
自然语言是指人类日常使用的语言，如中文、英语、法语等。自然语言处理是人工智能（AI）领域中的一个重要分支，它结合了计算机科学、语言学和统计学的方法，通过算法对文本和语音进行分析，使计算机能够理解、解释和生成自然语言。随着深度学习技术的发展，NLP在文本分类、机器翻译、情感分析、对话系统等任务中取得了显著进展，推动了人工智能技术在多个领域的广泛应用。自然语言处理的核心任务涉及如何使计算机理解和处理语
人工智能在医疗领域的应用人工智能
人工智能在医疗领域的应用前景广阔。医疗机器人是其中之一，如智能假肢、外骨骼等可修复受损身体，IBM的达・芬奇手术系统等则能承担手术或医疗保健功能.智能药物研发借助深度学习技术，可快速准确挖掘筛选化合物或生物，缩短新药研发周期、降低成本、提高成功率，在心血管药、抗肿瘤药等研发中已取得突破.智能诊疗让计算机学习专家医疗知识，模拟思维和诊断推理，给出可靠诊断与治疗方案.智能影像识别可对医学影像进行图像识
《零基础Go语言算法实战》【题目 4-9】给定链表的头部 head，判断链表是否为循环链表廖显东-ShirDon 讲编程算法 go语言算法 go web web编程程序员
《零基础Go语言算法实战》【题目4-9】给定链表的头部head，判断链表是否为循环链表如果链表中有某个节点可以通过不断跟随下一个指针再次到达，则链表中存在循环。如果链表中有循环，则返回真，否则返回假。【解答】①思路。通过Go语言循环链表的判断规则实现即可。②Go语言实现。packagemainimport"fmt"//定义双向链表typeListNodestruct{Prev*ListNodeDa
《零基础Go语言算法实战》【题目 4-8】用 Go 语言设计一个遵循最近最少使用（LRU）缓存约束的数据结构廖显东-ShirDon 讲编程算法程序员 go语言 web编程 go web 算法
《零基础Go语言算法实战》【题目4-8】用Go语言设计一个遵循最近最少使用（LRU）缓存约束的数据结构实现LRUCache类。●LRUCache(intcapacity)：初始化具有正大小容量的LRU缓存。●intget(intkey)：如果key存在，则返回key的值；否则返回-1。●voidput(intkey,intvalue)：如果键存在，则更新键的值；否则将键值对添加到缓存中。如果密钥数
深度学习每周学习总结R4（LSTM-实现糖尿病探索与预测）大地之灯每周深度学习总结深度学习学习 lstm 人工智能算法
本文为365天深度学习训练营中的学习记录博客R6中的内容，为了便于自己整理总结起名为R4原作者：K同学啊|接辅导、项目定制目录0.总结1.LSTM介绍LSTM的基本组成部分如何理解与应用LSTM2.数据预处理3.数据集构建4.定义模型5.初始化模型及优化器6.训练函数7.测试函数8.训练过程9.模型评估0.总结数据导入及处理部分：在PyTorch中，我们通常先将NumPy数组转换为torch.Te
双算法SSL证书：满足等保、密评要求的安全利器运维
什么是双算法SSL证书？双算法SSL证书就是一种既能用国际上的加密方法（比如RSA、ECC），也能用中国特有的加密技术（比如SM2、SM3、SM4）的SSL证书。它有以下几个显著特点：合规又国际化：既满足国内的安全规定，也符合国际标准，可以和其他国家的系统无缝对接。安全且高效：结合两种加密方式的优点，根据不同情况选择最合适的加密手段，既保证了安全性，也提高了效率。广泛的兼容性：这种证书可以根据环境
OP-TEE环境飞腾密码引擎编程指南安全芯片运维linux内核
【写在前面】飞腾开发者平台是基于飞腾自身强大的技术基础和开放能力，聚合行业内优秀资源而打造的。该平台覆盖了操作系统、算法、数据库、安全、平台工具、虚拟化、存储、网络、固件等多个前沿技术领域，包含了应用使能套件、软件仓库、软件支持、软件适配认证四大板块，旨在共享尖端技术，为开发者提供一个涵盖多领域的开发平台和工具套件。点击这里开始你的技术升级之旅吧本文分享至飞腾开发者平台《OP-TEE环境飞腾密码引
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round