nlp自然语言处理学习CBOW模型类实现示例解析

实现CBOW模型类

初始化：初始化方法的参数包括词汇个数 vocab_size 和中间层的神经元个数 hidden_size。首先生成两个权重（W_in 和 W_out），并用一些小的随机值初始化这两个权重。设置astype(‘f’)，初始化将使用 32 位的浮点数。

生成层：生成两个输入侧的 MatMul 层、一个输出侧的 MatMul 层，以及一个 Softmax with Loss 层。

保存权重和梯度：将该神经网络中使用的权重参数和梯度分别保存在列表类型的成员变量 params 和 grads 中。

正向传播 forward() 函数：该函数接收参数 contexts 和 target，并返回损失（loss）。这两个参数结构如下。

contexts 是一个三维 NumPy 数组，第 0 维的元素个数是 mini-batch 的数量，第 1 维的元素个数是上下文的窗口大小，第 2 维表示 one-hot 向量。下面这个代码取出来的是什么？

 h0 = self.in_layer0.forward(contexts[:, 0])
 h1 = self.in_layer1.forward(contexts[:, 1])

jym做了一个测试：

import sys
sys.path.append('..')
from common.util import preprocess #, create_co_matrix, most_similar
from common.util import create_contexts_target, convert_one_hot
text = 'You say goodbye and I say hello.'
corpus, word_to_id, id_to_word = preprocess(text)
contexts, target = create_contexts_target(corpus, window_size=1)
#print(contexts)
#print(target)
vocab_size = len(word_to_id)
target = convert_one_hot(target, vocab_size)
contexts = convert_one_hot(contexts, vocab_size)
print(contexts[:, 0])

输出：然后从输出就知道了，取的是不同target的左边的单词。

[[1 0 0 0 0 0 0]
[0 1 0 0 0 0 0]
[0 0 1 0 0 0 0]
[0 0 0 1 0 0 0]
[0 0 0 0 1 0 0]
[0 1 0 0 0 0 0]]

反向传播 backward()：神经网络的反向传播在与正向传播相反的方向上传播梯度。这个反向传播从 1 出发，并将其传向 Softmax with Loss 层。然后，将 Softmax with Loss 层的反向传播的输出 ds 传到输出侧的 MatMul 层。“×”的反向传播将正向传播时的输入值“交换”后乘以梯度。“+”的反向传播将梯度“原样”传播。

这个backward函数里面调用的是之前写好的层的反向传播函数，比如loss_layer.backward(dout)，因此backward函数用完之后，各个权重参数的梯度就保存在了成员变量 grads 中(这是之前写的层里面的反向传播函数来实现的)。先调用 forward() 函数，再调用 backward() 函数，grads 列表中的梯度被更新。

import sys
sys.path.append('..')
import numpy as np
from common.layers import MatMul, SoftmaxWithLoss
class SimpleCBOW:
    def __init__(self, vocab_size, hidden_size):
        V, H = vocab_size, hidden_size
        # 初始化权重
        W_in = 0.01 * np.random.randn(V, H).astype('f')
        W_out = 0.01 * np.random.randn(H, V).astype('f')
        # 生成层
        self.in_layer0 = MatMul(W_in)
        self.in_layer1 = MatMul(W_in)
        self.out_layer = MatMul(W_out)
        self.loss_layer = SoftmaxWithLoss()
        # 将所有的权重和梯度整理到列表中
        layers = [self.in_layer0, self.in_layer1, self.out_layer]
        self.params, self.grads = [], []
        for layer in layers:
            self.params += layer.params
            self.grads += layer.grads
        # 将单词的分布式表示设置为成员变量
        self.word_vecs = W_in
    def forward(self, contexts, target):
        h0 = self.in_layer0.forward(contexts[:, 0])
        h1 = self.in_layer1.forward(contexts[:, 1])
        h = (h0 + h1) * 0.5
        score = self.out_layer.forward(h)
        loss = self.loss_layer.forward(score, target)
        return loss
    def backward(self, dout=1):
        ds = self.loss_layer.backward(dout)
        da = self.out_layer.backward(ds)
        da *= 0.5
        self.in_layer1.backward(da)
        self.in_layer0.backward(da)
        return None

Trainer类的实现

CBOW 模型的学习的实现：给神经网络准备好学习数据。然后求梯度，并逐步更新权重参数。

Trainer类：学习的类。

初始化：类的初始化程序接收神经网络（模型）和优化器(SGD、Momentum、AdaGrad、Adam)

学习：调用 fit() 方法开始学习。参数：x，输入数据；t，监督标签；max_epoch，进行学习的 epoch 数；batch_size，mini-batch 的大小；eval_interval，输出结果（平均损失等）的间隔。例如设置 eval_interval=20，则每 20 次迭代计算 1 次平均损失，并将结果输出到界面上；max_grad，梯度的最大范数。当梯度的范数超过这个值时，缩小梯度。

 def fit(self, x, t, max_epoch=10, batch_size=32, max_grad=None, eval_interval=20):

plot方法：画出 fit() 方法记录的损失(按照 eval_interval 评价的平均损失)。

class Trainer:
    def __init__(self, model, optimizer):
        self.model = model
        self.optimizer = optimizer
        self.loss_list = []
        self.eval_interval = None
        self.current_epoch = 0
    def fit(self, x, t, max_epoch=10, batch_size=32, max_grad=None, eval_interval=20):
        data_size = len(x)
        max_iters = data_size // batch_size
        self.eval_interval = eval_interval
        model, optimizer = self.model, self.optimizer
        total_loss = 0
        loss_count = 0
        start_time = time.time()
        for epoch in range(max_epoch):
            # 打乱
            idx = numpy.random.permutation(numpy.arange(data_size))
            x = x[idx]
            t = t[idx]
            for iters in range(max_iters):
                batch_x = x[iters*batch_size:(iters+1)*batch_size]
                batch_t = t[iters*batch_size:(iters+1)*batch_size]

                # 计算梯度，更新参数
                loss = model.forward(batch_x, batch_t)
                model.backward()
                params, grads = remove_duplicate(model.params, model.grads)  # 将共享的权重整合为1个
                if max_grad is not None:
                    clip_grads(grads, max_grad)
                optimizer.update(params, grads)
                total_loss += loss
                loss_count += 1
                # 评价
                if (eval_interval is not None) and (iters % eval_interval) == 0:
                    avg_loss = total_loss / loss_count
                    elapsed_time = time.time() - start_time
                    print('| epoch %d |  iter %d / %d | time %d[s] | loss %.2f'
                          % (self.current_epoch + 1, iters + 1, max_iters, elapsed_time, avg_loss))
                    self.loss_list.append(float(avg_loss))
                    total_loss, loss_count = 0, 0
            self.current_epoch += 1
    def plot(self, ylim=None):
        x = numpy.arange(len(self.loss_list))
        if ylim is not None:
            plt.ylim(*ylim)
        plt.plot(x, self.loss_list, label='train')
        plt.xlabel('iterations (x' + str(self.eval_interval) + ')')
        plt.ylabel('loss')
        plt.show()

这里面使用Trainer 类来执行CBOW 模型的学习。

这个model其实存的就是SimpleCBOW的成员变量。

model = SimpleCBOW(vocab_size, hidden_size)

下面是调用Trainer 类：

trainer = Trainer(model, optimizer)
trainer.fit(contexts, target, max_epoch, batch_size)
trainer.plot()

# coding: utf-8
import sys
sys.path.append('..')  # 为了引入父目录的文件而进行的设定
from common.trainer import Trainer
from common.optimizer import Adam
from simple_cbow import SimpleCBOW
from common.util import preprocess, create_contexts_target, convert_one_hot
window_size = 1
hidden_size = 5
batch_size = 3
max_epoch = 1000
text = 'You say goodbye and I say hello.'
corpus, word_to_id, id_to_word = preprocess(text)
vocab_size = len(word_to_id)
contexts, target = create_contexts_target(corpus, window_size)
target = convert_one_hot(target, vocab_size)
contexts = convert_one_hot(contexts, vocab_size)
model = SimpleCBOW(vocab_size, hidden_size)
optimizer = Adam()
trainer = Trainer(model, optimizer)
trainer.fit(contexts, target, max_epoch, batch_size)
trainer.plot()
word_vecs = model.word_vecs
for word_id, word in id_to_word.items():
    print(word, word_vecs[word_id])

结果：

SimpleCBOW类里面成员变量有下面这个：权重矩阵W_in就是单词的分布式表示。

# 将单词的分布式表示设置为成员变量
self.word_vecs = W_in

那就可以看看单词的分布式表示。

word_vecs = model.word_vecs
for word_id, word in id_to_word.items():
    print(word, word_vecs[word_id])

结果如下：可见，单词表示为了密集向量

you [-0.9987413 1.0136298 -1.4921554 0.97300434 1.0181936 ]
say [ 1.161595 -1.1513934 -0.25779223 -1.1773298 -1.1531342 ]
goodbye [-0.88470864 0.9155085 -0.30859873 0.9318609 0.9092796 ]
and [ 0.7929211 -0.8148116 -1.8787507 -0.7845257 -0.8028278]
i [-0.8925459 0.95505357 -0.29667985 0.90895575 0.90703803]
hello [-1.0259517 0.97562104 -1.5057516 0.96239203 1.0297285 ]
. [ 1.2134467 -1.1766206 1.6439314 -1.1993438 -1.1676227]

这里面为啥是5个数，其实还是在于权重矩阵W。在SimpleCBOW类里面W_in大小是跟单词数目和hidden_size有关的。

V, H = vocab_size, hidden_size
 # 初始化权重
W_in = 0.01 * np.random.randn(V, H).astype('f')

在使用Trainer 类来执行CBOW 模型的学习时，设置的hidden_size = 5，所以最后单词就表示成包含五个数的向量了。

CBOW模型的学习：调整权重，以使预测准确。也就是说，上下文是 you 和 goodbye，正确解标签应该是 say，那么如果网络具有良好的权重，对应正确解的神经元(say)的得分应该更高。

对神经网络进行学习，其实是用了Softmax 函数和交叉熵误差。使用 Softmax 函数将得分转化为概率，再求这些概率和监督标签之间的交叉熵误差，并将其作为损失进行学习。推理的 CBOW 模型加上 Softmax 层和 Cross Entropy Error 层，就可以得到损失。

输入侧和输出侧的权重都可以被视为单词的分布式表示，这里面只使用输入侧的权重作为单词的分布式表示。

最后把之前写的CBOW模型类放上来：

class SimpleCBOW:
    def __init__(self, vocab_size, hidden_size):
        V, H = vocab_size, hidden_size
        # 初始化权重
        W_in = 0.01 * np.random.randn(V, H).astype('f')
        W_out = 0.01 * np.random.randn(H, V).astype('f')
        # 生成层
        self.in_layer0 = MatMul(W_in)
        self.in_layer1 = MatMul(W_in)
        self.out_layer = MatMul(W_out)
        self.loss_layer = SoftmaxWithLoss()
        # 将所有的权重和梯度整理到列表中
        layers = [self.in_layer0, self.in_layer1, self.out_layer]
        self.params, self.grads = [], []
        for layer in layers:
            self.params += layer.params
            self.grads += layer.grads
        # 将单词的分布式表示设置为成员变量
        self.word_vecs = W_in
    def forward(self, contexts, target):
        h0 = self.in_layer0.forward(contexts[:, 0])
        h1 = self.in_layer1.forward(contexts[:, 1])
        h = (h0 + h1) * 0.5
        score = self.out_layer.forward(h)
        loss = self.loss_layer.forward(score, target)
        return loss
    def backward(self, dout=1):
        ds = self.loss_layer.backward(dout)
        da = self.out_layer.backward(ds)
        da *= 0.5
        self.in_layer1.backward(da)
        self.in_layer0.backward(da)
        return None

以上就是nlp自然语言处理学习CBOW模型类实现示例解析的详细内容，更多关于nlp自然语言CBOW模型类的资料请关注脚本之家其它相关文章！

通过交互式网页探索传输现象-AI云计算数值分析和代码验证亚图跨际 AI 人工智能云计算
传输过程涉及质量、动量和能量等物理量在各种系统中的基本运动和转移，主要分为动量传输、热量传输和质量传输，在工程、环境科学、生物学和物流等领域至关重要。传输过程是指物理量（如质量、动量和能量）在物理、化学、生物或工程系统中的移动和传递。这些过程是各种科学和工程领域的基础，主要分为三类：☁️AI云计算数值分析和代码验证传输过程的类型动量传输这涉及动量在运动介质（例如流体）中的传递。它对流体流动、沉降、
阿里云服务器配置frp实现Ubuntu台式机电脑内网穿透涛歌依旧fly Linux frp 内网穿透 Ubuntu 云服务器
起因实验室一台Ubuntu20.04的台式机电脑，我想用我的Win10笔记本远程连接它，用它的高性能，在Ubuntu的环境下来跑代码，这样比较方便。编程环境即可具有便携、性能。两者兼得，而且我的笔记本看来很舒服，毕竟2.8k，90分辨率。需要使用内网穿透技术，我的Ubuntu处于内网，需要挂载到云服务器上，云服务器具有公网ip和域名。这样外网就可以访问我的内网ubuntu电脑。图来自：https:
Nuxt.js学习(二) --- Nuxt目录结构详解、Nuxt常用配置项、Nuxt路由配置和参数传递... 庭前云落前端 ---Nuxt.JS vue java javascript react js
[TOC]1、Nuxt目录结构详解Nuxt项目文件目录结构|--.nuxt//Nuxt自动生成，临时的用于编辑的文件，build|--assets//用于组织未编译的静态资源入LESS、SASS或JavaScript|--components//用于自己编写的Vue组件，比如滚动组件，日历组件，分页组件|--layouts//布局目录，用于组织应用的布局组件，不可更改。|--middleware/
当前最好的0样本文本转语音是哪个模型？ skywalk8163 多媒体人工智能人工智能 MegaTTS3
综合排名前三模型‌MegaTTS3（字节跳动&浙江大学）‌‌核心优势‌：仅需‌3-10秒‌参考音频即可精准克隆音色，支持中英混合语音自然切换1112轻量化设计（0.45B参数），实时生成延迟低于400ms11采用‌DiffusionTransformer+WaveVAE‌架构，在韵律自然度榜单SpeechArena排名第一11‌开源地址‌：GitHub官方仓库（免费商用）‌MiniMaxSpeec
SOAP和WSDL和web服务三者的关系
SOAP（简单对象访问协议）、WSDL（Web服务描述语言）以及Web服务三者构成了一个紧密相连的技术栈，它们共同作用以支持分布式应用程序之间的互操作性。为了更深入地理解这三者之间的关系，我们可以从定义、功能角色及其在实际应用中的互动来探讨。定义Web服务：这是一种软件系统设计模式，旨在通过网络提供某些功能给其他软件或最终用户使用。它允许不同平台上的应用程序通过标准化的接口相互通信，从而实现跨平台
在delphi中Char,PChar,PByte,Byte,String的相互转换示例冰雪青松 delphi
vars:string;pc:pchar;pb:pbyte;ac:array[1..100]ofchar;ab:array[1..100]ofbyte;i:integer;begins:='thisisatest';pc:=pchar(s);//string->pcharpb:=pbyte(pc);//pchar->pbytefori:=1tolength(s)dobeginac[i]:=s[i]
深入了解Stable Diffusion：解锁AI图像生成的神秘密码 ????? DTcode7 AI生产力 AI AIGC stable diffusion AI生产力前沿
深入了解StableDiffusion：解锁AI图像生成的神秘密码?????StableDiffusion：AI的像素炼金术士基础概念：从扩散到聚焦的魔法技术深潜：核心机制解析反向扩散算法代码实验室：动手实践StableDiffusion的魔法示例一：一句话，一个世界示例二：风格迁移的艺术实战技巧与最佳实践实际挑战与解决方案结语：艺术与科技的无限对话在这个数字洪流涌动的时代，AI图像生成技术正以前
利用Python驾驭Stable Diffusion：原理解析、扩展开发与高级应用
个人网站:【摸鱼游戏】【神级代码资源网站】【星海网址导航】摸鱼、技术交流群点此查看详情引言随着生成式AI的迅猛发展，StableDiffusion已成为图像生成领域最受欢迎的开源模型之一。其以开放性、高质量输出和广泛社区支持赢得了无数开发者的青睐。本文将从原理出发，结合Python工具链，深入剖析如何掌握StableDiffusion的本质，并基于其能力进行扩展开发与高级应用。一、StableDi
架构轻巧的kokoro 文本转语音模型 skywalk8163 软硬件调试多媒体 python 开发语言
Kokoro是一个具有8200万个参数的开放权重TTS模型。尽管其架构轻巧，但它提供了与较大型号相当的质量，同时速度更快，更具成本效益。使用Apache许可的权重，Kokoro可以部署在从生产环境到个人项目的任何地方。官网：hexgrad/kokoro:https://hf.co/hexgrad/Kokoro-82M现在我们来实践下KokoroLinux下安装使用安装库pipinstall-qko
MyBatis源码深度解析：核心机制与实战应用指南言宇程序 mybatis MyBatis源码深度解析核心
MyBatis源码深度解析：核心机制与实战应用指南作为Java开发者，深入理解MyBatis源码能显著提升复杂场景下的技术决策能力。面对框架底层庞杂的模块设计，如何快速建立系统化的源码认知体系？本文将从实际应用场景出发，拆解核心源码实现逻辑。一、源码阅读的价值与技术突破点配置陷阱规避通过分析XML配置加载流程，掌握MappedStatement注册机制与typeAliases的优先级陷阱性能调优依
数据库事务全面指南：概念、语法、机制与最佳实践步行cgn 数据库数据库
数据库事务全面指南：概念、语法、机制与最佳实践事务是数据库管理系统的核心功能，它确保数据库操作满足ACID特性（原子性、一致性、隔离性、持久性）。正确使用事务对于维护数据完整性和系统可靠性至关重要。一、事务核心概念ACID特性详解特性描述实现机制原子性(Atomicity)事务的所有操作要么全部完成，要么全部不执行回滚日志(UndoLog)一致性(Consistency)事务使数据库从一个一致状态
C#库存管理系统源码与详解 weixin_42613017
本文还有配套的精品资源，点击获取简介：本文深入剖析C#开发的库存管理系统源码，涵盖从设计到实现的各个方面。详细解释了面向对象编程思想在库存管理中的应用，包括商品、仓库、订单等实体的类设计，以及关键的库存管理模块如入库、出库、查询、预警、盘点、报表生成、数据库设计、用户界面设计、错误处理与安全性的实现。此项目旨在帮助开发者深入理解C#语言及其在业务系统开发中的实践经验，涵盖软件工程的核心概念。1.面
ThinkPHP框架深入解析与实战技巧 weixin_42613017
本文还有配套的精品资源，点击获取简介：《深入理解ThinkPHP框架》一文深入探讨了ThinkPHP这一广泛使用的PHPWeb开发框架。文章详细阐述了ThinkPHP的核心概念、设计模式、主要特点以及核心组件。此外，还提供了基于ThinkPHP的开发实践案例，包括常见应用场景、开发流程以及进阶话题，如模块化开发、错误处理、RESTfulAPI实现和调试工具的使用。读者将通过本文全面学习到如何高效运
MyBatis缓存机制深度解析搞怪青年布响丸辣 mybatis 缓存 spring
在软件开发中，性能优化是一个永恒的话题。对于频繁访问数据库的应用来说，缓存是提高性能的重要手段之一。MyBatis作为一款流行的持久层框架，自然提供了丰富的缓存支持。本文将深入探讨MyBatis的一级缓存、二级缓存以及集成第三方缓存的机制和使用注意事项。一、MyBatis缓存概述MyBatis缓存主要分为两类：一级缓存（SqlSession级别的缓存）和二级缓存（Mapper级别的缓存）。一级缓存
线程安全与锁机制深度解析大曰编程 java面试安全 java 大数据
在Java并发编程中，线程安全与锁机制是保障多线程环境下数据一致性的核心技术。本文从线程安全的本质定义、实现策略及主流锁机制的原理与实践展开，结合JVM底层实现与JUC框架特性，构建系统化知识体系，确保内容深度与去重性。线程安全核心概念与分类线程安全本质定义线程安全指多个线程访问共享资源时，无需额外同步措施仍能保证操作结果符合预期。其核心挑战源于以下三个特性的冲突：原子性：操作不可分割（如i++实
MCP vs LangChain：标准化协议与开发框架的优劣对比 guohuang MCP 人工智能深度学习大模型
随着大型语言模型(LLM)技术的迅速发展，开发者需要高效的工具来构建基于LLM的应用。MCP(ModelContextProtocol)和LangChain作为两种主流解决方案，各有优缺点。本文将从技术入门者的角度，对这两种技术进行深入对比分析。1.概述MCP：标准化协议MCP（ModelContextProtocol）是由Anthropic提出的一种标准化协议，旨在统一大模型API的调用方式，简
python：AI 生成卡通短视频 belldeep python AI python 人工智能短视频卡通
在AI生成卡通短视频领域，Python技术栈已形成成熟工具链，以下从核心技术、工具推荐、全流程实现到爆款案例提供完整解决方案：一、卡通生成三大核心技术1.风格化模型ToonCrafter（字节跳动）：基于扩散模型的卡通生成器，支持迪士尼/Pixar等20+风格fromdiffusersimportToonCrafterPipelinepipeline=ToonCrafterPipeline.fro
C++从入门到精通专栏简介 xiaoheshang_123 C++从入门到精通专栏开发语言 c++
目录C++从入门到精通专栏简介专栏概述专栏特色适用人群学习目标专栏结构第1章：C++语言基础第2章：面向过程编程第3章：面向对象编程(OOP)入门第4章：标准模板库(STL)初探第5章：高级特性第6章：现代C++第7章：实践项目第8章：性能优化与调试第9章：职业发展专栏优势期待与收获C++从入门到精通专栏简介专栏概述本专栏旨在为C++编程语言的学习者提供一个全面而系统的指南，帮助他们从零基础逐步成
SpringBoot项目接口集中测试方法及实现 sclibingqing spring boot 后端 java
为了实现在每次修改后自动测试所有接口的需求，你可以使用SpringBootTest框架结合JUnit5编写集成测试。以下是完整的实现方案：实现策略使用SpringBootTest进行集成测试-启动完整Spring上下文统一管理测试用例-集中配置所有接口的测试参数自动遍历测试-循环执行所有接口测试异常捕获与报告-精确报告失败接口的详细信息支持多种HTTP方法-处理GET/POST/PUT/DELET
spring event（spring事件）喝可乐的希饭a Spring spring java 数据库
背景在Spring框架中，事件处理是一个强大的功能，允许在应用程序中发布和监听事件。这对于解耦组件、实现异步处理以及增强应用的反应性非常有效。以下是使用Spring事件的一般步骤：定义事件类：首先，需要定义一个事件类，该类通常继承自ApplicationEvent。不过，从Spring4.2开始，你可以使用任何对象作为事件。publicclassMyCustomEventextendsApplic
深度学习目标检测之YOLOv3实战（二）训练自己的图像数据郎郎不会飞深度学习目标识别 python 深度学习
深度学习目标检测之YOLOv3实战（二）训练自己的图像数据数据集准备数据集预处理原demo修改数据集训练目标检测补充二零二零年的大年初一，给大家拜个年，祝大家鼠年吉祥，万事如意，趁着喜气，把Yolov3训练自己的数据过程，记录一下，共勉共进。同样，无人机搭载山狗拍摄的视频，目标检测的种类是模型tank和airplane，部分效果图镇贴：数据集准备首先需要将自己的数据集准备好，不同场景下的目标数据尽
Python训练营-Day25-异常处理 Mallow Flowers Python训练营 python 开发语言机器学习人工智能
Python的异常处理机制为程序提供了强大的容错能力(faulttolerance)。当程序在运行时遇到意外情况（即异常），它不会直接崩溃，而是可以被设计成优雅地处理这些错误，并可能继续执行后续逻辑（如果设计允许）或以可控的方式结束。当异常发生时，Python会创建一个异常对象(exceptionobject)（通常是Exception类的子类实例）。如果这段可能出错的代码位于try语句块中，程序
YOLOv12 正式发布 | 检测效果超越YOLO11！！
论文地址：YOLOv12:Attention-CentricReal-TimeObjectDetectors代码地址：https://github.com/sunsmarterjie/yolov12提升YOLO框架的网络架构一直至关重要，尽管注意力机制在建模能力方面已被证明具有优越性，但长期以来一直专注于基于CNN的改进。这是因为基于注意力的模型无法与基于CNN的模型的速度相匹配。本文提出了一种以
Python基础——类和对象十二测试录 Python基础 java 开发语言 python 经验分享程序人生
目录1.定义类2.创建对象3.类和对象的示例4.类的方法4.1实例方法4.2类方法4.3静态方法5.类的继承6.封装与多态在Python中，类（Class）和对象（Object）是面向对象编程的核心概念。通过类和对象，可以组织和管理代码，使得代码更加模块化、可重用和易于维护。下面详细介绍类和对象的概念、定义方法和使用方法。1.定义类类是创建对象的模板或蓝图。类定义了对象的属性（成员变量）和行为（方
D-FINE模型详解及代码复现清风AI 目标跟踪人工智能计算机视觉深度学习机器学习 python 神经网络
研究背景在实时目标检测领域的快速发展背景下，D-FINE作为一项突破性的方法应运而生。它超越了现有模型如YOLOv10、YOLO11及RT-DETRv1/v2/v3，重新定义了边界框回归任务，显著提升了实时目标检测的性能上限。D-FINE通过创新的细粒度分布优化(FDR)和全局最优定位自蒸馏(GO-LSD)机制，为目标检测领域带来了新的突破，为未来的研究奠定了基础。创新优势D-FINE模型在创新方
【HarmonyOS NEXT】鸿蒙应用实现屏幕录制详解和源码
【HarmonyOSNEXT】鸿蒙应用实现屏幕录制详解和源码一、前言官方文档关于屏幕录制的API和示例介绍获取简单和突兀。使用起来会让上手程度变高。所以特意开篇文章，讲解屏幕录制的使用。官方文档参见：使用AVScreenCaptureRecorder录屏写文件(ArkTS)二、方案思路鸿蒙应用关于录制屏幕，官方提供了AVScreenCaptureRecorder进行屏幕录制的调用。分为以下几个步骤
【HarmonyOS NEXT】解决自定义弹框遮挡气泡提示的问题
【HarmonyOSNEXT】解决自定义弹框遮挡气泡提示的问题鸿蒙开发能力##HarmonyOSSDK应用服务##鸿蒙金融类应用（金融理财一、问题背景：弹框和气泡，dialog和toast。是我们应用开发中常用的两种提示媒介。在鸿蒙应用中，如果自定义弹框在底部展示时，又弹出气泡进行提示，会发现气泡在弹框层级之下。会被遮挡住，影响气泡的显示。二、解决方案：设置气泡的显示模式为置顶即可：promptA
【HarmonyOS 5】鸿蒙应用代码控制横竖屏切换，自动切换横竖屏，监听横竖屏以及注意事项
【HarmonyOS5】鸿蒙应用代码控制横竖屏切换，自动切换横竖屏，监听横竖屏以及注意事项鸿蒙开发能力##HarmonyOSSDK应用服务##鸿蒙金融类应用（金融理财一、鸿蒙应用如何进行页面横竖屏调用API手动切换1.首先要在EntryAbility中获取主窗口对象EntryAbility.etsimport{AbilityConstant,UIAbility,Want}from'@kit.Abi
ali PaddleNLP docker 大熊程序猿 AI大模型 docker 容器运维
一、添加文件nano /root/projects/paddlenlp_similarity_server.pyfromflaskimportFlask,request,jsonifyimportpaddlefrompaddlenlpimportTaskflowimportjsonimportuuidapp=Flask(__name__)#初始化文本相似度模型similarity=Taskflow
《解锁AudioSet：开启音频分析的无限可能》
音频新时代的“密钥”：AudioSet登场在科技飞速发展的今天，音频作为信息传播与交互的关键媒介，早已渗透到现代科技的各个角落。从智能手机中的语音助手，让我们通过简单的语音指令就能查询信息、发送消息，到智能家居系统，凭借音频识别技术实现设备的智能控制，如智能音箱可根据我们的声音命令播放音乐、查询天气；从沉浸式的虚拟现实（VR）和增强现实（AR）体验中，逼真的音效让人身临其境，到智能驾驶领域，通过对
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

nlp自然语言处理学习CBOW模型类实现示例解析

目录

实现CBOW模型类

Trainer类的实现

你可能感兴趣的:(nlp自然语言处理学习CBOW模型类实现示例解析)