big_matster

Zero-Shot Learning across Heterogeneous Overlapping Domains

极简论文阅读

摘要

a zero-shot learning approach:零样本学习方法。
natural language understanding domain：自然语言处理域。
a given utterance：给定的话语。
domains at runtime：运行时的域。
utterances and domains 给定话语和域。
the same embedding space :相同的嵌入空间。
domain-specific embedding：特定域嵌入。
a set of attributes that characterize the domain: 一系列表征域的属性。

模型：

a neural network trained via ranking loss：排序损失函数训练神经网络。
a virtual assistant’s third-party domains:虚拟助手的第三部域。
效果： less storage和new domains。

介绍

virtual assistants: Alexa, Cortana and the Google Assistant
a small and relatively fixed number of domains：相对固定的域数量。
功能：
（被分组）
are groupings of mutually related user intents, and predicting the right domain for a given utterance could be treated as a multi-class classification problem

new frameworks

**the Alexa Skills Kit, the Cortana Skills Kit, and Actions on Google 域的数量呈现指数级的增长。

non-experts ：非专家。
heterogenous 异构
overlapping output label spaces: 重叠的输出标签空间。
scratch for every new domain 抓取每一个新域。
infeasible 不可行的。
at regular intervals 定期
the interim period 中期
学习一个函数将任何域映射到密集向量实现新域的连续可扩展性。
this continuous extensibility
new domains
project any domain into a dense vector
a function :generate a domain embedding for any domain
attributes of the domain, 域的属性。特征
the sample utterances:样本语句
generates domain embeddings from domain attributes。
（从域属性哪里产生域嵌入）
an utterance embedding for any incoming utterance.
（为输入语句产生输入嵌入）
two functions to use the same embedding space
（两个函数使用相同的嵌入空间）
list the domains whose embeddings are most similar to the utterance embedding

a neural joint attribute learning framework

神经多任务属性学习框架。

user preferences or past interactions 用户偏好和过去关系。

Zero-Shot Learning

创新点

This paper deals with the case where novel classes (i.e., domains) are added after our model has been trained,

we are constrained to not retrain to incorporate these new classes
continuously add new domains. （同时补充新域）

Proposed Zero-Shot Architecture

Standard classifiers :标准分类器。

learn unique parameters per training class
$\in Y^{train}$

在测试阶段并不能够预测新类。
标准的神经网络使用一个得分函数，为每个训练类别有一个参数空间。
$s(x,y;\theta,f_x) = h_x(x;\theta_x,f_x)\cdot\theta^T_y$

$f_x$ 是一个函数，能够提取输入向量的 $x$ 的输入属性。
$\theta_x$ ：排除最后一层神经网络的参数。

$h_x$ ：是输入的密集嵌入表征，基于属性 $f_x(x)$
$\theta_y$ .:与类 $y$ 相同维度的最终层参数。

再类参数 $\theta_y$ 函数是线性的。

$f_x(x) 和f_y(x)$ 是属性。
$h_x$ and $h_y$ 是密集嵌入。

At test time, new classes can be scored along with classes observed during training.

得分函数

$h_y(y;\theta_y,f_y)$ 是类 $y$ 的嵌入。基于类属性 $f_y(y)$

$\theta_y$ 是一系列所有类别的共享参数。
框架包含三个成分：

an input encoder,
an output encoder and
a discriminator or scorer module
模块中的每一个都是充分可微的。系统能够使用反向传播进行端到端的训练。

Input Encoder

the attributes of an input utterance,： $f_x(x)$
a dense embedding $h_x(x)$
输入属性包含： all utterance-specific contextual features
use 300-dimensional pre-trained word embeddings
初始化：the lookup layer
This is followed by a mean pooling layer followed by an affine layer with a (tanh) nonlinear activation function
s LSTM-based architectures

output Encoder

the attributes of a candidate output class $f_y(y)$
computes a dense embedding $h_y(y)$
the output encoder is a 256-dimensional dense layer
each class $y$ is a a natural language understanding (NLU) domain

为each domain y 我们提取以下属性： $f_y(y)$

Category metadata
Developer-provided metadata such as domain category
Mean-pooled word embeddings
Gazetteer attributes:
We have a number of in-house gazetteers,
. Gazetteer-firing patterns are noisy, and
some gazetteers are badly constructed, so instead of using
raw matches against the gazetteers as feature values, we
normalize them by applying
applying TF-IDF

Scorer

产生输入和输出的相似性得分。
define the scorer as a vector dot product

替代方案：cosine distance、Euclidean distance、
as a trainable neural network in itself, jointly trained as part of the larger network

Learning and Inference

$D^{train} = \left\{\begin{matrix}(x_i，y_i)\end{matrix}\right\}^N_{i = 1}$

表示可以利用的训练数据 $y_i \in y^{train} 任意：i$
所谓的得分函数如上图所示：
we coulde define a probility distribution over the training classes $y^{train}$
using a softmax layer similiar to a maximum entropy model :
$\frac{\exp s(x,y)}{\sum_{\hat{y} \in y^{train}}\exp s(x,\hat{y})}$
通过最小化损失函数：a cross-entropy loss, 可以最优参数 $\theta_x和\theta_y$
the training classes $y^{train}$
the test classes $y^{test} is,not,well,motivated$

替代方案

using an SVM-like margin-based objective function, popular in the information retrieval literature 最小化以下:
$\underset{\theta_x,\theta_y}{min}\sum^N_{i = 1}[\underset{y \not= y_i}{max}(s(x_i,y_i) + \gamma - s(x_i,y_i))]_{+}$

在这里 $x]_{+}$ the hinge function
is equal to $x$ when $x > 0$ else 0

This objective function tries to maximize the margin between the correct class and all the other classes.

训练阶段

sampling a random negative class label and maximizing the margin loss between that and the oracle true sample.
each epoch of training,
- we perform
  an inference step over the list of training classes and sample negative samples from that posterior distribution

at the start of training

the model chooses random output classses.

as training progresses

the model starts choosing the hardest,most confusable cases as negative samples.

Consistent with prior work

we find that this training strategy significantly speeds up convergence in training compared to purely random sampling, though sampling from the normalized output distribution adds a fixed time cost.

further more

maximizing the margin with the best incorrect class implies that the margin with other incorrect classes is maximized as well.

the input feature representation: a feed-forward neural network.
optimize this objective in an online fashion using any gradient descent method.比如：SGD
我们端到端的训练模型，使用 $D r o p o u t$ 。
using Dropout [20] on both encoder networks with a dropout rate of 0.2

在这里 $\hat{y_i} = argmax_{y \not= y_i}s(x_i,y$
the highest-scoring incorrect prediction under the current model)
$y_i$ denotes the ground truth .

$x_i,y_i)$ :the partial gradients during training
the input embedding $h_x(x_i)$
all the output embedding: $h_y(y)$
resulting scores: $s(x_i,y) 对任意的 y\in y^{train}$

使用公式5去计算得分函数更新参数的梯度。

测试阶段

我们给出一些测试例子:
$D^{test} = \left\{\begin{matrix}(x_i，y_i)\end{matrix}\right\}^{\hat{N}}_{i = 1}$
在这里 $y_i \in y^{test}$
我们计算 $f_y(y) 对任意的： y \in y^{test}$
我们按照以前的过程来计算所有测试类别的得分 $y^{test}$ :
预测这个最佳类别: $\argmax_{y \in y^{test}}s(x_i,y)$

相关工作

distributed representations for output classes 输出类别的分布式表示。
error-correcting codes for classes 误差正确率代码。
The
individual binary indicators in these error-correcting codes are generated randomly and does not carry any semantic meaning。

Many of the NLP problems can similarly be cast as attribute learning problems for better generalization and extending to novel classes.。

an intriguing avenue for research on how to train networks to learning-to-learn from a few examples

实验

Baselines

we also train a baseline model using k-nearest neighbors (k-NN) on domain embeddings。
另外一个baseline是一个生成式方法，通过验证这个问题:
$\times P(domain)$
build independent models $P (u t t e r a n c e ∣ d o m a i n)$
every domain and independently calculate domain priors.
以下，是我们列出的baselines methods。

. Naïve Bayes (Unigram)

$P (u t t e r a n c e ∣ d o m a i n)$
Naïve Bayes model with features being word unigrams in the utterance.

Naïve Bayes (Unigram + Bigram)

Same as above but word bigrams are added as features in addition to unigrams。

Language Model

A trigram language model is used per domain to model $P (u t t e r a n c e ∣ d o m a i n)$ . Kneser-Ney smoothing for n-gram backoff has been applied.

Embeddings k-NN:

K-NN using intent embeddings from a classifier trained on data excluding the zero-shot partion

a vocabulary size of 10,000 unique words 将其映射到 a special rare word token
Each domain consists of multiple intents。
Intents can be seen as fine_grained domains themselves。
they are more homogeneous and therefore easier to model.

实验步骤

sample utterances: generated from the domain grammars provided by the developers
better learn feature-attribute association weights.
data from 1574 dmoains。
we restrict ourselves to testing on 32 third-party domains。
测试集包含以三个部分:
Live + Generated (N=2814)
Generated (N=3016)
Zero-Shot Partition (N=2392)
the embeddings k-NN model was allowed to run on it, but not retrain its embedding model.

结果

we also compared the zero-shot model to an n-gram based maximum entropy model baseline for intent classification within a domain.

结论和未来展望

class attributes
a generic framework for achieving zero-shot language understanding.
a flexible neural network architecture

未来工作

Future work can explore techniques that better map from feature spaces in one modality to another.: Compact Bilinear Pooling popularized by 9.
incorporating syntactic information into the model via subword embeddings：18.
replacing the dot product based scoring function with a learned model as has recently been popularized by adversarial methods 10.
In the context of Spoken Language Understanding。we can
augment the encoders with context features and generalize them
to consume ASR lattices and developer grammars。

总结

代码运行的时候，会自己根据未来工作进行调试代码，然后会自己进行修改与整理。
会自己泛读论文，大致了解模型架构、创新ideas、未来展望、以及如何将未来展望带入模型进行调试，并用于自己的文章中。并不断探索新的阅读方法，阅读套路。
不断的探索，加快文章的阅读。会自己琢磨透彻，琢磨精髓，

总结

论文学习方法。读论文期间会了解模型架构以及公式推导。以及创新点都行啦，根本不需要逐字逐句的读，然后开始亚尼据其他的样子都行啦的回事与打算。还有基准模型，然后跑代码，了解代码架构都行啦。其他的不重要，学会慢慢的将其高完整。会自己略读都行啦的理由与打算

你可能感兴趣的:(模块复现,人工智能)

利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
大二下开始学数据结构与算法--07,单项循环链表的实现爱我的你不说话链表数据结构
自习所完成的任务单向循环链表代码的实现和测验任务学课程到p28复现相关代码感悟其实这个教程上的观念，跟我刚开始理解想的并不一样，我以为会是：头节点使实例化的节点的循环链表，但是，教程给的更像是存在头节点，但头节点没有实际意义的添加了尾节点单项循环链表（跟之前单向不循环链表相比，更像是只多了一尾节点）。#include#include#includeusingnamespacestd;//存在头节点
css预编译风不在乎前端 css css 前端 scss less stylus
前言定义我们使用css来编写样式，但是随着样式效果的多样化以及复杂化，css变量常量的缺失、语法的呆板等一成不变的写法就会十分臃肿难以维护。所以基于css扩展了一套属于自己的语法，通过专门的编程语言，扩展css的编程能力，在编译成css。常见的库有less、scss/sass、stylus等。特点完美兼容css代码，结构清晰便于扩展支持css定义变量常量、代码嵌套提供函数，支持循环语句支持模块化，
asp.net mvc mysql 开源项目_【开源项目SugarSite】ASP.NET MVC+ Layui+ SqlSugar+RestSharp项目讲解... weixin_39805732 asp.net mvc mysql 开源项目
SugarSite一个前端支持移动端的企业网站，目前只支持了简单功能，后续还会加上论坛等。源码GIT地址：技术介绍Layui个人而言不喜欢引用一堆东西，越简洁越好，layui正好能够满足我的这种需求，它是一款轻量级UI，JS部分都是采用模块化设计(AMD)，对移动端支持比较不错。唯一不足是目前支持的组件有些少，需要有一定前端扩展能力的人才可以顺心使用。用法：例如我想用form.js和uploda.
使用 Arduino 和 Wi-Fi 的 Web 控制伺服 David WangYang ESP8266项目前端硬件工程
使用Arduino和Wi-Fi的Web控制伺服在这篇文章中，我们将在Arduino和Wi-Fi模块ESP8266的帮助下使用Web浏览器控制伺服电机。ESP8266将在舵机和web浏览器通过IP地址建立连接，然后通过移动web页面上的Slider，舵机将相应地移动。即使通过在路由器中设置PortForwarding，您也可以从世界任何地方通过Internet控制Servo，我们将在本教程后面解释。
腾讯云大模型知识引擎与DeepSeek：打造懒人专属的谷歌浏览器翻译插件大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 腾讯云云计算
摘要：随着人工智能技术的飞速发展，越来越多的前沿技术和工具已走入日常生活。翻译工具作为跨语言沟通的桥梁，一直处于技术创新的风口浪尖。本文探讨了腾讯云大模型知识引擎与DeepSeek结合谷歌浏览器插件的可能性，旨在为用户提供一种便捷、高效的翻译体验。通过应用深度学习、自然语言处理和知识图谱技术，该插件不仅能实时翻译网页内容，还能根据上下文进行智能推荐，实现精准的语境转换。本文将详细阐述其设计思路、技
硬件练习生系列（六）——LDO设计自学心得炸洋芋Zy. 硬件工程嵌入式硬件单片机
一、LDO稳压原理LDO（LowDropoutRegulator，低压差线性稳压器）是一种线性稳压电路，其核心功能是将输入电压转换为稳定的输出电压，且输入与输出之间的压差（DropoutVoltage）非常低（通常在几百毫伏以内）。1.基本结构LDO主要由以下关键模块组成：调整元件（PassElement）：通常为PNP或PMOS晶体管，负责调节输入到输出的电流。误差放大器（ErrorAmplif
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
分享12个国内AI对话聊天的免费网站（含DeepSeek大模型）码上飞扬人工智能语言模型 DeepSeek
在人工智能领域，基于对话的语言模型已成为当前研究的热点，其中以ChatGPT为代表的模型凭借其卓越的语言理解与交互能力备受瞩目。为帮助用户更好地选择和使用这类AI工具，本文将介绍12个国内可直接体验对话聊天功能的平台，为用户提供实用参考。1、腾讯元宝地址：https://hunyuan.tencent.com/bot/chat腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预
PySimpleGUI模块用法的示例(从入门到进阶) 赵阿萌 java 前端服务器 linux javascript
入门版下面是几个全面展示PySimpleGUI模块用法的示例，并附有详细的代码注释，帮助你更好地掌握该模块的使用。示例1：简单的输入输出界面这是一个基础的GUI示例，展示了如何使用文本输入框、按钮和文本输出框。登录后复制importPySimpleGUIassg#定义布局layout=[[sg.Text("请输入您的名字：")],#标签组件[sg.InputText(key="-NAME-")],
CVE - 2016 - 6628 漏洞复现：深入剖析及实战演示 Waitccy 网络安全网络安全 java
CVE-2016-6628漏洞复现：深入剖析及实战演示一、引言在网络安全领域，漏洞复现是理解和应对安全威胁的重要手段。CVE-2016-6628是一个影响广泛的严重漏洞，它主要存在于某些版本的Android系统中，攻击者可利用此漏洞通过特制的应用程序获取敏感信息、执行任意代码等，给用户带来极大的安全风险。本文将详细介绍CVE-2016-6628漏洞的背景、原理，并进行完整的漏洞复现过程，帮助读者更
《今日AI-人工智能-编程日报》-源自2025年3月21日小亦编辑部人工智能
一、AI编程领域最新动态AI编程工具崛起，程序员职业面临挑战Anthropic首席执行官DarioAmodei预言，未来一年内，90%的代码将由AI生成，传统程序员的工作可能被大幅替代。最新发布的AI编程模型（如Claude3.7、Sonnet3.7）在初级开发评估中表现优异，得分率超过60%，部分模型甚至在全球程序员排名中位列前0.1%。字节跳动的Trae海外版接入Claude3.7和GPT-4
《今日AI-人工智能-编程日报》-源自2025年3月19日小亦编辑部每日AI-人工智能-编程日报人工智能
1.豆包AI编程功能迎来三项重磅升级豆包平台今日宣布其AI编程功能迎来三项重要升级，包括：HTML实时预览：支持用户在编写HTML代码时实时查看网页效果，显著提升前端开发效率，尤其适用于小游戏和网页制作。Python代码直接运行与一键修复：用户可直接运行Python代码，并在出错时一键修复，极大降低了编程门槛，提升了开发效率。生成完整项目：新增生成完整项目的功能，帮助用户快速创建应用程序，缩短开发
普通人学习AI应该如何入手？2025年最新AI大模型学习路线+全套学习资料，适合新手小白！小城哇哇人工智能学习大数据语言模型 AI大模型 agi ai
引言随着人工智能（AI）技术的飞速发展，越来越多的人开始意识到掌握这项技能的重要性。然而，对于许多没有编程背景或数学基础的人来说，进入AI领域似乎是一个遥不可及的梦想。但实际上，通过合理的规划和适当的学习资源，任何人都可以逐步掌握AI的核心知识，并应用到实际工作中去。本文将为普通读者提供一份详细的2025年最新AI大模型学习路线图，并附带一套完整的自学资料，帮助您从零基础起步，顺利开启AI学习之旅
时钟控制模块、主频修改实验 Couvrir洪荒猛兽 #野火i.mx 6ull裸机开发单片机 stm32 嵌入式硬件
目录一、时钟控制模块1.1核心1.2系统时钟来源1.3PLU和PFD倍频时钟1.4PLL选择时钟1.5外设时钟二、主频修改实验2.1clock.c/h文件2.2main.c文件2.3Makefile文件2.4实验现象一、时钟控制模块1.1核心4个层次配置芯片时钟：配置晶振时钟（24MHz）配置PLL与PFD时钟（528PLL、USB1PLL细分PFD）配置PLL选择时钟配置根时钟/外设时钟1.2系
知识蒸馏：让大模型“瘦身“而不失智慧的魔术一休哥助手人工智能人工智能
引言：当AI模型需要"减肥"在人工智能领域，一个有趣的悖论正在上演：大模型的参数规模每年以10倍速度增长，而移动设备的算力却始终受限。GPT-4的1750亿参数需要价值500万美元的GPU集群运行，但现实中的智能设备可能只有指甲盖大小。这种矛盾催生了一项神奇的技术——知识蒸馏（KnowledgeDistillation），它就像给AI模型进行"脑外科手术"，将庞然大物的智慧浓缩到轻量模型中。第一章
后端框架模块化 GIS程序媛—椰子后端
后端框架的模块化设计旨在简化开发流程、提高可维护性，并通过分层解耦降低复杂性。以下是常见的后端模块及其在不同语言（Node.js、Java、Python）中的实现方式：目录1.路由（Routing）2.中间件（Middleware）3.数据库与ORM（models）4.迁移（Migration）5.服务层（ServiceLayer）6.配置管理（Configuration）7.依赖注入（DI）8.
适合阅读源码的 Java 优质开源框架、库盘点（初级友好项目、中级进阶项目、高级深入项目）我命由我12345 Java -项目 java 开源开发语言 java-ee spring boot spring intellij-idea
一、初级友好项目1、JUnit5基本介绍：JUnit5是单元测试框架，代码简洁，适合学习测试驱动开发（TDD）和设计模式GitHub地址：https://github.com/junit-team/junit5特点：代码量适中，模块化设计，适合学习测试框架的实现原理2、Guava基本介绍：Guava是Google核心库，包含集合、缓存、字符串处理等工具类GitHub地址：https://githu
Profinet转ModbusTCP网关模块连发那科机器人与DCS通讯 BA_TU_AUTO_TECH Profinet转Modbus TCP网关 Modbus TCP转Profinet网关服务器网络
一、现场要求：发那科机器人作为服务器端，DCS作为客户端向发那科机器人发送读写请求，发那科机器人应答后DCS接收发那科机器人的数据，实现数据的传递。二、解决方案：在不增加编程任务的前提下只需在DCS与机器人中间添加巴图自动化Profinet转ModbusTCP网关（BT-ETHPN20）就可实现。本文将介绍如何使用巴图自动化Profinet转ModbusTCP网关（BT-ETHPN20）配置通讯三
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
一个完整的小项目案例，涉及到项目的规划，模块的设计功能的衔接等。 PyAIGCMaster 我的学习笔记学习
以下是一个基于分层架构和模块化设计的项目规划，使用Tkinter作为GUI框架，Playwright进行浏览器操作，SQLite作为数据库：项目结构```web_checker/├──__main__.py#程序入口├──config.py#配置管理├──gui/#图形界面模块│├──__init__.py│└──main_window.py├──services/#业务逻辑│├──__init_
使用大语言模型API在AI应用中的实现 qq_37836323 人工智能语言模型自然语言处理 python
随着人工智能技术的迅速发展，大语言模型（LLM）在自然语言处理（NLP）领域的应用越来越广泛。本文将介绍如何使用大语言模型API来实现一些基础的AI应用，并提供一个简单的demo代码，帮助大家更好地理解和使用这些技术。大语言模型API简介大语言模型（如GPT-4）能够理解和生成类似人类的文本。这些模型可以应用于各种任务，包括文本生成、语言翻译、情感分析、对话系统等。为了方便国内用户访问这些强大的模
【深度学习】 PyTorch一文详解 Nerous_ 深度学习深度学习 pytorch 人工智能机器学习 python
“PyTorchisadeeplearningframeworkthatprioritizessimplicityandflexibility,makingitthego-tochoiceforbothresearchersanddevelopers.”—Anonymous1.PyTorch简介1.1PyTorch的背景与发展PyTorch是由Facebook人工智能研究院（FAIR）开发的一个开
stm32完全学习——NRF24L01模块小A159 STM32完全学习 stm32 学习嵌入式硬件
对于这个模块的移植，无论是标准库还是HAL库，无论是软件模拟SPI还是，硬件SPI通信，网上都有很多的例子，这里关于移植的事情就不再赘述了。一、调试中遇到的一些问题我是用的别人的代码进行移植的，使用的是软件模拟SPI时序，在进行通信的时候，可以正确检测到NRF24L01的存在，但是发送数据和接收数据都不能成功的运行，本来以为是发送的时候数据包设置的不正确，后来发现他的代码里面使用软件SPI里面的延
【nnUnetv2】Code复现是Winky啊 #项目nnUnet 人工智能深度学习
作者提出一种nnUNet（no-new-Net）框架，基于原始的UNet（很小的修改），不去采用哪些新的结构，如相残差连接、dense连接、注意力机制等花里胡哨的东西。相反的，把重心放在：预处理（resampling和normalization）、训练（loss，optimizer设置、数据增广）、推理（patch-based策略、test-time-augmentations集成和模型集成等）、
python数据可视化绘制图表（直方图，饼图圆环图，散点或气泡图，误差棒图） 2224070304 信息可视化 python 数据分析
一，直方图#先导入模块importnumpyasnp importmatplotlib.pyplotasplt#准备50个随机的数据scores=np.random.randint(0,100,50)#绘制直方图plt.hist(scores,bins=8,histtype='stepfilled')plt.show()其中，scores为数组（可为单个或多个的数列)bins=8,表示矩形的条数为
【数据治理】数据湖治理实践：腾讯云数据湖元数据实践指南菜鸟蜀黍数据治理大数据
最近数据湖非常的火，但是一旦没弄好，就会变成“数据沼泽”。如何避免“数据湖”变成“数据沼泽”呢？最好的办法就是治理先行。本文的内容主要包括四部分：1、数据湖背景概述，介绍腾讯数据湖的整体架构；2、数据湖统一元数据模块的详细架构实现；3、介绍腾讯云上元数据多租户的设计模式；4、介绍统一元数据的两大核心能力：在线数据目录和离线数据治理的功能。01什么是数据湖随着Snowflake公司股价高歌猛进和各大
存算一体与存算分离：架构设计的深度解析与实现方案克里斯蒂亚诺罗纳尔多阿维罗大数据数据库
随着数据量的不断增大和对计算能力的需求日益提高，存算一体作为一种新型架构设计理念，在大数据处理、云计算和人工智能等领域正逐步引起广泛关注。在深入探讨存算一体之前，我们需要先了解存储和计算的基本概念，以及存算分离和存算一体之间的区别。什么是存算一体？存算一体，顾名思义，是将数据存储与计算资源紧密结合，形成一个统一的架构。在这种架构下，存储和计算不仅在物理层面上结合，更在架构设计上深度融合。具体来说，
OpenCV图像拼接（2）基于羽化（feathering）技术的图像融合算法拼接类cv::detail::FeatherBlender 村北头的码农 OpenCV opencv 算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::FeatherBlender是OpenCV中用于图像拼接的一个类，它属于stitching模块的一部分。这个类实现了基于羽化（feathering）技术的图像融合算法，用于平滑地混合重叠区域中的图像，从而生成无缝的全景图。主要特点羽化技术：
密码策略合规性检查仪表盘闲人编程 python 网络服务器异常报警实时监控多因素认证合规性密码策略
目录一、前言二、密码策略合规性背景与意义2.1密码策略的重要性2.2密码策略合规性检查的需求三、系统设计思路与架构3.1数据采集与加解密模块3.2异步任务调度与GPU加速模块3.3密码策略检查算法模块3.4GUI界面模块四、核心数学公式与算法证明4.1AES-GCM加解密公式4.2密码强度评分算法4.3合规性检测算法4.4统计与报告生成五、异步任务调度与GPU加速设计六、GUI界面设计与功能模块七
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他