lunan0320

【Paper Reading】VAFL: a Method of Vertical Asynchronous Federated Learning

VAFL: a Method of Vertical Asynchronous Federated Learning

原文来源：[Arxiv2020] VAFL: a Method of Vertical Asynchronous Federated Learning

文章目录

VAFL: a Method of Vertical Asynchronous Federated Learning
- 0. Abstract
- 1. Introduction
- - 1.1 Prior part
  - - Federated Learning
    - Privacy-preserving learning
    - Asynchronous and parallel optimization
  - 1.2 This work
- 2. Vertical federated learning
- - 2.1 Problem statement
  - 2.2 Asynchronous client updates
  - 2.3 Types of flexible update rules
- 3. Convergence analysis
- - - Assumption 1
    - Assumption 2
    - Assumption 3
  - 3.1 Convergence under bounded delay
  - - Assumption 4 (Uniformly bounded delay)
    - Theorem 1
    - Theorem 2
  - 3.2 Convergence under stochastic unbounded delay
  - - Assumption 5 (Stochastic unbounded delay)
    - Theorem 3
    - Theorem 4
- 4. Perturbed local embedding: Enforcing differential privacy and smoothness
- - 4.1 Local Perturbation
  - 4.2 Enforcing smoothness
  - - Theorem 5
  - 4.3. Enforcing differential privacy
  - - Theorem 6
- 5. Numerical tests and remarks
- - 5.1 VAFL for federated logistic regression
  - 5.2 VAFL for federated deep learning

欢迎大家访问我的GitHub博客

https://lunan0320.cn

0. Abstract

Horizontal Federated learning (HFL) ：多个client data之间共享相同的特征
vertical FL：从不同的clients之间联合所有的features（两个数据集共享相同样本空间，但是特征空间不同）

VAFL: 每个client 在不需要于其他clients协商的情况下，运行随机梯度下降

new technique： Perturbed local embedding 来保护数据隐私和提高通信效率。

理论分析: strongly convex, nonconvex, nonsmooth objectives
实验验证：应用于各类图像和健康数据集

Result : 比较了中心化方法centralized 以及同步 synchronous FL方法

1. Introduction

Federated Learning ：一个central server和多个clients协同训练一个机器学习模型

与已经存在的分布式机器学习范式相比，FL增加了同步clients、数据模型隐私保护的困难性

大多数已经存在的FL方法考虑的场景是HFL，即clients有一个不同的数据集，他们共享相同的特征

Horizontal FL: 可以协同训练从feature space 到 label space

相同的samples，每个client有独一无二的features

应用场景：电子商务、金融、健康医疗等

（电子商务公司从多个金融机构使用用户的交易来预测用户的信用）

（医疗机构使用一个病人在不同医院的临床诊疗数据来评估病人的健康水平）

场景中，数据拥有者有相同用户的不同的records。通过联合他们的特征，可以建立一个更加准确的模型——这就是feature-partitioned or vertical FL

HFL：全局模型在一个server处完成对local model的聚合，local model是被每个client在本地使用local data更新完的
VFL: global model是local models的 concatenation，这是与loss function成对出现的。因此，更新一个client的local model是需要其他的clients的信息的。

这种强的模型依赖性，导致了在隐私保护以及通信效率方面的挑战。

1.1 Prior part

Federated Learning

HFL: large data 中划分给all clients, share the same feature space

communication efficiency是一大问题：

1）减少number of bits per communication round

2）节省number of communication rounds

Privacy-preserving learning

不同于在HFL中聚合梯度，在VFL中的 local gradients可能会involve raw data of other clients

Differentiable privacy：

1）是一种可量化的隐私措施

2）许多已经存在的学习算法通过简单调整可以实现DP

但是并不是为VFL而设计的

Asynchronous and parallel optimization

asynchronous 和 parallel优化方法是通常被用来解决asynchrony和delay的问题

对于feature-partitioned vertical FL，尤其与Block Coordinate Descent (BCD )方法有关

异步的BCD和随机变量已经应用于bounded delay

最新算法可以考虑unbounded delay在blockwise或者stochastic update的情况

最新的异步方法不能保证:

1）loss function在nonsmooth情况下的收敛性

2）local update的privacy

1.2 This work

A general optimization formulation

VFL包括一个global model和对于每个client的一个local embedding model

local embedding model(linear, nonlinear, nonsmooth) 可以将raw data 映射为紧凑的特征，从而减少与global model 通信的次数
Flexible federated learning algorithms

client间歇性的参与，非协同训练，以及DP、MPC
Rigorous convergence analysis

建立性能的下界和隐私的保护水平

2. Vertical federated learning

2.1 Problem statement

M个clients，N个samples，每个client与一个unique set的features相关
$x_{n,m}$
是第n个sample vector的第m个block
$y_n$
是第n个sample对应的label，存储在server中

每个client上的特征集是不同的，在第m个client上保存的特征 $x_{n,m}\in R^{pm}$ ，Pm表示第m个client上数据的维度

每个client在本地learns 一个 local（linear or nonlinear）embedding function $h_m$ , 把较高维度的x_n,m映射到一个低维度，即数据维度pm映射到公共维度 $\overline pm$

目标函数：

【Paper Reading】VAFL: a Method of Vertical Asynchronous Federated Learning_第1张图片

$$ \theta_0是server的global\quad model的参数，\bold{\theta}是local\quad clients参数的串联\\ l是loss function,r是正则项 $$ client m的本地信息是embedding vector $h_n,m$

整个过程中传输的参数为： ${h_{n,m}}$ 和梯度
$\nabla h_{n,m}loss$

【Paper Reading】VAFL: a Method of Vertical Asynchronous Federated Learning_第2张图片

2.2 Asynchronous client updates

【Paper Reading】VAFL: a Method of Vertical Asynchronous Federated Learning_第3张图片

server接收来自active client m的：

1）a query：关于loss function的 gradient

2）a new embedding vector $h_n,m$ : 使用更新的local model的参数来计算

对于query 1），server 使用当前的 {h_n,m} 为client m计算gradient

对于query 2），server计算新的梯度，使用当前收到的clients的updates，来更新global model的参数 $\theta_0$

一次interaction：

client: active client m 随机选择data $x_n,m$ ，并向server query对应的梯度，之后上传更新后的embedding vector $h_n,m$ ，然后更新本地的参数 $\theta_m$

server: 收到embedding vector $h_n,m$ ，计算gradient，更新server的参数 $\theta_0$

k代表global counter or iteration

在第k个sample上随机梯度的 loss值:

1）server model

2）local model

【Paper Reading】VAFL: a Method of Vertical Asynchronous Federated Learning_第4张图片

delay的定义:

server端的更新：

activate local client端的更新：

other clients的更新：

2.3 Types of flexible update rules

延迟delay是存在的，来自于异步通信和随机sampling

【Paper Reading】VAFL: a Method of Vertical Asynchronous Federated Learning_第5张图片

为了确保收敛，对于灵活更新协议上的设置：

Uniformly bounded delay D.

在训练过程中，delay如果超过了D，server就会立刻重新query fresh的 $h_n,m$

Stochastic unbounded delay.

每个client的activation是一个随机的过程，delay取决于随机过程的hitting times

因此，如果activation服从一个独立的Poison processes，delay就会服geometrically distributed

t-synchronous update, t > 0.

全异步的update是most flexible，但是t-synchronous update也是通常采用的

sever直到收到t个client的 $h_n,m$ 才计算gradient，然后去更新server的model

实验表面，t-synchronous具有更加稳定的性能。

3. Convergence analysis

在nonconvex 和 strongly convex情况下展现收敛性情况

如下展示 fully synchronous version of VAFL 的收敛率

首先，是对sampling 和 smoothness的一些假设：

Assumption 1

（1）Sample index {n_k}是 i.i.d

（2）gradient的variance服从如下：
$E[||g_m^k - \nabla\theta_mF(\theta_0^k,\theta^k)||^2 ] \le\sigma_m^2,\quad g_m^k是在没有delay下的\hat{g_m^k}$

Assumption 2

optimal loss 是有下界的
$F^* > -∞，\nabla F是 L-Lipschitz\quad continuous$
Assumption 2 在 nonsmooth local embedding 函数下通常是无法满足的 (neural networks)

对此，使用 perturbed local embedding 可以增加smoothness

Assumption 3

activation of all clients满足 independent Poisson process

3.1 Convergence under bounded delay

Assumption 4 (Uniformly bounded delay)

在第k个iteration，delay是有界的

The convergence for the nonconvex case

Theorem 1

学习率满足

则有

在强convexity 的情况下，convergence rate得到提升

Theorem 2

额外的假设 F 是 u-strongly convex，第k轮的学习率满足：

则有：

3.2 Convergence under stochastic unbounded delay

Assumption 5 (Stochastic unbounded delay)

对于每个client m，delay是随机的无界的

Theorem 3

学习率满足

则有

Theorem 4

假设 F 是 u-strongly convex，学习率满足：

则有

在有界和无界假设的情况下，但随机延迟的假设下，算法都能达到收敛

4. Perturbed local embedding: Enforcing differential privacy and smoothness

介绍一个 local perturbation technique,促进DP和smooth

4.1 Local Perturbation

$h_m$ 是一个linear embedding时，可以看作：

$h_m $是一个nonlinear embedding时，例如 neural networks，可以看作：

【Paper Reading】VAFL: a Method of Vertical Asynchronous Federated Learning_第6张图片

perturbe 过程：

在每个layer，加入一个random neuron的output $Z_l$ 来perturb local embedding function

perturbation distribution满足：

11a 是均值为0，方差为c 方的Gaussian distribution

11b 是uniform distribution

4.2 Enforcing smoothness

受到randomized smoothing启发，因此对random neuron的期望值，可以smooth objective function

通过适当的方式卷积，可以提高function的smoothness

通过增加random neuron Z_l, $\sigma_l$ 将会被smoothed

通过进一步诱导，可以证明loss function 对local embedding vector h_m的平滑性

Theorem 5

local model 的 smoothness constants满足：

【Paper Reading】VAFL: a Method of Vertical Asynchronous Federated Learning_第7张图片

$$ L_{\theta m}^{F_c} 是正则项的smoothness\quad constant\\ L_{bl}^{h}和L_wl^h是perturbed\quad local\quad embedding h \\的smoothness\quad constant $$

是均匀扰动下的第l层neuron的smoothness constant

对于local model来说，perturbed loss 是smooth，大的扰动（更大的c）会导致更小的平滑常数

4.3. Enforcing differential privacy

将perturbed local embedding technique与private information exchange联系

a trade-off between privacy and accuracy

Gaussian differential privacy (GDP)

u-GDP ：两个neighboring 数据集 S 和 S’ 满足：

u越小，privacy loss越少

Theorem 6

设置在第L 层的Gaussian random neuron的variance为：

VAFL对于client m满足 u-GDP

为了提高privacy,可以decrease u，增加 random neurons 的 variance

但是在增大 variance of random neurons的同时，stochastic gradient也是在增加，可能会导致收敛效果变差

5. Numerical tests and remarks

测试

(1) fully asynchronous version VAFL (async)

(2) t-synchronous version VAFL (t- sync)

(3) private version via perturbed local embedding technique

5.1 VAFL for federated logistic regression

在MNIST、Fashion-MNIST、CIFAR 10 以及 Parkinson disease datasets上进行logistic regression

下面的图片依次是在这四个数据集上的ACC

【Paper Reading】VAFL: a Method of Vertical Asynchronous Federated Learning_第8张图片

5.2 VAFL for federated deep learning

neural network是从MVCNN修改得到

client：使用7-layer CNN作为local embedding function

server：使用fully connected network来聚合local embedding vectors

测试在MIMIC-III数据集上VAFL的准确性（死亡率预测）

每个client使用LSTM作为embedding function

【Paper Reading】VAFL: a Method of Vertical Asynchronous Federated Learning_第9张图片

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
华为云分布式缓存服务DCS 8月新特性发布华为云PaaS服务小智华为云分布式缓存
分布式缓存服务（DistributedCacheService，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。此次为大家带来DCS8月的特性更新内容，一起来看看吧！
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
跟着黑马学mysql（5）小杜不吃糖 mysql 数据库
17.DQL-聚合函数DQL-聚合函数介绍将一列数据作为一个整体，进行纵向计算。常见聚合函数函数功能count统计数量max最大值min最小值avg平均值sum求和语法SELECT聚合函数(字段列表)FROM表名;注意：所有的null值不参与聚合函数的运算18.DQL-分组查询语法SELECT字段列表FROM表名[WHERE条件]GROUPBY分组字段名[HAVING分组后的过滤条件];where
为什么说在中国贩毒就是找死，这些外籍毒贩的下场就是最好证明毒言毒语
网上有个段子说在俄罗斯当人质、美国逃税、中国贩毒是世界三大作死，虽然调侃意识浓厚，但并非空穴来风。俄罗斯当人质很危险的说法源于2002年的莫斯科剧院人质事件，当时40名恐怖分子绑架了850名人质。营救过程中，俄国反恐军队秘密向剧院内灌入化学气体麻醉，击毙39名恐怖分子，但也导致129名人质因吸入过量麻醉气体而死亡。在美国欠谁的钱都可以，唯独不能欠美国联邦国税局（IRS）的钱。因为一旦被查处逃税，除
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
2022-12-22 东临沧海
波兰立陶宛联邦是16~17世纪，欧洲面积最大、人口最多的国家，又称波兰立陶宛王国，该国在波兰王国与立陶宛大公国结为联邦时宣告成立。联邦的政治制度被称为贵族民主制或金权自由制，法律与由贵族(施拉赤塔)控制的议会(瑟姆)限制君主的权利，该联邦的两个主体国家在原则上是平等的，而波兰是事实上的统治主体。该国是一个多民族国家，且呈现出一种宗教多样化，该国以在当时少有的宗教自由而闻名。在空前繁荣的几十年后，联
el-dialog高度设置夏之小星星前端 vue.js elementui css
el-dialog高度设置::v-deep.el-dialog{height:78vh;overflow:auto;}
2021年1月写作复盘：1月的失败给2月的警醒发发执笔
统计了1月的写作字数：55584。以前都没有这样统计过一个月的写作字数，所以也无法判定，这是多是少。这是目前每天千字文的积累。群里每周周报日更字数的榜首，一星期的字数都有5万了，是我一个月的字数。不与他人比较。1月的写作，作为今年坚持写作的基石。以后每个月，都要争取在此基础上有所进步。纵向对比，每个月进步一个方面，就好了。贪多嚼不烂，一步跨太远会摔跤。1月的写作情况并没有达到预期目标，表现在5个方
elementuiPlus取消el-input的边框 qq_39016177 elementui
elementuiPlus取消el-input的边框1.通常取消边框的方法设置border为none2.还有其他类似边框的例如outlinebox-shadow这两个属性都是会产生边框效果3.el-input需要更改的话–如下需要修改box-shadow为空即可上代码:deep(.el-input__wrapper){align-items:center;background-color:#F7F
【学习笔记】武志红心理学—潜意识决定命运万万千千
冰山一角什么构成了我们的命运？命运是由我们的显意识和潜意识来决定的。我们可以用一张图做一个比喻。看过“冰山一角”图片的都知道，潜意识就是水面以下的部分，显意识是水面以上的部分，从体积来看，潜意识占了大部分，而显意识只是冰山一角，纵向来看，庞大的潜意识支撑着冰山一角的显意识，才得以让冰山漂浮在水面。延伸到我们的人生，我们对自己显意识层面的想法很容易感知到，所以我们会说这是“我”自己做的选择。而潜意识
【双语新闻】AGI安全与对齐，DeepMind近期工作曲奇人工智能安全 agi 安全 llama 人工智能
我们想与AF社区分享我们最近的工作总结。以下是关于我们正在做什么，为什么会这么做以及我们认为它的意义所在的一些详细信息。我们希望这能帮助人们从我们的工作基础上继续发展，并了解他们的工作如何与我们相关联。byRohinShah,SebFarquhar,AncaDragan21stAug2024AIAlignmentForumWewantedtosharearecapofourrecentoutput
【HDFS主从集群】存在两个独立的问题和解决方案流辉fglow 大数据 #HDFS hdfs java hadoop 大数据分布式学习
主从集群存在两个独立的问题和解决方案单点“主”的两个独立的问题以下是解决方案HA高可用方案：解决单点故障导致集群整体不可用问题Federation联邦机制：解决NN压力过大问题总结一般很多技术都是主从结构（最简单的结构）优点：结构相对简单，主与从协作“主”是单点，好处有，缺点也有好处：单点NameNode，数据一致性好掌握因为一个人管，说一不二的单点“主”的两个独立的问题关键词：独立：两套独立
【ESP32 WiFi篇（四）】ESP32 UDP服务端、客户端 Eiker_3169 ESP32 ESP32 http
文章目录UDP客户端UDP服务端UDP客户端/*BSDSocketAPIExampleThisexamplecodeisinthePublicDomain(orCC0licensed,atyouroption.)Unlessrequiredbyapplicablelaworagreedtoinwriting,thissoftwareisdistributedonan"ASIS"BASIS,WITH
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
go-etcd实战小书go golang 实战演练 golang etcd 服务发现服务注册微服务
etcd简介etcdisastronglyconsistent,distributedkey-valuestorethatprovidesareliablewaytostoredatathatneedstobeaccessedbyadistributedsystemorclusterofmachines.Itgracefullyhandlesleaderelectionsduringnetwork
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
Lt-8 Multithreading yanlingyun0210 java
IntendedLearningOutcomesTounderstandtheconceptofconcurrency.Tounderstandthedifferenceofaprocessandathread.TodefineathreadusingtheThreadclassandRunnableinterface.TocontrolthreadswithvariousThreadmethod
如何使用Pytorch-Metric-Learning？鱼儿也有烦恼 PyTorch pytorch
文章目录如何使用Pytorch-Metric-Learning？1.Pytorch-Metric-Learning库9个模块的功能1.1Sampler模块1.2Miner模块1.3Loss模块1.4Reducer模块1.5Distance模块1.6Regularizer模块1.7Trainer模块1.8Tester模块1.9Utils模块2.如何使用PyTorchMetricLearning库中的
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key