Kirvin_xia

【论文阅读笔记】Contrastive Multiview Coding

Contrastive Multiview Coding

摘要

这篇文章主要探讨人类通过多种感官通道来观察世界，比如左眼观察到的长波长光通道，或右耳听到的高频振动通道。每个观察角度都带有噪音且是不完整的，但一些重要的因素，如物理、几何和语义，往往在所有观点之间共享（例如，“狗”可以被看到、听到和感受到）。文章研究了一个经典的假设，即一个强大的表示应该能够建模与观察角度无关的因素。

在多视图对比学习的框架下，他们通过学习一个表示来最大化同一场景不同视图之间的互信息，但这个表示本身要尽可能紧凑。该方法可以扩展到任意数量的视图，并且对视图是不可知的。作者分析了该方法的关键属性，发现对比损失在性能上优于基于跨视图预测的流行替代方法，而且从更多视图学习时，所得到的表示更好地捕捉了场景底层的语义。

介绍

在编码理论中的一个基本思想是学习压缩表示，尽管这种表示仍然可以用于重构原始数据。这一思想在当代的表示学习中体现为自动编码器[65]和生成模型[40, 24]，它们试图尽可能无损地表示数据点或分布。然而，无损表示可能并不是我们真正想要的，实际上，这是微不足道的——原始数据本身就是无损表示。相反，我们可能更喜欢保留“好的”信息（信号）并丢弃其余的（噪音）。那么，我们如何确定哪些信息是信号，哪些是噪音呢？
在这段文字中，作者重新审视了一个经典的假设，即好的信息位通常是在世界的多个视图之间共享的，例如在多个感官模态之间，比如视觉、听觉和触觉[70]。从这个角度来看，“狗的存在”是好的信息，因为狗可以被看到、听到和感觉到，但“相机的位置”是坏的信息，因为相机的位置对图像场景的声学和触觉特性几乎没有影响。这一假设对应于这样的归纳偏好：观察场景的方式不应该影响其语义。在认知科学和神经科学的文献中有很多证据表明，大脑通过编码这种与观察角度无关的表示来处理信息（例如，[70, 15, 32]）
因此，我们的目标是学习能够捕捉多个感官通道之间共享信息的表示，但这些表示在其他方面要尽可能紧凑（即舍弃特定通道的干扰因素）。为了实现这一目标，我们采用了对比学习，通过学习一个特征嵌入，使得同一场景的不同视图映射到附近的点（在表示空间中用欧几里得距离测量），而不同场景的视图映射到相距较远的点。具体而言，我们改编了最近提出的对比预测编码（CPC）方法[57]，但进行了简化（去除了循环网络）并进行了泛化（展示了如何将其应用于任意图像通道的集合，而不仅仅是时空预测）。与CPC相关联，我们将我们的方法称为对比多视图编码（CMC），尽管我们指出我们的表述可能同样与实例辨别[79]相关。在我们的公式中，对比目标，就像在CPC和实例辨别中一样，可以理解为试图最大化数据的多个视图的表示之间的互信息。
我们故意将“好的信息”留给了较为宽泛的定义，并将其定义视为一个经验性问题。最终，实践出真知：我们认为一个表示是好的，如果它使得后续问题的解决变得容易，尤其是在人们感兴趣的任务上。例如，图像的一个有用的表示可能是一个特征空间，其中容易学习识别对象。因此，我们通过测试学到的表示是否能够良好地迁移到标准的语义识别任务来评估我们的方法。在多个基准任务上，我们的方法在与其他自监督表示学习方法的比较中取得了与现有技术水平竞争的结果。此外，我们发现表示的质量随着用于训练的视图数量的增加而提高。最后，我们将多视图学习的对比公式与最近流行的跨视图预测方法进行比较，并发现在直接比较中，对比方法学到了更强大的表示。


• 我们将对比学习应用到多视图环境中，试图最大化同一场景的不同视图的表示之间的互信息（特别是不同图像通道之间的互信息）。
• 我们将这一框架扩展到从两个以上的视图中学习，并且展示了学到的表示质量随着视图数量的增加而提高。我们是第一篇明确展示多视图对表示质量的益处的工作。
• 我们进行了有控制的实验，以测量互信息估计对表示质量的影响。我们的实验表明互信息与视图之间的关系是微妙的。
• 我们的表示在流行的基准测试上与最先进的方法相媲美。
• 我们证明对比目标优于跨视图预测。

2. Related work

无监督表示学习旨在学习数据的变换，使得后续的问题解决变得更容易[7]。这个领域有着悠久的历史，始于一些经典方法，拥有成熟的算法，例如主成分分析（PCA [37]）和独立成分分析（ICA [33]）。这些方法倾向于学习聚焦于数据中的低级变化的表示，从对象识别等下游任务的角度来看，这些表示通常不太有用。
更适合这些任务的表示是使用深度神经网络学习的，始于一些开创性的技术，如玻尔兹曼机（Boltzmann machines [71, 65]）、自动编码器（autoencoders [30]）、变分自动编码器（variational autoencoders [40]）、生成对抗网络（generative adversarial networks [24]）和自回归模型（autoregressive models [56]）。还有许多其他的工作，可以在[7]中找到综述。无监督表示学习中一类强大的模型被归纳在“自监督”学习的范畴下[64, 35, 85, 84, 78, 60, 83]。在这些模型中，模型的输入 X 被转化为输出 ˆX，该输出应该接近另一个信号 Y（通常在欧几里得空间中），而 Y 本身与 X 以某种有意义的方式相关联。这些 X/Y 对的示例包括图像的亮度和色度通道[85]、来自单个图像的补丁[57]、视觉和声音等模态[58]，或者视频的帧[78]。显然，这样的示例在世界中非常丰富，为我们提供了几乎无限量的训练数据，这是这一范式的吸引之一。
时间对比网络（time contrastive networks [68]）使用三元损失框架从同一场景的不同视频摄像机拍摄的对齐视频序列中学习表示。与自监督学习密切相关的是多视图学习的概念，它是一个涉及许多不同方法的通用术语，例如协同训练[8]、多核学习[13]和度量学习[6, 87]；关于综述，请参见[80, 45]。几乎所有现有的工作都处理了一两个视图，如视频或图像/声音。然而，在许多情况下，可以提供更多的视图来为任何表示提供训练信号。
用于训练基于深度学习的表示的目标函数通常包括基于重构的损失函数，例如不同规范下的欧几里得损失[34]，对抗性损失函数[24]（它们学习除了表示之外的损失），或者对比损失，例如[26, 81, 72, 25, 31, 57, 3, 29, 36]，利用多个视图的共现性。
一些与我们工作最相似（并对我们产生启发）的先前研究包括对比预测编码（CPC）[57]、Deep InfoMax [31]和实例辨别 [79]。与我们的方法类似，这些方法通过对比场景的一致和不一致的表示来学习表示。CPC从两个视图学习——过去和未来——适用于时空序列数据。Deep InfoMax [31]将这两个视图视为神经网络的输入和输出。实例辨别则学习匹配同一图像的两个子裁剪。CPC和Deep InfoMax最近分别在[29]和[4]中进行了扩展。这些方法都共享相似的数学目标，但在视图的定义上存在差异。我们的方法与这些工作的不同之处在于：我们将目标扩展到两个以上的视图的情况，并探索了不同的视图定义、体系结构和应用设置。此外，我们为这一表示学习范式做出了独特的经验性研究贡献。

3. Method

我们的目标是在没有人类监督的情况下学习捕捉多个感官视图之间共享信息的表示。我们首先回顾先前的预测性学习（或基于重构的学习）方法，然后详细介绍了两个视图内的对比学习。我们展示了与最大化互信息的联系，并将其扩展到包括两个以上视图的情况。我们考虑数据的M个视图的集合，表示为V1, . . . , VM。对于每个视图Vi，我们用vi表示一个随机变量，表示遵循vi ∼ P(Vi)的样本。

3.1. Predictive Learning

假设V1和V2代表数据集的两个视图。例如，V1可能是特定图像的亮度，而V2是色度。我们将预测性学习设置定义为通过潜在变量z的深度非线性转换从v1到v2，如图2所示。形式上，z = f(v1)，vˆ2 = g(z)，其中f和g分别表示编码器和解码器，vˆ2是在给定v1的情况下对v2的预测。然后使用一个目标函数训练编码器和解码器模型的参数，该目标函数试图使vˆ2“接近”v2。这样的目标函数的简单例子包括L1或L2损失函数。请注意，这些目标假设在给定v1的情况下，v2的每个像素或元素之间是独立的，即p(v2|v1) = Πip(v2i|v1)，从而降低了模拟相关性或复杂结构的能力。预测性方法在表示学习中得到了广泛应用，例如颜色化[84, 85]和从视觉预测声音[58]。

本文思想

两个视角的目标函数：两个视角对比着学习，f1和f2是两种backbone 不共享参数，这个和Spreading Instance是有区别的

多个视角的目标函数

3.4. Implementing the Contrastive Loss

对比学习可以学到更好的表示，通过使用许多负样本。在极端情况下，我们可以对于给定的数据集将每个数据样本都包括在分母中。然而，计算完整的softmax损失对于大型数据集（如ImageNet）来说是代价高昂的。一种近似这个完整的softmax分布并减轻计算负担的方法是使用Noise-Contrastive Estimation [25, 79]（详见补充说明）。另一种解决方案，我们在这里也采用了，是随机抽样m个负例，并进行简单的(m+1)-way softmax分类。这种策略也在[4, 29, 27]中使用，并可以追溯到[72]。
内存银行。根据[79]，我们维护一个内存银行来存储每个训练样本的潜在特征。因此，我们可以有效地从内存缓冲区中检索m个负样本，与每个正样本配对，而无需重新计算它们的特征。内存银行是根据实时计算的特征动态更新的。内存银行的好处是允许与更多负对进行对比，代价是略微滞后的特征。

4. Experiments

我们在许多数据集和任务上进行了对比多视图编码（CMC）的广泛评估。我们在两个已建立的图像表示学习基准上进行评估：ImageNet [16] 和 STL-10 [12]（详见补充说明）。我们进一步在视频表示学习任务上验证了我们的框架，其中使用图像和光流模态作为联合学习的两个视图。最后一组实验将我们的CMC框架扩展到两个以上的视图，并提供了其有效性的经验证据。

4.1. Benchmarking CMC on ImageNet

4.3. Extending CMC to More Views

我们进一步将我们的CMC学习框架扩展到多视图场景。我们在包含1449张标记图像的NYU-Depth-V2 [53]数据集上进行实验。我们致力于更深入地理解CMC的行为和有效性。我们考虑的视图包括：亮度（L通道）、色度（ab通道）、深度、表面法线[20]和语义标签。
实验设置。为了从每个视图中提取特征，我们使用了一个具有5个卷积层和2个全连接层的神经网络。由于数据集的规模相对较小，我们采用了基于子图像的对比目标（详见补充说明），以增加负对的数量。从原始图像中随机裁剪大小为128×128的补丁用于对比学习（从大小为480×640的图像中裁剪）。对于下游任务，我们舍弃全连接层，并使用卷积层作为表示进行评估。

4.3.1 Does representation quality improve as number

of views increases?

为了衡量学到的表示的质量，我们考虑从L的表示中预测语义标签的任务。我们遵循核心视图的范式，将L作为核心视图，因此通过与L对比学习一组表示。我们使用UNet风格的体系结构[63]执行分割任务。对上述体系结构进行对比训练，相当于UNet的编码器。在完成对比训练后，我们从L编码器初始化UNet的编码器权重（它们是等效的体系结构），并将其冻结。在此微调阶段仅训练解码器。

由于我们使用基于补丁的对比损失，在1个视图的情况下，CMC与DIM [31]相一致。2-4个视图的情况将L与ab进行对比学习，然后顺序添加深度和表面法线。通过所有类别的平均IoU和像素准确率来衡量语义标签的结果，如图4所示。我们看到随着新的视图的添加，性能稳步提高。我们已经测试了添加视图的不同顺序，它们都遵循类似的模式。

我们还将CMC与两个基线进行比较。首先，我们随机初始化并冻结编码器，将其称为随机基线；它作为质量的下限，因为表示只是一个随机投影。与冻结随机初始化的编码器不同，我们可以与解码器一起训练它。这种端到端的监督基线作为上限。结果呈现在表3中，表明即使CMC对下游任务一无所知，它仍然产生高质量的特征图。

4.3.2 Is CMC improving all views?

STM32+w5500+TcpClient学习笔记结城明日奈是我老婆嵌入式 stm32 学习笔记
文章目录参考文章本地和远程IP连接的配置(重点)TCP发送参考文章注意:SPI的CSRST脚这些都是通过cubeMX自定义的可以自行修改。用的是SPI1项目地址//MyTcpClient.h#ifndefMYTCPCLIENT_H#defineMYTCPCLIENT_H#include"main.h"#include"w5500.h"#include"socket.h"#include"wizch
第四期【践行总结】第9周—适度荷语微光
践行时间：20181105——20181111本周践行适度：避免极端，避免别人对你产生怨恨。【目标】1.保持平和的沟通态度。2.刻意反思自己是否过于要求他人而不要求自己。3.宽容对人，宽容对己，不因琐事产生怨恨。【行动】1.得到每日学习计划完成2.删除照片83张。3.每日练声+得到打卡4.每日深蹲5.专栏输出：第36周正义之心思维导图及知识笔记6.文章输出：【精力管理4】睡得好，能提升你的决策水平
pyQT学习笔记——Qt常用组件与绘图类的使用指南 tt555555555555 Qt pyqt 学习笔记
Qt常用组件与绘图类的使用指南一、大小策略（SizePolicy）1.1大小策略概述1.2具体参数1.3其他常见策略1.4伸展值的作用二、常用组件的使用2.1QSpinBox和QComboBox示例代码2.2QDialog示例代码2.3QTableView示例代码三、QPainter类介绍3.1QPainter的使用示例代码3.2QPainter的功能一、大小策略（SizePolicy）1.1大小
Java基础入门（传智）暑期预习笔记（一）7.18 wssgakki Java java
Java的基本语法【修饰符】class类名{程序代码}publicclassHelloword{publicstaticvoidmain(String[]args){System.out.printIn(”你好呀");}注意大小写、排版问题{左大括号里面的第一行代码要有缩进ctrl+shift+F键快速格式化代码一个连续的字符串不能分开在两行中书写即同一个双引号里面的内容不能分两行写。Java中的
【0314践行笔记】创造多样性，你的世界因此会变得与众不同正本
学习一件新鲜事物，是要经过了解、熟悉、精致、深入拓展这一系列步骤。是一个逐渐探索、积累、完善循序渐进的过程。学习的越深入，就越会感觉到乐趣兴趣信心所在，也会与已有认知建立起一套完整的思维网络，这些网络充斥在头脑中，我们经常称之为“智慧”。我们判断一个人学习成效如何，主要是看他是否主动拓展自己的知识面以及是否有多样性的新想法。那么用何种办法提高学习成效？今天就与大家探讨三点，希望能给予你帮助。001
PyQt5学习笔记，带例子源码
一、很程序员，都喜欢开发windows桌面应用系统，基于python3开发，效率高二、PyQt5开发的桌面应用系统是可以跨平台的，可以在Mac上、Window上、Linux桌面系统上运行，以下为学习笔记及总级三、源码下载登录后复制1、QDateTimeEdit日期输入框setCalendarPopup弹出日期选择框setDisplayFormat("yyyy-MM-ddHH:mm:ss")设置展示
PyQt5学习笔记 Shane1111111 qt 学习笔记
来源：王铭东老师的B站教程链接：PyQt5快速入门_哔哩哔哩_bilibili基本控件QRadioButtonQLineedit#清空xxx.clear()#插入新内容到最右光标处xxx.insert("内容")布局1.水平布局创建组#hobby主要是保证他们是一个组。hobby_box=QGroupBox("爱好")设置hobby_box的布局将组中内容添加到该组的容器中将组hobby_box添
PyQT5 新手入门学习笔记 UncleShuShuShu python的坑 python pyqt5
一、PyQt5的起点第一个简单的pyqt程序#创建一个label程序（QLabel模块）importsysfromPyQt5.QtWidgetsimportQApplication,QLabelif__name__=='__main__':app=QApplication(sys.argv)label=QLabel('helloworld')#label的setText方法:label=Qlabe
思考笔记1392/2023-10-22 农N代fun
黄奇帆老师的一篇文章《当下中国的发展，很多看起来是问题，实际上是成果。》其中一段关于数字经济的内容学习，因为作为数字化、智能化这个行业一线搬砖工人，对这一方面知识还是相当有感触，特别是今天读到这一段落，以黄奇帆老师的身份一定程度上也算是代表着国家级对这个行业顶层计划阐明发展方向了。（节选一）制造业数字化，就是要推进产业互联网、工业互联网。推进产业互联网将大大促进数字经济发展。我国曾提出数字经济三大
2020-12-09 幸福大黑鸭
IT1.LeetCode：汇总区间Java编写2020-12-09（228.汇总区间）2.《Java从入门到精通》明日科技：P351~355阅读记xmind笔记，并自己实现实例。知识点之前确实都学过，但还是再系统复习一下吧。3.《Semantic-awareWorkflowConstructionandAnalysisforDistributedDataAnalyticsSystems》：粗读关键
《有关写书评文章的写作框架》千江雪_2932
11月5日书评比读后感难写，对于新手来说，要先掌握好写书评的套路和写作框架，然后先按着框架写，要不写着写着就写成读后感去了。因为想要写书评，所以，正在不断学习的过程中，今天发现有这么一篇文章，作者把书评的写作框架和过程说的非常的清楚。所以学习笔记了。写文章都要谋篇布局，写书评也是一样的，先列出主题和文章框架。以下是最简单也是最常见的书评文章框架。1、开篇破题2、引出书的内容梗概及作者简介3、用一个
玩转Docker | 使用Docker部署Mininote笔记工具心随_风动玩转Docker docker 笔记容器
玩转Docker|使用Docker部署Mininote笔记工具前言一、Mininote介绍Mininote简介Mininote使用场景二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署Mininote服务下载镜像创建SSL自签名证书创建容器创建容器检查容器状态检查服务端口安全设置四、访问Mininote服务访问Mininote首页设置访问密码五、基本使用新建笔记六、实践总结前
读名老中医之路笔记（一）岳美中：无恒难以做医生 weixin_33937499
岳美中：无恒难以做医生岳美中先生虽然处于流离颠沛的年代中，通过不断的刻苦学习，终成一代名医。岳老从《衷中参西录》、《歌头汤诀》、《药性赋》一路走到《伤寒论》《金匮要略》，后又学习唐代祛疾利器《千金》、《外台》等书，他的读书经验：一、对中华古典文化的学习，培养读书的能力和习惯二、读书宁涩勿滑，对经典著作每个字句要读懂掌握，强调对经典著作熟读甚至必须背诵三、自学必当知道自己的短处，每个人都有他的优点，
我的自学中医笔记 hbxncjs 中医其他经验分享
藏象之心系统形态描述古代的形态描述跟现代差不多心居肺管之下，隔膜之上，心象尖圆形，如莲蕊，外有赤黄裹脂，是为心包络——【类经图骥·经络】心与内外环境的联系不讲心的主要生理功能心主血脉心气推动和调控血液在脉中运行，流注全身，发挥营养和滋润的作用要素：血、脉、心气主血：营养、心生血（心生血这个概念用的不多）肉桂可补心阳，补阳来促进化气主脉：心气推动与调控心脏的搏动和脉管的舒缩，使脉道通利。血正常运行的
nodeJs笔记（五） a_xiaotaotao nodeJs 笔记
os操作系统模块主要作用导入模块常用方法1.系统信息与标识os.platform()作用:返回值:用途:os.arch()作用:返回值:用途:os.type()作用:返回值:用途:os.release()作用:返回值:用途:os.version()(Node.jsv13.0.0+)作用:返回值:用途:os.hostname()作用:返回值:用途:os.uptime()作用:返回值:用途:2.用户信
nodeJs笔记（一） a_xiaotaotao nodeJs 笔记前端
nodeJs笔记（一）基础知识什么是nodejs？nodejs的生态系统结构nodejs的工作原理V8JavaScript引擎：libuv：异步I/O与事件循环引擎：事件循环(EventLoop)的详细阶段：非阻塞I/O的工作流程(以fs.readFile为例)：单线程与高并发：核心依赖库：工作原理全景图关键点：node.js的优缺点核心优势(优点)高性能与高并发(I/O密集型场景)：核心原理：结
第 13 题：谈谈你对 CSS 选择器以及优先级的理解？ Noxus丶SJ
常用的CSS选择器ID选择器、类选择器、标签选择器、属性选择器、伪类选择器、后代选择器权重划分在同一层级下!important>内联样式>ID选择器>类选择器>（标签选择器、伪类选择器、属性选择器）不同层级下正常来说权重值越高的优先级越高，但是一直以来没有具体的权重值划分，所以目前大多数开发中层级越深的优先级越高文章的内容/灵感都从下方内容中借鉴【持续维护/更新500+前端面试题/笔记】https
你活着可能已经死了-《得到》“武志红的心理学课”学习笔记28 大庆思考笔记
人生由几百、几千乃至几万个大大小小的选择构成，等你老了，回顾一生的时候，你发现最亏待的，恰恰是你自己，那你这一生，就白活了。我们来做一个调查，很简单，然而也许很“致命”：你能不能想起五件事，你特别想做的，但却一直没有去做的，就按照自由联想的顺序，把这五件事写出来。现在，你可以做你自己的“父母”，试试带着点偏执劲，去追逐一些你特别想追逐的事物，以此来滋养你的本我。分享一段鲁米的诗给你：有一颗光的种子
ReactiveCocoa 学习笔记七（RACCommand）那夜的星空分外清澈 ReactiveCocoa ReactiveCocoa
RACCommandRACCommand关键的两个方法如下，理解了他们便能理解RACCommand的作用。-(instancetype)initWithEnabled:(nullableRACSignal*)enabledSignalsignalBlock:(RACSignal*(^)(InputType_Nullableinput))signalBlock;-(RACSignal*)execut
C语言学习笔记：do..while循环、goto语句女巫和她的乌鸦 C语言 c语言学习
do…while（）循环，do语句的语法：do循环语句；while（表达式）；例：intmain(){inti=1;do{printf("%d",i);i++;}while(i#include#includevoidmenu(){printf("1.play\n");printf("0.exit\n");}voidgame(){//猜数字游戏的实现:先生成随机数-->猜数字。rand函数返回了一个
Kubernetes学习笔记（四）--Pod 状态与生命周期管理 Mr小三 Kubernetes 云原生 kubernetes
文章目录四、Pod状态与生命周期管理1.Pod概念网络存储用法pod的终止2.Init容器init模板用途3.Pause容器4.Pod的生命周期Podphase（阶段）Pod状态5.Pod健康-容器探针(Probe)概念EXEC探针HTTP探针TCPSocket探针四、Pod状态与生命周期管理Pod是kubernetes中最重要的基本概念，在kubernetes中最小的管理元素不是一个个独立的容器
《比昂全集》阅读笔记：漫长的周末 - 战争 4 中若宁Rena
【战争】第4节。如果年轻时候遇到一些优秀的人，这些人可能成为年轻人的榜样。一个人可能希望自己未来成为自己欣赏的老师、教官、或者自己的父母那样的父母。Bion所在的营地很好，纪律严明。那些军官也是应该服从的人。尽管有的教官有有依据的缺点，但是那时候还是容易把对方放到权威的角色里。Bion的生活中，有着：“训练、技术课程、左轮手枪、机关枪、六磅步枪，还有强大的坦克本身……”“不坏的士兵……熄灯……夜晚
什么是java IT界小新学姐
Java属于一种计算机语言，计算机语言的种类非常多，总的来说可以分成机器语言、汇编语言、高级语言三大类。Java是一种高级计算机语言。Java是由SunMicrosystems在1995年首先发布的编程语言和计算平台。有许多应用程序和Web站点只有在安装Java后才能正常工作，而且这样的应用程序和Web站点日益增多。Java快速、安全、可靠。从笔记本电脑到数据中心，从游戏控制台到科学超级计算机，从
《小狗钱钱》学习心得（第三、四、五章） A01琪公子
《小狗钱钱》学习心得（第三、四、五章）最近在跟战友读一本《小狗钱钱》的书，今天把读到的精华与对这本书的感悟分享给正在看文章的你，希望对你有用。一、成功笔记：1.昨天的梦想相册的三个重要梦想开始在我脑海中浮现，我闭眼想到靠自己努力买房并装修好的新房的温馨舒适、爸妈安享晚年的幸福时刻，以及清晨爱人醒来那甜蜜的微笑。2.给客户重新发了合同，不在急急燥燥，而是准备好，只要有机会，就紧紧抓住。3.用心读完了
python分布式爬虫打造搜索引擎--------scrapy实现 weixin_30515513 爬虫 python 开发工具
http://www.cnblogs.com/jinxiao-pu/p/6706319.html最近在网上学习一门关于scrapy爬虫的课程，觉得还不错，以下是目录还在更新中，我觉得有必要好好的做下笔记，研究研究。第1章课程介绍1-1python分布式爬虫打造搜索引擎简介07:23第2章windows下搭建开发环境2-1pycharm的安装和简单使用10:272-2mysql和navicat的安装
创意PPT模板：好水灵的排版，还是熟悉的味道 LJ的学习笔记
大家好，我是爱学习的瞄代表。今天给广大职场人带来一份创意PPT模板（好水灵的排版）。【总览图】：【PPT展示】：【PPT模板特点】：1、创意PPT模板，前所未有的快感；2、几乎所有素材均可编辑，有型更有料；3、扁平设计，时下正流行；4、好水灵的排版，还是熟悉的味道【获取方式】：微信公众号：LJ的读书笔记（ljdushubiji）回复关键词“0505”，即可获取。
猴子·成功日记（32） Monkey_858e
2020/3/211、口语打卡2、牙套计时——26副第2天3、小提琴练习2小时4、学习理财+笔记5、备课+文稿6、尤克里里打卡7、上课8、练读《末日焚书》
《How to Take Smart Notes》读书笔记1 LY320
最近在读一本书，题为《HowtoTakeSmartNotes:OneSimpleTechniquetoBoostWriting,LearningandThinking–forStudents,AcademicsandNonfictionBookWriters》1。尚未读完，分享一些读这本书的感想，我的一些心得，和不解。这本书让我觉得最有收获的点是更新了我对记录和整理笔记的认识。通常我们在记录笔记时
左眼跳财右眼跳灾的科学依据是什么？医生告诉你答案高省张导师
俗话说“左眼跳财，右眼跳灾”。许女士对这句俗语深信不疑。从一年前开始，许女士总是左眼皮跳，但每次只要稍作休息就能恢复正常，所以许女士都没放在心上，甚至还心想：说不定能走财运了。大家好，我是高省APP最大团队，【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，也期待你的加入。高省邀请码520888，注册送2皇冠会员，送万元推广大礼包。给大家推荐一个公主号《张十五笔记》分享引流，思维
为这人间操碎了心-读书笔记-02 Tracy的小书斋
火车有人嫌火车走得慢，又有人嫌火车冒烟脏。人类浪费时间精力做好多好多不该做的事，何必斤斤计较旅途所耗的时间？纵然火车走得像枪弹一般快，车上的人忙的是什么？火车冒烟是脏，可是冒烟的并不只是火车，何况现在火车多不冒烟了。如果老远地看火车冒黑烟或吐白气，那景象却不一定讨厌。送礼礼尚往来，来而不往非礼也。升官图一开始以为这篇文章会是在讲述官场的景象，但是原来升官图只是一个游戏。但是游戏中也蕴含了人间真理：
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文