QbitAl

“深度学习不能拿来乱用”，Nature论文引发激烈争论

地应栗发自凹非寺
量子位报道 | 公众号 QbitAI

“登上Nature的研究，就是重要的研究，还能有这样的缺陷？”

最近几天，哈佛一篇用深度学习预测余震位置的Nature论文，遭受了地震一般的猛烈质疑，被封为“深度学习的错误用法”。

发起挑战的是名叫Rajiv Shah的数据科学家，在伊利诺伊大学芝加哥分校做兼职助理教授。

他用论文作者提供的代码重现了算法，由此提出的问题，几乎可以全盘否定这项研究的意义：

一是，算法在测试集上的表现，远远超过了训练集，这不是有数据泄漏么？

二是，用随机森林之类的简单方法，就能得出和神经网络相当的结果，为什么还要用深度学习？

Shah说，深度学习不是拿来乱用的。

他花了半年时间，对这项研究做了仔细的分析，还把完整分析过程放上了GitHub，供大家自行判断。

在公开发表意见之前，Shah也把自己观察到的问题发给了论文作者和Nature。

虽然，作者团并没有回复他的邮件，却给Nature写了封信。除了逐条回应质疑，也不乏情绪式发言，比如：

这些评论 (指Shah的质疑) 不值得发表，Nature真把它们发出来的话，我们会很失望的。

一来一往，引发了机器学习社区热烈的讨论，Reddit热度已经超过600。

这篇研究，仿佛比一年前登上Nature官网头条的时候，还更加瞩目了。

那么一起来观察一下，论文是怎样的论文，质疑是怎样的质疑。

“打根上就错了”

论文来自哈佛和谷歌的四位科学家，思路大概是这样的：

一次主震发生后，附近岩石中的应力会发生改变。从前科学家也是用这样的改变，来预测余震可能发生的位置，这叫“应力断裂法” (Stress-Failure Method) 。

它已经能解释许多余震地点的规律，但还有更多无法预测的情况。于是，团队便利用神经网络的力量，学习了131,000次主震和余震。

这个算法模拟了一个网格，每格包含主震震中5公里的范围。把每次主震和它的余震情况，以及应力改变的数据都喂给AI，训练出预测每一格余震概率的能力。

团队说，实验证明AI预测比传统的应力断裂法要准。另外，AI还能指示哪些参数对余震预测更重要：比如金属应力的变化，就是从前科学家很少用到的数据。

研究人员觉得，这次研究会给今后的余震预测，带去一些启发。

但在数据科学家Shah的眼里，他们得出的结论，完全建立在有缺陷的根基之上，并不可靠：

数据泄漏，结果掺水

Shah用论文作者开源的代码和数据集，跑了跑算法。发现了奇怪的事情：

测试集上的AUC，明显比训练集上要高。

Shah说，测试集比训练集成绩好，根本不正常。出现这种现象，最大的可能性就是数据泄漏 (Data Leakage) 。

不只是推测，观察一下数据集，他便发现了证据：

1985NAHANN01HART，1996HYUGAx01YAGI，1997COLFIO01HERN，1997KAGOSH01HORI，2010NORTHE01HAYE，这些编号的地震，在训练集和测试集里都出现了。

发现数据集有重叠还不够，要证明这些重叠真的会影响AI的成绩：

保证一次地震的数据，只存在于训练集，或者只存在于测试集，而不能两者都有。

数据集修改之后，测试集上的成绩降下来了，也并没不传统方法更优秀：

△ 第2行=传统方法，第5行=神经网络

这样一来，Shah便否定了论文得出的结论。

但故事并没有结束。在他眼里，这项研究还有其他诡异的地方。

没必要用深度学习

Shah说，机器学习研究通常都会用一些基准算法 (Benchmark Algorithm) ，来衡量自家模型的表现。

随机森林和逻辑回归都是常用的基线。

这篇论文没有跟任何基线作对比。但Shah测试的结果表示，一个随机森林就能解决同样的问题，表现和神经网络几乎无差。

Shah说，论文里的任务的确是随意一个简单模型，如支持向量机 (SVM) 、如广义相加模型 (GAM) ，都可以得出和神经网络相当的结果。

他觉得，论文给了读者一种误导，让人以为只有深度学习才能做到。

如果不是这样的话，能用简单模型解决的问题，就没必要搭个6层的深度网络。

对于自己选用的方法，研究人员应该说明它的优越性，这一点余震论文也没有做到。

再退一步，即便神经网络真的比基线模型表现更好，Shah也提出了针对这一种方法的质疑：

1500行数据就能搞定

论文提到，神经网络用了470万行数据，得到了最终的结果。

Shah认为，研究人员没有用学习曲线 (Learning Curve) 。

因为，如果用了就会发现，只要拿数据集的一小部分来训练，已经可以得到很好的结果。

比如，Shah只用了1500行数据、两个Epoch，就获得了和论文里相当的成绩。

也就是说，就算用深度学习是个合理的选择，得出一个这样“简单”的结果，也不该用到那么多数据。

这三点质疑，原本都是写在Shah发给论文作者的邮件里。只是一直没有收到回复。

后来，他又把这些问题发给Nature编辑部。

这次终于有回复，但Nature认为虽然数据泄漏确有严重嫌疑，模型的选择问题也会令实验结果无效，但是觉得并没有必要去纠正这些错误。因为：

Devreis et al (作者们) 主要的点在于，把深度学习作为探索自然界的一个工具，而不在于算法设计中的细节。

一边失望，Shah一边决定把自己的所有分析，直接公开给全世界看。

他说，机器学习从一个小众领域，变成迅猛发展的行业了。

有一大波ML扩增、自动化、GUI工具，让各行各业的人都能把深度学习用到自己的工作上去。

而问题就在这里：

这些工具是降低了机器学习/数据科学的门槛，但人类的知识水平并没有跟上。

数据科学家是接受过训练的，他们能够发现一些非常根本、但普通人不易察觉的问题。

前文提到的数据泄漏，就是典型的例子。

除了发现问题的能力之外，勇于承认“这结果也太好了，好到不像真的”，也是一种修为。

换句话说，不能被好结果冲昏了头，要记得自己做的是严谨的科学。

Shah说，去年这篇论文登上Nature之后，关注度爆炸，还获得了广泛的认可。

就连谷歌发文宣传TensorFlow 2.0，讲到深度学习都能做些什么，举的第一个例子就是这项研究。

把论文里的问题指出来，可以给整个社区一个好的反例，告诉大家常见的错误都有哪些，真正的机器学习研究应该是什么样的。

所以，虽然有同事劝他发条推特就别再管了，Shah依然坚持把全部见解发布了。

他的分析结果，还得到了许多人的赞同。

有位网友 (sensetime，这名字怎么有点熟悉) 说：

如果我在一个机器学习会议上审到这篇论文，应该也会提出差不多的问题吧。至少Ablation还是要做的吧。

注：Ablation Stuties判断一个结构是否有用的方法。加上这个结构，去掉这个结构，看两者之间的表现有没有差异。目的是，能用简单的方法解决问题，就不用复杂的方法。

走出机器学习，Ablation就是著名的控制变量法。大概是所有实验科学，都离不开的方法了。

那么，面对针针见血的质疑，余震研究的作者是怎样回应的？

给Nature写了封信

三点质疑，作者一一给出了解释。

第一个问题是数据泄漏，团队并不认为有这样的情况存在。

他们的说法是：

训练集和测试集是基于不同的主震，随机分的。

而主震B本身，可能就是主震A的一次余震。所以，主震B的余震，和主震A的余震，也会有重叠。

如果主震A在训练集里，主震B在测试集里，训练集和测试集就会有重叠。评论说的是事实。

即便如此，作者也不觉得这是数据泄漏，理由是：

训练集里，是把主震A造成的应力变化，映射到余震位置上。

而主震B在测试集里，是把B造成的应力变化，映射到余震位置上。

测试集里要做的映射，和训练集里的完全不一样。明明是要预测同样的余震，主震却不是那个主震了。

所以，数据集里并没有额外信息，能帮AI在测试集里表现得更好，反而可能降低AI的表现。

然而，占领Reddit讨论版顶楼的，是这样一句话：

看了这些人的回应，感觉他们并不知道什么是数据泄漏。

关于第二个问题，该不该用深度学习，作者解释：

在比较浅或者非感知 (non-perceptual) 的机器学习任务里，神经网络和随机森林通常都表现差不多。一点也不奇怪。

这篇论文的意义在于，一个神经网络用简单的应力数据，就学会了余震位置的预测。

如果纠结其他方法是不是也做得到，就找错重点了。

读到这样的回应，Shah有些哭笑不得。他在博客里写到：

只要用了预测模型，实验结果的说服力就取决于模型的质量。

你的工作变成了数据科学的工作，也该有数据科学上的严谨。

不是一句“这不是机器学习论文，是地震科学论文”就能混过去。

还有第三个问题，学个简单规律是不是用了太多数据？

团队的回应里却没有提到“太多数据”这件事：

对，就是学到了一个简单的规律，这个事实就是整篇论文的全部意义了。

神经网络从一堆非常简单、却被人遗忘的数据里，学到一个预测方法。论文花了很大的篇幅来写这一点，也是因为它就是意义。

只记得强调，自己发现了从前没被当作预测工具的一些参数。

这封信的内容，大家并不买账。台下的看客甚至开始了调侃：

听他们的口气，似乎就快做好准备，开家深度学习创业公司了。

就叫leakAIge。

别说了，拿好我的天使投资!!!

如果说上面的三条解释，只是令观众感到苍白而已。那么来欣赏作者的一段情绪式发言：

这些评论，并不值得发表在Nature上。

它们也不会推动这个领域向前走。

事实上，这些评论要么是错的，要么是全然误解了科学的意义，听上去还很居高临下。

全都是没有科学依据的。

如果Nature把这些评论发布出来，我们会很失望。

这些激愤的字句，引起了网友 (sensetime) 的一串惊奇问号：

质疑为啥不值得发在Nature上啊？为啥要被河蟹啊？难道不是把它们公开，才能促进健康的学术讨论么？

同理，对于Nature编辑部的不作为，也有人 (darchon30704) 表示了相似的不满：

这种对待批评的态度，非常不成熟了。

那么，这篇看上去千疮百孔的研究，和它的作者团，就真的没有一丝优点了么？

One More Thing

提出三大质疑的Shah，最终还是为这支团队讲了句话：

感谢作者们开源了代码，公开了数据集，不然就没办法找到里面的问题。

开源也是整个领域都应该坚持做下去的事情。

论文传送门：
http://sci-hub.tw/https://www.nature.com/articles/s41586-018-0438-y

代码传送门：
https://github.com/phoebemrdevries/Learning-aftershock-location-patterns

作者回应：
https://github.com/rajshah4/aftershocks_issues/blob/master/correspondence/Authors_DeVries_Response.pdf

Shah的分析过程：
https://github.com/rajshah4/aftershocks_issues

Shah的博客：
https://towardsdatascience.com/stand-up-for-best-practices-8a8433d3e0e8

其他人也质疑过这项研究，还发了两篇论文：
1、http://sci-hub.tw/https://link.springer.com/chapter/10.1007/978-3-030-20521-8_1

2、https://arxiv.org/abs/1904.01983

Reddit讨论版：
https://www.reddit.com/r/MachineLearning/comments/c4ylga/d_misuse_of_deep_learning_in_nature_journals/

作者系网易新闻·网易号“各有态度”签约作者

— 完 —

AI社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
《庄子.达生9》钱江潮369
【原文】孔子观于吕梁，县水三十仞，流沫四十里，鼋鼍鱼鳖之所不能游也。见一丈夫游之，以为有苦而欲死也，使弟子并流而拯之。数百步而出，被发行歌而游于塘下。孔子从而问焉，曰：“吾以子为鬼，察子则人也。请问，‘蹈水有道乎’”曰：“亡，吾无道。吾始乎故，长乎性，成乎命。与齐俱入，与汩偕出，从水之道而不为私焉。此吾所以蹈之也。”孔子曰：“何谓始乎故，长乎性，成乎命？”曰：“吾生于陵而安于陵，故也；长于水而安于
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
郎朗大婚娶公主：所有光环的背后，都是十年如一日的自律简小尘
近日，关于郎朗大婚的新闻上了热搜，看了新娘的照片，既有天使般的面容，更有魔鬼般的身材，关键是人家还身世好，又有才华，这真的是让所有男人羡慕嫉妒恨哪。有些人不禁会想，“凭什么郎朗的人生就象开挂了一样，可我却每天都活得这么狼狈！”其实，每个开挂的人生背后，都是苦行僧般的自律。01欲戴王冠，必承其重。练琴不能只靠兴趣，更需要自律！我们先来看一下朗朗在小时候的作息时间表：早晨5:45起床，练琴1小时。中午
如果做到轻松在股市赚钱？只要坚持这三个原则。履霜之人
大A股里向来就有七亏二平一赚的说法，能赚钱的都是少数人。否则股市就成了慈善机构，人人都有钱赚，谁还要上班？所以说亏钱是正常的，或者说是应该的。那么那些赚钱的人又是如何做到的呢？普通人能不能找到捷径去分一杯羹呢？方法是有的，但要做到需要你有极高的自律。第一，控制仓位，散户最大的问题是追涨杀跌，只要涨起来，就把钱往股票上砸，然后被套，隔天跌的受不了，又一刀切，全部割肉。来来回回间，遍体鳞伤。所以散户首
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
其二十八尾喵
你知道吗？图片发自App我今天知道了你有喜欢的人，不是我。心空空的，整个人都不是我的了。可，怎么办？还是要好好的活着，毕竟你喜欢的人，我不能杀，可是我可以杀其他喜欢你的人呀！也罢，此生无缘，来世再见。鱼干
走向以教育叙事为载体的教育叙事研究 666小飞鱼
今天我读了吴松超老师的《给教师的68条建写作建议》中的第23条《如何通过教育叙事走向研究》，吴老师在文中与我们分享了一个德育案例，这是一个反面的案例，意在告知我们在处理问题时，不能就考虑的点太窄，思考要全面。走向教育叙事研究，教师要有敏锐的“感知力”，这个感知力来自于背后专业知识的支撑，思维能力以及广阔的视野和见识等。所以对于同一件事处理方法不同，这个就是教师背后“敏锐力”的不同造成的，也就是说是
心有蓝天白云，爱情便会晴空万里，然后有花香有鸟鸣有美好的未来曹十二吖
丁南的婚姻，来自于一场她对生命的对比。她曾经说过，当她最爱的母亲用生命去逼迫她结婚的时候，她曾一度不理解到愤怒，甚至于想过用轻生来对抗母亲的不理智。庆幸的是，丁南是一个自我调节能力非常强的人，她想如果我连死亡都不怕，还怕不能经营好一段婚姻吗？抱着这样的念头，24年没有谈过恋爱的她，用短短三个月的时间，完成了少女到女人的蜕变。她曾经说过：“我要把自己最珍贵的东西留给自己命中注定的那个人。”闺蜜几人中
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
钟表可以回到起点却已不是昨天凉小夏
人生的路很长，但是我们只能前进不能后退就像钟表，可以回到起点，却已时过境迁，永远也找不到那个过去的昨天。因我们总是会对过去有着很多留恋不舍和怀念，会时常回头看看走过的脚印，时常想起过去的美好时光，时常想到那些悲伤和不如意。今天的到来时钟不可阻止，历史的记录，原人生最宝贵的不是金钱，不是地位，而是时间。拥有时间就等于拥有一切，因为拥有时间，我们不怕囊中羞涩，因为拥有时间我们不惮创业无门，因为拥有时间
女儿考研完报考雅思捡拾流年
是否我过于焦虑？会不会无形间让女儿觉得压力太大了啊。2022年对于我们家来说是不平常的一年。女儿今年大四，为了准备考研，暑假也没回家，年初去了学校到了年末才回家。女儿自己一个人面对考研，没有参加培训，大四学校作业论文等课业也多，她同时也是很努力复习考研的。在疫情开放很多羊的时期，女儿终于顺顺利利参加12月24、25号的考研，我们和家人都觉得女儿回家来要好好休息调养。可女儿回到家，我再查阅考研信息，
119:虚惊一场追梦的小蚂蚁
医院体检结果出来了。老a被通知再次去复查，又复查了一遍，结果还是不理想。老a心里有点不痛快了，难不成饭吃到头了？这人生最悲剧的事情就是人没了，钱还没花完。我从明天开始想吃的想喝的一毛都不省，天天抽华子。上班期间，老a掏出华子给人散。老c：“这发什么横财了？都整上了华子了？”老a：“别tm废话，抽不？不抽我装上了！”老c：“哥哥，肯定抽啊，拿来。”老a：“就凭这个哥哥，以后给你天天发华子！”老c：“
xilinx vivado PULLMODE 设置思路坚持每天写程序 fpga开发
1.xilinx引脚分类XilinxIO的分类：以XC7A100TFGG484为例，其引脚分类如下：1.UserIO(用户IO)：用户使用的普通IO1.1专用(Dedicated)IO：命名为IO_LXXY_#、IO_XX_#的引脚，有固定的特定用途，多为底层特定功能的直接实现，如差分对信号、关键控制信号等，不能随意变更。1.2多功能(Multi-Function)IO：命名为IO_LXXY_ZZ
发现荞麦过敏这件事怪小泊
荞麦在我这里不是常用的谷物。所以前二十年，我以为自己是很正常的，从街头小吃到包装零食到每日三餐，从来没有不能吃的。可是有天我突然病倒了，喉咙火辣辣的肿痛，口水都咽不下去，舌头发麻。当时我以为吃太多零食所致，因为那天我吃了很辣的泡椒凤爪。其实我是不怎么吃辣的。而那个泡椒凤爪真的超辣。当时我以为自己吃多了，并不知道自己对哪个食物过敏。因为不舒服我早早睡了，结果并没有睡着。肚子一阵一阵疼，非常痛苦，终于
九月班级管理工作反思追梦蜂
这个月应该算是最难的一个月，我已N年没当班主任，然后我又开始当了。职称是一方面，想到我如果退休了，不能再接触学生了，那该是多么遗憾的事！我的学生梁*铭是我的榜样，她那么努力，那么拼，那么上进，为什么我不行？虽然我面临的工作很难，但是高考数学也不容易。她拿下来了！满分150分她考了146分！我目睹她的艰辛，她的拼搏！还有，我要为我的孩子做榜样，如何竭尽全力，实现梦想。还有，服务，为社会做事，也是会有
928、在新冠的日子里（2）隔离天使小鱼儿
昨天YD全部人员核酸检测阴性。但是也都不能回家，要隔离14天，按规定执行。小红也是其中之一，今天是第三天，第二夜，门把手的源头还没有通报，在排查中。隔离措施是对的。是人？是物？是相似病毒？希望是虚惊一场。昨天，单位排长队，做核酸检测。我们都统一做了检测。现在出去做事，核酸检测是必须的。我今天也要外出做事，所以核酸检测也要提供。给小红准备了简单的替换衣服。我们也按规定执行。问闺蜜你们也都不回家吗？回
如何在心上用功？余超林AIA财富管家
思考：如何在心上用功？学习心得：心-道-德-事的理解心-道-德-事这四部曲，本质上就是一个人的思维智慧的四个层面：事是最底层，这是所有人在这个社会谋求生存的基础，一个人能够把事情彻底做好，保质保量的完成，才会有真正的结果，但是这个层面要获得真正成功很困难，因为会做事的人很多，最终会出现恶性竞争；德是第三层，如果说整个社会做事的竞争激烈程度为100%，那么上升到德上的竞争激烈程度降低为80%，德是一
人生自信的灯塔 QQQ否极泰董宝珍
不论你的背景如何或是面临怎样的环境,你都可以具有和我一样的态度。如果困难成为你的拦路虎,你要坚信自己的重要性,坚信自己能够战胜困难,而且更重要的一点就在于,你要相信赢得胜利是很多人对你的期望。如果你具备这种态度,你甚至都不敢相信自己的能量有那么大。这不仅是你能不能活下去的问题,这不仅是成不成功的问题,这是你的责任。竭尽所能去追求圆满的责任感能帮助你在生活和事业上乘风破浪。我所经历的最困难的财务危机
作业是家庭关系的枢纽潘海松
回想一下，当孩子做作业的时候，我们不断地在和孩子聊天、沟通，互相提出一些要求，也不可避免地，会产生分歧。举个最常见的例子，我们告诉孩子：「该写作业了。」娃是什么反应？好的亲子关系，孩子会乖乖停掉手里的事马上去写作业，或者好声好气地和家长商量，能不能在半个小时（或某个时间）开始。而不如意的亲子关系，孩子听到这句话的瞬间，就是各种不情愿，敷衍、拖延甚至于撒谎、撒泼打滚。最后，成为当天家庭里坏情绪的引爆
春雨 · 心境 jinlinglq
春捂秋冻，谁都知晓。清明前，南京的气温逼近30℃，这样就不能再去“捂”了，否则就会让人怀疑你身上穿的真是租来的了。可是，一场清明时节的春雨又让爬高的温度如过山车般地下降，今天气温已然呈个位数了。昨日在家，我还说起南京的俗语：三月三，冻得把眼翻。意思是，即使到了农历三月三，南京还是会有低温来临。母亲更正道：错了，应该是“三月三，冻得把衣翻”。农历的三月三要是冻得把眼翻，那还得了？其实是把收起的冬衣从
2022.01.22 有用谨言的成长
写作，对我来说，更像是一个自说自话，自我观察，自我反思，自我探索的途径。可以写我的心情故事，写我的观点而不用担心任何人的评论，写我的情绪，写我想说的，有时候觉得只是简单用语言还不能表现出那份深刻，但是文字可以给自己一个更长的时间来思考，来做深度思考，表达得更透彻。写作，有时候我会写自己看了某个电影后的一点感悟，自己的真实感受，不管它和专业影评人相比是不是很肤浅，是不是片面了，只是有时候我也想发声，
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
骑昆明到北海—119 砚山县 61清风i
从十年前第一次长途骑行青海湖开始每年一次长途骑行看风景，尝各地美食，探访异域文化，记录途中美食美景美事，已逐渐形成习惯。每年春季详细规划好线路，夏季出行，2020年因为疫情迟迟不能确定线路和行程。总算到了暑期疫情逐渐消失，规划了50多天的云南昆明—广西北海计划。本次行程从云南昆明出发到广西北海市结束，五十一天骑行二千多公里线路昆明-官渡古镇-环滇池--澄江市一抚仙湖—路居镇--江川区--通海县—龙
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分