如果曾经拥有

some collected dl tips

调参侠的自我修养——深度学习调参秘籍_夕小瑶的卖萌屋-CSDN博客_人工智能调参侠
https://blog.csdn.net/xixiaoyaoww/article/details/105036075

NLP、炼丹技巧和基础理论文章索引_夕小瑶的卖萌屋-CSDN博客_nlp 炼丹
https://blog.csdn.net/xixiaoyaoww/article/details/104553483

项目经验

调研做好，找准起点

接手一个算法问题后，如果时间很充裕，就可以先定位一下该算法问题所对口的学术会议或期刊：

比如你要解决query-doc相关性匹配的问题，那么你就要优先考虑SIGIR，CIKM等IR强相关的会议，而不是NLP的会议；

如果你要解决NLI、问答、对话这种语义匹配的问题，那么你就要优先考虑ACL、EMNLP、NAACL、COLING这种NLP会议，而不是IR会议了；

如果你把匹配模型做好了，想压缩一下变得更小更快，那就要优先考虑ICLR、NIPS这种更general的深度学习、神经网络会议了。

定位不出来算法问题的对口会议？最起码可以逛逛AAAI和IJCAI吧（虽然鱼龙混杂问题比较严重）

然后根据文章title，找几篇跟你的算法问题最接近的近两年的paper，慢慢调研。通过这些paper的related work章节和实验章节，还很容易追溯出更早的工作，(基本就是paper中提到的 baseline 和 related work)；所以一般没有必要去手动调研更早期的paper。

如果时间很不充裕，要解决的问题又比较简单（比如就是个典型的文本分类问题、序列标注问题等），在知乎上搜一下也经常能发现惊喜。

总之，非常不建议直接去github一个repo一个repo的蛮力调参，大量的宝藏方法是很难通过通用搜索引擎来找到的（虽然这种行为在比赛刷榜的时候随处可见）。

先跑起来

不要一上来就自己动手写模型。

建议首先用成熟的开源项目及其默认配置（例如 Gluon 对经典模型的各种复现、各个著名模型作者自己放出来的代码仓库）在自己的数据集上跑一遍，在等程序运行结束的时间里仔细研究一下代码里的各种细节，最后再自己写或者改代码。

构建策略迭代闭环，找准努力方向

避免蛮力试错的第二步就是构建完整的策略迭代闭环。由于不同的问题有不同的限定，因此不存在一个绝对的流程可以恰好适合所有算法问题，（一般都是非线性的，部分步骤需要来回修改，反复调整）。夕小瑶最常用的迭代闭环就是

数据集分析 - 预处理策略 - 算法策略 - 模型评价 - case study

对于小白，往往是在第三步和第四步陷入死循环，看不到前两个环节和最后一个环节。

对于大白，往往还能额外考虑一下预处理策略。

1. 数据集分析

很多小白拿到数据集后就开始迫不及待的调参之路了，其实在开始之前对数据集做个简单的分析，可能有助于大大降低你之后的体力劳动（提前排除不靠谱的策略和不敏感的超参数），并大大降低初次接触新任务时犯致命错误的概率。

比如，简单统计一下样本长度分布，你就可以知道max sequence length这个参数的大体取值范围，没有必要把它当成一个正儿八经的超参数从小调到大；简单统计一下类别分布，你就不会在正负样本比9：1的情况下为一个90%的准确率沾沾自喜，误导决策；多扫几眼数据集，你就不会在初次接触文本风格相关任务时把英文单词统一小写了。

2.预处理策略与算法策略

这个环节不用太多赘述啦，最直接方法就是搬运上一节的调研结果，将一些paper中比较有效的策略搬过来进行验证。不过，尤其是注意一个meaningful的问题，即我搬运这个策略，甚至设计一个新的策略，目的是什么？要解决什么问题？毕竟很多paper中的策略的适用场景是很局限的，毫无目的的搬运可能会大大增加无用功。

3.模型评价

模型评价的问题在打比赛时一般不会遭遇，在比较成熟的算法任务中一般也被解决了。比如谈到文本分类，就能想到acc、f1等指标；谈到机器翻译，就能想到bleu等。然而有很多算法问题是很难找到一个无偏且自动的评价指标的。

一个典型的例子就是开放域对话生成问题。

虽然与机器翻译一样，这也是个生成问题，但是如果你沿用BLEU作为评价指标，那么BLEU对对话生成来说就是一个有偏的评价指标，你刷的再高也难以真实反映对话生成模型的质量（对话生成问题中不存在机器翻译中的强的对齐关系）。更糟糕的是，由于找不到无偏的自动指标，因此每迭代一次策略，就需要让一群人轰轰烈烈的标注打分，还要去检验是否存在异常标注者（说不定有个宝宝就耍脾气了给你乱打一通），这无疑是效率非常低的，纵然你代码写的再快，也会被评价问题所拖累。

业务中更是可能有一些模棱两可的算法任务，比如“小夕，来个更好的句子表示吧”，那么如何无偏的评价一个表示的好坏，就需要你在大规模开搞之前仔细设计清楚了。没有一个客观、无偏且自动的评价指标，策略迭代无疑会非常缓慢甚至到后期推翻重来。

4.case study

像accuracy、f1、bleu等标量型评价指标可以指导当前策略整体上好不好，但是却无法帮助你发现更细粒度的问题。很多小白在入行时，喜欢把各种花里胡哨的算法和各种不着边际的想法一顿乱试，以为有了模型评价指标就可以很轻松的评判一个算法“是不是有用”，以及可以因此纯拼体力的炼丹。

但！是！当你额外的做一下case study之后，可能你会突然发现，很多自己之前的尝试完全就是多余的：

你以为数据不均衡问题很严重，case study才发现模型其实很轻松；
你以为推理问题离自己很遥远，case study才发现一大半的错例是推理问题导致的；
你以为领域问题不重要，case study才发现太多模型没见过的领域术语了；
你以为数据集很干净，case study却发现了大量错别字导致的错误决策；

总之，在经验不足的情况下，通过case study可以帮助你排除大量的不必要尝试，并有助于发现当前策略的瓶颈，针对性的寻找策略和创新。

重视bug，找准翻车原因

效果不好时，首先检测有没有bug。

摆脱“洁癖”，提高写代码速度

早期探索阶段，没必要封装代码，能跑能看效果即可。

分规模验证，快速完成实验

这个问题写出来时感觉很白痴，但是据我观察，大部分新手都存在这个问题。如果你给他100万规模的训练集，他就会拿整个训练集去调试；你给他1000万规模的训练集，他还是拿整个训练集去调试。。。

第一阶段：调通代码。这时候象征性的挂几百条样本就够了，修正语法错误和严重的逻辑错误。

第二阶段：验证收敛性。很多bug不会报错，但会导致训练完全崩溃或者压根就没在训练。可以对几百条或者几千条样本进行训练，看看若干epoch之后训练loss是否能降低到接近0。

第三阶段：小规模实验。在万级或十万级别的小样本集上验证模型表现，分析超参数敏感性。这一阶段在数据规模不大时（比如几十万或一二百万）其实可有可无，当训练数据极其庞大时（十亿级甚至百亿级的话）还是必要的。有一些很细微的bug虽然不会影响收敛，却会显著影响最终模型的表现。此外也有助于发现一些离谱的超参数设置。

第四阶段：大规模实验。即，有多少训练数据，就上多少，甚至多训练几个epoch。进行到第四阶段时，应当绝对保证代码是高度靠谱的，基本无需调参的，否则试错代价往往难以承受。

实验管理 & 项目管理

实验管理就是，要记录下来每一次实验的策略名和对应的实验结果，一般以表格的形式记录。

这里可以用excel、markdown编辑器等记录，当然更建议使用支持云端同步的工具来记录（比如石墨文档、印象笔记或内网的相关工具等），以防电脑被偷、文件误删等意外导致的悲剧。

但是，有时候实验着急，对策略的描述不够仔细怎么办？比如某次实验同时改变了具体策略、还改了超参数、预训练模型等一堆东西，不能用一个名字概括全部，怎么办呢？

最简单的做法就是与版本管理工具配合，再也不用担心未来settings丢失、模型无法复现、模型无法追溯环境等问题了。

而要实现版本管理，也很简单，Git自然是不二之选。

首先，务必保证训练日志、eval日志是以文件的形式存了下来，而不是打印到屏幕上变成过眼云烟了；此外，需要保证每一次运行时的settings（比如超参数、数据集版本、ckpt存储路径等）都能保存到日志文件中，且尽量封装一个run.sh来维护训练任务的启动环境。

之后就是看每个人自己的习惯啦。夕小瑶的习惯是

主线策略每成功推进一步，就调用git tag打个tag。这里的tag即策略名，与实验管理的表格中的策略名对齐
如果要在某个策略的基础上尝试一个很不靠谱的探索，那么可以在当前策略的基础上拉一个分支出来，在这个分支上完成相应事情后切回主分支。当然啦，万一这个分支上的策略work了，就可以考虑将其转正，合入主分支并打上相关tag

调参经验 - general

在调参之前，小夕强烈建议在代码里完成下面几件事：

可视化训练过程中每个step（batch）的loss。如果是分类任务，可以顺便可视化出每个batch的准确率（不均衡数据可视化F1-score）。
将训练日志在打印到屏幕上的同时也写入到本地磁盘。如果能实时同步写入那更好了（在python中可以用logging模块可以轻松实现。一个handler输出到屏幕，再设置一个handler输出到磁盘即可）。
借助tensorflow里的FLAGS模块或者python-fire工具将你的训练脚本封装成命令行工具。
代码中完成tensorboard等训练过程可视化环境的配置，最少要可视化出训练loss曲线。
如果使用tensorflow，记得设置GPU内存动态增长（除非你只有一个GPU并且你确信一个训练任务会消耗GPU的一大半显存）
初始调参阶段记得关闭L2、Dropout等用来调高模型泛化能力的超参数呐，它们很可能极大的影响loss曲线，干扰你的重要超参数的选取。
根据自己的任务的量级，预估一个合理的batch size（一般来说64是个不错的初始点。数据集不均衡的话建议使用更大一点的值，数据集不大模型又不是太小的情况下建议使用更小一些的值）。

数据预处理：

对输入数据进行归一化处理，能够显著加速梯度下降的收敛过程。如果不归一化，输入数据每个维度的尺度范围的差异会对梯度下降的迭代过程造成影响。

权重初始化：

目前有很多关于如何做权重参数初始化的研究。因为深度学习权重初始化很重要，如果有问题就不会有好结果。这是一个非常重要的问题。

如果权值初始化为0的话，用梯度下降算法，那会完全失效。因为如果权重初始化为0，每个神经元将会输出同样的结果，方向传播时就会计算出同样的梯度，最后会得到完全相同的参数更新，所以算法失效。

如果用很小的随机数值初始化。比如用高斯分布乘以一个很小的常数进行初始化：W = 0.01 * np.random.randn()。对于层数较少的神经网络效果很好，但是随着层数的增加，对于初始化更为敏感。

如何初始化：

深度学习之参数初始化策略_浅梦的学习笔记-CSDN博客_glorot初始化
https://blog.csdn.net/u012151283/article/details/78230891

作者：萧瑟
链接：https://www.zhihu.com/question/41631631/answer/94816420

要做梯度归一化,即算出来的梯度除以minibatch size；
clip c(梯度裁剪): 限制最大梯度,其实是value = sqrt(w1^2+w2^2….),如果value超过了阈值,就算一个衰减系系数,让value的值等于阈值: 5,10,15；
dropout对小数据防止过拟合有很好的效果,值一般设为0.5,小数据上dropout+sgd在我的大部分实验中，效果提升都非常明显.因此可能的话，建议一定要尝试一下。 dropout的位置比较有讲究, 对于RNN,建议放到输入->RNN与RNN->输出的位置.
adam,adadelta等,在小数据上,我这里实验的效果不如sgd, sgd收敛速度会慢一些，但是最终收敛后的结果，一般都比较好。如果使用sgd的话,可以选择从1.0或者0.1的学习率开始,隔一段时间,在验证集上检查一下,如果cost没有下降,就对学习率减半. 我看过很多论文都这么搞,我自己实验的结果也很好. 当然,也可以先用ada系列先跑,最后快收敛的时候,更换成sgd继续训练.同样也会有提升.据说adadelta一般在分类问题上效果比较好，adam在生成问题上效果比较好。
除了gate之类的地方,需要把输出限制成0-1之外,尽量不要用sigmoid,可以用tanh或者relu之类的激活函数.1. sigmoid函数在-4到4的区间里，才有较大的梯度。之外的区间，梯度接近0，很容易造成梯度消失问题。2. 输入0均值，sigmoid函数的输出不是0均值的。
rnn的dim和embdding size,一般从128上下开始调整. batch size,一般从128左右开始调整.batch size合适最重要,并不是越大越好；
word2vec初始化,在小数据上,不仅可以有效提高收敛速度,也可以可以提高结果；
尽量对数据做shuffle；
如果你的模型包含全连接层（MLP），并且输入和输出大小一样，可以考虑将MLP替换成Highway Network,我尝试对结果有一点提升，建议作为最后提升模型的手段，原理很简单，就是给输出加了一个gate来控制信息的流动。

关于 Ensemble

Ensemble是论文刷结果的终极核武器,深度学习中一般有以下几种方式

同样的参数,不同的初始化方式
不同的参数,通过cross-validation,选取最好的几组
同样的参数,模型训练的不同阶段，即不同迭代次数的模型。
不同的模型,进行线性融合. 例如RNN和传统模型.

训 RNN 注意加上 gradient clipping，不然会导致训练一段时间以后 loss 突然变成 Nan。
tying input & output embedding（就是词向量层和输出 softmax 前的矩阵共享参数，在语言模型或机器翻译中常用）时学习率需要设置得非常小，不然容易 Nan。
在数据集很大的情况下，一上来就跑全量数据。建议先用 1/100、1/10 的数据跑一跑，对模型性能和训练时间有个底，外推一下全量数据到底需要跑多久。在没有足够的信心前不做大规模实验。
不要只喜欢漂亮的模型结构，瞧不起调参数的论文/实验报告。看论文时也需要看超参数设置等细节。NLP 领域主要推荐以下几篇：

Regularizing and Optimizing LSTM Language Models（LSTM 的训练技巧）

Massive Exploration of Neural Machine Translation Architectures（NMT 里各个超参的影响）

Training Tips for the Transformer Model（训练 Transformer 时会发生的各种现象）

RoBERTa: A Robustly Optimized BERT Pretraining Approach（BERT 预训练技巧，虽然跟大部分人没啥关系）

作者：Towser
链接：https://www.zhihu.com/question/41631631/answer/862075836

虽然有至少十种激活函数，但初期用 Relu 或者和某个 paper 统一即可。优化器只推荐 Momentum 和 Adam。在这些方面做尝试意义不大，如果性能提升反倒可能说明模型不成熟。不推荐做人肉模型设计，比如把某层卷积改大一点，或者微调一下通道数。除非有特别 insight，不要自己乱设计玄学组件，以吸收别人经验为主。
链接：https://www.zhihu.com/question/41631631/answer/1129785528
激活函数用relu一般就够了，也可以试试leaky relu。
batchnorm和dropout可以试，放的位置很重要。优先尝试放在最后输出层之前，以及embedding层之后。RNN可以试layer_norm。有些任务上加了这些层可能会有负作用。
metric learning中先试标label的分类方法。然后可以用triplet loss，margin这个参数的设置很重要。
batchsize设置小一点通常会有一些提升，某些任务batchsize设成1有奇效。
embedding层的embedsize可以小一些（64 or 128），之后LSTM或CNN的hiddensize要稍微大一些（256 or 512）。（ALBERT论文里面大概也是这个意思）
模型方面，可以先用2或3层LSTM试一下，通常效果都不错。
weight decay可以试一下，我一般用1e-4。
有CNN的地方就用shortcut。CNN层数加到某一个值之后对结果影响就不大了，这个值作为参数可以调一下。
GRU和LSTM在大部分任务上效果差不多。
看论文时候不要全信，能复现的尽量复现一下，许多论文都会做低baseline，但实际使用时很多baseline效果很不错。
对于大多数任务，数据比模型重要。面对新任务时先分析数据，再根据数据设计模型，并决定各个参数。例如nlp有些任务中的padding长度，通常需要达到数据集的90%以上，可用pandas的describe函数进行分析。

理性调参，把算力和时间留给策略探索

调参之前 - 『模型是否 work』
先把锦上添花的东西去掉，如数据增广，玄学学习率和超参，魔幻损失函数，异形模型。如果世界上有一个非要加八个增广和 1.96e-4 学习率 42 batchsize，配上四种混合损失函数的模型，改动一点都不行，它应该存在于灵能文明。

可以先造一些尽量玩具的模型，验证代码正确性。（最开始的时候，主要看是否大致work；naive的model即可，不需trick）
作者：hzwer
链接：https://www.zhihu.com/question/41631631/answer/859040970

调参的第一步，也是最重要的一步，是进行超参数敏感性分析，找到对当前任务性能影响最大的几个超参数，之后再进行精调。

而要确定各个超参数的敏感性，一方面可以根据自身经验来定，一方面可以根据各paper中的取值（差异大的超参数可能是敏感超参，大家都取值相同的一般不敏感），实在不确定，跑两三组实验就够确定敏感性了，完全没有必要来个“网格搜索”。

调参顺序1 - from 夕小瑶

阶段1: learning rate --> 阶段2: batch size和momentum --> 阶段3: 学习率衰减策略.

阶段1：lr

这个阶段是最容易的，打开tensorboard，按照指数规律设置几组可能的学习率，小夕一般设置如下六组[1, 0.1, 0.01, 0.001, 0.0001, 0.00001]。

如果你的GPU比较多，你还可以在几个大概率学习率附近多插几个值，比如小夕一般喜欢再插上[0.03, 0.05, 0.003, 0.005, 0.007, 0.0005]这几个值（最起码在做文本分类任务时经常撞到不错的结果哦）。

当这些任务跑完时，就可以去tensorboard里挑选最优学习率啦。选择原则也很简单，选择那条下降的又快又深的曲线所对应的学习率即可，如下图，选择粉色那条曲线：(收敛太早太晚都不好，也要注意收敛的程度)

选择好学习率后，顺便再观察一下这条曲线，选择一个差不多已经收敛的step作为我们的训练总steps(如果数据集规模小的话也可以换算成epoch次数)。如图

可以看到，我们的模型在迭代到4K步的时候就基本收敛了，保险起见我们可以选择6K来作为我们训练的总num_steps。

关于GPU

如果GPU有限并且任务对显存的消耗没有太大，那么可以同时在一个GPU里挂上多组训练任务（这时每组任务的计算速度会有损耗，但是完成全部任务所消耗的总时间大大减少了）。小夕一般先随便设个学习率跑一下，确定一下每个任务大体消耗的显存，然后在shell脚本里将这若干个任务塞进GPU里并行跑（shell脚本里直接用&扔进后台即可）。当然，如果代码里用到了时间戳，可以给时间戳加个随机噪声或者在shell脚本里为任务之间加上一定的时间间隔，免得训练任务的时间戳发生碰撞。

阶段2：batch size和momentum

带着第一阶段得到的超参数，我们来到了第二阶段。

如果我们使用的是Adam这种“考虑周全”的优化器的话，动量项momentum这类优化器的超参数就基本省了。然而，不仅是小夕的经验，业界广泛的经验就是Adam找到的最优点往往不如精调超参的SGD找到的超参数质量高。因此如果你想要追求更加极限的性能的话，momentum还是要会调的哦。

momentum一方面可以加速模型的收敛（减少迭代步数），另一方面还可以带领模型逃离差劲的局部最优点（没理解的快回去看看momentum SGD的公式）。而batch size参数似乎也能带来类似的作用——batch size越小，噪声越大，越容易逃离局部最优点，同时这时对梯度的估计不准确，导致需要更多的迭代步数。因此小夕一般将这两个参数一起调。

另外，由于这两个超参数可能涉及到模型的泛化能力，因此记得在监控loss曲线的同时也要监控开发集准确率哦。如果两组实验的loss曲线的形状都很好，这时就可以根据开发集准确率来做取舍了（一般不会出现loss曲线形状很差但是开发集准确率超好的情况）。

阶段3：学习率衰减策略

调参顺序2 - from 知乎

关于神经网络的调参顺序? - 知乎

https://www.zhihu.com/question/29641737

阶段1: learning rate & 衰减策略 --> 阶段2: batch size --> other params: L1，L2正则化; epoch.

L1，L2正则化参数，也就是很多深度学习框架里面的wd参数，一般默认是0.0001，调整正则化的参数可以根据模型表现来，过拟合的时候可以适当加大系数，非过拟合的时候可不调这个参数.

超参上，learning rate 最重要，推荐了解 cosine learning rate，其次是 batchsize 和 weight decay。当你的模型还不错的时候，可以试着做数据增广和改损失函数锦上添花了。
链接：https://www.zhihu.com/question/41631631/answer/859040970

调参经验-text clf

原文：

文本分类有哪些论文中很少提及却对性能有重要影响的tricks？

分词器

首先就有一个问题，真的是算法越“先进”的分词器就会给下游任务带来越好的性能吗？

很多人走到这一步的时候会忽略一个东西，词向量！！！

其实比起分词算法本身的先进程度，在神经网络使用预训练词向量的大背景下，确保分词器与词向量表中的token粒度match其实是更更重要的事情！毕竟哪怕你词分的再好，一旦词向量表里没有的话，那么就变成OOV了，分的再好也木用了。

1. 已知预训练词向量的分词器

一般像word2vec、glove、fasttext这些官方release的预训练词向量都会公布相应训练语料的信息，包括预处理策略如分词等，这种情况真是再好不过了，不用纠结，如果你决定了使用某一份词向量，那么直接使用训练该词向量所使用的分词器叭！此分词器在下游任务的表现十之八九会比其他花里胡哨的分词器好用。

2. 不知道预训练词向量的分词器

这时就需要去“猜”一下分词器了。怎么猜呢？首先，拿到预训练词向量表后，去里面search一些特定词汇比如一些网站、邮箱、成语、人名等，英文里还有n't等，看看训练词向量使用的分词器是把它们分成什么粒度，然后跑几个分词器，看看哪个分词器的粒度跟他最接近就用哪个，如果不放心，就放到下游任务里跑跑看啦。

当然，最理想的情况当然是先确定最适合当前任务数据集的分词器，再使用同分词器产出的预训练词向量啦。可惜互联网上不可能有那么多版本的公开词向量供选择，因此自己在下游任务训练集或者大量同分布无监督语料上训练词向量显然更有利于进一步压榨模型的性能。

当然，除了分词器跟词向量表要match上，另外，还要保证大小写、OOV的定义等跟词向量表match上。如果使用了一个区分了大小写的词向量表，但是你还将下游任务的单词全都小写，那么不用想了，绝对性能丢N多个百分点。

数据集噪声是否严重

这里噪声严重有两种情况。对于数据集D(X, Y)，一种是X （train sample）内部噪声很大（比如文本为口语化表述或由广大互联网用户生成），一种是Y (label) 的噪声很大（一些样本被明显的错误标注，一些样本人也很难定义是属于哪一类，甚至具备类别二义性）。

1. X （train sample）内部噪声很大:

一个很自然的想法是去使用语言模型或者基于编辑距离去做文本纠错，然鹅实际中由于专有名词和超出想象的“假噪声”存在，在实际场景中往往效果并不是很好。

这里小夕一般有两种思路，一种是直接将模型的输入变成char-level（中文中就是字的粒度），然后train from scratch（不使用预训练词向量）去跟word-level的对比一下，如果char-level的明显的效果好，那么短时间之内就直接基于char-level去做模型叭～

如果性能差不太多，或者char的已经做到头了，想做一下word-level呢？

一个很work但是貌似没有太多人发现的trick就是使用特殊超参的FastText去训练一份词向量啦。

为什么说特殊呢？一般来说fasttext在英文中的char ngram的窗口大小一般取值3～6，但是在处理中文时，如果我们的目的是为了去除输入中的噪声，那么我们可以把这个窗口限制为1～2，这种小窗口有利于模型去捕获错别字（想象一下，我们打一个错误词的时候，一般都是将其中的一个字达成同音异形的另一个字），比如word2vec学出来的“似乎”的最近词可能是“好像”，然而小ngram窗口fasttext学出来的“似乎”最近词则很有可能是“是乎”等内部包含错别字的词，这样就一下子让不太过分的错别字构成的词们又重新回到了一起，甚至可以一定程度上对抗分词器产生的噪声（把一个词切分成多个字）。当然，如果数据集很干净的话，这样训练词向量的话可能就gg了。

2.Y (label) 的噪声很大

一种很直接的想法是做标签平滑，然而小夕在实战中使用多次发现效果并不是太明显。

最后总结的trick是，首先忽略这个噪声，强行的把模型尽可能好的训出来，然后让训练好的模型去跑训练集和开发集，取出训练集中的错误样本和开发集中那些以很高的置信度做出错误决策的样本（比如以99%的把握把一个标签为0的样本预测为1），然后去做这些bad cases的分析，如果发现错误标注有很强的规律性，则直接撸一个脚本批量纠正一下（只要确保纠正后的标注正确率比纠正前明显高就行）。

如果没有什么规律，但是发现模型高置信度做错的这些样本大部分都是标注错误的话，就直接把这些样本都删掉吧～常常也可以换来性能的小幅提升，毕竟测试集都是人工标注的，困难样本和错标样本不会太多。

Dropout加在哪里

word embedding层后、pooling层后、FC层（全联接层）后，哦了。

关于多标签分类

如果一个样本同时拥有多个标签，甚至标签同时还构成了DAG（有向无环图），不要着急，先用binary-cross-entropy训出个baseline来（即把每个类别变成一个二分类问题，这样N个类别的多标签分类问题就变成了N个二分类问题），毕竟这个都在tensorflow里有现成API了，即tf.nn.sigmoid_cross_entropy_with_logits。因此实现代价很小。

然后你还可能惊喜的发现，这个baseline做好后好像多标签问题不大了，DAG问题自己也基本解决了（虽然模型层并没有专门针对这个问题作处理），然后就可以安心做模型辣。

别太纠结系列

别太纠结文本截断长度使用120还是150
别太纠结对性能不敏感的超参数带来的开发集性能的微小提升
别太纠结未登陆词的embedding是初始化成全0还是随机初始化，别跟PAD共享embedding就行
别太纠结优化器用Adam还是MomentumSGD，如果跟SGD的感情还不深，就无脑Adam，最后再用MomentumSGD跑几遍.

QA1 - loss曲线抖动上升是什么原因

深度学习train accuracy曲线抖动上升是什么原因?

1.直接原因——显示的数据点太多

2. 深入原因——学习率设置、batchsize大小等

1）学习率越大，波动越剧烈，学习率越小，波动越平缓。
2）batchsize越小，波动越剧烈，batchsize越大，波动越平缓。

3. 根本原因——梯度下降算法

抛开表象看根本，是由于神经网络是高维度的，通过简单的公式求解最优值显然不现实。这时梯度下降算法应运而生了。梯度就是曲线的斜率，如果要最小化目标函数，反向传播过程中，每个参数在梯度方向上减小一定幅度，最终网络收敛到一个局部最优值，减小的幅度大小由学习率决定。

在梯度反向传播过程中，每个patch分别求参数的梯度，最终整个batch的梯度为每个patch梯度之平均，而由于patch之间的差异性，梯度差异较大，因此最终的平均梯度无法精确地匹配每一个patch。下一个batch进来时，由于和第一个batch也存在差异，求平均之后的梯度又偏离了第一个梯度方向，因此损失和精确度的值总是在波动，最终向总体样本的平均梯度靠近。

作者：木一水
链接：https://www.zhihu.com/question/64949637/answer/673388242

QA1 - loss曲线震荡分析

分析原因: 1:训练的batch_size太小

1. 当数据量足够大的时候可以适当的减小batch_size,由于数据量太大，内存不够。但盲目减少会导致无法收敛，batch_size=1时为在线学习。

2. batch的选择，首先决定的是下降方向，如果数据集比较小，则完全可以采用全数据集的形式。这样做的好处有两点，

1）全数据集的方向能够更好的代表样本总体，确定其极值所在。

2）由于不同权重的梯度值差别巨大，因此选取一个全局的学习率很困难。

3. 增大batchsize的好处有三点：

1）内存的利用率提高了，大矩阵乘法的并行化效率提高。

2）跑完一次epoch(全数据集)所需迭代次数减少，对于相同的数据量的处理速度进一步加快。

3）一定范围内，batchsize越大，其确定的下降方向就越准，引起训练震荡越小。

4. 盲目增大的坏处：

1）当数据集太大时，内存撑不住。

2）batchsize增大到一定的程度，其确定的下降方向已经基本不再变化。

总结：

1）batch数太小，而类别又比较多的时候，可能会导致loss函数震荡而不收敛，尤其是在你的网络比较复杂的时候。

2）随着batchsize增大，处理相同的数据量的速度越快。

3）随着batchsize增大，达到相同精度所需要的epoch数量越来越多。

4）由于上述两种因素的矛盾， Batch_Size 增大到某个时候，达到时间上的最优。

5）过大的batchsize的结果是网络很容易收敛到一些不好的局部最优点。同样太小的batch也存在一些问题，比如训练速度很慢，训练不容易收敛等。

6）具体的batch size的选取和训练集的样本数目相关

分析原因: 2:数据输入不对

数据输入不对包括数据的格式不是网络模型指定的格式,导致训练的时候网络学习的数据不是想要的; 此时会出现loss曲线震荡;

解决办法: 检查数据输入格式,数据输入的路径;

原文链接：https://blog.csdn.net/yuanlunxi/article/details/79378301

你可能感兴趣的:(research)

使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
全球核酸样品制备市场展望：2030年预计达到6387.4百万美元恒州诚思CC 人工智能大数据数据库数据分析
随着全球生物技术和生物医药行业的迅速发展，核酸样品制备市场正逐渐成为一个重要的生命科学领域。据恒州恒思（YHresearch）团队的研究数据显示，2023年全球核酸样品制备市场规模已达到4158.5百万美元，并预计在未来六年内，该市场将以年复合增长率（CAGR）6.5%的速度增长，到2030年市场规模预计将达到6387.4百万美元。核酸样品制备主要用于提取和纯化DNA和RNA样本，以供后续的分子生
2024全球数字电影摄像机、相机、广播摄像机市场报告 8K超高清数码相机人工智能科技
一、全球数字电影摄像机市场规模①全球数字电影摄像机市场销售额市场调研机构恒州博智QYResearch统计，2022年全球数字电影摄像机市场销售额达到31.19亿元，2023年全球数字电影摄像机市场销售额达到33.7亿元，预计未来将持续保持平稳增长的态势，到2030年市场规模将接近53亿元，未来六年CAGR为6.3%。②全球主要数字电影摄像机制造商品牌全球主要的数字电影摄像机制造商包括阿莱、索尼、佳
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
2022-05-22 李雨轩l
Part11，从本单元中我学到的最重要的理念（精读和视听说分别总结）精读:有更多比实验好的方法去探索动物的智商视听说:梦想着去许多国外的城市看看2，我在本片文章／音频／视频中学到的怦然心动的单词（精读和视听说分别总结）精读:extensively广泛地controversy争论explore探索vet兽医research研究员keeper饲养员encounter遇到reveal展示feat技艺do
通过mvn dependency:tree 查看依赖树,解决依赖jar冲突问题常敲代码手不生 IDEA学习与实践
举例：E:\01workspace\chenxh\09research\rop\rop>mvndependency:tree[WARNING][WARNING]Someproblemswereencounteredwhilebuildingtheeffectivesettings[WARNING]'pluginRepositories.pluginRepository.id'mustnotbe'l
2019-02-05 ruicore
LeetCode274.H-Index.jpgLeetCode274.H-IndexDescriptionGivenanarrayofcitations(eachcitationisanon-negativeinteger)ofaresearcher,writeafunctiontocomputetheresearcher'sh-index.Accordingtothedefinitionofh-
Python 使用 Detectron2 进行目标检测 (Detectron2, CenterNet2, Detic) Eric Woo X Python AI Ubuntu python 目标检测开发语言
代码说明代码主要是一个用来演示如何使用Detectron2进行目标检测的脚本。它可以从摄像头或视频文件中读取图像，并应用指定的配置文件进行目标检测。其中，Detectron2结合了CenterNet2和Detic进行目标检测。主要库介绍Detectron2Detectron2是由FacebookAIResearch开发的一个用于目标检测和实例分割的开源库。它提供了一系列预训练模型和灵活的配置系统，
TPAMI 2024 | 无需多源证据的无监督领域自适应小白学视觉论文解读 IEEE TPAMI 深度学习 TPAMI IEEE 顶刊论文论文解读
EvidentialMulti-Source-FreeUnsupervisedDomainAdaptation题目：无需多源证据的无监督领域自适应作者：JiangboPei;AidongMen;YangLiu;XiahaiZhuang;QingchaoChen源码：https://github.com/SPIresearch/EAAF摘要多源自由无监督领域自适应（MSFUDA）需要从多个源模型中聚
如何高效记录并整理编程学习笔记？编织幻境的妖学习笔记
高效地记录和整理编程学习笔记是提高学习效率和巩固知识的重要手段。以下是一些建议，帮助你更好地管理你的编程学习笔记：一、选择合适的工具：数字笔记应用：如notion,evernote,onenote,roamresearch等，它们支持云同步，方便在不同设备间查看和编辑。文本编辑器：如vscode,sublimetext,notepad++等，适合编写纯文本笔记。markdown编辑器：如typor
云计算与分布式技术-常见云的比较 NicolasLearner 服务器云服务器云主机云服务云服务器阿里云腾讯云华为云
云南大学软件学院期中报告SchoolofSoftware,YunnanUniversity个人成绩学号姓名成绩学期:2019秋季学期课程名称:云计算任课教师:陆歌皓姓名:学号：年级:完成提交时间：2019年11月4日目录SchoolofSoftware,YunnanUniversity1云计算概念2什么叫做云计算?2云计算定义及分类2根据iiMediaResearch数据挖掘和分析机构所发论文分析
IROS2021投稿说明计算机视觉-Archer
IROSIntro,VenueandThemeTheIEEE/RSJInternationalConferenceonIntelligentRobotsandSystems(IROS)isapremierflagshipacademicconferenceinrobotics.Forover30-years,IROShasshowcasedleading-edgeresearch.Inhindsi
免费申请https的方法有哪些 AitTech https 网络协议 http
免费申请HTTPS的方法主要包括以下几种：一、通过免费的证书颁发机构（CA）Let’sEncrypt：简介：Let’sEncrypt是一个由InternetSecurityResearchGroup(ISRG)运营的开源证书颁发机构，提供免费的SSL/TLS证书。特点：免费且自动化，开源且广泛支持，自动续期。使用步骤：安装Certbot（一个自动化工具，用于获取和更新Let’sEncrypt证书）
FastReport .NET & FastReport.Core Crack SEO-狼术 Delphi net Crack 数据库
FastReport.NET&FastReport.CoreCrackKeyFeaturesofFastReport.NET:ItfunctionsalongwiththeinformationobtainedfromtheADO.NETandisallowedtofilterandsortthecolumnsofdatabeingresearched,utilizedalongwiththeir
向量数据库入坑：传统文本检索方式的降维打击，使用 Faiss 实现向量语义检索 soulteary 为了不折腾而去折腾的那些事 faiss 向量检索语义检索文本检索搜索引擎
在上一篇文章《聊聊来自元宇宙大厂Meta的相似度检索技术Faiss》中，我们有聊到如何快速入门向量检索技术，借助MetaAI（FacebookResearch）出品的faiss实现“最基础的文本内容相似度检索工具”，初步接触到了“语义检索”这种对于传统文本检索方式具备“降维打击”的新兴技术手段。有朋友在聊天中提到，希望能够聊点更具体的，比如基于向量技术实现的语义检索到底比传统文本检索强多少，以及是
ChatGPT 50个顶级指令 yjyang1990 人工智能
点击上方蓝字关注我们！新用户注册，送3天超级会员免费使用GPT-4.0，不限次数和字数GPT-4omini免费✔在线使用地址：https://ai.ninebotai.com免费使用方法：直接点击下方名片，关注NineBotAi公众号每天公众号发送消息：抽奖，兑换卡密点击左侧，切换AI模型，选择GPT-4omini改写的提示词指令英文提示词:Iamaresearcherstudying+(你的研究
向量数据库Faiss（Facebook AI Similarity Search） shiming8879 数据库 faiss 人工智能
向量数据库Faiss（FacebookAISimilaritySearch）是FacebookAIResearch开发的一款高效且可扩展的相似性搜索和聚类库，专门用于处理大规模向量数据的搜索和检索任务。Faiss以其出色的性能和灵活性，在图像检索、文本搜索、推荐系统等多个领域得到了广泛应用。以下将详细介绍Faiss的搭建与使用过程，包括安装、基本使用、索引类型选择、性能优化及应用场景等方面。一、F
向量数据库 Faiss 的搭建与使用 eqa11 数据库
向量数据库Faiss的搭建与使用一、引言在人工智能和大数据技术飞速发展的今天，向量数据库作为处理高维数据检索的关键技术，越来越受到重视。Faiss，作为由MetaAI（原FacebookAIResearch）开源的高效相似性搜索库，以其卓越的性能和灵活性，成为众多技术选型中的佼佼者。本文将深入探讨Faiss的搭建和使用，旨在为读者提供一个全面而详细的指南。二、Faiss简介与环境搭建1、Faiss
终于鼓起勇气给论文作者发送邮件要数据集和代码椒图图图图经验分享
渣硕+社恐鼓起勇气不容易，经过了一番思想挣扎。贴上整合的网络模板如下：Questionregardingtheimplementationof【问题】HiProfessor【教授】:Thankyouforreading!Iamasecond-yearundergraduateat【学校】University,China.Myresearchisfocusedon【研究】.Ihaverecently
当前主流的 ChatGPT 工具有哪些？圣逸人工智能专栏 chatgpt
目录1.OpenAIChatGPT概述特色应用场景优缺点2.MicrosoftAzureOpenAIService概述特色应用场景优缺点3.GoogleBard概述特色应用场景优缺点4.ChatGPTbyAnthropic概述特色应用场景优缺点5.其他值得关注的工具5.1.HuggingFace5.2.FacebookAIResearch(FAIR)5.3.自然语言处理科研界的其他项目总结随着人工
Vblog#1 English learning for science research 一粒咖啡
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档Englishlearningforscienceresearchintroduction一、GOALsin1month二、PlanseverydaySummeryintroductionIstartedtowritepaperinEnglishinordertoimproveabilityofEnglishandunderstand
SAM 2——视频和图像实时实例分割的全新开源模型知来者逆计算机视觉 SAM SAM 2 实例分割图像分割语义分割万物分割计算机视觉
引言源码地址：https://github.com/facebookresearch/segment-anything-2过去几年，人工智能领域在文本处理的基础人工智能方面取得了显著进步，这些进步改变了从客户服务到法律分析等各个行业。然而，在图像处理方面，我们才刚刚开始。视觉数据的复杂性以及训练模型以准确解释和分析图像的挑战带来了重大障碍。随着研究人员继续探索图像和视频的基础人工智能，人工智能图像
ENAS：首个权值共享的神经网络搜索方法，千倍加速 | ICML 2018 VincentTeddy
NAS是自动设计网络结构的重要方法，但需要耗费巨大的资源，导致不能广泛地应用，而论文提出的EfficientNeuralArchitectureSearch(ENAS)，在搜索时对子网的参数进行共享，相对于NAS有超过1000x倍加速，单卡搜索不到半天，而且性能并没有降低，十分值得参考来源：【晓飞的算法工程笔记】公众号论文:EfficientNeuralArchitectureSearchvia
【桥水研报】2022年全球展望：MP3政策的成功及不良后果 fry3251
原文地址：https://www.bridgewater.com/research-and-insights/our-2022-global-outlook-the-success-and-excesses-resulting-from-mp3-policiesMP3政策，也就是美联储自疫情以来的一系列宽松的货币与财政政策，已经生效了，把经济从大崩溃中拉了出来，并产生了提振以及持续的增长。经济产出
C# Onnx GroundingDINO 开放世界目标检测乱蜂朝王人工智能 c#目标检测开发语言
目录介绍效果模型信息项目代码下载介绍地址：https://github.com/IDEA-Research/GroundingDINOOfficialimplementationofthepaper"GroundingDINO:MarryingDINOwithGroundedPre-TrainingforOpen-SetObjectDetection"效果在运行程序时，要注意输入的提示词的格式，类
Regular Paper, Short Paper, Demo Paper 和Poster的区别艾思科蓝-何老师【H8053】计算机方向的国际学术会议人工智能软件工程算法深度学习机器学习大数据信息科学
RegularPaper,ShortPaper,DemoPaper和Poster是常见的四种会议论文的类别。期刊并没有ShortPaper,DemoPaper,或者Poster。总的来说，并没有一种规则来界定这四种论文类别。但是，大致上，RegularPaper或者ResearchPaper属于一种较完整的研究型论文。长度一般为8-12页。有时，较短一点的RegularPaper，可能只有6页。一
BUUCTF [SWPU2019]神奇的二维码 1 玥轩_521 BUUCTF MISC 安全 CTF 笔记网络安全 BUUCTF Misc
BUUCTF:https://buuoj.cn/challenges题目描述：得到的flag请包上flag{}提交。密文：下载附件，得到一个.png图片。解题思路：1、使用QRresearch扫一下，得到“swpuctf{flag_is_not_here}”的提示。2、放到010Editor中看一下，没找到什么明显的特征。使用Kali中的binwalk工具进行检测，发现四个rar压缩包。使用bin
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement