a609640147

ACL2019|最佳长论文|减小神经机器翻译训练与推理之间的距离

神经机器翻译(NMT)根据上下文单词来预测下一个词，并按照序列生成整个目标句子。在训练时，它以正确标注的单词作为上下文进行预测，而在推理时，它只能从头开始生成整个序列。训练和推理的差异造成了整个过程的误差累积。除此之外，词级别的训练要求生成的序列和正确标注的序列严格匹配，这会导致对不同于正确标注序列但是合理翻译的句子的过度校正。这篇文章提出了一种新颖的解决方法，在训练阶段，模型不仅从正确标注的序列中采样上下文单词，同时在预测生成的序列中采样上下文单词；在推理阶段，使用句级别最优的预测。

论文地址:
https://arxiv.org/pdf/1906.02448.pdf

引言

神经机器翻译模型在训练时，在训练时，它以正确标注的单词作为上下文进行预测，而在推理时，它只能从头开始生成整个序列。这样做的结果是训练和推理中的预测词分别来自不同的分布，训练来自于数据分布，推理来自于模型分布。这种差异被称为暴露偏差(Exposure Bias)，导致训练于推理之间的差距。随着目标序列的增长，错误会不断地在序列中积累。为了解决这个问题，直观来看，模型应该在与推理相同的条件下进行训练，在训练时使用正确标注的词和预测得到的词作为上下文可以作为一种解决方法。
NMT模型通常使用优化交叉熵损失的方法来进行训练，这需要预测序列和正确标注序列在词级别的严格匹配。一旦模型生成偏离正确标注序列的单词，交叉熵损失就会立即纠正错误并且让剩下的预测回归正确标注序列。这会导致一个新的问题：一个句子通常有多个合理的翻译，即是模型产生了与正确标注序列不同的词，也不能说模型犯了错误。但是这种强行校正却可能令预测序列产生语法或者意思上的错误，这个问题被称为过度校正(Over Correction)错误。

文章提出一种减小训练和推理之间距离的方法，并且提高模型对过度校正恢复的能力。文章首先从预测的单词中选择Oracle单词，然后从Oracle单词和正确标注的单词中进行抽样，所得的结果作为上下文进行训练。Oracle单词不仅仅通过单词贪婪搜索来选择，还是用句级的评估结果来选择，例如BLEU。在训练开始时，模型以更大的概率选择正确标注的单词作为上下文进行训练，随着模型收敛，模型以更大的概率选择Oracle单词作为上下文进行训练。通过这种方法，模型训练从完全引导变为较少引导，并且模型有机会学习处理推理中产生的错误，修正因为过度校正产生的错误。

模型结构

文章使用RNN-based NMT作为例子进行实验。假设输入序列为 $x=\{x_1,...,x_{|x|}\}$ ，翻译结果为 $y^*=\{y_1^*,...,y^*_{|y^*|}\}$

编码器

使用双向GRU作为编码器 $x_i$ 代表 $h_i=[\stackrel{\rightarrow}{h_i}, \stackrel{\leftarrow}{h_i}]$ ， $e_{x_i}$ 代表 $x_i$ 的embedding。

Attention

Attention用于提取源语言信息。在第 $j$ 步，目标词 $y^*_j$ 和第 $i$ 个源端词的相关度为

源端向量为

解码段

使用GRU的一种变体进行解码。第 $j$ 步，目标的隐藏状态 $s_j$ 为

目标词表的概率分布 $P_j$ 为

其中 $g$ 代表线性变换， $W_o$ 用来映射 $t_j$ 到 $o_j$ ，每一个目标词在 $o_j$ 中拥有一个对应维度。

结构图

步骤

如果预测第 $j$ 步的目标词汇 $y_j$ ，首先需要在第 $j - 1$ 步选择Oracle词汇 $y_{j-1}^{oracle}$ ，接下来在概率为 $p$ 的标注词汇 $y^*_{j-1}$ $和概率为$ $1 - p$ 的Oracle词汇 $y_{j-1}^{oracle}$ 中进行采样，最后使用采样所得词代替原始训练词 $y^*_{j-1}$ 进行训练和推理。

Oracle词汇选择

文章使用两种方法选择Oracle词汇：其一为在词汇级别使用贪婪搜索策略进行选择，其二为在句级别选择Oracle句，使用N-gram匹配Oracle句和标注序列，得到过度校正修复的能力。Oracle词汇应为标注词汇的近义词或者与标注词汇很相近。

词级别Oracle (Word-Level Oracle)

对于解码的第 $j - 1$ 步，一个选择Oracle词的直接方法为选择词汇分布 $P_{j-1}$ 中概率最高的词。但是这种方法鲁棒性不足。

使用Gumbel-Max方法可以更高效的从候选分布中进行抽样。Gumbel噪声，可以视为一种正则化，可以加在 $o_{j-1}$ 上，目标词 $y_{j-1}$ 的词汇分布近似为

其中 $\eta$ 为一元随机向量 $u U (0, 1)$ 计算得到的Gumbel噪声， $t a u$ 是温度。当 $t a u$ 接近0时， $s o f t m a x$ 方程与 $a r g m a x$ 类似，当 $t a u$ 接近无穷大， $s o f t m a x$ 方程接近一元分布。最后1-best词语由下式选择

Gumbel只用来选择Oracle词汇，对训练的损失方程没有影响。

句级别Oracle (Sentence-Level Oracle)

句级别的Oracle使用N-gram匹配，可令翻译变得更加灵活，同时选用BLEU作为句级别的参考。为选择句级别的Oracle，文章使用beam search得到每一个batch全部的候选句。在进行beam search的过程中，Gumbel噪声可以用于每一个词的生成过程。通过计算预测语句与标注语句的BLEU值，拥有最高值的预测语句被视为Oracle语句。令 $y^S=(y_1^s,...,y^S_{|y^S|})$ ，在第 $j$ 步解码，句级别的Oracle词为

但是预测语句并不一定与标注语句拥有同样的长度，所以文中使用Force Decoding的方法来确定两个语句拥有相同的长度。

Force Decoding

对于超过长度的预测语句，此方法会提前选择EOS结束预测，对于短于长度的预测语句，此方法会选择除EOS外最高概率的值继续进行预测。

Sampling with Decay

标注词汇和Oracle词汇的选择概率会随着训练进行改变，文章定义 $p$ 作为依据训练轮数 $e$ 的衰减方程：

其中 $\mu$ 为超参

训练损失方程

其中N为训练数据集中的句对数目， $y^n|$ 为第 $n$ 个标注句子的长度， $P^n_j$ 代表第 $n$ 句第 $j$ 步的预测概率分布，因此 $P^n_j[y^n_j]$ 为预测第 $j$ 步标注词汇 $y_j^n$ 的概率

实验

文章在中英NIST数据集和英德WMT14数据集上进行实验。
所得结果为

结论

端到端的NMT模式逐字生成翻译，但是仅仅使用标注词作为训练时的上下文，忽略的推理生成词作为训练上下文的情况。为减小训练和推理之间的差距，在于此一个单词时，文章使用一个采样方法选择标注词汇或者推理词汇作为训练上下文。除此之外，文章还提出词级别Oracle和句级别Oracle的选择，句级别Oracle可以进一步的为模型提供过度校正修复的功能，同时文章还指出句级别Oracle结果优于词级别Oracle

个人思考

文章针对端对端NMT模型训练和推理的差异进行了深入研究，提出了结合预测语句和标注语句进行训练的新方法。个人认为这种方法类似于一种语料增广的方法，即将训练语句进行微小并且合理的修改，并将修改语句加入到后续训练之中。除此之外，Transformer对编码端的修改大大提高了翻译质量，但是解码端依然使用之前的解码方法。将解码端与编码端的差异进行缩小可以很好的提升翻译质量，文章提供了一种很好的思路来实现这个想法。

ACL2019|最佳长论文|减小神经机器翻译训练与推理之间的距离_第16张图片

扫码识别关注，获取更多论文解读

你可能感兴趣的:(ACL2019|最佳长论文|减小神经机器翻译训练与推理之间的距离)

全链路跟踪关键技术-ThreadLocal txxs 架构
转自：https://github.com/alibaba/transmittable-thread-local/issues/123应用场景的文章Java多线程上下文传递在复杂场景下的实践byvivo互联网技术（海外商城租户区分）2021-02-01SpringSecurityOAuth2.0认证授权五：用户信息扩展到jwt2021-01-14再谈Token认证，如何快速方便获取用户信息By尹吉
荆门地区亲子鉴定收费费用标准大全(附2024年最新报价）国医基因陈主任
荆门地区亲子鉴定多少钱费用？荆门地区dna亲子鉴定收费费用标准在2000元到5000元之间不等，亲子鉴定按（鉴定用途、鉴定对象）大致可分为：司法亲子鉴定、个人亲子鉴定、无创胎儿亲子鉴定；荆门地区亲子鉴定中心收费标准如下：荆门国医基因亲子鉴定中心地址：荆门市象山大道67号1、荆门地区个人亲子鉴定费用：2000元-2600元元，一般3-7天出结果；2、荆门地区司法亲子鉴定费用：2600元-3200元元
今天最开心的事吴奕豪
今天，是放假的第二天。我很高兴，因为，今天我在奶奶家吃小鸡炖蘑菇了，蘑菇很好吃，鸡肉也很好吃。今天下午我在家吃西瓜啦！西瓜很凉快，又很甜。结果我忘了，我不能吃西瓜，我很难受，最后我把西瓜吐了。我妈妈说，你有病，别吃西瓜，我说，妈妈，我忘了，妈妈说有啥事不能忘，我说妈妈，我知道了。今天是2020年10月2日星期五
2024年阿里云服务器购买攻略：如何便宜购买阿里云服务器？阿里云最新优惠和活动汇总
在购买阿里云服务器时，很多用户以为通过阿里云的活动购买就是最便宜的了，毕竟活动价格通常都很低。然而，对于新手用户来说，可能并不知道如何确保自己购买的阿里云服务器是当下最便宜的。实际上，在购买之前，我们应该先比较阿里云各个活动中的云服务器价格，同时关注阿里云不定期推出的各种优惠券和代金券活动，先领券后购买，这样既能享受活动的低价，又能使用代金券或优惠券享受满减优惠，从而实现更加便宜购买阿里云服务器的
Agent架构与工作原理：理解智能体的核心机制 hdzw20 agent学习 ai 机器学习 agent 智能体
Agent架构与工作原理：深入理解智能体的核心机制AIAgent的核心组成部分一个完整的AIAgent通常由以下几个核心模块组成：1.规划模块（PlanningModule）规划模块是Agent的"大脑"，负责制定行动策略。它接收目标任务，分析当前状态，并制定一系列行动计划。规划可以是：短期规划：针对当前步骤的即时决策长期规划：面向整体目标的战略性规划动态规划：根据执行结果实时调整计划2.记忆模块
MySQL索引机制解析：B+树、索引类型与优化策略 hdzw20 mysql复习 mysql b树数据库
MySQL索引机制解析：B+树、索引类型与优化策略索引是MySQL数据库中提高查询效率的关键。深入理解索引的底层机制、不同类型及其优化策略，对于数据库性能调优和面试准备都至关重要。本文将围绕B+树、聚簇索引与非聚簇索引、索引下推、覆盖索引以及自适应哈希索引等核心概念进行阐述。1.B+树vsB树：为何MySQL选择B+树？B树（B-tree）和B+树（B±tree）都是常用的多路平衡查找树，它们旨在
MySQL存储引擎核心：了解Buffer Pool与Page管理机制 hdzw20 mysql 数据库
MySQL存储引擎核心：了解BufferPool与Page管理机制1.BufferPool：数据库的高速缓存1.1基本概念作用：缓存表数据与索引数据，减少磁盘IO组成：缓存数据页（Page，默认16KB）控制块（约800字节，记录表空间、页号、缓存页地址等）默认大小：128MB（控制块额外占用约5%内存）1.2工作流程查询过程：通过哈希表（Key=表空间号+页号）判断页是否在BufferPool缓
许志安黄心颖出轨！香港专一男艺人还有谁？刘德华周润发榜上有名圈老九
近日，许志安和黄心颖的“安心事件”引起网友热议！许志安和黄心颖先后道歉，而马国明和郑秀文也做出了回应。虽然感情是个人的，旁人无法做太多评论，但也正是因为“安心事件”，让我们再次对出轨这个问题重视起来。娱乐圈总有吃不完的“瓜”，前有文章，陈浩民等男艺人，后有张丹峰等人还没回应，所以除开内地，如今香港男艺人中“专一”的还有谁？首先让人想到的是刘德华，他和朱丽倩认识超过30年，婚后育有女儿刘向蕙。朱丽倩
Python训练 + Go优化 + C#部署：端到端AI模型的跨语言实践威哥说编程人工智能学习资料库 python golang c#
在现代AI应用中，如何高效地训练、优化、并最终部署AI模型是一项复杂且具有挑战性的任务。在这一过程中，选择合适的编程语言和工具可以显著提高效率和系统的性能。Python作为AI领域的主流语言，具有丰富的深度学习框架（如PyTorch和TensorFlow），在模型训练方面处于领先地位。然而，针对计算密集型任务（如数据预处理、加密等），Go语言因其高效的并发处理和出色的性能，成为优化计算的理想选择。
自律从早睡早起开始邱兰芳
空闲时翻阅网文，大篇幅的都在说自律。自律到底是什么？可以统一答案“早睡早起”百度搜索：自律，出自《左传·哀公十六年》，指在没有人现场监督的情况下，通过自己要求自己，变被动为主动，自觉地遵循法度，拿它来约束自己的一言一行。指不受外界约束和情感支配,据自己善良意志按自己颁布的道德规律而行事的道德原则。朴素简洁的说，自律就是自我约束。有没有数据标准？好像很难定义。我自律的唯一标准就是早睡早起。只要能做到
PyQt6基础_pyqtgraph_横向柱状图程序猿与金融与科技 PyQt6基础 PyQt6 pyqtgraph
效果：效果图显示的是2025Q1申万行业1，各行业的总资产柱状图代码：#-*-coding:utf-8-*-importnumpyasnpfromPyQt6.QtGuiimport(QColor)fromPyQt6.QtWidgetsimport(QApplication)importpyqtgraphaspgclassGraphHorizonalBarWidget(pg.PlotWidget):
适合女生的五大高薪职业哪些工作前景好氧惠购物达人
这几年每一位女性消费者们也希望个人的经济独立，这样就能够有花钱的自由，而且也能够展现出自己的魅力。那么女人在家干点啥最挣钱？1、开展一家小型的加工厂虽然说女人的体力不如男的高，但是现在很多的女性消费者们在做事情的时候并不比男性差，经营者们就可以在家经营一家小型的加工厂，比如说服装加工厂。2、制作手工工艺品总共一品这几年得到了迅速的发展，很多的消费者们对于手工艺品是非常的喜欢，不少的手工艺品进入到市
在人间笔趣阁免费小说-主角为阿伟林秀芳柳娇娇的小说全文在线赏析一米文库2
在人间笔趣阁免费小说-主角为阿伟林秀芳柳娇娇的小说全文在线赏析主角配角：阿伟林秀芳柳娇娇小说别名：在人间、人间乐事、人间芳韵简介：“嗯~~阿伟，你好强壮……”芳姨喝多了酒，被我搀扶着艰难的往卧室走去。她身上香喷喷的，温香软玉靠在我身上，性感的红唇几乎贴着我的脖子，在我耳边吐气幽兰……正文：“嗯~~阿伟，你好强壮……”芳姨喝多了酒，被我搀扶着艰难的往卧室走去。她身上香喷喷的，温香软玉靠在我身上，性感
不可多得的风味小吃——读杨勇的《家园四书》（笔记4）潜2023
身为亳州人，谁不喜欢了解亳州事？读杨勇先生（雅不知）的《家园四书》，相当于走进了亳州，了解她的过去和现在。《家园四书》总共有四部分组成，每一部分都是一道亳州风味的小吃，让你了解亳州的同时，更能咀嚼出她的美。《历史书：明月前身》写了亳州诸多历史人物。写得厚重大气，篇篇有铮铮铁骨，文笔刚劲有力，也不乏诙谐，偶有文白相间之处，读来很有韵味，像作者的书法，需得细细地品。它是亳州的肉夹馍，咔吱一口咬下去，满
磨课心得爬坡启动
这几天，严格的说是一个星期以来，参加中心学校选送县级参赛教师的磨课。参赛课题是人教版小学数学三年级上册分数单元的《认识几分之几》到《分数的简单应用》共五个课题中的一个。今天早上已经抽签定下来，我们乡镇参赛教师抽到的课题是五个参赛课题的第二个课时——《同分母分数大小的比较》，所以这个课题今天下午又给这位参赛老师听了第二遍。通过这几天参与磨课，收获颇多，简要记录于下。一、进一步认同了黄爱华老师所说的“
深度解析：阿里云服务器ECS计算型c7性能CPU内存、带宽和存储测评阿腾云
深度解析：阿里云服务器ECS计算型c7性能CPU内存、带宽和存储测评，ECS计算型c7实例性能测评，CPU采用第三代IntelXeon可扩展处理器（IceLake），基频2.7GHz，全核睿频3.5GHz，计算性能稳定；c7云服务器依托第三代神龙架构，提供稳定可预期的超高性能。同时通过芯片快速路径加速手段，完成存储、网络性能以及计算稳定性的数量级提升。阿里云服务器网aliyunfuwuqi.com
Android bootanimation动画制作和验证小姜的android之旅 Android bootanimation bootanimation
Android开机动画使用bootanimation程序显示开机画面，只需按格式要求做bootanimation.zip包，放在系统的/system/media目录中。开机画面主要是由一个zip格式的压缩包bootanimation.zip组成，压缩包里面包含数张png格式的图片，还有一个desc.txt的文本文档，开机时按desc.txt里面的指令，屏幕上会按文件名称顺序连续的播放一张张的图片，
博文书院赵春柳碳资产是正规的吗?亏损被骗损失惨重真相曝光墨守成法
网络骗局中投机心态和急于成功是很多人的特点，一些受骗者可能具有投机心态，希望通过投资或参与某项计划快速致富。他们渴望一夜暴富，急于达到自己的成功目标。这种心态容易使他们冲动行事，没有耐心和理性思考，更容易上当受骗！你的博文书院赵春柳“碳资产账户“余额”是真的吗？为什么不能提现呢？其实都是骗子给你的一串数字而已！最近曝光骗子假冒赵春柳！利用赵春柳的名气在顺尧价投会股票交流群带股民参加所谓的慈善投票比
怎么充话费便宜？充话费怎么充划算？高省APP珊珊
充话费便宜且划算的方法有多种，以下是一些建议：一、选择优惠活动运营商官方活动：运营商（如中国移动、中国联通、中国电信）会定期推出充值优惠活动，如满减、折扣券等。关注运营商的官方网站、APP或社交媒体账号，可以及时了解这些活动信息。例如，中国移动曾在特定时间段内推出88折话费充值券活动，用户抢到充值券后，充值50元即可减6元。返利APP和网站：使用返利APP（如高省、氧惠、直返、麦芽妈妈）进行话费充
任何时候都不要放弃希望南海北
晚上嫂子就要回江苏了，总共在家里住了四天左右吧，虽然家里经历了一些事情但是他对这个家还是挺好的，给我们四个人一个人买了一双鞋，想的很周到。刚刚嫂子坐车走了，正好坐一夜车正好就到了，明天还要考科目四，安排的很妥当。总的来说嫂子也算是一个女强人了，一个人在外面自己做饭，一个人去上班，有着自己的人生规划，先考驾照再去学月嫂。我挺佩服嫂子的，虽然经过了一些挫折，但是仍然不放弃希望。风雨之后的彩虹才更美，我
高省的邀请码怎么获取小心坑码获得高省邀请码步骤! 凌风导师
写点什么..推荐填联合创始人邀请码500888直升2皇冠，佣金更高，升级无忧，送万元推广大礼包，教授百度霸屏、强势引流技术！高省-各大应用商城下载即可-购物领劵返利高，邀请码切记填500888，凌风高省邀请码500888，全网唯一教你技术的老师码填对码直送2皇冠总裁等级，《凌风导师V:125130414》送价值百万引流技术推广绝密大礼包，也可以后台联系老师进高省官方群。星巴克说：每分享保举位新主顾
免费小说全本阅读青云官道庄岩柳琴_青云官道庄岩柳琴免费阅读无弹窗 d1932dbc5104
《青云官道》主角：庄岩柳琴，简介：小科员庄岩，因一纸调研报告被副市长赏识，本以为能够就此走上人生巅峰，结果副市长就被双规！不过庄岩非但没有被牵连，反而拿着副市长留下的东西，不仅抱得美人，还平步青云，扶摇而上九万里！庄岩本来还想再细问一下赵心颖到底有什么背景，周开济的手机突然响了！周开济掏出手机接通，下一刻脸色一变，对着手机沉声问道：“你说什么？刘战被纪委的带走了？什么时候的事？我知道了，等我几分钟
女人会如何挑选追求她的男人？有5种淘汰测试百里子清
文|百里子清专栏主要分享追女人相关的小知识、小技巧、小经验。帮助大家解决追求女人所遇到的各种问题，让大家追到自己心仪的姑娘。相信有不少男人听说过女人的“淘汰测试“。有些人管这个也叫”废物测试“。不管是怎么称呼。总之，女人面对追求她的男人，必定会设置一些考验。她们有自己的想法。她们会根据自己的想法来考察男人。如果这个男人，能够通过她的考察。那么，她才会考虑答应男人的追求。而对于男人来说，我们自己要明
哪种粉底液好用？最好用的粉底液排行榜前十名测评君高省
粉底液是我们日常化妆必不可少的产品，好的粉底液不仅对皮肤比较好，而且能够让我们的妆容更加精致持久，那么哪些粉底液是公认最好用的呢?今天小编为大家盘点了最好用的粉底液排行榜前十名，一起来看看吧!从哪里买便宜呢？通过高省APP（官方邀请码518518）购物，领券还能返佣！超级便宜~！分享赚钱，自用省钱！！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，
手机兼职平台正规app有哪些？用手机做的正规兼职古楼
很多用户想在自己空闲的时候找一份兼职的工作来赚一些零花钱，今天小编就来介绍一下找兼职哪个app靠谱2022，以方便用户们更快的找到一款合适的找兼职工作app。用户可以根据自己的需求下载不同的兼职app，以下是最新能找靠谱兼职的app前十名。1、高省app使用【高省app】网购，更便宜更划算！高省app上每天都有大额内部优惠券，还有返利佣金，而且高省的返利佣金在全网超高的！手机应用商城搜索【高省】直
《度五行》生活报报壬子140：浪的好可以引领新潮流，创造新时代 YangduSam2021
221026壬寅庚戌壬子，20221026，周三，兴大上海六班2590天，西交大2013上海班3290天，后TA15410天，度生活700天，《度.生活五行》:天干金生水，壬壬反吟。地支寅戌合。浪，什么叫做浪？你觉得什么是浪？浪一般用来形容人表现出玩世不恭、自信膨胀、不按常理出牌的行为和心理状态，带有无所谓、我行我素、行为随意、举止轻佻的意味。浪用做动词的时候，是玩的意思。一般被他人用“浪”字形容
长沙正规亲子鉴定办理-亲子鉴定中心地址大全（附2024年更新办理流程攻略）中量国鉴知识科普
在生活中，亲子鉴定有时成为解开疑惑、确认亲缘关系的关键需求。当身处长沙这座繁华都市，人们常常会困惑：长沙正规亲子鉴定在哪里可以办理呢？毕竟，亲子鉴定是一件严肃且重要的事情，需要专业、可靠的机构来进行操作。选择正规的亲子鉴定机构，不仅关乎结果的准确性，更涉及到个人隐私的保护和法律的权威性。那么，让我们一同来探寻长沙那些可以放心办理亲子鉴定的地方。长沙亲子鉴定在哪里可以办理？长沙亲子鉴定可以到“长沙中
侯府千金本小姐多财又多亿李知月程长宴完整版免费阅读_李知月程长宴精彩小说热门小说_5
书名：侯府千金本小姐多财又多亿主角：李知月程长宴简介：醒来后，她发现自己成为了一个家族即将破产的败家女。面对朝廷的流放，她决定依靠自己，将家族中的纨绔子弟培养成才子。可以关注微信公众号【书香名斋】去回个书名或主配角，即可免费阅读【侯府千金本小姐多财又多亿】小说全文！>>>>>>>>>>戳我继续阅读>>>>>>>>>戳我继续阅读>>>>>>>>>戳我继续阅读>>>>>>>>>戳我继续阅读<<<<<<
WorkPlus聊天群伍戈的low carbon-碳中和伍戈碳排放不够出金受阻，不要再上当了! 法律咨询维权
随着互联网的普及和金融科技的发展，越来越多的人开始使用线上平台进行投资、交易等活动。然而，一些不法分子也利用这些平台实施诈骗行为，给投资者带来了巨大的损失。本文将介绍一种常见的骗局——黑平台无法出金，以帮助大家提高警惕性，避免上当受骗。推荐网上投资理财、炒*的、做外汇的、炒数字货币、虚拟币慈善投票网站买数字的等等都是，广大市民对此要提高警惕，遇到此类情况一概不要相信。（注明：该文章出现名字为网上冒
大脑也需要休息，需要保养剑飞在思考
image1有没有这种感觉，就是在晚上10点以后，如果有事情没有立刻去做，就会拖拖拉拉。为什么不鼓励熬夜呢？因为晚上这段时间，人的整体意志力不是特别强。从时间安排角度来说，强度和质量都不够。早一点睡，早一点起，反而会更好一些。每天衡量效率高不高的一个标准，不是看睡之前多么疲劳，而是多么不疲劳。在时间记录体系里，有一个标签是『健康休闲』。“休息一下”，是指发呆的情况，或者是大脑不知道做了什么，不知道
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他