oldmao_2001

深度之眼Paper带读笔记NLP.17：GNMT

文章目录

前言
第一课论文导读

神经机器翻译简介
神经机器翻译相关方法（之前有，看带读15课）

多层LSTM模型
Attention
处理OOV词

前期知识储备

第二课论文精读

论文整体框架
模型

残差连接
双向LSTM
束搜索

实验和结果

数据集
实验结果

讨论和总结

前言

Google’s Neural Machine Translation System：Bridging the Gap between Human and Machine Translation
谷歌的神经机器翻译系统
作者：Yonghui Wu et al.
单位：Google
发表会议及时间：2016
在线LaTeX公式编辑器

a. 神经机器翻译的概念
神经机器翻译就是通过端对端的神经网络使得机器能够自动将一种语言的句子翻译成另外一种语言的句子。
b. 三种神经机器翻译模型
了解基于多层LSTM、attention、处理OOV词的三种神经机器翻译模型。
c. 了解Seq2Seq模型
当前的神经机器翻译模型都是基于端对端的Seq2Seq结果，包含一个Encoder和一个Decoder，Encoder将源语言压缩成一个向量，而Decoder利用源语言压缩得到的向量生成目标句子。
d. 谷歌的神经机器翻译系统
理解谷歌神经机器翻译系统的细节，包括模型的总体结构，attention，残差连接，底层的双向LSTM以及改进的Beam Search等。
e. 谷歌神经机器翻译系统实验结果
深入理解论文突出的谷歌神经机器系统的实验结果。

第一课论文导读

神经机器翻译简介

神经机器翻译：通过端对端的神经网络模型将一种语言的句子翻译成另外一种语言。
意义：解决人与人之前的交流问题。

神经机器翻译相关方法（之前有，看带读15课）

多层LSTM模型

输入逆序。

Attention

来自之前读过的：Neural Machine Translation by Jointly Learning to Align and Translate
Encoder：单层双向LSTM。(就是下图中下面两层方框)
Decoder：
对于输出：
$p(y_i)=g(y_{i-1},s_i,c_i)$
对于 $c_i$ ：
$c_i=\sum_{j=1}^{T_x}a_{ij}h_j,a_{ij}=\frac{exp(e_{ij})}{\sum_{k=1}^{T_x}exp(e_{ik})}$
$\space e_{ij}=a(s_{j-1},h_j)$

处理OOV词

OOV词就是out-of-vocabulary词，文中提出在翻译之后，对于翻译结果中的unk词找到源语言句子中的对应词，然后直接将源语言中对应unk词的词用词典翻译。

REF:Addressing the Rare Word Problem in Neural Machine Translation

前期知识储备

了解Seq2Seq模型
·本文讲的谷歌机器翻译模型就是基于Seq2Seq模型，Seq2Seq模型有一个Encoder和一个Decoder，可以参考：
https://zhuanlan.zhihu.com/p/57155059

第二课论文精读

论文整体框架

这个论文非常长长长长的（23 pages）
摘要
1.介绍
2.相关工作
3.模型
4.词分割方法（如何处理OOV）
5.目标函数
6&7.加速推理&解码器
8&9.实验结果&结论

模型

模型分别由8层encoder和8层decoder组成

先看左边的encoder，最下面两层是双向LSTM（就是GPU1和GPU2对应的那里），后面每层都是单向的LSTM。最后的结果用于最后的Attention。Attention是单隐层的感知机（中间蓝色部分），就是一个隐层一个输出层。然后接上decoder中的y1到y3得到的结果用于后面的每一层。
$s_t=AttentionFunction(y_{t-1},x_t),\forall t,1≤t≤M$
$p_t=\frac{exp(s_t)}{\sum_{t=1}^Mexp(s_t)},\forall t,1≤t≤M$
$a_i=\sum_{t=1}^Mp_t\cdot x_t$

残差连接

由于层比较多，为了防止梯度消失，加入了残差连接模块

$c_t^i,m_t^i=LSTM_i(c^i_{t-1},m^i_{t-1},x^i_{t-1};W^i)$
$x_t^i=m_t^i$
$c_t^{i+1},m_t^{i+1}=LSTM_{i+1}(c_{t-1}^{i+1},m_{t-1}^{i+1};W^{i+1})$
其中i代表第几层， $x_t^i$ 是t时刻 $LSTM_i$ 的输入， $m_t^i$ 和 $c_t^i$ 分别是t时刻 $LSTM_i$ 隐层状态和记忆单元状态，加入了残差连接后，上面的公式变成了：
$c_t^i,m_t^i=LSTM_i(c^i_{t-1},m^i_{t-1},x^i_{t-1};W^i)$
$x_t^i=m_t^i+x_t^{i-1}$
$c_t^{i+1},m_t^{i+1}=LSTM_{i+1}(c_{t-1}^{i+1},m_{t-1}^{i+1};W^{i+1})$
这样梯度就可以不通过LSTM直接从前一层传到后一层。

双向LSTM

一个LSTM是正向，一个LSTM是反向的，然后把他们的结果进行concat，双向LSTM计算量是比较大的，所以没有在所有后面的模型结构中使用，而是在第一层使用了。

束搜索

其中lp是让模型倾向于长句结果例如：

cp是在等长结果的情况下，倾向于每个结果与原文的每个词更加匹配的结果，例如：

两个超参数α和β变化与结果的关系

实验和结果

数据集

WMT English to French：包含36M英语到法语的双语语料，是机器翻译领域最常用的语料之一。
WMT English to German：包含5M英语到德语的双语语料，机器翻译领域最常用的

实验结果

结果解读老师的mic听得要吐血，自己看文章吧。

讨论和总结

本篇论文的主要贡献？
本文提出的GNMT使用多种技术大大超越了传统的基于短语的统计翻译模型。
GNMT的优点？
GNMT是使用当时神经机器翻译的集大成者，使用多种神经机器翻译技术大大超越了PBMT（传统基于统计的机器翻译模型）。
后来的改进模型？
后面的改进有改进LSTM，有改进Beam Search，还有词分割等等。
创新点：
A.提出了一种新的端对端神经翻译模型。
B.使用了多种技术使得其成为谷歌翻译的核心技术。
C.在多个数据集上达到了最好结果。

你可能感兴趣的:(Paper带读)

语言大模型综述
Paper:ASurveyofLargelanguageModels目录Paper:ASurveyofLargelanguageModels综述概要LLM关键技术规模定律（ScalingLaws）预训练与微调对齐调优（AlignmentTuning）外部工具集成GPT系列模型的技术演进模型检查点和APIPre-Training数据准备和处理数据准备数据预处理数据调度架构EmergentArchit
【附源码】基于flask框架求职招聘网站 (python+mysql+论文)
本系统（程序+源码）带文档lw万字以上文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景：随着互联网技术的飞速发展，网络求职招聘已经成为了现代人才市场的一大趋势。传统的求职招聘方式逐渐被线上平台所取代，这主要得益于网络平台的便捷性、实时性和广泛性。然而，现有的求职招聘网站虽然数量众多，但质量参差不齐，用户体验也各不相同。一些求职者和招聘者在面对海量信息时，往往会感到无所适从，
Aurora中插入伪代码的字体设置
中文：宋体英文：TimesNewRoman公式：LatinModernMath，跟包newtxmath有关word里面插入对象-->选择AuroraEquation-->Properties-->Packages，复制以下代码：%!TEXprogram=xelatex%强制使用XeLaTeX引擎\documentclass[a4paper]{article}%\usepackage{mathptm
【LeetCode 热题 100】234. 回文链表——快慢指针+反转链表 xumistore LeetCode leetcode 链表算法 java
Problem:234.回文链表题目：给你一个单链表的头节点head，请你判断该链表是否为回文链表。如果是，返回true；否则，返回false。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表问题：回文链表(PalindromeLinkedList)。问题要求判断一个单链表是否是回文结构，即从前向后读和从后向前读的序列是否相同。例如1
基于python+flask框架的某图书馆书籍推荐系统的设计与实现（开题+程序+论文）计算机毕设 zhihao502 python flask 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景在数字化时代，图书馆作为知识传播与积累的重要场所，面临着如何更有效地服务于广大读者的挑战。随着信息量的爆炸式增长，读者在浩瀚的书海中寻找符合个人兴趣和需求的书籍变得日益困难。传统的图书检索方式已难以满足读者快速、精准获取推荐书籍的需求。因此，开发一套智能化的图书馆
【Python】Python 3.10 新特性月落一寸光 Python新特性 python 开发语言
文章目录前言：一、新特性1.1PEP617；带括号的上下文管理器1.2更清楚的错误消息1.3PEP634：结构化模式匹配（match）1.4PEP604：有关类型提示的新增特性1.5PEP613：类型别名二、改进的模块2.1`asyncio`2.2`argparse`2.3`base64`2.4`collections.abc`2.5`dataclasses``__slots__`2.6`trac
【一起来学AI大模型】支持向量机（SVM）：核心算法深度解析运器123 AI大模型支持向量机机器学习人工智能 ai 大数据 AI编程算法
一、算法核心思想支持向量机（SVM）是一种强大的监督学习算法，核心思想是通过寻找最优超平面实现分类或回归：分类目标：找到能最大化两类数据间隔的超平面回归目标：找到包含最多数据点的ε带关键概念图解超平面：w·x+b=0/\/\+1|支持向量|-1|●●||●●||●●||_________________|最大间隔(margin)二、数学原理与优化问题1.线性可分情况目标函数：\min_{w,b}\
[特殊字符] Excel 读取收件人 + Outlook 批量发送带附件邮件 —— Python 自动化实战 happydog007 python自动化办公 excel outlook python
许多公司定期需要将不同部门或客户的报告发送给指定人员。手动操作容易出错、耗时且繁琐。今天这篇文章教你如何利用Python实现：从Excel中读取“收件人+抄送人+附件文件路径”；使用win32com.client调用Outlook自动生成并发送邮件；✅附加模板正文，并保持批量发送规范无需手工操作。从Excel中读取部门、收件人与附件路径fromopenpyxlimportload_workbook
C++编程语言入门指南 jdlxx_dongfangxing c++
一、C++语言概述C++是由丹麦计算机科学家BjarneStroustrup于1979年在贝尔实验室开发的一种静态类型、编译式、通用型编程语言。最初被称为"CwithClasses"(带类的C)，1983年更名为C++。它既具有高级语言的抽象特性，又保留了底层硬件操作能力，被广泛应用于系统软件、应用软件、驱动程序、嵌入式软件、高性能服务器和客户端应用以及娱乐软件等开发领域。作为C语言的超集，C++
MySQL性能调优实战指南：从踩坑到精通，让数据库“跑”起来！码不停蹄的玄黓数据库 mysql MySQL调优
引言作为后端开发/DBA，你是否也经历过这样的崩溃时刻？业务高峰期数据库CPU飙到90%，慢查询堆成山；主从延迟严重，读操作频繁超时；批量插入数据时，应用卡成“PPT”；优化了半天索引，查询还是慢……别慌！今天这篇文章结合个人数据库调优经验，从架构设计→配置调优→索引优化→SQL诊断→硬件加持全链路拆解，带你彻底搞定MySQL性能瓶颈！一、先搞清楚：你的数据库到底“卡”在哪？优化前必须做的一步：定
SQLite和MySQL数据库的区别与应用坚持学习的小菜鸟数据库
简单来说，SQLITE功能简约，小型化，追求最大磁盘效率；MYSQL功能全面，综合化，追求最大并发效率。如果只是单机上用的，数据量不是很大，需要方便移植或者需要频繁读/写磁盘文件的话，就用SQLite比较合适；如果是要满足多用户同时访问，或者是网站访问量比较大是使用MYSQL比较合适。下面详细介绍两者的区别和应用：SQLiteSQLite是非凡的数据库，他可以进程在使用它的应用中。作为一个自包含、
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
反向传播神经网络极简入门自信哥
单个神经元神经网络是多个“神经元”（感知机）的带权级联，神经网络算法可以提供非线性的复杂模型，它有两个参数：权值矩阵{Wl}和偏置向量{bl}，不同于感知机的单一向量形式，{Wl}是复数个矩阵，{bl}是复数个向量，其中的元素分别属于单个层，而每个层的组成单元，就是神经元。神经元神经网络是由多个“神经元”（感知机）组成的，每个神经元图示如下：这其实就是一个单层感知机，其输入是由和+1组成的向量，其
Gemini CLI：AI工程师的黄金规范框架 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 语言模型 python 深度学习人工智能机器学习
GeminiCLI的系统提示词：高阶工程规范+安全边界控制+工具编排能力GeminiCLI的系统提示词，它是AI工程师的黄金范本，可看作“高阶工程规范+安全边界控制+工具编排能力”的完整框架，具体内容如下：核心目标：让AI作为专注软件工程任务的交互式CLI代理，遵循指令、利用工具，安全高效地协助用户。核心准则：读改代码要遵守项目规范，验证库和框架的可用性，模仿现有代码风格，修改要自然融入项目，谨慎
RocksDB深度指南：从LSM树原理到时序键优化涵树_fx Rust 实战架构设计 rust 后端时序数据库
RocksDB确实很适合这种中等规模的配置数据存储场景，它比文件存储更高效，又比独立数据库更轻量。除此之外，它还具有下面这些优点：支持原子写入操作，避免文件存储可能出现的写入中断问题读操作支持无锁并发，效率非常高支持列式存储，带来了更加丰富的数据管理和查询能力内置压缩功能，可以节省存储空间支持快照功能，方便配置回滚当然，我选择RocksDB的原因是我不希望因为存储配置相关的数据而依赖传统意义上的数
STM32-内存运行原理与RAM执行实战东方少爷内存地址单片机嵌入式硬件 arm开发硬件工程 stm32
一、底层原理深度解析（先懂“为什么要拷贝”）1.存储介质本质差异（ROM/FlashvsRAM）ROM（以STM32内部Flash为例）：物理特性：电可擦写非易失性存储（虽叫ROM，实际可通过编程改写），擦写次数有限（一般万次级别），读速度慢（STM32F1系列Flash读取周期约30-50ns）。存储内容：程序代码（指令）、只读常量（const修饰的全局变量、字符串字面量）、初始化的全局变量（R
Python实例题：基于 Flask 的在线聊天系统
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目基于Flask的在线聊天系统要求：使用Flask框架构建一个实时在线聊天系统，支持以下功能：用户注册、登录和个人资料管理一对一实时聊天功能群聊功能消息通知和未读消息提示在线用户状态显示使用Flask-SocketIO实现实时通信。使用SQLite数据库存储用户、聊天记录等信息。添加美观的前端界面，支持响应式设计。解题思路：使
DeepSeek AI全面应用：AI时代的高效办公与创意生产指南 Want595 人工智能 deepseek
京东链接：https://item.jd.com/15045868.html当当链接：https://product.dangdang.com/29893005.html文章目录写在前面核心亮点1.直击痛点：从“低效搬砖”到“智能掌控”2.创意觉醒：让AI成为你的“灵感引擎”3.跨平台协作：无缝衔接AI生态4.实战驱动：130+案例，即学即用5.超值资源包：扫码即得适合谁读1.职场人2.创作者/自
Redis分片集群原理
1.为何需要分片集群？让我们先快速回顾一下Redis扩展的演进过程：单机Redis：最简单，但也最受限于服务器的物理资源（CPU、内存、网络带宽）。一旦宕机，服务完全中断。主从复制：通过设置一个主节点和多个从节点，实现了读写分离，提高了读并发能力，并提供了数据冗余以应对主节点故障。但所有数据仍存储在主节点上，内存容量和写性能依然受限于单个服务器，无法无限扩展。当业务数据量达到数十GB甚至TB级别，
Entity Framework 实体数据模型入门：从创建到实战应用 Leon@Lee 数据库
EntityFramework（简称EF）作为.NET平台下的ORM（对象关系映射）框架，极大地简化了数据库操作。本文将由浅入深，带您一步步了解EF实体数据模型的创建、配置、开发与使用，即使是新手也能快速上手。一、EF与ADO.NET：为何选择EF？在介绍EF之前，我们先看看传统的数据访问方式与EF的区别：ADO.NET的局限：直接编写SQL语句操作数据库，需要手动处理类型转换、SQL拼接等问题，
基于STM32C8T6的智能小车陌沫不是momo stm32 arm开发单片机
有幸赶上了今年的电赛，赛前用了一周多的时间准备迷宫小车赛题，苦于摄像头刚刚入门并不能实际应用，只能用红外传感器做出个半成品。制作小车的硬件清单：（1）小车框架小车底层版*1、顶层版*1、面包板*2、、车轮*2、万向轮*1（2）小车设备STM32C8t6核心板*1、TB6612电机驱动*1、0.96OLED、JDY-31蓝牙模块、TCRT5000红外摄像头*6、电池、电机（带编码器）*2一、小车框架
前端页面结构介绍斯kk 前端前端
前端页面中常见的标签结构通常遵循HTML5标准，以下是典型的结构分类和示例：1.文档基础结构页面标题：声明文档类型。：根标签，通常包含语言声明（lang属性）。：存放元数据、引用的CSS/JS等。：页面可见内容。2.内容分区标签网站页眉（Logo/导航）主导航链接独立内容（如博客文章）内容区块（通常带标题）侧边栏/附加内容页脚（版权/联系方式）语义化标签：HTML5引入的语义化标签，提升可读性和S
Typora快速上手Markdown编写 TT-Kun Mine markdown typora
文章目录Markdown编写指南（以Typora为例）==前言：==一、标题快捷键二、段落1、换行/段2、分割线三、文字显示1、字体2、上下角标3、转义\解决解析冲突问题四、列表1、无序列表代码及效果：2、有序列表**代码及效果**：3、任务列表（方框，带勾方框）**代码及效果**五、Quote区块显示六、Code代码显示1、行内代码2、代码块及高亮（1）直接创建高亮代码块（2）设置不在代码块中的
淘宝卖什么比较好？资源客淘宝卖什么比较好新手开店
在淘宝平台经营时，选择具有市场潜力且符合平台生态的商品品类是成功的关键。结合当前消费趋势、平台数据及用户需求，以下品类具有较高的商业价值和发展潜力：‌一、高潜力消费品类‌‌美妆与个人护理‌‌核心优势‌：消费者对美妆产品的需求持续增长，尤其注重成分安全性和品牌口碑。护肤、彩妆、美发工具等细分领域存在机会。‌策略建议‌：优先选择具有差异化或创新性的产品（如天然成分、便携设计），结合直播带货和内容营销提
10分钟掌握Python缓存
项目背景代码检查项目，需要存储每一步检查的中间结果，最终把结果汇总并写入文件中在中间结果的存储中可以使用context进行上下文的传递，但是整体对代码改动比较大，违背了开闭原则也可以利用缓存存储，处理完成之后再统一读缓存并写入文件在权衡了不同方案后，我决定采用缓存来存储中间结果。接下来，我将探讨Python中可用缓存组件。python缓存分类决定选择缓存，那么python中都有哪些类型的缓存呢?1
无盘服务器万兆网卡吃鸡报错,FAQ-Hardware 服务器万兆网卡插槽引起网络慢、卡问题的排查、分析就解决... 俄罗斯一只战斗鸡无盘服务器万兆网卡吃鸡报错
网络环境：S5100-32F-4TF+S2500-26G-4TF(光钎汇聚方案)，2台万兆服务器；问题现象：2台服务器有1台带的机器很卡；排查步骤：1、服务器带机器卡不能单方面认为是网络问题(大家都知道磁盘，缓存，无盘软件配置都会引起这样现象)，于是就用了局域网测试工具进行排查，下载地址：http://www.tg-net.cn/bbs/forum.php?mod=viewthread&tid=6
《ARM64 迁移深度实战：在飞腾 D2000+ 麒麟 V10 构建高可用全栈环境》 2301_82150492 python c++c语言 c#
从源码编译优化到容器跨架构迁移|附自研文档转换工具开发全记录目录（带锚点）环境深度适配：飞腾芯片+KylinOS安全内核特性基础组件迁移（源码级优化）2.1JDK17GraalVMARM编译指南（性能提升40%）2.2MySQL8.0深度适配（解决麒麟安全模块冲突）2.3Redis7.0内存池优化（ARMNUMA架构调优）容器化迁移企业级实践3.1Docker离线安装+麒麟内核模块编译3.2构建多
《ARM64 架构迁移实战：在银河麒麟系统部署全栈环境及容器化应用》副标题：从 MySQL 到 Docker+Nginx 的完整迁移适配指南 2301_82150492 架构 mysql docker
文章目录(带锚点跳转)环境准备：ARM64+KylinOS特性解析基础组件迁移安装2.1JDK（ARM优化版）2.2MySQL8.0（解决依赖冲突）2.3Redis6（源码编译优化）容器化迁移：Docker部署与镜像适配3.1Docker离线安装（适配麒麟内核）3.2拉取ARM版Nginx镜像3.3容器生命周期管理（启动/监控/删除）数据迁移实战：MySQL到Redis同步策略开发工具迁移：文档转
烧录成砖分享 Mr_-G Linux 底层软件开发编程入门烧录烧录成砖
一、烧录与“成砖”的基础概念界定1.1烧录的技术本质烧录（Programming）是将固件（Firmware）、系统镜像或程序代码写入电子设备存储介质的过程，其核心是通过特定通信协议（如USB、UART、SPI、I2C等）将二进制数据固化到芯片（如Flash、EEPROM、MCU内置存储）的指定地址空间。烧录的对象涵盖智能手机、路由器、单片机、主板BIOS、智能家电等几乎所有带处理器的设备，不同设
ubuntu 18.04系统的镜像源 weixin_45081353 ubunt 日常操作 ubuntu linux 运维
1国内可用的镜像源Ubuntu官方下载地址阿里云开源镜像站清华大学开源镜像站中国科技大学开源镜像站华为云开源镜像站2ubuntu18.04镜像说明Ubuntu18.04是一个广泛使用的Linux发行版，它有多个版本的镜像可供下载。在物理机上安装的镜像如带desktop字样的镜像，含桌面环境，适合办公如带server字样的镜像，无桌面环境，适合部署服务器在虚拟机中安装的镜像仅用于制作启动介质的镜像在
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他