尔呦

自然语言处理学习笔记-李宏毅-01-SpeechRecognition01

输入：声音信号，一个向量序列，长度 $T$ ，维度 $d$
输出：文本，一个token序列，长度 $N$ ， $V$ 个不同的token

Token

Phoneme：发音的基本单位，可以看做音标，需要词典
lexicon：词典，单词到phoneme的映射，这个映射是明确的，但是lexicon的获取比较困难
Grapheme：书写的基本单位，例如26个英文字母以及空白符标点符号等，这种方法不需要词典的参与
Word：词来当token，但是对于某些语言，词汇的数量很大
Morpheme：比词小，但是比Grapheme大，最小的有意义的单位，例如将unbreakable拆成un，break，able
Byte：

输入Acoustic Feature

取一个时间window，例如25ms，里面有400个采样点(16KHz)，或使用MFCC转成39维的向量，或通过filter bank output得到80维的向量，之后移动窗口，连续的窗口之间有重叠
首先一个声音信号进来，经过DFT得到spectrogram(可以作为特征)，之后将其经过filter bank和取log之后，经过DCT得到MFCC
一些语音资源：TIMIT(4h),WSJ(80h),Switchboard(300h),Librispeech(960h,免费),Fisher(2000h)

seq-seq

Listen, Attend, and Spell(LAS) NIPS’15

encoder

输入： $\{x^1,x^2,\cdots,x^T\}$ acoustic feature
输出： $\{h^1,h^2,\cdots,h^T\}$ 高层次的表示
输入和输出长度是一样的，encoder可以使用RNN，1-D CNN，常见的是结合使用
在encoder的过程中会进行down sampling，有一些工作Pyramid RNN，每一层都减少一些输出尺寸，Pooling over time也是一个工作，time-delay DNN，truncated self-attention

attention

有一个vector $z_0$ 关键字，分别和 $h$ 例如 $h^1$ 通过match操作得到一个常量 $\alpha_0^1$ ，这个match操作有dot-product attention和additive attention，前一种是将 $h, z$ 分别经过 $W^h,W^z$ 变换之后的结果点乘得到常量 $\alpha$ ，后一种方式是将 $h, z$ 分别经过 $W^h,W^z$ 变换之后的结果加起来，得到的结果经过tanh和线性函数输出 $\alpha$ ，这样之后每个 $h$ 都有 $\alpha$ ，将这些 $\alpha$ 经过一个softmax得到 $\alpha'$ 使加和为1，之后将 $\alpha'$ 作为权重将 $h$ 加和得到 $c^0$ ，这个 $c^0$ 常被称为context vector，是decoder的输入

decoder

$c^0$ 作为输入，输入一个token的分布，每个token一个几率，所以输出的尺寸是token的数量，此时有隐层状态 $z^1$ ，之后 $z^1$ 又到encoder得到 $c^1$ ，经过decoder输出下一个token，如此不断循环，token序列的生成使用了beam search，动态规划的思想，每次只保留固定数目的最好的几条路径，使用到了teacher forcing的思想，也就是使用上一时刻的gt作为下一时刻的输入

思考：是否需要attention机制，因为这个最早用在翻译中，因为翻译的顺序和原顺序不是对应的，现在翻译的词可能是很早之前的词，但是语音识别里面这个问题很小

LAS的缺点：不能一边听一边识别，现在的是在听完一句话之后才能进行encoder

Connectionist Temporal Classification(CTC) ICML’06

可以做到online recognition，只需要encoder得到 $h$ ，然后每个 $h$ 经过classification得到token，也就是假如输入 $T$ 个acoustic Feature，输出 $T$ 个token，因为每个Feature很短，所以token的空间增加一个 $\emptyset$ 表示，之后对得到的token序列进行后处理，merge相同的token，丢掉 $\emptyset$ ，此时的gt构建比较困难，因为输出中有重复token和 $\emptyset$ ，需要alignment来人为构建，CTC类似于每次只选择一个 $h$ vector作为decoder的输入

RNN Transducer(RNN-T) ICML’12

在介绍RNN-T之前介绍RNA这个工作，之前的CTC的decoder可以看做每一个输出只和一个输入的 $h$ 有关，和其上下文无关，那么RNA就增强了不同时刻之间的联系
现在都是一个音对应一个输出，那么假如要一个音对应多个输出的token呢，例如 $t h$ 这个组合只有一个发音，RNN-T可以解决这个问题，对于每一个输入的 $h$ 都可以输出多个token，直到没有什么好输出的了就输出 $\emptyset$ 之后再输入下一个 $h$ ，此时还是存在alignment的问题，需要在token之间插入 $\emptyset$ ，有几个输入就要插入多少个 $\emptyset$ ，此时会穷举所有的alignment

Neural Transducer NIPS’16

之前的CTC，RNA和RNN-T每次都只输入一个 $h$ ，而Neural Transducer每次输入 $w$ 个 $h$ ，也就是存在一个window，然后经过attetion得到一个输出，这个输出和RNN-T里面的输入 $h$ 的位置差不多

Monotonic Chunkwise Attention(MoChA) ICLR’18

之前在Neural Transducer里面的window每次都是移动固定的距离，此时是自动的决定啥时候移动，移动多少

HMM

此时需要比phoneme更细的表示，原因是不能有二义性，还需要alignment，需要语音和文本对齐，有不同的alignment，算出来的acoustic Feature就不同，接下来考虑如何将深度学习运用到HMM里面

Tandem

使用DL来产生较好的acoustic Feature，其他的HMM过程没有变

DNN-HMM Hybrid

使用DNN来得到 $p (a ∣ x)$ ，其中 $a$ 表示文本， $x$ 表示acoustic model，之后通过贝叶斯公式得到 $p (x ∣ a)$ 也就是发射矩阵，其他的HMM过程没变

alignment

在LAS中计算给定acoustic feature条件下的文字序列的概率直接将decoder输出的概率相乘即可，但是CTC和RNN-T中计算需要alignment，需要将所有的alignment的情况举出来，然后将不同的情况下的加起来作为那个概率，存在以下问题：

如何穷举alignment
如何将不同的alignment下的概率加起来
如何训练
如何测试

首先解决如何穷举alignment这个问题，就是在label中插入 $\emptyset$ 的过程，CTC的alignment假设一个表格，列是输入的长度为 $T$ 的acoustic feature，行是label每个token两侧加上 $\emptyset$ ，之后寻找一个从左上到右下的路径，RNN-T类似

接下来解决如何将不同的alignment下的概率加起来：
假设现在有一个序列 $\emptyset c \emptyset \emptyset a \emptyset t \emptyset \emptyset$

你可能感兴趣的:(自然语言处理,自然语言处理,学习,深度学习)

LLM初识
从零到一：用Python和LLM构建你的专属本地知识库问答机器人摘要：随着大型语言模型（LLM）的兴起，构建智能问答系统变得前所未有的简单。本文将详细介绍如何使用Python，结合开源的LLM和向量数据库技术，一步步搭建一个基于你本地文档的知识库问答机器人。你将学习到从环境准备、文档加载、文本切分、向量化、索引构建到最终实现问答交互的完整流程。本文包含详细的流程图描述、代码片段思路和关键注意事项，
学习《诗经》——011麟之趾+012雀巢+013菜蘩+014草虫高逸木
麟之趾麟之趾，振振公子，于嗟麟兮。麟之定，振振公姓，于嗟麟兮。麟之角，振振公族，于嗟麟兮。这是一首赞美公候子孙有美德的诗。麒麟有脚不踩人，就如那公侯之子，宽侯有仁德。麒麟的额头从不会撞击人，就如同那公侯的子孙，温和又善良。麒麟的脚从来不会伤及人，就如同公侯的子孙，宽厚善良，有仁德。雀巢维鹊有巢，维鸠居之。之子于归，百两御之。维鹊有巢，维鸠方之。之子于归，百两将之。维鹊有巢，维鸠盈之。之子于归，百两
教育岁月静好_nx
昨天和小叔家的两个妹妹、妹夫吃饭。女人好像都这样，怎么聊都离不开孩子，再加上有一个妹妹也是两孩妈妈，共同话题不由就多了。小叔还一直说我家的两个孩子很好带，不用操心，我只能默默地咽口老血，他们是没见过我被孩子气得跳脚，破口大骂时的样子，也没见过为给孩子讲题，我在单位听课的样子。总之，看别人家的孩子都挺好的，为啥自己家的是熊孩子？哎，第一次做父母，都在学习，摸着石头过河，等到了河对岸，孩子长大了，我们
7.28日志.王翼王翼wy
今天到青岛去接妙妙，由于没买上卧铺，昨晚坐了一晚上硬座。到了青岛，妙妙妈带我到了一位女士开的正骨室，对我的身体骨骼进行了系统检查，找到了病根，说不是很严重，只要坚持练习就好康复。这件事让我内心感动，我却从来没这样关心过她。以后要向她学习，多用心关心关心她。我们中午去了一家水饺自助店用餐，吃的很好。下午妙妙妈说去哪儿玩？我看孩子容易迷入视频，就说去游泳吧！（妙妙妈说这两天泳后睡的实发育好）妙妙游了一
怎样考研才最高效呢？如何准备呢？十里li 考研
大学生考研全攻略：备考路径+高效学习法+时间管理考研全流程导航（时间轴）2023-01-012023-02-012023-03-012023-04-012023-05-012023-06-012023-07-012023-08-012023-09-012023-10-012023-11-012023-12-012024-01-012024-02-012024-03-01确定目标院校英语/数学筑基专
微信小程序入门实例_____从零开始开发一个“旅行清单 ”微信小程序数码小沙微信小程序微信小程序小程序
前面的博文中。我们陆续学习与开发了记账等一些实用实用小程序的开发过程，今天来打造一个适合出行场景的工具——“旅行清单小程序”。无论是短途游玩还是长途旅行，它都能帮你梳理需要携带的物品，避免遗漏。下面就跟着步骤，一步步实现这个小程序。再次体验开发者的快乐一、开发小程序员前的准备工作1.工具检查确保微信开发者工具已安装并更新到最新版本。若未安装，打开微信公众平台（微信公众平台），在页面底部找到“下载”
在家有哪些能做的赚钱项目？在家挣钱的兼职有哪些？古楼
高省app是浙江的一家专业的网购省钱APP，致力于为用户提供更好的网购优惠，实现购物优惠最大化。高省是由杭州长孚科技有限公司开发的一款专门帮助淘宝天猫卖家、品牌代运营等商家省钱的app，也是目前国内唯一一款能让消费者真正省钱的APP，高省为所有用户提供“分享赚佣金”和“邀请他人赚佣金”两种赚钱模式。在购物、旅游、学习中用到优惠券的时候，可以在高省APP上领取哦。一、自用省钱自用省钱是指用户在购买产
深入解析部分可观测马尔可夫决策过程（POMDP）及其应用码字的字节算法人工智能马尔可夫决策过程 POMDP
POMDP的基本概念与模型部分可观测马尔可夫决策过程（PartiallyObservableMarkovDecisionProcess,POMDP）是强化学习领域中处理不完全信息环境的核心数学模型。与完全可观测的马尔科夫决策过程（MDP）相比，POMDP更贴近现实世界中智能体面临的感知局限，其核心特征在于系统状态无法被直接观测，智能体必须通过间接的观测信号来推断潜在状态。POMDP的七元组模型PO
2019-4-2晨间日记展翅的鱼
今天是什么日子起床：8:10就寝：11:30天气：阴心情：美丽纪念日：4月第二天任务清单昨日完成的任务，最重要的三件事：昨天完成了一个面试；体验超市服务人员的工作4小时；与侄女玩耍改进：每日目标的确定；按时早中晚三餐；习惯养成：按时中晚餐；日目标总结；周目标·完成进度写一个简易小程序，完成进度0%；学习·信息·阅读学习小程序；完成法语每日基础单词的认识；阅读一篇英语文章；健康·饮食·锻炼下班走路回
《我不惧怕成为这样“强硬”的姑娘》读书笔记05 幺拐妖怪
在大学那些年因为我考取的并不是什么名牌大学，所以我一直羡慕着那些考上名牌大学的学霸们。作者刘媛媛与北大的那些年让我意识到：学霸之所以是学霸，是因为他们都在抓住飞逝的光阴，为着出厂的一刻做准备，努力变成一盒优质的牛奶。反观我的大学四年，好像都沉浸在社团活动里面，对学业并不怎么上心，而且也没怎么多多跟专业的老师们沟通交流，获取学习经验和心得。在大学里面，我也看到过许多不同的人，有些人在学校里面就肆意开
应该给自己一个大大的赞 2025过好每一天
一直以来我骨子里都是比较讨厌一个人在抱怨的，或是把自己活成了受害者，虽然现在的我在思想上已经经过一场洗礼，的确做出很多努力才让自己的人生变得越来越好的，我也知道这个过程是有多么不容易，但是一路走来，我从来都不会去抱怨什么。的确应该给自己一个大大的赞，我以后也不想再让谁来影响我的人生，人生如此短暂，不如就由着自己的性子活吧。坚持学习，永远不放弃，可以帮助我们不管摸到什么样的牌，都能把它打成王炸。这个
C程序设计语言 cvcode吴 c语言开发语言
1.入门学习一门新程序设计语言的惟一途径就是使用它编写程序。对于所有语言的初学者来说编写的第一个程序几乎都是相同的，即:请打印出下列内容hello,world尽管这个练习很简单，但对于初学语言的人来说，它仍然可能成为一大障碍，因为要实现这个目的，我们首先必须编写程序文本，然后成功地运行编译，并加载、运行，最后输出到某个地方。掌握了这些操作细节以后，其它事情就比较容易了。在C语言中，我们可以用下列程
AI产品经理面试宝典第42天：学习方法与产品流程解析 TGITCIC AI产品经理一线大厂面试题产品经理 AI面试大模型面试 AI产品经理面试大模型产品经理面试 AI产品大模型产品
具体问答：学习产品及AI知识的方法问：请谈谈您是如何学习产品及AI知识的，以及您认为哪些资源对您帮助最大答：我的学习体系包含三个维度：分层知识架构、实践验证闭环、资源筛选机制。在知识获取阶段，采用「理论-案例-工具」三级学习法：通过《人工智能：一种现代的方法》构建AI基础框架，用TensorFlow官方文档掌握工程实现，结合《启示录》《俞军产品方法论》理解产品逻辑。实践环节采用「项目反哺」模式，例
2023年第10期(NeuroImage)：DomainATM：多中心医学图像数据标准化工具箱影浮科技ImageFlow
基本信息1.标题：DomainATM:Domainadaptationtoolboxformedicaldataanalysis.2.期刊：NeuroImage3.IF/JCR/分区：7.4/Q1/中科院一区4.DOI：10.1016/j.neuroimage.2023.119863目录1、导读2、背景动机3、研究目的4、工具箱介绍5、测试试验6、局限不足1导读域适应（DA）是基于机器学习的现代医
2021-08-26 项城069吴喜红
班主任经验培训心得——四个时间花2021年8月26日，我校举行全员班主任素质提升培训，一个半小时的培训干货满满，我收获很多。从徐银鸽校长关于“用心绽放四个时间花”的班级管理经验分享中，我感到自己在班主任工作道路上还在蹒跚学步阶段，要想取得更好的职业幸福感努力提高自己势在必行。这次的学习，印象最深的是徐校长对班级管理中的阶段划分，四个阶段，开学第一天、开学第一周、开学第一月，而后365天......
吴猛强：爱你们，么么哒（1985高考作文全国卷）吴猛强专栏
1985高考作文全国卷.澄溪中学附近有一家前进化工厂。工厂天天向外排放有毒的气体和废水。广大师生和附近居民长期处在被污染的环境中，身体健康受到损害，工作学习受到影响。几年来，学校多次向工厂提出意见，要求妥善解决污染问题。但厂方以生产任务繁重、技术力量薄弱和经费开支太大等为理由，一再拖延，至今未能解决。试就上述问题，以“澄溪中学学生会”的名义，给《光明日报》编辑部写一封信，反映情况，申述理由，呼吁尽
日精进第四十一天 A琉璃瓶
敬爱的李老师，智慧的马教授，优秀的跃友们：大家好！我是来自辽宁春天内衣50号跃友刘丽平，今天是2019年1月18日我日精进的第【41】天，分享一下今天的改变，我们共同勉励，每天进步一点点，距离成功就不远。1.比学习：学习苗店的积极心态，对待工作的认真负责。当你对生活的态度，变得越来越消极，当你失去了，尝试的动力和改变的勇气，你才是真正的变得衰老了。不要因为年龄就拒绝一些东西，只要你想开始，什么时候
0727今天感到寂寞徐镁鑫
1.昨天没有午睡，晚上又晚睡，直接导致今天晚起了许多，包括霏，起床了又跑去沙发睡了二十分钟。等吃完早餐（鲜花饼、酸奶、鸡蛋、珍珠李）开始学习，都准备十一点了！我跟着学了十来分钟英语，又补写了昨天的日记。2.医生同学来信息告知前天我去她医院做的糖筛结果，还好，血糖在正常范围内。就是有轻微贫血，同学说，多吃点红枣红皮花生，还有动物血和内脏吧。真没想到我会有贫血，明明那么胖。~胖跟贫血没有关系好吗？！~
WPF利用NotifyIcon创建任务栏图标（菜鸟教程）不喜欢打篮球的厨师不是好程序员 c#windows
学习目标：记录从WPF应用创建开始，一步步到任务栏图标创建的全过程。流程：1、环境：Win10+VS2017打开VS2017，选择文件->新建->项目->VisualC#->Windows桌面->WPF应用->更改项目名为TasbarIcon->确定2、添加图标类右键项目->添加->引用，找到System.Windows.Forms和System.Drawing两个程序集，打上勾添加进去。双击打开
2018-05-25 张景_b55f
姓名:张景公司:扬州方圆建筑有限公司363期（哈尔滨）《六项精进》“谦虚二组”【日精进打卡第62天】【知～学习】背诵《六项精进》5遍背诵《大学》5遍共计570遍【经典名句分享】只要认真的为自己活过，只要为生命中重要的人，努力奋斗过，这本身已是一种完美。【行～实践】一、修身：默背《六项精进》五遍默背《大学》五遍微信步数:20000二、齐家：与父母视频和女友聊天三、建功：淀粉车间B去放线，放控制线A去
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
20220812成就感日志225/365 kidII
奋斗是人生的底色，你会经历很多人事物，学会更多的东西。从学习上掌握技能，从学习上享受生活，即便是辛苦也没有关系，生活没有不辛苦的，但是要辛苦的有意义。与其说平凡的过一辈子，不如吃苦耐劳，选择自己喜欢的生活，一点点的付出，积累很多的经验，未来才会有希望。虽然我们渴望成就感，但也需要平衡生活，让自己越来越幸福。1.【日思】：今日最重要的一件事情。调整（训练3h，4k+2h信息1+1.5h信息2+自私的
什么情况下需要心理咨询？——中原焦点团队，坚持分享776天，2022-03-13 归鸿_66
心理咨询对象恰恰是正常人，而不是心理有疾病的人（这要去医院就诊，需要药物治疗的。）当正常人有了情绪困扰，工作、学业压力、家庭矛盾，或者其它内心烦恼的话，在咨询室里可以得到释放，能够对自己、对事情认识的更深刻。这样你能心理状态更好更轻松的去应对外边的挑战，面对当下的生活学习。尤其正在成长中的青少年。可以这么说，心理咨询室就是你的解压的驿站，情绪的安放地。走出咨询室，你会变得轻松、自信、有力量。当然，
牛客华为机试题解（python版更新中）
目录一、字符串（知识点）HJ1字符串最后一个单词的长度（简单）HJ2计算某字符出现次数（简单）HJ4字符串分隔（简单）HJ5进制转换（简单）HJ10字符个数统计（简单）HJ11数字颠倒（简单）HJ12字符串反转（简单）HJ14字符串排序（简单）HJ17坐标移动（中等）HJ18识别有效的IP地址和掩码并进行分类统计（较难）自己研究的题解，也有借鉴评论区牛人思路，答案不唯一，仅供学习参考，也欢迎大家指
Three.js入门第一步：两种方式搭建你的3D项目[特殊字符]️
上一篇我们聊了学习Three.js前的“地基”知识，现在地基牢固，该正式动工了！在创造炫酷的3D世界之前，我们得先把开发环境给搭好。官方手册提供了两种主流的安装方式，分别适用于不同场景。选对方法，事半功倍！方式一：CDN+Importmap(极速上手)这是官方最为推荐的、也是最简单的入门方式，尤其适合学习、做小练习、或者快速验证一个想法。优点：无需安装任何东西！只需要一个能联网的浏览器。操作方法：
欣诚幼儿园小六班：冬日相伴，温暖如初欣诚幼儿园郑雅文
太阳当空照花儿对我笑小鸟说早早早你为什么背上小书包我去上学校天天不迟到爱学习爱劳动长大要为人民立功劳集体活动：周一：《哈巴狗》1.学习歌曲《哈巴狗》，能够边唱边跟随歌曲内容变换动作。2.愿意表演歌曲，体验表演的乐趣。周二：《小鱼游游》1.愿意和同伴一起玩“捉迷藏”游戏，感受游戏的乐趣。2.会使用水彩笔或者油画棒画曲线。周三：《咪咪猫》1.喜欢并尝试模仿儿歌中的语言，体会其中的乐趣。2.理解儿歌内容
致自己的几句话 sundy007
图片发自App1.昨天的成功对今天的你来说，如果还是大事，说明你今天什么大事都没做！2.如果现在的你和一年前的你一样，意味着你没有成长。即使成绩依旧表现不错，让客户着迷，那依然是吃老本的行为！3.一个人最难做的是否定自己，尤其是自己过去成功的经验，如果不否定，总重复过去的套路，就没有了学习进步的空间！4.这个世界有偶然的运气，也有必然的运气。人应该追求必然的运气，通过努力踏踏实实的达到某个状态，某
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
Self-Consistency：跨学科一致性的理论与AI推理的可靠性基石大千AI助手人工智能 Python #Prompt 人工智能机器学习神经网络算法大模型幻觉 LLM
本文综合其在逻辑学、心理学及人工智能领域的核心定义、技术实现与前沿进展来对Self-Consistency（自洽性）进行系统性解析。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与跨学科内涵基础概念逻辑学定义：指理论或系统内部逻辑自洽，无矛盾或悖论。例如物理理论中，狭义相对论的速度变换
*SFT深度实践指南：从数据构建到模型部署的全流程解析大千AI助手人工智能 Python #OTHER 人工智能深度学习算法大模型 SFT 微调 Lora
一、SFT技术原理与定位核心定义SFT是在预训练语言模型（如LLaMA、GPT）基础上，利用标注数据优化模型以适应特定任务的技术。其本质是通过调整模型参数，将通用语言能力迁移至专业领域（如法律、医疗）或任务（如对话生成、代码补全）。与预训练的区别预训练：使用无标注数据（如维基百科）学习通用表征，消耗千亿级token算力。SFT：使用标注数据（如指令-答案对）进行任务适配，成本仅为预训练的1/100
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他