zmzhang2000

语言模型 python实现uni-gram和bi-gram 使用ppl困惑度对比模型效果山东大学2019 NLP实验1

语言模型

实验目的
实验内容
数据集

Example:

实验环境
实验思路

train
test

代码实现

一元语法

train
test

二元语法

Train
test

测试结果

实验目的

理解并实践语言模型

实验内容

用python 编程实践语言模型(uni-gram 和bi-gram) ,加入平滑技术。
计算测试集中句子的perplexity，对比uni-gram 和bi-gram 语言模型效果。

数据集

train_LM.txt
test_LM.txt

Example:

（每行数据是一段对话，句子间用__eou__分隔）
How much can I change 100 dollars for ? __eou__ What kind of currency do you
want ? __eou__ How much will it be in Chinese currency ? __eou__ That’s 680 Yuan .
__eou__
What kind of account do you prefer ? Checking account or savings account ?
__eou__ I would like to open a checking account . __eou__ Ok , please just fill out
this form and show us your ID card . __eou__ Here you are . __eou__

实验环境

python 3.7.1
nltk
- 安装过程：
  1. pip install nltk
  2. 进入python命令行模式
  3. 执行以下命令
```
import nltk
nltk.download()
```
    下载安装所有文件

实验思路

train

对训练集进行预处理
- 全部转化为小写
- 去标点
- 分句（使用bi-gram时，句尾句首词不会组成二元组，保证句子间独立性）
  *在bi-gram中，将词组成二元组，并且储存以w_i为前缀的bi-gram的种类数量（例：词表中只存在go to和go back两种组合，则w_go的值为2）
训练
- 以词作为基元，对每个分句进行分词，并统计每个基元在整个数据集中出现的频数
- 加入未登录词，并将频数置为0（注意维护w_i为前缀的bi-gram的种类数量）
- 对数据进行平滑并利用频数计算词的频率，以此代替词的概率（此次实验采用加一平滑法）

test

计算测试集中每个句子的perplexity
注：因概率值极小，为了减小误差，将先累乘再取对数的运算转化成先取对数再累加
对测试集句子的perplexity取平均值

代码实现

from nltk.tokenize import word_tokenize
from nltk import bigrams, FreqDist
from math import log

# 读取数据 小写 替换符号 分句 
dataset = open("train_LM.txt", 'r+', encoding='utf-8').read().lower()\
                .replace(',',' ').replace('.',' ').replace('?',' ').replace('!',' ')\
                .replace(':',' ').replace(';',' ').replace('<',' ').replace('>',' ').replace('/',' ')\
                .split("__eou__")
testset = open("test_LM.txt", 'r+', encoding='utf-8').read().lower()\
                .replace(',',' ').replace('.',' ').replace('?',' ').replace('!',' ')\
                .replace(':',' ').replace(';',' ').replace('<',' ').replace('>',' ').replace('/',' ')\
                .split("__eou__")

一元语法

train

unigramsDist = FreqDist()  # uni-gram词频数字典
for i in dataset:
    sWordFreq = FreqDist(word_tokenize(i))  # 每一句的词频数字典
    for j in sWordFreq:
        if j in unigramsDist:
            unigramsDist[j] += sWordFreq[j]
        else:
            unigramsDist[j] = sWordFreq[j]

test

# 加入未登录词
for i in testset:
    word = word_tokenize(i)  # 每一句的词频数字典
    for j in word:
        if j not in unigramsDist:
            unigramsDist[j] = 0

# 频数转化为频率  使用加一平滑法   unigramsDist.B()表示每个词都加一后的增加量
s = unigramsDist.N() + unigramsDist.B()
unigramsFreq = FreqDist()
for i in unigramsDist:
    unigramsFreq[i] = (unigramsDist[i] + 1) / s

ppt = []
for sentence in testset:
    logprob = 0
    wt = 0
    for word in word_tokenize(sentence):
        if word in unigramsFreq:
            logprob += log(unigramsFreq[word],2)
            wt += 1
    if wt > 0:
        ppt.append([sentence,pow(2,-(logprob/wt))])

temp = 0
for i in ppt:
    temp += i[1]
print("一元语法模型的困惑度:", temp/len(ppt))

一元语法模型的困惑度: 885.5469372058856

二元语法

Train

w2gram = {}     # 可能存在的以w为开头的2-gram的种类数量
bigramsDist = FreqDist()
for sentence in dataset:
    sWordFreq = FreqDist(bigrams(word_tokenize(sentence)))
    for j in sWordFreq:
        if j in bigramsDist:
            bigramsDist[j] += sWordFreq[j]
        else:
            bigramsDist[j] = sWordFreq[j]
            if j[0] in w2gram:
                w2gram[j[0]] += 1
            else:
                w2gram[j[0]] = 1

test

# 加入未登录词
# 由于将每种未出现的2-gram一一列举会生成vacab size * vocab size大小的bigramsDist，为节省时间和空间，此处只加入test中出现的2-gram
for sentence in testset:
    word = bigrams(word_tokenize(sentence))
    for j in word:
        if j not in bigramsDist:
            bigramsDist[j] = 0
            
            if j[0] in w2gram:
                w2gram[j[0]] += 1
            else:
                w2gram[j[0]] = 1

# 频数转化为频率  使用加一平滑法
history = {}    # 以w为历史的2-gram的数量和
for i in bigramsDist:
    if i[0] in history:
        history[i[0]] += bigramsDist[i]
    else:
        history[i[0]] = bigramsDist[i]
bigramsFreq = FreqDist()
for i in bigramsDist:
    bigramsFreq[i] = (bigramsDist[i] + 1) / (history[i[0]] + w2gram[i[0]])

ppt = []
for sentence in testset:
    logprob = 0
    wt = 0
    for word in bigrams(word_tokenize(sentence)):
        if word in bigramsFreq:
            logprob += log(bigramsFreq[word],2)
            wt += 1
    if wt > 0:
        ppt.append([sentence,pow(2,-(logprob/wt))])

temp = 0
for i in ppt:
    temp += i[1]
print("二元语法模型的困惑度:", temp/len(ppt))

二元语法模型的困惑度: 68.3362351830629

测试结果

一元语法模型的困惑度: 885.5469372058856
二元语法模型的困惑度: 68.3362351830629

你可能感兴趣的:(语言模型 python实现uni-gram和bi-gram 使用ppl困惑度对比模型效果山东大学2019 NLP实验1)

新手配音兼职入门指南【专业完整版】配音新手圈
入行配音业数年，自己思索了很久，跟朋友或同行也探讨无数次这个问题——如何利用自己的专业把有用的配音、有声书知识教给别人。而作为刚想入门的新手，面对眼前海量的信息，或许根本不知道从哪里开始，今天这篇文章用任何人都可以看懂的表达方法来全面的解析一下都有哪些配音平台，怎么选择配音平台。1、配音新手圈这是一个公众号配音新手圈里面每天更新配音任务，都是适合没有基础的人去做的，每天都有任务。适合新入门的小白练
前端------Filter 童小纯前端系列---从入门到深化 html vue
其实数组的很多函数需要的参数都是一样的arr.fun((item,index,arr)=>{item:数组的元素index:数组元素在的位置arr:整个数组})Filter是数组的一个用法,用来返回一个数组,满足特定条件的数组中的元素letarr=[1,2,3,4];letnewArr=arr.filter((item,index,arr)=>{console.log("数组元素${item}")
高省怎么赚钱?模式是什么?原来是这样高省APP珊珊
大家应该都知道淘宝内部优惠券，现在很多淘宝客主要是通过推广优惠券来推广商品的。现在，出现了一个新平台，这里涵盖了美团外卖、滴滴出现、肯德基等各个平台的优惠券，那就是高省，微商货源小编给大家介绍下其赚钱方式。【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，也期待你的加入。高省邀请码777777，注册送2皇冠会员，送万元推广大礼包。高省邀请码777777高省是淘宝京东拼多多等第三方
CSS实现前端响应式布局
一、响应式布局概述响应式布局的定义与重要性响应式布局是一种能够使网页在不同设备上（如桌面电脑、平板电脑、手机等）都能呈现出良好视觉效果和用户体验的设计方法。它通过使用灵活的布局、可适应的图像和媒体查询等技术，确保网页能够根据设备的屏幕尺寸、分辨率和方向进行自动调整和优化。在当今数字化时代，响应式布局至关重要。随着移动设备的广泛使用，用户越来越多地通过各种设备访问网页。如果网页不能在不同设备上良好地
【国内超大型智能算力中心建设白皮书 2024】 AI大模型 lose and dream 人工智能开源 git 开源软件 github gitlab 开放原子
文末有福利！智算中心建设通过领先的体系架构设计，以算力基建化为主体、以算法基建化为引领、以服务智件化为依托，以设施绿色化为支撑，从基建、硬件、软件、算法、服务等全环节开展关键技术落地与应用。一、体系架构（一）总体架构图8智算中心总体架构智能算力中心建设白皮书，重点围绕基础、支撑、功能和目标四大部分，创新性地提出了智算中心总体架构。其中，基础部分是支撑智算中心建设与应用的先进人工智能理论和计算架构；
全栈开发的现状与未来——机遇与挑战并存 Willin 老王躺平不摆烂 chatgpt AIGC 程序员创富 ecmascript javascript
目录全栈开发的现状与未来：机遇与挑战并存1.全栈开发的就业市场现状与趋势1.1当前市场需求与薪资水平1.2行业竞争与公司偏好1.3未来几年发展预测2.全栈开发的技能要求与职业发展2.1核心技能栈：从前端到后端2.2新兴技术：AI与低代码/无代码2.3职业发展路径与晋升空间2.4多元化发展机会3.全栈开发的行业挑战与应对策略3.1主要行业挑战3.2应对策略与建议全栈开发依然充满机遇，市场需求旺盛，薪
《提拔》唐诚马玉婷全文免费阅读【完结小说无弹窗】桃子爱阅读
《提拔》唐诚马玉婷全文免费阅读【完结小说无弹窗】主角：唐诚马玉婷简介：镇政府门外，一辆黑色帕萨特轿车径直停在了楼门口，从轿车上下来一位年纪大约四十岁上下的妇女来，穿着一身黑色的西装，脚蹬一双曾明瓦亮的黑皮鞋，猛一看，以为是男人呢，仔细一看，脖子里系着一条淡花色的丝巾，才知道是一个干练的女人。----阅读全文小说内容请翻阅文章最底部---第7章各有不同孙运的身材不高，和马玉婷差不多，两个人摞在一起，
道德经第二十九章大庆思考笔记
[原文]将欲取①天下而为②之，吾见其不得已③。天下神器④，不可为也，不可执也⑤。为者败之，执者失之。是以圣人无为⑥，故无败，故无失。夫⑦物⑧或行或随⑨；或觑或吹⑩；或强或羸⑾；或载或隳⑿。是以圣人去甚、去奢、去泰⒀。[译文]想要治理天下，却又要用强制的办法，我看他不能够达到目的。天下的人民是神圣的，不能够违背他们的意愿和本性而加以强力统治，否则用强力统治天下，不能够违背他们的意愿和本性而加以强力统
高并发解决方案：SpringBoot+Redis分布式缓存实战 fanxbl957 Web 缓存 spring boot redis
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人高并发解决方案：SpringBoot
SpringBoot缓存技术全解析：Redis+Caffeine二级缓存架构 fanxbl957 Web 缓存 spring boot redis
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot缓存技术全解析：
【AI大模型应用开发】Prompt提示词工程 bay_Tong桐小白 AI大模型人工智能 prompt ai 大模型应用开发 LLM 聊天机器人
halo~我是bay_Tong桐小白本文内容是桐小白个人对所学知识进行的总结和分享，知识点会不定期进行编辑更新和完善，了解最近更新内容可参看更新日志，欢迎各位大神留言、指点感谢新老朋友给予过的关心，过去经历了很多，身心状态慢慢调整，因此更新文章较慢，给关注我的新老朋友道声抱歉，也再次给对桐小白给予关心的新老朋友表示感谢~Prompt提示词工程（初步）【更新日志】大模型分类prompt基本概念pro
蜜源是怎么赚钱的？蜜源APP返利高吗? 高省APP珊珊
蜜源主要通过以下几种方式赚钱：蜜源的赚钱方式平台佣金：蜜源作为电商平台，提供了众多商品供用户购买。当用户通过蜜源购买商品时，平台会从商家那里获取一定比例的佣金。这是蜜源主要的盈利方式之一。蜜源凭借庞大的用户群体和消费能力，吸引了越来越多的商家入驻，从而增加了平台的交易量和佣金收入。广告推广：蜜源为商家提供了广告推广服务。商家可以通过投放广告在蜜源平台上获取更多曝光和点击量，从而增加商品销量。蜜源根
2022年4月22日《0–8岁儿童纪律教育》培训感悟星星_e1d9
–––刘文克+春蕾怡馨幼儿园1、儿童发展关键时期是指在儿童成长的过程中，在某一特定的时期内，对某种特定的知识和行为十分敏感。2、儿童通过体育游戏习得的技能也是避免和解决问题的重要技能。儿童学习交往和与他人有效合作以及管理自己的行为与情绪。
系统架构设计师教程第二章计算机系统基础知识-2.9 系统性能 AncleLeen 软考-系统架构设计师-学习路线系统架构软考-系统架构师
系统架构设计师教程第二章计算机系统基础知识-2.9系统性能2.9.1.性能指标2.9.1.1计算机的性能指标2.9.1.2路由器的性能指标（了解即可）2.9.1.3交换机的性能指标（了解即可）2.9.1.4网络的性能指标2.9.1.5操作系统的性能指标2.9.1.6数据库管理系统的性能指标2.9.1.7Web服务器的性能指标2.9.2.性能计算2.9.3.性能设计2.9.3.1性能调整2.9.3.
2021/1/1 星期五晴 40b358b2b093
2020再见！跨过了这不平凡的一年，终于迎来了崭新的2021，新的一年，新的愿望，新的开始，今天是孩子们小长假的第一天，早上睡了个懒觉，醒来时，艳阳高照太的阳已经照进来了，看来今天肯定是个大晴天了，下午皓轩在写作业，趁小的睡了抓紧时间把韭菜，荠菜摘了一下，一会小家伙也跑了过来，坐在旁边和我一起摘了起来，真是长大了，能帮忙干活了，菜洗好烫好，切好把肉放进去调好了，正要准备和面的时候小的醒了，没办法只
《当我遇见一个人》读书心得 hebl
中原焦点团队高级五期贺变丽坚持分享第1027天2021—4—4去年十月份，我买了李雪老师的《当我遇见一个人》，当时只读了十几页，因为没有时间就放下了，今天终于把这本书读完。这是写母婴关系的一本书，对于即将成为父母的人来说，这本书是必读的教材。在书的封面上有一句话：母婴关系决定孩子的一切关系。这本书分为五个部分：一、觉察——遇见内在的婴儿；二、态度——放下评判，全然看见；三、关系——童年的沟通模式，
#1122#感官占领的方法运用张景楠
1、【眼睛】：你看到了什么？好比你卖一款特别浓稠的希腊酸奶，写“浓稠可口”是不够的，我们要写“像乳白色的奶香冰淇淋一样，只能用勺子挖着吃。”2、【鼻子】：你闻到了什么？好比你卖香薰蜡烛，不要写“香味浓郁”，而是写“北非百合花的高雅花束，混合着刚割下的青草香气与高山上清新空气的味道”。3、【耳朵】：你听到了什么？好比你卖音响系统，不要写“震撼音效”，而是写“当电影里一辆摩托车呼啸而过时，马达的轰鸣声
2019-03-09 1c63abd2a32c
1、壮壮与亮亮的打算在山东省临清市的一个小村子里，住着几十户人家，小牛壮壮与小羊亮亮就出生在这里。现在，它们已经是一对如兄弟一样的好朋友，几乎没有闹过矛盾。壮壮住在村子的西北角，亮亮则住在村子的东南角，从壮壮家走到亮亮家，至少要走上5分钟，可见它两家的距离有多大。早上，壮壮与亮亮在村口汇合，来到村边的草地上吃起草来。中午，它们在草地上打滚、睡觉。下午，它们在草地上玩的不亦乐乎。傍晚，只听村里传来的
期待《云襄传》定档，男女主强强联手，配角们都不简单娱娱鱼
网传古装权谋剧《云襄传》将在1月播出。是一部狂虐男主的剧。不过因为男主云襄（陈晓饰）很聪明，斗过了白手起家的漕帮帮主戚天风（王劲松饰），结识了世家公子苏鸣玉（唐晓天饰），快手刀客金彪（刘冠麟饰）等几位好友，获得了女主舒亚男（毛晓彤饰）的爱情，实现了自己匡扶正义惩强除恶的抱负。
“东方瑞士”新加坡：如何用短短几十年成就一个金融帝国外小至
新加坡是一个1965年才取得独立的，面积很小的岛国。然而它却在短短的几十年之间，发展成为一个繁荣的金融帝国。它是亚洲最大的新兴市场货币交易中心，全球第三大外汇交易中心，全世界发展最快的国内债券市场之一，同时也是亚洲地区金融衍生品交易的领军国，亚洲为数不多的国际金融中心。这让人在叹服的同时，也忍不住好奇他们是如何做到在几十年之内做到这样飞速地发展的。下面，我们就来学习下新加坡金融市场以及金融衍生品市
《和闺蜜一起穿进仙界救赎文》林黎叶昭九月书舍
简介：“可没想到这只狸奴竟然敢是叶昭姑娘养的，为了它叶昭姑娘竟然要杀我。”“可是它是魔物啊，叶昭姑娘为什么会养一只魔物呢。”小说书名：《和闺蜜一起穿进仙界救赎文》主角：林黎叶昭那天我和闺蜜去我的太子夫君管下的蟠桃园炫了一大堆蟠桃，撑得肚子溜圆才各回各家。结果刚和她分开没多久。我就收到了她的求救信号。等我火急火燎赶去她的寝殿。就看到分开时还好端端的闺蜜，此时满身是血。她不顾自己不断涌血的伤口，挥着一
后端开发：Spring Boot 的分布式缓存方案大厂资深架构师 Spring Boot 开发实战 spring boot 分布式缓存 ai
后端开发：SpringBoot的分布式缓存方案关键词：SpringBoot、分布式缓存、Redis、Caffeine、缓存策略、缓存失效摘要：本文深入探讨了在SpringBoot后端开发中分布式缓存方案的相关技术。首先介绍了分布式缓存在现代应用中的重要性及本文的研究范围，接着阐述了核心概念如分布式缓存的原理与架构，详细讲解了常用的核心算法原理及具体操作步骤，包括使用Python代码示例说明。通过数
【周检视】5.0第11周 2021年第15周检视 StevenWangSH
量变带来质变很多时候会感觉进步很慢，甚至感觉倒退。看着别人飞速前进，而自己止步不前不由得焦虑万分，给自己平添了很多压力。甚至会觉得是不是走错了方向，明明是世间真理，为什么到了自己这里就不灵验了，但是坚持一段时间以后会体会到，不是没有进步，而是我们要遵循进步的规律，我们要跨越一阶一阶的台阶，那么就要在一个个的台阶上进行积累，不把该补的课补齐，是难以实现跨越的。就如同同样的世界，但是我们每个人的看法不
我在黑马程序员学web前端新手来了@click 前端
1网页由三部分组成1.、html负责网页的结构2.css、负责网页的美化，控制网页元素的样式3、js，负责网页交互html常见的标签：1、form表单input输入框select下拉菜单option下拉列表2、table表格thead表头ｔｂｏｄｙ是表体tr行th表头加粗ｔｄ是列ｂｒ是换行2/CＳＳ常见的三种引入方式行内样式、内部样式、外部样式用ｌｉｎｋ关键字常用的元素选择器：标签选择器、id选择
乐享生活2014.7.11 乐享生活
2014.7.11今天热情满满的去教育基地培训实作，本来蛮清白的，去了后成了一脑袋浆糊。还是按照自己的计划去实施吧，以长补短。小妞还是不紧不慢的对待自己的作业，中午故意看影讯，然后惊奇地说原来两个动画片都上映了，好想去啊。可是妞的作业还没完成，真可惜啊。妞在那委屈得只想哭，可是没办法，这都是以前约定好的。下午陪着她把剩下的暑假作业里不会的都差不多完成了。下午接到了两个好消息。豪客来最后承认了自己的
Leetcode703. 数据流中的第K大元素 LonnieQ
题目设计一个找到数据流中第K大元素的类（class）。注意是排序后的第K大元素，不是第K个不同的元素。你的KthLargest类需要一个同时接收整数k和整数数组nums的构造器，它包含数据流中的初始元素。每次调用KthLargest.add，返回当前数据流中第K大的元素。示例:intk=3;int[]arr=[4,5,8,2];KthLargestkthLargest=newKthLargest(
Java-数构链表 2301_81674311 java 链表开发语言
1.链表1.1链表的概念和结构链表是一种物理存储结构上非连续存储结构，数据元素的逻辑顺序是通过链表中引用链接次序实现的。这里大多讨论无头单向非循环链表。这种结构，结构简单，一般与其他数据结构结合，作为其他数据结构的子数据。1.2链表的实现publicclassMysingleList{staticclassListNode{publicintval;//节点的值域publicListNodenex
拖拽放大镜　　购买查看照片不惧_f01e
这里是用三张图做成一套放大镜Document*{padding:0;margin:0;list-style:none;}.box{width:400px;height:500px;margin-left:100px;/*border:3pxsolid#00f;*/}.m{width:400px;height:400px;/*border:1pxsolid#000;*/position:relati
顶刊潜力！国家产融合作试点城市DID 皮皮学姐分享-ppx 人工智能其他经验分享大数据科技
1632顶刊潜力！国家产融合作试点城市DID数据来源国家产融合作试点城市是由工业和信息化部、财政部、中国人民银行、金融监管总局、中国证监会联合组织的项目。‌国家产融合作试点城市旨在通过产融合作的方式，引导金融资源有效支持实体经济，推动产业与金融的协调发展，探索产融合作新模式新路径，强化对新型工业化的金融支撑。试点城市将采取设立专项基金、提供贷款支持、建设产融信息对接服务平台等措施，促进产业链与金融
上位机知识篇---Prompt&PowerShell Prompt Atticus-Orion 上位机知识篇 prompt powershell
在Anaconda环境中，AnacondaPrompt和AnacondaPowerShellPrompt是两个常用的命令行工具，它们的核心功能都是为了方便管理Python环境和执行相关命令，但底层依赖的命令行解释器不同，因此在使用场景和语法上存在一些区别。下面详细介绍两者的差异：1.底层依赖的命令行解释器不同这是两者最根本的区别，决定了它们的语法规则和功能范围：AnacondaPrompt基于Wi
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他