Rock_y

cs224n学习1：Word2Vec发展及代码实现

Word2Vec

语言模型

计算
缺点
基于马尔科夫的假设
n-gram模型
构造语言模型

词向量

独热编码
语言模型生成词向量
word2vec

Continuous Bag of Words（CBOW）
Skip-gram
训练技巧
目标函数
公式推导

代码实现

语言模型

语⾔模型：预测每个句⼦在语⾔中出现的概率

P(S)也被称为语言模型，即用来计算一个句子概率的模型。

计算

表示整句话在训练语料库中出现的次数除以不算当前词Wi后句⼦
出现的次数。

缺点

数据过于稀疏
参数空间太大
解释：虽然能够表示出一句话的概率，但是这样的计算的计算量特别大，会导致数据过于稀疏，因为每一个词都要考虑前⾯很多很多的词，而前面很多词组合在以起的概率其实并没有很高，组合到⼀起的词越多，它的数据模型是越稀疏的。因为数据非常稀疏，这会导致参数空间太大。

基于马尔科夫的假设

为了解决上述缺点，下面介绍基于马尔科夫的假设。
基于马尔科夫的假设：下一个词的出现仅依赖于它前面的一个或几个词。

假设下一个词的出现依赖它前面的一个词，则有：

假设下一个词的出现依赖它前面的两个词，则有：

n-gram模型

n-gram模型：假设当前词的出现概率只与它前面的N-1个词有关。
如何选择n:

更大的n：对下ー个词出现的约束信息更多，具有更大的辨别力；
更小的n：在训练语料库中出现的次数更多，具有更可靠的统计信息，具有更高的可靠性。
理论上，n大越好,经验上，trigram用的最多，尽管如此，原则上，能用
bigram解决，绝不使用 trigram。

构造语言模型

构造语言模型：最大似然估计。

Count（X）：在训练语料库单词序列X在训练语料中出现的次数。

词向量

词表示为:[0.792，-0.177，-0.107，0.109，0.542，…]
常见维度50或者100
解决”语义鸿沟“问题
可以通过计算向量之间的距离(欧式距离、余弦距离等)来体现词与词的相似性

独热编码

语言模型生成词向量

神经网络语言模型(NNLM)：直接从语言模型出发，将模型最优化过程转化为求词向量表示的过程。
目标函数：

模型结构：

NNLM是从语言模型出发（即计算概率角度），构建神经网络针对目标函数对模型进行最优化，训练的起点是使用神经网络去搭建语言模型实现词的预测任务，并且在优化过程后模型的副产品就是词向量。
进行神经网络模型的训练时，目标是进行词的概率预测，就是在词环境下，预则下一个该是什么词，目标函数如下式，通过对网络训练一定程度后，最后的模型参数就可当成词向量使用。

循环神经网络语言模型（RNNLN）：基于循环神经网络的语言模型。
w(t)表示第t个时刻的当前输入单词，维度为V，V是词典大小。one-hot表示。
s(t-1)代表隐层的前一次输出，
y(t)表示输出的。

循环神经网络的最⼤优势在于，可以真正充分地利⽤所有上文信息来预测下⼀个词，而不像前⾯的其它工作那样，只能开⼀个 n 个词的窗口，只⽤前 n 个词来预测下⼀个词。

缺点：

计算复杂度大
参数较多

所以接下来介绍word2vec

word2vec

Continuous Bag of Words（CBOW）

Continuous Bag of Words（CBOW）：连续词袋模型，即利用中心词(Wt)
的上下文( context)来预测中心词(Wt)。

目标函数：

无隐层
使用双向上下文窗口
上下文词序无关(BoW)
输入层直接始用低维稠密向量表示
投影层简化为求和(平均)

CBOW模型结构图：

Skip-gram

Skip-gram，跳字模型，是根据中心词(Wt)来预测周围的词，即预测上下文( context)。

目标函数：

输入层：只含当前样本的中心词w的词向量
投影层：恒等投影，为了和CBOW模型对比
输出层：和CBOW模型一样，输出层也是一棵 Huffman树

Skip-gram模型结构图：

训练技巧

层次softmax（Hierarchical Softmax）
负采样（Negative Sampling）

目标函数

最小化目标函数⟺最大化预测精度

我们需要最小化目标函数，那么对于每个单词w我们将使用两个向量：

v_(w)：当w是中心词时
u_(w)：当w是上下文词时

然后对于中心词c和上下文词o：

公式推导

代码实现

用gensim学习word2vec（gensim是一个NLP的包）
下面所使用的数据集为小说《人民的名义》，参照
链接：https://pan.baidu.com/s/1ojWGMI756SO93OCAMNXFVg
提取码：l0zv
复制这段内容后打开百度网盘手机App，操作更方便哦

# -*- coding: utf-8 -*-

import jieba
import jieba.analyse

jieba.suggest_freq('沙瑞金', True)
jieba.suggest_freq('田国富', True)
jieba.suggest_freq('高育良', True)
jieba.suggest_freq('侯亮平', True)
jieba.suggest_freq('钟小艾', True)
jieba.suggest_freq('陈岩石', True)
jieba.suggest_freq('欧阳菁', True)
jieba.suggest_freq('易学习', True)
jieba.suggest_freq('王大路', True)
jieba.suggest_freq('蔡成功', True)
jieba.suggest_freq('孙连城', True)
jieba.suggest_freq('季昌明', True)
jieba.suggest_freq('丁义珍', True)
jieba.suggest_freq('郑西坡', True)
jieba.suggest_freq('赵东来', True)
jieba.suggest_freq('高小琴', True)
jieba.suggest_freq('赵瑞龙', True)
jieba.suggest_freq('林华华', True)
jieba.suggest_freq('陆亦可', True)
jieba.suggest_freq('刘新建', True)
jieba.suggest_freq('刘庆祝', True)

with open('./in_the_name_of_people.txt',encoding='utf-8') as f:
    document = f.read()
    
    #document_decode = document.decode('GBK')
    
    document_cut = jieba.cut(document)
    #print  ' '.join(jieba_cut)  //如果打印结果，则分词效果消失，后面的result无法显示
    result = ' '.join(document_cut)
    result = result.encode('utf-8')
    with open('./in_the_name_of_people_segment.txt', 'wb') as f2:
        f2.write(result)
f.close()
f2.close()

# import modules & set up logging
import logging
import os
from gensim.models import word2vec

logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)

sentences = word2vec.LineSentence('./in_the_name_of_people_segment.txt') 

model = word2vec.Word2Vec(sentences, hs=1,min_count=1,window=3,size=100)

req_count = 5 #输出几组
#找出某一个词向量最相近的词集合
for key in model.wv.similar_by_word('李达康', topn =100):
    if len(key[0])==3:  #第一列的长度
        req_count -= 1
        print (key[0],key[1])
        if req_count == 0:
            break;

req_count = 5
for key in model.wv.similar_by_word('赵东来', topn =100):
    if len(key[0])==3:
        req_count -= 1
        print (key[0], key[1])
        if req_count == 0:
            break;

req_count = 5
for key in model.wv.similar_by_word('高育良', topn =100):
    if len(key[0])==3:
        req_count -= 1
        print (key[0], key[1])
        if req_count == 0:
            break;

req_count = 5
for key in model.wv.similar_by_word('沙瑞金', topn =100):
    if len(key[0])==3:
        req_count -= 1
        print (key[0], key[1])
        if req_count == 0:
            break;

#看两个词向量的相近程度
print (model.wv.similarity('沙瑞金','高育良'))
print (model.wv.similarity('李达康','王大路'))

#找出不同类的词
print (model.wv.doesnt_match(u"沙瑞金 高育良 李达康 刘庆祝".split()))

你可能感兴趣的:(cs224n学习1：Word2Vec发展及代码实现)

Golang：报错no required module provides package github.com/xx的解决方法凭君语未可 Golang 常见问题 golang github 开发语言
报错问题重现可能的原因及解决方法1.未初始化Go模块解决方法：2.没有添加依赖解决方法：3.网络问题解决方法：4.依赖版本问题解决方法：5.包未发布或路径拼写错误解决方法：6.`gomodtidy`未运行解决方法：7.代码中未使用依赖解决方法：8.`vendor`模式导致依赖无法找到解决方法：实际报错原因及分析解决方法问题重现在运行以下代码时：packagemainimport("context"
OCR字符识别--WeChatocr 鲁鲁在川 ocr
导入库，及定义微信OCR地址fromwechat_ocr.ocr_managerimportOcrManager,OCR_MAX_TASK_IDimportthreadingwechat_ocr_dir=r"./ocr/WeChatOCR/7079/extracted"#OCR的地址，可以用everythin工具查找一下地址这个地址是电脑用户安装APP的地址---C:\Users\xxxx\App
HIVE合并小文件难以触及的高度 hive hadoop 数据仓库
8.分区分桶，合并小文件为什么小文件需要合并？1.小文件过多，MR处理数据时，会产生多个MapTask,然而每个MapTask处理的数据量很少，那么导致MapTask启动时间大于执行时间，整体任务时间消耗较大如何合并小文件：1）在map执行前合并小文件，减少map数：CombineHiveInputFormat具有对小文件进行合并的功能（系统默认的格式）。HiveInputFormat没有对小文件
1.4走向不同：GPT 与 BERT 的选择——两大NLP模型的深度解析少林码僧 AI大模型应用实战专栏自然语言处理 gpt bert
走向不同：GPT与BERT的选择——两大NLP模型的深度解析在自然语言处理（NLP）领域，GPT（GenerativePretrainedTransformer）和BERT（BidirectionalEncoderRepresentationsfromTransformers）无疑是最具代表性和影响力的两个模型。它们都基于Transformer架构，但在设计理念、任务应用和训练方式等方面存在显著差
1.8 GPT-4：开创人工智能的新纪元少林码僧 AI大模型应用实战专栏人工智能
GPT-4：开创人工智能的新纪元自从OpenAI推出GPT-4以来，人工智能领域经历了显著的突破。作为“生成预训练转换器”家族中的最新成员，GPT-4不仅在功能上进行了提升，更在语言处理能力、理解深度以及适应性方面带来了全新的变革。本篇文章将深入探讨GPT-4的特点、创新以及它如何定义未来人工智能技术的发展。GPT-4的技术亮点1.规模与深度的进一步提升GPT-4的规模比前代模型更大，训练数据量和
JavaWeb开发 - Filter过滤器详解秦老师Q JavaWeb基础 java web java-ee
前言本章节主要学习JavaWeb开发中的Filter过滤器技术，收录于JavaWeb基础专栏，该专栏主要学习JavaWeb开发原生框架、Servlet、JSP、请求对象、响应对象、Session会话对象、Filter过滤器、三层开发模型等知识点，欢迎童鞋们互相交流。觉得不错可以三连订阅喔。目标1.概念2.Filter介绍3.入门案例4.验证登录案例4.1登录代码4.2过滤器验证内容1.概念Filt
华为OD机试E卷 --跳格子3 --24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c++算法源码题目描述小明和朋友们一起玩跳格子游戏，每个格子上有特定的分数score=[1,-1,-6,7,-17,7]，从起点score[0]开始，每次最大的步长为k，请你返回小明跳到终点score[n-1]时，能得到的最大得分。输入描述第一行输入总的格子数量n第二行输入每个格子的分数score[i]第三
Kotlin Bytedeco OpenCV 图像图像55 图像透视变换深色風信子 kotlin opencv 透视变换 bytedeco
KotlinBytedecoOpenCV图像图像53图像透视变换1添加依赖2测试代码3测试结果1添加依赖4.0.0com.xuKotlinOpenCV1.02.0.0UTF-8official1.8mavenCentralhttps://repo1.maven.org/maven2/cn.hutoolhutool-all5.8.29org.apache.commonscommons-compres
C++ 的 CTAD 与推断指示（Deduction Guides）王晓华-吹泡泡的小猫现代 C++c++现代 C++类模板参数推导
1类模板参数推导（CTAD）1.1曲线救国CTAD的全称是类模板参数推导（ClassTemplateArgumentDeduction），它允许在实例化类模板时，根据构造函数的参数类型自动推导模板参数，从而避免显式指定模板参数。CTAD是在C++17引入的，在这之前，只有模板函数支持根据函数参数自动推导模板参数，类模板不支持这样的动作。代码中实例化类模板必须显式指定模板参数，十分不便，以致怨声载道
第83期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.混乱中建立秩序：人
NVIDIA Hopper 架构深入 RZer 硬件工程架构 NVIDIA
在2022年NVIDIAGTC主题演讲中，NVIDIA首席执行官黄仁勋介绍了基于全新NVIDIAHopperGPU架构的全新NVIDIAH100TensorCoreGPU。文章目录前言一、NVIDIAH100TensorCoreGPU简介二、NVIDIAH100GPU主要功能概述1.新的流式多处理器（SM）具有许多性能和效率改进。主要新功能包括：2.新的transformer引擎结合使用软件和定制
腾讯cos对象存储，下行流量费贵，是否可以加入服务器减少费用，架构如何设计 iteye_10392 对象存储 java
腾讯云COS（CloudObjectStorage）对象存储服务提供了一种高效、安全、低成本的方式存储大量数据。然而，当涉及到外网下行流量时，确实会产生一定的费用，这可能会增加整体的成本。为了减少这些费用，可以通过以下几种方式优化架构设计：1.内网访问内网通信：如果您的应用服务器也在腾讯云上，尽量使用内网IP来访问COS。腾讯云通常不收取内网流量费用，这样可以大大减少成本。VPC互通：确保您的应用
【Python】已解决：ModuleNotFoundError: No module named ‘sklearn‘ 屿小夏 python sklearn 人工智能
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
[python]通过whl文件安装torchvision和torchaudio及国内whl文件下载地址汇总萌萌哒240 环境配置 python 开发语言
要通过.whl文件安装torchvision和torchaudio，你需要先确保你已经安装了与这些库兼容的PyTorch版本。以下是一个详细的步骤指南，帮助你通过.whl文件安装这些库。1.安装PyTorch首先，确保你已经安装了PyTorch。你可以从PyTorch的官方网站获取适合你系统的安装命令例如，如果你使用的是CUDA11.3和Python3.8，你可以使用以下命令安装PyTorch：p
drogon跨域问题和全局异常处理 zh7314 c++
2024年6月20日12:21:11在main.cc里加入/***全局异常处理*/drogon::app().setExceptionHandler([](conststd::exception&e,constdrogon::HttpRequestPtr&req,std::function&&callback){LOG_DEBUGdrogon::HttpResponsePtr{if(req->me
drogon orm分页问题，req->getJsonObject()为空会导致Segmentation fault zh7314
2024年6月22日17:14:12req->getJsonObject()获取json数据的时候，如果没有提前判断if(req->getJsonObject()==nullptr){throwstd::invalid_argument("参数json不能为空");}autojsonPtr=req->getJsonObject();官方文档：https://github.com/drogonfra
重生之我在异世界学编程之算法与数据结构：算法复杂度介绍篇就爱学编程数据结构与算法算法数据结构排序算法
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！本文目录引言正文一时间复杂度1.常数时间复杂度O(1)2.线性时间复杂度O(n)3.对数时间复杂度O(logn)4.平方时间复杂度O(n^2)5.指数时间复杂度O(2^n)二空间复杂度（1）空间复杂度的定义与重要性（2）常见的空间复杂度类型及介绍1.常数空间复
重生之我在异世界学编程之算法与数据结构：深入静态顺序表篇就爱学编程数据结构与算法算法数据结构
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！本文目录引言正文一、顺序表的概念及结构1.顺序表的定义2.顺序表的结构3.顺序表的初始化二、顺序表的基本操作（静态）1.插入操作2.删除操作3.查找操作4.更新操作5.获取元素操作6.遍历操作7.求顺序表的长度8.判断顺序表是否为空快乐的时光总是短暂，咱们下篇
重生之我在异世界学编程之C语言：深入动态内存管理篇就爱学编程 C语言 c语言网络 android
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！本文目录引言正文一动态内存管理的必要性二动态内存管理的关键函数1.`malloc`函数2.`calloc`函数3.`realloc`函数4.`free`函数三动态内存管理中的错误和最佳实践1.内存泄漏2.野指针3.内存越界四动态内存管理的高级主题内存分配器内存
重生之我在异世界学编程之C语言：深入指针篇（上）就爱学编程 C语言 c语言开发语言
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！本文目录引言正文（1）内置数据类型指针（2）自定义类型指针1.数组指针与指针数组2.结构体指针3.联合体指针（1）联合体指针的定义（2）联合体指针的使用（3）联合体指针的注意事项（3）函数指针1.函数指针的定义2.函数指针的赋值3.函数指针的使用4.函数指针作
Centos7.6离线安装软件 PascalMing Linux Centos yum ntp 离线安装
在离线情况下，安装Centos软件，有几个方法1、直接下载离线软件包如果能直接下载离线软件包，是最省事的方法，可以直接baidu查找试试，或到下面这个网址试试：PackagesforLinuxandUnix-pkgs.orgUbuntu各版本的软件比较齐全，下载后直接安装即可由于Centos目前逐步停止支持，导致不少安装包不容易找到，可以试试第2种方法2、使用yum的离线包下载功能yum将一个包下
GitLab：添加SSH密钥之前，您不能通过SSH来拉取或推送项目代码 dingcho 运维 gitlab ssh 运维
1、查看服务器是否配置过[root@kingbal-ecs-7612~]#cd.ssh/[[email protected]]#lsauthorized_keysid_ed25519id_ed25519.pubid_rsaid_rsa.pub2、创建密钥$ssh-keygen-trsa-C'[email protected]'#-C后写你的邮箱一路回车3、复制密钥[root@k
yarn：安装依赖包出现“There appears to be trouble with your network connection. Retrying...” dingcho 前端 yarn
//设置镜像地址为淘宝（地址1，推荐）：yarnconfigsetregistryhttps://registry.npmmirror.com//设置镜像地址为淘宝（地址2）：yarnconfigsetregistryhttps://registry.npm.taobao.org
C语言入门算法——明明的随机数 0X78 C语言算法 c语言数据结构
题目描述：明明想在学校中请一些同学一起做一项问卷调查，为了实验的客观性，他先用计算机生成了N个1到1000之间的随机整数(N≤100)，对于其中重复的数字，只保留一个，把其余相同的数去掉，不同的数对应着不同的学生的学号。然后再把这些数从小到大排序，按照排好的顺序去找同学做调查。请你协助明明完成“去重”与“排序”的工作。输入格式输入有两行，第1行为1个正整数，表示所生成的随机数的个数N。第2行有N个
【3. 深入解析 C++ 数据类型：全方位指南】涛ing C++基础 c++开发语言 c语言 linux visual studio vscode vim
本章目录:前言1.什么是数据类型？2.C++基本数据类型类型修饰符3.数据类型的大小和范围4.高级数据类型：`typedef`和`enum``typedef`类型别名枚举类型(`enum`)5.类型转换1.静态转换(`static_cast`)2.动态转换(`dynamic_cast`)3.常量转换(`const_cast`)4.重新解释转换(`reinterpret_cast`)6.实用技巧：提
Python：Numpy使用方法从小就看凹凸曼^o^ python numpy
一.生成数组1.快速生成数组importnumpyasnpa=np.array([1,2,3,4,5])#[12345]b=np.array(range(6,11,1))#[678910]c=np.arange(11,16,1)#[1112131415]d=np.linspace(16,20,5)#[16.17.18.19.20.]其中：np.array(range(......))←→np.ar
使用神经网络拟合6项参数 Andrew_Xzw 神经网络人工智能深度学习开发语言机器学习 python
使用神经网络拟合6项参数1.数据预处理1.1添加参数解析1.2数据预处理逻辑1.3数据归一化及划分1.4数据标签处理逻辑1.5数据转torch2.定义model2.1CNN_LSTM2.2Transformer3.定义train脚本3.1loss和optimizer3.2train3.3predict1.数据预处理1.1添加参数解析为了方便管理模型和训练等参数，统一用参数解析。defparse_a
TiDB Drems 凉兮分布式
架构原理及安装部署第一天：学习任务【PCTA备考指南1/16】TiDB架构原理及安装部署：https://asktug.com/t/topic/34500第二天：学习任务【PCTA备考指南2/16】TiDB使用管理手册：https://asktug.com/t/topic/34505第三天：学习任务【PCTA备考指南3/16】TiDB管理工具：https://asktug.com/t/topic/
Ubuntu问题集2.0 Glourier 小技巧 Linux ubuntu linux
目录1.实时显示网速、内存占用等2.创建虚拟环境3.设置命令走代理4.下载东西时ConnectionRefused5.通过ssh连接到另一台电脑6.Ctrl+C无法终止进程7.结束某个后台进程8.持久化安装9.桌面无反应10.装系统时缺少grub文件11.查看网络情况和本机IP12.令终端命令走代理13.释放缓存和swap14.Windows远程登录ubuntu桌面15.Sogou拼音皮肤安装不了
软件测试基础入门运筹帷幄小红花软件测试软件测试
一、基础概念什么是软件：控制计算机硬件的工具，操作系统软件、应用软件软件基本组成：客户端、服务器、数据库软件产生过程：需求构思-->需求文档-->UI/UE-->产品研发-->产品测试-->部署上线什么是软件测试：使用技术手段验证软件是否满足需求软件测试的目的：减少软件中的缺陷，保证软件质量；二、主流技术1、功能测试：执行测试用例2、自动化测试：通过工具或代码执行测试用例，场景：回归测试，新增功能
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他