周若梣

初始分词算法

中文分词简介
- 什么是分词
- 分词算法有哪些
- 什么是一个好的分词算法
基于匹配规则方法
- 前向最大匹配（forward-max matching）
- 后向最大匹配（backward-max matching）
- 双向匹配（Bi-direction Matching）
基于概率统计
- 语言模型
- HMM/CRF

讲个段子

日/ 照香炉/ 生/ 紫烟
日照/ 香炉/ 生/ 紫烟

下面我们一起来学习分词算法吧

中文分词简介

什么是分词

借用百度百科定义：分词就是将连续的字序列按照一定的规范重新组合成词序列的过程

分词算法有哪些

这里按照分词的方法大致分为两类：基于规则的分词和基于统计的分词

基于规则的分词
- 前向最大匹配
- 后向最大匹配
- 最少切分（使每一句中切出的词数最小）
- 双向最大匹配
基于统计
- 语言模型
- HMM
- CRF
- 深度学习

什么是一个好的分词算法

这就涉及到分词算法的设计原则：

颗粒度越大越好
切分结果中非词典词越少越好，单字字典词数越少越好
总体词数越少越好

基于匹配规则方法

前向最大匹配（forward-max matching）

例子：[日照香炉生紫烟]
词典：["日","日照","香炉","照香炉","生","紫烟"]

假设我们设定词的最大长度为5，下面我们看看怎么进行前向最大匹配

第一轮：

“日照香炉生” ，词典中没有匹配该词的

“日照香炉” ，未匹配

“日照香” ，未匹配

“日照” ，匹配

第二轮：

“香炉生紫烟” ，未匹配

“香炉生紫” ，未匹配

“香炉生” ，未匹配

“香炉” ，匹配

第三轮：

“生紫烟” ，未匹配

“生紫” ，未匹配

“生” ，匹配

第四轮：

“紫烟” ，匹配

最终的分词结果为：日照/ 香炉/ 生紫烟

代码实现：

#前向最大匹配
def forward_max_matching(text,maxlen,vocab):
    results = []
    while text:
        #取最大长度的子串进行匹配
        if len(text)

 
 后向最大匹配（backward-max matching） 
 例子：[日照香炉生紫烟]
词典：["日","日照","香炉","照香炉","生","紫烟"]
 
 假设我们同样设定词的最大长度为5，下面我们看看怎么进行后向最大匹配 
 第一轮： 
  “香炉生紫烟” ，未匹配 
  “炉生紫烟” ，未匹配 
  “生紫烟” ，未匹配 
  “紫烟” ，匹配 
 第二轮： 
  “日照香炉生” ，未匹配 
  “照香炉生” ，未匹配 
  “香炉生” ，未匹配 
  “炉生” ，未匹配 
  “生” ，匹配 
 第三轮： 
  “日照香炉” ，未匹配 
  “照香炉” ，匹配 
 第四轮： 
  “日” ，匹配 
 最终的分词结果为：日/ 照香炉/ 生/ 紫烟
 
 发现两种分词结果不一样！！ 
 代码实现： 
 #后向最大匹配
def backward_max_matching(text,maxlen,vocab):
    results = []
    while text:
        #取最大长度的子串进行匹配
        if len(text)
 
 双向匹配（Bi-direction Matching） 
 将前向最大匹配算法和后向最大匹配算法进行比较，从而确定正确的分词方法 
 算法流程： 
  
  比较正向最大匹配和逆向最大匹配结果 
  如果分词数量结果不同，那么取分词数量较少的那个 
  如果分词数量结果相同 
    
    分词结果相同，可以返回任何一个 
    分词结果不同，返回单字数比较少的那个 
   
  
  
 def bidirection_matching(text,maxlen,vocab):
    results = []
    forward = forward_max_matching(text,maxlen,vocab)
    backward = backward_max_matching(text,maxlen,vocab)[::-1]
    # 前后向结果词数不同，返回词数小的
    if len(forward)!=len(backward):
        return forward if len(forward)
 
 直观上来看，如何得到一个好的分词结果呢？ 
 输入文本 -->  找到所有可能的分割  -->  选择最好的结果 
 
  
  可以看到在基于规则匹配的方法中，分词的结果都是局部最优解，更重要的是这种分词方法没有考虑句子的语义信息。如何从所有可能的分词结果中选择最好的，这就需要语言模型出场了 
  
 基于概率统计 
 语言模型 
 语言模型就是用来计算一个句子的概率的模型，也就是判断一句话是否是人话的概率？ 
 给定句子 
  
 
   \[S=W_1,W_2,...,W_K \] 
  
  
 概率可以表示为 
  
 
   \[p(S) = p(W_1,W_2,...,W_K) \] 
  
  
 这里根据马尔可夫假设，可以指定一个词依赖于前面的几个词，这里我们假设每个词的出现都是互相独立的，也就是一元语言模型，所以概率表示为 
  
 
   \[p(S) = p(W_1,W_2,...,W_K)=p(W_1)p(W_2)...p(W_K) \] 
  
  
 我们知道一个词相对整个语料库，出现的概率是非常低的，多个小数相乘可能会出现-inf，所以取对数变为相加，将结果最大的作为最好的分词结果。 
 这里还有一个问题，根据前面说的，生成输入所有的分词结果，这个过程太低效了，我们需要一种方法融合生成分词和计算概率的过程，使用概率图！！ 
  
 上图是一个简单的示意，每一个线段表示一个字或者词，p表示对应的词在词典库出现的概率。如果使用一元语言模型，我么需要做的就是找到概率乘积最小的那条路径，使用动态规划实现最短路径。 
 HMM/CRF 
 使用序列标注方法解决分词，对每一个字标注： 
  
  B（开头）,M（中间),E(结尾),S(独立成词）四种状态 
  
 就学到这里了，实际用的时候需要根据场景做出选择，比如在搜索引擎对大规模网页进行内容解析时，对分词对速度要求大于精度，而在智能问答中由于句子较短，对分词的精度要求大于速度。 
 references 
 匹配法. https://blog.csdn.net/selinda001/article/details/79345072 
 中文分词综述. https://zhuanlan.zhihu.com/p/67185497 
 分词算法综述. https://zhuanlan.zhihu.com/p/50444885


    
        你可能感兴趣的:(初始分词算法)
        
            
                
                    Pytorch实现之利用特征分布的差异来指导GAN的训练
                        这张生成的图像能检测吗
优质GAN模型训练自己的数据集GAN系列pytorch生成对抗网络人工智能神经网络深度学习计算机视觉机器学习
                        简介简介：FIDGAN通过将FID损失引入GAN的训练过程，显著提升了生成图像的质量。其核心思想是利用特征分布的差异来指导生成器的训练，同时通过使用轻量级的MobileNet-v3提高了计算效率。这种方法在图像生成任务中具有广泛的应用前景。论文题目：FIDGAN:AGenerativeAdversarialNetworkwithAnInceptionDistance（FIDGAN：具有初始距离的生
                    
                    Linux运维常见问题排查
                        Hadesls
Linux1024程序员节
                        1.Linux系统安装初始状态时>找不到硬盘，无法进入下一步安装解决方法：进入BIOS/COMS设置，找到硬盘设置相关选项，并设置为兼容模式。2.Linux系统安装时，在硬盘分区完成后>无法继续安装解决方法：硬盘分区不符合安装要求，可能忘记创建根分区或swap交换分区。这一点与Windows系统安装有区别。3.Linux系统安装时，软件包选择困惑，安装完成后发现有组件未按需求安装；解决方法：对Li
                    
                    UVA10608 Friends 题解
                        W9095
算法c++
                        0x01STEP1读题审题UVA10608Friends题面翻译读完题就知道，这题用并查集。本人太弱，就用带权并查集做。0x02STEP2主要步骤实际上，带权并查集的几种操作并不复杂，是基础并查集的扩展版。初始化：for(inti=1;iusingnamespacestd;intn,m,t,f[300000],num[300000];intgetf(intx){if(f[x]==x)returnx
                    
                    STM32启动文件.s解析
                        贾saisai
嵌入式STM32及操作系统stm32单片机
                        文章目录基本介绍实践详解栈空间开辟堆空间的开辟中断向量表定义复位程序对于_main函数的分析中断服务程序用户堆栈初始化系统启动流程基本介绍启动文件由汇编编写，是系统上电复位后第一个执行的程序。启动文件主要做了以下工作：1、初始化堆栈指针SP=_initial_sp2、初始化程序计数器指针PC=Reset_Handler3、设置堆和栈的大小4、初始化中断向量表5、配置外部SRAM作为数据存储器（可选
                    
                    STM32硬件SPI函数解析与示例
                        weixin_58038206
stm32嵌入式硬件单片机
                        1.SPI简介SPI（SerialPeripheralInterface）即串行外设接口，是一种高速、全双工、同步的通信总线，常用于微控制器与各种外设（如传感器、存储器等）之间的通信。STM32系列微控制器提供了多个SPI接口，具有灵活的配置选项。2.相关函数解析2.1初始化相关函数SPI_Init(SPI_TypeDef*SPIx,SPI_InitTypeDef*SPI_InitStruct)功
                    
                    stm32正常运行流程图_stm32初始化流程图解析
                        imToken-Daisy
stm32正常运行流程图
                        STM32系列基于专为要求高性能、低成本、低功耗的嵌入式应用专门设计的ARMCortex-M3内核。stm32参数：12V-36V供电兼容5V的I/O管脚优异的安全时钟模式带唤醒功能的低功耗模式内部RC振荡器内嵌复位电路工作温度范围：-40°C至+85°C或105°Cstm32特点：内核：ARM32位Cortex-M3CPU，最高工作频率72MHz，1.25DMIPS/MHz。单周期乘法和硬件除法
                    
                    软路由折腾 | OpenWrt安装后基础配置指南：联网设置与DNS优化
                        The god of big data
教程虚拟系统网络可以是魔法之地计算机网络网络
                        在PVE中安装OpenWrt教程一、网络基础配置1.确认网络接口角色OpenWrt旁路由通常仅需配置LAN口，无需WAN口。其流量通过主路由转发，因此需确保：物理连接：OpenWrt的LAN口（如eth0）桥接到主路由的局域网（通过PVE的vmbr1）IP规划：旁路由IP需与主路由同网段（如主路由192.168.1.1，旁路由设为192.168.1.2）2.验证初始网络连通性登录OpenWrt管理
                    
                    Oracle快速运行一指禅
                        weixin_30865427
数据库操作系统
                        对于oracle数据库下的企业级应用开发，经常会使用到新建用户，新建表空间以及数据的迁移工作。虽然目前互联网存在很多单个问题的解决方案，但是比较零散，本博文结合研发兄弟们的实际现状，提供一套完整初始研发数据库环境的搭建手段，免得导出搜素。登录相关操作默认有以下2个超级用户：sys：超级管理员用户，具备所有操作的权限，包括启动，停止，修改数据库模式等所有操作；一般我们进行特殊操作都会使用sys用户；
                    
                    STL-向量Vector
                        蓝桉_An
C++STL全集c++开发语言
                        一、简化概念变长数组，倍增思想：和普通数组思想一样，只是长度可以根据需要进行更改，能自动扩大到当前数组大小的两倍(大部分情况下是两倍)使用时需包含头文件，#include其实质是一个动态数组，可以随时添加或删除元素；支持随机访问、在末尾添加元素、在任意位置插入或删除元素等操作，但在中间插入或删除元素会比较慢。二、基本定义vector变量名(长度,初值)，详细定义如代码//省略长度和初始值vecto
                    
                    【字节青训营--还原原始字符串(中）】
                        幼儿园口算大王
java开发语言算法
                        问题描述给定一个字符串F，这个字符串是通过对某个初始字符串S执行若干次以下操作得到的：选择一个整数K（其中0≤K<∣S∣0≤K<∣S∣，∣S|表示字符串S的长度）将S从第K个位置（从0开始计数）到末尾的子串追加到S的末尾，即：S=S+S[K:]输入格式输入为一个字符串F，仅包含小写字母，长度不超过1000。输出格式输出一个字符串，表示可能的最短初始字符串S。如果无法通过题目描述的操作得到字符串F，
                    
                    Vue学习教程-11数组变化监测
                        番茄番茄君
vue.js学习javascript
                        文章目录前言一、vue侦听响应数组变更方法二、使用Vue.set或者this.$set三、替换数组总结前言在Vue中，数组变化监测是其响应式系统的一个重要特性。Vue2.x版本中，当使用Vue.set或者this.$set，或者在初始化时就声明好数组的每个元素或者调用数组方法，可以确保数组的变更能够被Vue检测到并触发视图的更新。然而，在某些情况下，直接通过索引修改数组元素，例如array[ind
                    
                    std::unique_lock＜std::mutex＞ lock(_mutexSwathDone)；
                        Ring__Rain
c++
                        std::unique_locklock(_mutexSwathDone);是C++中用于管理互斥锁（mutex）的常见用法。以下是详细解析：1.代码作用std::mutex：这是C++标准库中的互斥锁类，用于保护共享资源，防止多线程同时访问导致数据竞争。std::unique_lock：这是一个RAII（资源获取即初始化）风格的锁管理类，用于自动管理互斥锁的加锁和解锁。这行代码的作用是：在构造l
                    
                    【力扣】45.跳跃游戏 II
                        shaozk_
力扣刷题算法leetcodec++贪心算法
                        文章目录一问题描述二解决方法1贪心法分析1—反向代码1分析2—正向代码2三总结一问题描述给定长度为n的整数数组nums，每个元素nums[i]代表从索引i向前跳跃的最大长度。初始位置为0，返回达到n-1的最小跳跃次数。（假定数组一定能跳到n-1）45.跳跃游戏II二解决方法1贪心法分析1—反向直接从前往后找到最优的跳跃位置并计算出其所需花费的跳跃次数，并不是很容易（因为无法从判定当前最优位置的下一
                    
                    C++中memset函数的用法
                        MatthewMao
C++使用积累C语言使用积累C++memset函数初始化字符串或
                        //复习数组的时候，第一次见到了memset，学之。memset：char型初始化函数头文件：或函数原型：void*memset(void*s,intch,size_tn)memset(结构体/数组名,用于替换的ASCII码对应字符,前n个字符);memset(结构体/数组名,"用于替换的字符“,前n个字符);函数解释：将s中的前n个字节用ch替换并且返回s函数作用：在一段内存块中填充某一个给定的
                    
                    力扣---跳跃游戏 II
                        53488736abcdefg
leetcode游戏算法力扣数据结构
                        题目：给定一个长度为n的0索引整数数组nums。初始位置为nums[0]。每个元素nums[i]表示从索引i向前跳转的最大长度。换句话说，如果你在nums[i]处，你可以跳转到任意nums[i+j]处:0<=j<=nums[i]i+j
                    
                    Android 第四十二章 Fragment
                        漂泊的蚂蚁
Androidandroid
                        一、简介Fragment(碎片)主要用于对ActivityUI模块化，依托Activity存在，当Activity销毁时，Fragment随之销毁二、生命周期onAttach()Fragment和Activity绑定onCreate()初始化onCreateView()创建视图onActivityCreated()Activity已初始化完成onStart()界面可见onResume()获得焦点o
                    
                    代码随想录2.18-2.19
                        我会非常幸运
代码随想录跟练记录算法c++力扣数据结构开发语言
                        动态规划动态规划题目类型：基础（包括斐波那契类）背包打家劫舍股票子序列动规五部曲：（1）dp数组以及下表的含义（2）递推公式（3）dp数组如何初始化（4）遍历顺序：背包类尤其重要，两层for循环，先遍历背包再遍历物体（5）打印dp数组：看看dp数组是否正确509.斐波那契数70.爬楼梯分析之后发现就是斐波那契数的问题。这道题难点在于递推公式拓展：如果一步可以走m个台阶，如何做爬楼梯拓展就是一步一个
                    
                    常用标准库之-std::iota
                        HL_LOVE_C
C/C++c++算法开发语言
                        定义与头文件std::iota是C++标准库头文件中提供的一个算法，用于将一个连续递增的值赋给指定范围内的元素。函数原型templatevoidiota(ForwardItfirst,ForwardItlast,Tvalue);ForwardIt：前向迭代器类型，用于指定元素范围。T：用于初始化和递增的值的类型。first：指向范围起始位置的迭代器。last：指向范围结束位置的迭代器。value：
                    
                    QT+FFmpeg如何使用GPU加速解码？
                        bug菌¹
全栈Bug调优(实战版)qtffmpeg开发语言c++
                        本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！全文目录：问题描述解决方案1.确保FFmpeg和CUDA的支持2.正确选择硬件解码器设置硬件解码器3.初始化CUDA硬件设备4.硬件解码流程解码帧并处理硬件帧5.检查FF
                    
                    鸿蒙开发：V2版本装饰器@Once
                        

                        前言本文代码案例基于Api13。最近准备把refresh刷新库的装饰器由V1升级至V2时，遇到了一个问题，在@Prop装饰器切换@Param装饰器时，发现了自定义组件的属性无法修改问题，提示报错：Cannotassignto'testContent'becauseitisaread-onlyproperty.实际错误截图：错误原因为，@Param装饰的变量仅支持本地初始化，不允许在组件内部直接修改
                    
                    Golang 面试题
                        ox0080
#北漂+滴滴出行程序员面试指南Golanggolang开发语言后端
                        常见的Go语言面试题及其答案和代码示例：一、高频面试题1.Goroutine和线程的区别？答案：Goroutine是Go语言中的轻量级线程，由Go运行时管理，初始栈大小约为2KB，可以动态扩展和收缩，创建和切换成本非常低。线程是操作系统级别的线程，栈大小通常为MB级，创建和切换涉及内核态和用户态的切换，成本较高。Go使用M:N调度模型，将多个Goroutine映射到少量的操作系统线程上，从而高效利
                    
                    ubuntu上/etc/profile.d/目录的作用
                        阳洞洞
ubuntulinux运维
                        在Linux系统（如Ubuntu、CentOS等）中，/etc/profile.d/目录有着重要的作用，主要用于存放系统级的环境变量和shell脚本配置，详细介绍如下：目录一、工作机制二、具体用途1.设置环境变量2.定义别名3.加载特定模块或初始化程序三、优点一、工作机制在用户登录时，系统会先读取/etc/profile文件，而/etc/profile脚本里包含了对/etc/profile.d/目
                    
                    「学编程常见问题」学Java要准备什么配置的电脑？
                        测试小扎
自学java编程java开发语言自学编程
                        学Java对电脑的配置没有特别高的要求，不需要买配置特别好的电脑，普通PC机可以参考下方的这个配置哦！操作系统：Win10或Mac，优先Win10内存：推荐16G及以上，8G也OK，越大越好CPU：Inteli5及以上，AMD谨慎考虑硬盘：512G及以上，含固态硬盘优先品牌：windows系统优先选择Thinkpad系列，联想，华为等其他品牌也可以考虑注意：购机初始化系统时，用户名建议用英文，不要
                    
                    Centos7 搭建Mongodb 分片集群4.0/ PSA（三成员副本集）
                        乱蹦的小鱼干
MongoDBmongodb数据库
                        MongoDB简介：1、优点和缺点：2、MongoDB适用的业务场景：Centos7搭建Mongodb分片集群一、安装MongoDB社区版4.01、配置程序包管理系统（`yum`）2、安装对应版本的MongoDB软件包。3、创建运行mongodb的目录并禁用SELinux4、修改文件打开数5、初始化系统5.1、创建config配置服务器，配置文件mongoconfig.conf，并启动5.2、创建
                    
                    【Amazing! C】初识结构体（一）
                        jp_yc
c语言数据结构开发语言
                        目录前言一、结构体类型的声明1.1结构体类型的声明1.2typedef关键字1.3结构体成员的类型1.4结构体变量的定义和初始化二、结构体成员的访问2.1结构体变量访问成员2.2结构体指针访问成员三、结构体传参前言我们之前了解了数组，知道数组是一组相同类型元素的组合，元素类型是char，int，float，double等中的一种。单一的类型可以描述事物的部分特征，但并不能表述清楚一个复杂对象，例如
                    
                    MySQL 中各种日志简介
                        C语言扫地僧
MySQL专栏mysql数据库学习
                        MySQL日志慢查询日志(Slowquerylog)慢查询⽇志由执⾏时间超过系统变量long_query_time指定的秒数的SQL语句组成，并且检查的⾏数⼤于系统变量min_examined_row_limit指定值。被记录的慢查询需要进⾏优化，可以使⽤mysqldumpslow客⼾端程序对慢⽇志进⾏分析汇总。获取初始锁的时间不计⼊执⾏时间，mysqld在执⾏完SQL语句并释放所有锁后才将符合条
                    
                    iOS App的启动与优化
                        Cedicn
IOS开发ios
                        App的启动流程App启动分为冷启动和热启动冷启动：从0开始启动App热启动：App已经在内存中，但是后台还挂着，再次点击图标启动App。一般对App启动的优化都是针对冷启动。App冷启动可分为三个阶段：dyld：加载镜像、动态库RunTime方法main函数初始化动态库vs静态库静态库：一堆.o文件的集合（通常是.a后缀），还没有被链接过，缺点是产物体积比较大，优点是链接到App之后体积比较小。
                    
                    【数据结构】清华出版社-刘小晶、朱蓉《数据结构渐进实践指导》第一章(个人手打版)
                        shixiexunnie
立志从0到c++全栈志数据结构算法c++
                        文章目录1_1_SqList.cpp1_1_LinkList.cpp1_1_SqList.cpp#include#include#definesql_size100//线性表初始分配空间的容量#definekuo10//线性表扩展空间的量#defineERROR0#defineOK1#defineOVERFLOW-2typedefintElemType;//数据元素的抽象数据类型，一般为intty
                    
                    哈希表(C语言实现)
                        写代码的大学生
散列表c语言哈希算法
                        在计算机世界中，哈希表如同一位聪慧的图书管理员。他知道如何计算索书号，从而可以快速找到目标图书。文章目录1.哈希表的概念1.1哈希表的基本操作1.2哈希表的常用操作2.基于数实现哈希表2.1哈希表的结构体定义2.2哈希表的初始化2.3删除哈希表2.4哈希函数2.5查找哈希表中的元素2.6删除哈希表中的元素2.7添加哈希表元素3.哈希冲突与扩容4.链式地址改良哈希表4.1链式地址哈希表结构体定义4.
                    
                    LeetCode 232: 用栈实现队列
                        Ning_.
LeeCodeleetcode算法数据结构
                        LeetCode232:用栈实现队列题目描述使用栈实现队列的操作。支持以下操作：MyQueue()：初始化队列。push(x)：将元素x推入队列。pop()：从队列中移除元素。peek()：返回队列头部的元素。empty()：检查队列是否为空。队列的先进先出（FIFO）原则可以通过两个栈来模拟。栈A用于入队操作，栈B用于出队操作。C语言实现#include#include//定义栈结构体typed
                    
                                PHP，安卓，UI，java，linux视频教程合集
                                    cocos2d-x小菜
javaUIlinuxPHPandroid
                                    ╔-----------------------------------╗┆                           
                                
                                zookeeper admin 笔记
                                    braveCS
zookeeper
                                      
Required Software 
1) JDK>=1.6 
2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 
3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘 
   


数据和日志目录  
1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
                                
                                Spring配置多个连接池
                                    easterfly
spring
                                    项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ 
Spring中有关于dataSource的配置： 
    <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" 
  &nb
                                
                                Mysql
                                    171815164
mysql
                                    例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 
 
GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI 
 
TH GRANT OPTION; 
 
如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
                                
                                CommonDAO（公共/基础DAO）
                                    g21121
DAO
                                            好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 
        DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
                                
                                直言有讳
                                    永夜-极光
感悟随笔
                                      
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 
  
精华: 
“直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
                                
                                安装CentOS 7 和Win 7后，Win7 引导丢失
                                    随便小屋
centos
                                    一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。 
一、首先具有root 的权限。 
     即进入Terminal后输入命令su，然后输入密码即可 
二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 
v
                                
                                Oracle备份与恢复案例
                                    aijuans
oracle
                                    Oracle备份与恢复案例 
一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
                                
                                JavaEE开源快速开发平台G4Studio v5.0发布
                                    無為子

                                      
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。 
  
访问G4Studio网站  
http://www.g4it.org       
2013-04-06 发布G4Studio_V5.0版本 
功能新增 
(1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
                                
                                Oracle显示根据高考分数模拟录取
                                    百合不是茶
PL/SQL编程oracle例子模拟高考录取学习交流
                                    题目要求: 
1,创建student表和result表
2,pl/sql对学生的成绩数据进行处理
3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 
  
  
1,创建student表,和result表 
学生信息表; 
create table student(
   student_id number primary key,--学生id
                                
                                优秀的领导与差劲的领导
                                    bijian1013
领导管理团队
                                    责任 

  优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。 
  
 差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。 
 
努力工作 

  优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
                                
                                js函数在浏览器下的兼容
                                    Bill_chen
jquery浏览器IEDWRext
                                      做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： 
 
  IE6：node.nextSibling,对于FF是不能识别的； 
 
  FF：node.nextElementSibling,对于IE是不能识别的； 
 
兼容解决方式：var Div = node.nextSibl
                                
                                【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC)
                                    bit1129
垃圾回收
                                    吞吐量与用户线程暂停时间 
  
衡量垃圾回收算法优劣的指标有两个： 
 
 吞吐量越高，则算法越好 
 暂停时间越短，则算法越好 
 
首先说明吞吐量和暂停时间的含义。 
  
垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
                                
                                J2EE监听器和过滤器基础
                                    白糖_
J2EE
                                     Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。 
监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 
  
 
 ServletContex监听器 
   ServletContex又叫application
                                
                                博弈AngularJS讲义(16) - 提供者
                                    boyitech
jsAngularJSapiAngularProvider
                                      Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。 
  那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
                                
                                java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。
                                    bylijinnan
java
                                    

public class CommonSubSequence {

	/**
	 * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。
	 * 写一个版本算法复杂度O(N^2)和一个O(N) 。
	 * 
	 * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。
	 * O(
                                
                                sqlserver 2000 无法验证产品密钥
                                    Chen.H
sqlwindowsSQL ServerMicrosoft
                                    在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。 这样做, 收到以下错误信息CD KEY的 SQ
                                
                                [新概念武器]气象战争
                                    comsci

                                     
 
       气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 
 
       原因如下: 
 
       地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
                                
                                oracle 中 rollup、cube、grouping 使用详解
                                    daizj
oraclegroupingrollupcube
                                    oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示 转自namesliu 
 
-- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景  
  
--- ROLLUP ， 为了理解分组的成员数量，我增加了 分组的计数  COUNT(SAL)  
 
                                
                                技术资料汇总分享
                                    Dead_knight
技术资料汇总 分享
                                    本人汇总的技术资料，分享出来，希望对大家有用。 
 
http://pan.baidu.com/s/1jGr56uE 
 
资料主要包含： 
Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) 
Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) 
Ser
                                
                                初一下学期难记忆单词背诵第一课
                                    dcj3sjt126com
englishword
                                    could 能够 
minute 分钟 
Tuesday 星期二 
February 二月 
eighteenth 第十八 
listen 听 
careful 小心的，仔细的 
short 短的 
heavy 重的 
empty 空的 
certainly 当然 
carry 携带；搬运 
tape 磁带 
basket 蓝子 
bottle 瓶 
juice 汁，果汁 
head 头；头部 

                                
                                截取视图的图片, 然后分享出去
                                    dcj3sjt126com
OSObjective-C
                                    OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. 
I implemented a category method on UIView to get the vi
                                
                                MySql重置密码
                                    fanxiaolong
MySql重置密码
                                    方法一: 
 在my.ini的[mysqld]字段加入： 
skip-grant-tables 
重启mysql服务，这时的mysql不需要密码即可登录数据库 
 然后进入mysql 
mysql>use mysql; 
 mysql>更新 user set password=password('新密码') WHERE User='root'; 
mysq
                                
                                Ehcache（03）——Ehcache中储存缓存的方式
                                    234390216
ehcacheMemoryStoreDiskStore存储驱除策略
                                    Ehcache中储存缓存的方式 
  
目录 
1     堆内存（MemoryStore） 
1.1     指定可用内存 
1.2     驱除策略 
1.3     元素过期 
2   &nbs
                                
                                spring mvc中的@propertysource
                                    jackyrong
spring mvc
                                      在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： 
 
@PropertySource  在spring 3.1中开始引入 
 
比如有配置文件 
config.properties 
 
mongodb.url=1.2.3.4 
mongodb.db=hello 
 
则代码中 
  

@PropertySource(&
                                
                                重学单例模式
                                    lanqiu17
单例Singleton模式
                                    最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。 
	第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。
	单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式
	静态内部类方式: 
package test.pattern.singleton.statics;

publ
                                
                                .NET开源核心运行时，且行且珍惜
                                    netcome
java.net开源
                                    背景 
2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
                                
                                使用oscahe缓存技术减少与数据库的频繁交互
                                    Everyday都不同
Web高并发oscahe缓存
                                    此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。 
  
缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
                                
                                Spring+Mybatis 手动控制事务
                                    toknowme
mybatis
                                    @Override 
   public boolean testDelete(String jobCode) throws Exception { 
      boolean flag = false; 
 &nbs
                                
                                菜鸟级的android程序员面试时候需要掌握的知识点
                                    xp9802
android
                                    熟悉Android开发架构和API调用 
掌握APP适应不同型号手机屏幕开发技巧 
熟悉Android下的数据存储  
熟练Android Debug Bridge Tool 
熟练Eclipse/ADT及相关工具  
熟悉Android框架原理及Activity生命周期 
熟练进行Android UI布局 
熟练使用SQLite数据库； 
熟悉Android下网络通信机制，S
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.