中文分词方面的重要文章

  1. Jianfeng Gao, Mu Lin, Andi Wu, Chang-Ning Huang, Chinese Word Segmentation: A Pragmatic Approach.  Microsoft Research 2004.
    这是微软亚洲研究院对MSRSeg的实现方法的详细描述,内容非常详细。
  2. Hua-ping Zhang, Qun Liu, Chinese Lexical Analysis Using Hierarchical Hidden Markov Model. SIGHAN 2003. 这是对中科院计算所的ICTCLAS系统算法的描述,主要利用了分层HMM模型。
  3. Hua-ping Zhang, Qun Liu, Automatic Recognition of Chinese Unknown Words Based on Roles Tagging. 这是对ICTCLAS中命名实体和新词的识别做出的解释。
  4. Guohong Fu, Kang-Kwong Luke, Chinese Named Entity Recognition using Lexicalized HMMs. 关于HMM在命名实体识别中的描述。
  5. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition。关于HMM的教程,比较详细。

 

你可能感兴趣的:(中文分词方面的重要文章)