使用python调用计算所分词系统ICTCLAS30

代码很简单,但我自己摸索了一下午

#coding:gb2312
from ctypes import *

dll=cdll.LoadLibrary("ICTCLAS30.dll")
dll.ICTCLAS_Init(c_char_p("."))
lpText = u"计算所汉语词法分析系统ICTCLAS调用测试"
bSuccess = dll.ICTCLAS_ParagraphProcess(c_char_p(lpText), 1)
print c_char_p(bSuccess).value,lpText
dll.ICTCLAS_Exit()

把这个文件同ICTALAS30.DLL ,DATA文件夹,Configure.xm l放在同一个目录下即可。

模块化设计如下:
#coding:gb2312
from ctypes import *
import re

class ictclas:
    def __init__(self):
      self.dll=cdll.LoadLibrary("ICTCLAS30.dll")
      self.dll.ICTCLAS_Init(c_char_p("."))
      
    def exit(self):
        self.dll.ICTCLAS_Exit()
    
    def addDict(self,dictpath):
        self.dll.ICTCLAS_ImportUserDict(c_char_p(dictpath));
        self.dll.ICTCLAS_SaveTheUsrDic()
        
    def procss(self,text):
        bSuccess=self.dll.ICTCLAS_ParagraphProcess(c_char_p(text), 1)
        return c_char_p(bSuccess).value
    
if __name__=="__main__":
    fenci=ictclas()
    #fenci.addDict('d://pku-words.txt')
    print fenci.procss('亚太经合组织欢迎你')
    fenci.exit()

你可能感兴趣的:(C++,c,python,C#)