一些人机对话方面的资料

 

一些想法:
一、人机对话程序反应速度太慢,一句话一般需要1500ms以上,再加上网络延迟和较大的提问量,速度可能会不理想。
二、购买的语料库很可能需要再次处理。我们的人机对话的智能性一部分是语料库的容量,一部分也要靠分词,如果其他公司或个人的语料库的存取算法和我们不同(极有可能),就需要对其进行处理(如分词)。需要的时间可能不亚于构造语料库。
三、学习的问题。如果希望提问者亦能教机器人问答,那必然需要提问者手动分词,这有两个问题,一个是分词的质量和准确性,一个是根据什么规范,不能要求提问者按照“介词/2个动词/2个名词/3个任意词”的模式进行教授,这过于繁琐,会降低提问者的教授积极性。

一、MSN机器人

  • 亮亮机器人[email protected]
    主页:http://www.funnyok.net/Home/
    优点:学习功能,会记住提问者的信息并做出相应的回答(再次登陆后还是记得);
    缺点:语料库一般,英文很差
    附加功能:据主页介绍,本站绝大部分功能都可以通过MSN机器人:[email protected] 实现,测试发现可以实现快速论坛注册、email发送、主页帖子搜索、缩写查询、数学计算、在线学习等功能。

  • I   [email protected]
    主页:http://www.xiaoi.com/
    优点:语料库较大(众多网友为其添加知识库)
    缺点:英文很差。
    附加功能:http://www.xiaoi.com/func.asp?mode=1
    其他:有QQ版本的小I,由于公司限制,未测试

  • E  [email protected] 
    主页:http://www.evabot.com
    优点:会些英文
    附加功能:http://www.evabot.com/?q=node/view/4

  • 捷博MSN精灵
    优点:架设自己的MSN机器人,且数据库在本地机子上
    缺点:简单的like匹配,智能低

  • 中国机器人
    主页:http://www.aawns.com/cnrobot/index.asp
    优点:可以架设自己的MSN机器人
    缺点:数据库在cnrobot服务器上

  • 中国机器人[email protected]
    主页:http://www.aawns.com/cnrobot/index.asp
    (由于一直离线,所以无法测试)

  • 小布
    主页:http://www.9zi.com/
    开发者:武汉光衡信息技术有限公司
    (由于一直离线,所以无法测试)

  • 其他(其他MSN机器人,随意添加了几个,全部离线,晕了)
    http://www.charry.org/MSN/article/list.asp?id=152

二、其他机器人

  • 端端机器人
    主页:http://duanduan.implight.com:8080/
    开发者:武汉光衡信息技术有限公司

  • 悠悠超人UC机器人)
    (由于公司限制,未测试)

  • 小强QQ机器人)
    (由于公司限制,未测试)

三、相关URL(排名不分先后)

  • 知网:
    http://www.keenage.com/html/c_index.html

  • CIPP-中文信息处理平台
    http://www.njnu.edu.cn/wxy/cipp/forum.asp

  • 北京大学汉语语言学研究中心
    http://ccl.pku.edu.cn/resource.asp?item=1

  • 北京大学计算语言学研究所
    http://icl.pku.edu.cn/default_cn.asp

  • 纳讯------中文信息处理
    http://naxun.sjtu.edu.cn/

  • 人工智能研究者俱乐部
    http://www.souwu.com/bitfarmer/

  • 语言学论文选
    http://ling.ccnu.edu.cn/message/yyxlwx/yyxlwx.htm

  • 中国人工智能网
    http://www.chinaai.org/

  • 中文语音语言数据联盟
    http://www.chineseldc.org/index.htm

  • 中文自然语言处理开放平台
    http://www.nlp.org.cn/


四、其他资料

l       6万条词语分词词库

l       人民日报标注语料1998

l       双语句子对照语料库

你可能感兴趣的:(数据库,测试,自然语言处理,语言,开放平台,数学计算)