统计局拟通过电商数据完善CPI

  “大数据”未来将应用于物价调查。记者12月4日获悉,国家统计局总统计师鲜祖德日前表示,大数据应用首先是完善CPI(居民消费价格指数)调查。他同时透露,国家统计局正在研究通过网上交易数据和电商数据补充完善CPI。


  大数据将应用于价格调查

  国家统计局今年11月与阿里巴巴、百度、中国联通、58同城、上海钢联等11家企业签订了大数据战略合作框架协议,将共同推进大数据在政府统计中的应用。


  鲜祖德说,要在一些专业统计制度上进行改革和完善,大数据的应用首先是完善CPI的调查,在价格调查方面取得应用和突破。据了解,现在的CPI调查采用的方法是,国家统计局在全国按统一的方法随机选一些调查点,调查员上门调查的方式。


  鲜祖德透露,目前国家统计局正在研究通过网上的交易数据、通过电商企业的数据来补充和完善CPI的调查,这样可以大大减轻基层统计调查员的负担。他同时表示,在CPI调查中,已经开始使用手持电子终端进行调查。


  据悉,政府统计部门收集的数据来源越来越多,有各个部门的行政记录,有电商企业的数据,包括搜索记录、社交记录和媒体等互联网数据。


  将与百度进一步合作


  鲜祖德称,下一步会与更多的企业共同推进政府统计利用大数据的工作。他透露,国家统计局已经与百度谈过,在经济景气判断和民意关注的热点问题方面进行进一步的合作。


  “每天网民在百度上进行的搜索请求超过了50亿次,这些用户搜索的数据就形成特别海量庞大的数据集合,也是具有十分高的统计价值,可以应用在各个方面,包括政府的宏观决策、经济判断、生活的方方面面都可以做一些预测。”百度高级研究员黄林莉说。


  鲜祖德表示,企业有很多数据,这些数据经过汇总提供给国家统计局,将丰富统计局的数据来源,同时,也将对传统的统计数据的收集方式、处理方式、分析方法和发布方式,以及各个统计生产环节带来新的影响,将促进统计生产方式新的变革。




汉语分词系统NLPIR(前身ICTCLAS)2000年诞生以来,历时14年,全球用户突破30万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名,已经成为中文信息处理领域标杆性的工作。ICTCLAS创始人张华平博士倾力打造,即将推出的NLPIR2014版,是迄今为止最大的一次更新,在汉语分词体系架构下增加了对英文词法分析的支持,可以自动识别英文词汇的原型、词性标注、命名实体与关键词;并在当前汉语词法分析的基础上,实现了文档的完整语义分析,自动提取文档的人名、地名、机构名、文章作者、发布的媒体、关键词与摘要,是当前中文信息处理的必备神器,值得期待!

我们即将召开NLPIR2014发布暨ICTCLAS用户大会,由北京理工大学大数据搜索挖掘实验室主办,计算机世界与大数据论坛联合承办。张华平博士诚邀历年来所有支持我们前行的ICTCLAS用户,中文分词及中文信息处理的技术爱好者莅临参加,分享中文语言智能理解的美妙。届时,张华平博士将亲自讲解NLPIR2014背后的技术原理与最新进展,并由资深工程师在不同操作系统不同开发语言下NLPIR的实训技巧,同时还有不同背景的资深用户分享他们的使用开发经验。

在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名

基本信息

会议形式

(a) PPT算法讲解;

(b) NLPIR2014系统演示与实际开发操作;

(c) 针对学员具体需求的互动交流会

(d) 提供专属U盘:保护NLPIR2014的演示系统、各类试用的API以及新版开发手册;

会议时间

1221日上午9:00-12:00,下午13:30-17:00 ( 17:00-18:00 开放式讨论答疑 )

门票费用

(a)1400 (包含门票,NLPIR2014演示系统、开发包与文档, U盘,工作餐,赠送由张华平博士亲笔签名的《大数据搜索与挖掘》专著);

(b) 1210日前缴费优惠价1300元;老学员或同单位三人以上报名九折优惠;全日制学生凭学生证会费优惠价格980元,不含发票。

(c)名额有限,参会者需在参会前提前购买门票。

(d)差旅及食宿费用自理。

与会嘉宾

主讲人:张华平:NLPIR(ICTCLAS)创始人与开发者,北京理工大学大数据搜索挖掘实验室主任,博士,副教授

主持人:赵燕平:北理工经管学院教授,北京理工大学大数据搜索挖掘实验室副主任

特邀ICTCLAS典型用户嘉宾待定(将包括跨国企业、金融、政府机关、科研院所、投资与互联网等代表性用户)

会议地址

北京理工大学理工国际交流中心

在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名

ICTCLAS创始人张华平博士简介

2005年博士毕业于中科院计算所,研究方向为:微博计算、自然语言处理、信息检索与信息安全、大数据搜索与挖掘。曾先后获得2010年度钱伟长中文信息处理科学技术奖一等奖,中科院院长优秀奖、中科院计算所所长特别奖,中科院计算所“百星计划”首批入选者。张华平作为课题组长主持开发了国家自然科学基金、863973242等科研课题十余项,发表《大数据搜索与挖掘》《信息检索:算法与启发式规则》《自然语言理解》等专译著3部,所研制的ICTCLAS分词系统已经向国内外的企业和学术机构颁发了三十万多份授权,在学术界和产业界得到了广泛的应用。并作为特邀技术专家,先后在中央电视台、全国网络侠客行大会、全球大数据技术峰会、中国网络科学大会上做大数据相关的主题演讲,广受好评。

会议日程

时间

讲师

环节

主要内容

8:00-9:00

各位参会人员

会议报到

签到,领取各项资料。

9:00-9:20

赵燕平教授

大会开幕式

开幕式致辞,嘉宾与学员介绍

9:20-09:50

张华平博士

NLPIR2014发布

1)     NLPIR2014功能展示:分词、词性标注、命名实体识别、新词识别、英文分析、关键词提取;

2)    NLPIR2014开发包介绍

09:50-10:10

 

合影留念及茶歇

 

10:10-12:00

张华平博士

NLPIR2014汉语分词关键技术及最新进展

1.  ICTCLAS的层叠隐马分词模型(汉语分词、未登录词识别、词性标注)

2.   ICTCLAS的词典管理专利算法:完美双数组TRIE树;

3.  新词识别与关键词提取算法原理;

4.  NLPIR2014英语词法分析技术;

12:00-13:30

 

工作午餐

 

13:30-15:00

张华平博士

康肖钰硕士生

张冰波硕士生

NLPIR2014汉语分词开发包使用实训

1.    NLPIR2014 C/C++语言调用实训

2.    NLPIR2014 Java语言调用实训

3.    NLPIR2014 Linux调用实训

4.    NLPIR2014 高级编程实训(多线程安全、用户自适应分词、python调用、关键词提取等)

15:00-15:30

朱勇高级工程师

NLPIR示范应用:黄金眼Web大数据搜索与挖掘平台

主要介绍利用NLPIR系统开发的黄金眼Web大数据搜索与挖掘平台,展示主要功能与背后的实战应用经验,目前已经应用于工信部、总参、财经杂志等单位。

15:30-16:00

姜伟(北京外事办信息中心主任)

NLPIR示范应用:政务公文主题词提取系统

主要介绍利用NLPIR系统开发的政务公文主题词系统,历经十余年,目前已经应用于大部分政府机关。

16:00-16:30

罗文川(缔元信CTO

NLPIR示范应用:缔元信网站统计数据挖掘与应用

主要介绍缔元信利用NLPIR系统开发的互联网网站统计数据挖掘与应用,是目前网站统计方面权威的机构。

16:30-17:00

待定

 

 

17:00-18:00

 张华平博士

交流沙龙

 可与ICTCLAS创始人张华平博士直接交流讨论


名额有限,先到先得,参会报名热线:

张老师 13681251543    Email: [email protected]

官网支持:http://ictclas.nlpir.org

在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名


你可能感兴趣的:(百度,博士,调查,中国联通,钱伟长)