17-
17 单词,建立主页,interspeech文字,阅读技巧;
18 英语OG(阅读),interspeech实验部分以及文章整体框架的修改,github和git怎么关联以及搭建(搞懂但没做,具体是因为个人用途不大,就当扩充视野了);
19 听力单词,Interspeech改完一遍
20 滑雪运动(周六),继续改interspeech第二遍
21 英语单词 interspeech第二遍改完 单位推荐函
22 英语单词 (组内调动)interspeech第三遍结束 在线客服和聊天机器人调研(智齿,图灵机器人,小黄鸭(simsimi)深度搜索算法规则库,ALML语言的Alice Tornado搭建网站)
23 听力答题技巧+2篇训练 想方向;学习代码(numpy, pandas, pickle)PCA
24 英语单词 交接项目(有备注)拜读Arjun的博士毕业论文 讨论论文改动(argmax)
25 Arjun论文 修改专利
26 英语写作(知乎)总结, 修改专利最终版
27 看课外书(周六)学习语法,准备报告to ZC
************************************************************(做论文baseline,中移动,论文的细节,specifize)
28 讲报告toZC(外围可视化Angularjs,交互呈现可以用SpingMVC,交互层自己用java写;如果想要存储消息化序列采用kafka,部署在大数据平台spark,(Handoop, Hbase,ES)相当于顺序是kafka-spark/java-Hbase(kafka)/Hadoop/ES;论文查重-聊天机器人-智能客服--SSaS)
29去移动通信研究院出差
30 接手**之前在移动研究院的项目工作,熟悉他们的工程环境和数据获取方式等。
3月
21-25
计划:
21 自:论文实验部分数据整理(评价标准),写作;实验室:主题发现系统思路
21实际:做分角色的情感与不分角色情感实验,经过实验表明分角色的情感性能会更高;确定评分方案(评分方案选择仍像MultiLing上说的有待进一步研究),但做了几组对比实验;基于海量文本的主题发现及其倾向性分析方案,其中在对种子主题词汇扩充上写了一个基于PMI的脚本。
22自:论文修补写作。学习机器学习。实验室:继续尝试新方法
22实际:论文模板移植,学习机器学习实战里的numpy的用法;方法.shape,.dtype .sum(axis=1)函数tile
23 实验室:看论文尝试新方法,修改论文加入实验结果。
23实际:看论文找到在微博上主题发现的方法,并在微博数据上做了预处理训练了个词矢量。CNN与声学模型融合(移动研究院)
24实验室:工程搭建。 自:论文抽时间改改
24实际:根据阅兵为种子主题,扩充主题列表。然后根据主题列表过滤海量文本,提取出跟阅兵主题相关的微博。
25实际:移植在Pure_Weibo上
28-31
28:关于中国移动项目做文本层模型与声学层模型融合实验,应对方要求整理模型融合后加规则的实验并添加完整注释以及操作流程说明。
29:整理CSC材料,修改论文,把之前的实验数据结果补充
30:修改论文并提交论文。(表达的核心是逻辑)
31:英文(动、名、形容词积累)(3)、论文/考试 套路(5)、总结与复习(2)