无标题文章

##本周工作报告_10

######2014.12.18

#### 一、之前的思路总结- 分别使用Toppgene -> SVMLight -> SVMrank -> transtive SVM 针对不同的核函数进行疾病基因预测的训练- 前两周我遇到了问题,不论如何都发现无论是 SVMrank 还是 SVMLight 还是 transtive SVM 要出来结果都非常慢,要么训练出结果通常需要一天以上,要么svm在一直在循环迭代,以至于使得工作一直停滞不前#### 二、本周工作- 这周我认真检查了我写过的代码,终于发现了导致我的训练速度这么慢的真正原因,原来是我之前处理文件的代码有一个很小的错误,使得文件格式虽然SVM是支持的,但是很难训练出来结果,或者说训练出来的结果非常慢: 原因就是:我之前没有加上negative_index,所以我的结果的negative基因只有一个,但我预想的negative基因要有166*3个,怪不得速度这么慢- 然后我解决代码的问题,所以我使用了R 语言的函数化编程,把不同的功能写成不同的函数进行- 然后我写了第一个函数:setNegativeIndex_Script.r,用来快速处理raw data ,然后放到服务器进行训练: 使用svmlight 的 transductive 方法对 [email protected] /mouse_time 进行 mouse_time的训练,只用了640秒,结果就出来了,O(∩_∩)O~太好了,这就是我想要的结果,我对实验又充满了信心,相信很快就能对比出来结果#### 三、接下来方案1. 迭代不收敛的问题已经解决了,接下来的工作首先是第一层的训练 1.1 对比SVMLight SVMRank 还有 transductive这些方法之间的优劣,我个人倾向于 SVMRank 1.2 尝试随机的negative gene 与 不随机的negative gene 对于训练的影响,个人倾向于 通过其它方法来得到指定的 negative gene2. 将我写过的这些处理代码修改,并函数话,之前写的代码太多,太乱了3. 用版本控制工具来辅助实验的进行4. 准备下周的讨论班

你可能感兴趣的:(无标题文章)