(week1)
day1. 在paperwork 配环境 搞琐碎的事 一天就过去了。。
day2. 装了虚拟机 尼玛装了超久 讨厌用windows== 下午导数据
day3. 太久没用数据库了 非常疲惫。。今天预计完成的任务没有做完 晚上在家里写完script吧
day4. 今天吃太多了!!!没有战斗力(布朗委屈脸) 任务差不多完成啦
day5. 有点累 research就是麻烦 跟做data sci一样 还是挺喜欢上班的 感觉像在实验室一样
(week2)
day1. 不行 放了周末就不想上班了。。当我得知税后工资才两千 当我发先我才上7周的班 我。。想哭。。每天最累的是眼睛 今晚又做不进去事 这一天做了slide和数据分析
day2. phd提出一种酷炫的online learning的方法 还要做成distributed 真好玩!好想做!结果因为知识产权什么之类的问题我不能和他合作但是我可以用他的概念 自己写。。好 学scala!现在我的任务是 给你一杯饮料 把它变成水。。然后我们不知道什么是水 也不能花太长时间变成饮料。。看了一下午资料毫无头绪 天哪
day3. 本来想换问题 似乎mentor不愿意 那我就尽快做完这个问题。下午完成pca, cosindis, 在测itembase 数据量太大了 似乎python numpy的问题 不知道 看不到报错信息 vm就挂了。java的PrintWriter 最后要记得close 不然数据存在buffer里 不会flush到文件里
day 4. 照我这样做下去 真的是瞎做 没有人指导 今天略无进展 主要问题是数据量太大 电脑跑不动 打算用spark啦 然后再看看parameter learning的东西
day 5. 一天的开始 先来整理下各种琐碎的概念。。
apache: web server. hadoop: apache's ds architecture, it's two main core design: HDFS & MapR(yarn: a new mapr archi). and also yarn, hbase, hive, pig. cloudera has biggest hadoop . spark: apache's another product.
mentor的最终目的是要发paper。。可是这和初级数学建模一样的solution不值得发啊= =
(week 3放假)
day1. 前一天晚上看新闻看的失眠 结果这天一天躺在床上 什么事也没干
day2. 导致晚上又失眠。。今天任务是 刷题 backtraking刷完 看coursera
day3. function programming有点有趣。
没有记录的这几天都在失眠 我也是醉了 怎么上班了就不失眠 !!!
week 4
day1. 写好mapreduce jar包一直有问题啊 受不了
day2. 处理数据 写mapr
day3. 算法还是用多线程来处理好 写了多线程
day4. run code. mentor也太墨迹了吧 开个instance还要求那么多 自己拿ec2跑. 重看fast code的课件 parallel program真是有用
day5. 上午跷班看牙齿 医生对我没洗过牙表示震惊 原来美国这边每六个月都得做一次牙齿检查。mentor给我开了个好大的机器 20核哈哈多谢多谢 跑的超快 半小时就好了 不过打算后续步骤也先写多线程 不行再用spark
sat: 刷题 刷dp
week 5
day1. 失眠。groundtruth有问题 mentor好像pm。。。。
day2. 失眠。瞎搞搞没力气
week6
好久没记录了。。详细的都记录在google drive里。 没做好数据分析 现在从头开始做 简直是 以后记住了。知道mentor也要去siggraph 因为他有篇paper后 再也不敢吐槽他了= =算了还是偶尔吐槽下