这个领域里,什么都特别快.三个月前看到Bengio组的BinaryConnect. 脸草的同事都很喜欢模型加速/压缩的主题,因此立刻就重现了结果开始改进.
当时就说要做成Binary Activation,并且搞一个GPU runtime.
正当同事们回家过年,我在yy这学期parallel大作业要不就写这个runtime的时候,昨天看到Bengio新的paper挂出来,已经都做完了.
更夸张的是,在前天arxiv挂了另一篇文章,方法基本一样.三个月,能专心做的话并不难,然而我要应付作业,要去oculus写代码,还有其他好玩的东西在分心.
想着有空慢慢做的时候,别人已经不等你了.一个月前Yuandong学长说可以来FAIR跟他做围棋. 目前的CNN方法很promising,问题本身也很酷,觉得是个好项目.
然而过几天DeepMind出来说,我们早都做差不多了,三月份韩国比赛,指不定就problem solved了.
我都不知道该期待李世乭赢还是输.看了一篇博文和Yuandong学长的专栏,
感慨万千. DeepMind的paper看下来,很多人说没看到新鲜的东西. 用CNN做估值不算难以想到的idea,
用SL和RL像是他们试了试不同模型挑了个最好的. 然而DeepMind有一帮有时间的人,有钱有系统,能以极致的规模把问题给solve掉,
上了nature封面. 而我们只能在家里看
...
继续阅读
(87)