很多人不知道梦想是什么,我也不清楚。但我的的确确有一个朦胧的目标,我知道梦想实现后的样子,我了解实现梦想的手段有很多。我知道经过了2014,我离梦想的实现又近了一步。—— 题记一
2014,就这样过去了,有快也有慢,有精彩也有平淡,有开心也有苦涩,有雄心勃勃也有颓颓废废。一切,都让我觉得我真的已经长大了,变得更加成熟了。这其中的关节,说起来有点搞笑,就是不停的发现以前的自己有多幼稚可笑或者称之为“逗比”。脑海中挥之不去的,总是前年的逗比之处,去年的逗比之处,甚至于上个月上周的逗比之处,这其中的意味,就是我在加速度的成长,爆发式的成长,指数式的成长。所以每当我发现自己前几个小时前几秒的逗比之处的时候,我都有一种窃喜,因为我的意识以及我的潜意识都在进步,虽然发现自己逗比仍然敢于窃喜本身就是一件很逗比的事情。—— 题记二
因为本人从12年起就有了记日记的习惯,所以对于每个月都做了什么事情翻翻日记本心中就有数了。所以我的总结按照如下顺序进行:首先是按照时序流水账般的总结每个月都做了什么事情;其次是对今年的感悟和思考,感悟和思考既可能是针对时序记录中某个时间的,也可能是自己与别人交流时思考的,也可能是自己凭空想出来的。
时序总结
一月份的时候,日子过的比较快,每天去图书馆看看三大学报(《计算机研究与发展》《计算机学报》《软件学报》)上比较感兴趣的机器学习方面论文,主要是关于社交网络和推荐系统的。没有一个主要的方向,就像是海边的卡夫卡里的男主人公,随意的读点东西罢了。最后形成了一片博文作为成果:http://blog.csdn.net/stdcoutzyx/article/details/18814627。
二月份的时候,主题自然就是过年放假啦。在家的日子一般都是温馨和满的,不必细表。期间,读了一些IT类书籍,下面有一个IT类书单,大部分书就是在这个时候开始读的。其中,很多书都没读完,都是在之后三四月份才读完的。除了技术类那两本,其他书都可以读的特别快。也可以像《暗时间》里那样,利用零散时间来读,比如回家的火车上。不过,虽然如此,还是耽误了很多和家里人在一起的时光,故而今年应该不会读那么多了,另外,由于装备的原因,那时我拿的还是一个ipad3,举着特别累,对颈椎特别不好,故而今年也想换个专业装备,百万电子书随你挑,不说大家也知道是kindle神器了。哈,还没入手。
除了书以外,还业余看了coursera上几个公开课,包括社交网络分析(SNA)、概率图(PGM)和自然语言处理(NLP)的。不过可惜,除了SNA以外,另外两个都没能坚持看完。
三月份的时候,拿到了去年参加比赛的奖金,没捂热乎就买了一个mba,相信大家也知道,mba对于程序员的重要性不亚于关二爷的青龙偃月,卓凌昭的神剑擒龙。
从三月份开始,直到六月份,开始疯狂的看各种科幻小说,几乎把大刘(刘慈欣)的科幻小说都看完了。原因就是看了《三体》以后,被科幻世界的宏大与精彩所迷醉。下面有一个科幻小说书单,大部分书籍就是在这个时候读的。同时间段,也开始看《逻辑思维》。
在这个时间段,主要忙着的正事有四个,上面那些看小说什么的只是占用了一小部分时间而已(主要是上课时间)。这三个事情一个是一个叫做餐馆建模的东西,第二个是山西某地的一个智慧城市项目,主要在写方案什么的。第三个是一个地质体的网格简化项目。
七月,开始转向图像处理方向,学习一些图像中一些基础的算法,包括Haar(人脸检测)、Hog(行人检测)、LBP(人脸识别)等。
八月起到十月,开始学习深度学习尤其是卷积神经网络,并开始阅读这方面的论文,开始使用cuda-convnet库进行ImageNet图像分类的实验。这一阶段的目标是重现Hinton的那篇经典论文《Imagenet classification with deep convolutional neural networks》的结果。cuda-convnet是论文中提及的库实现,但是里面并没有论文中描述的那些特性。后来发现了cuda-convnet2,很好的实现了论文中的各项功能。
十一月与十二月,主要在做两方面的研究,一方面是人脸识别,考虑将卷积神经网络应用到人脸识别中去,这一点后来发现了DeepID系列算法,在人脸识别中把卷积神经网络运用的炉火纯青,读了该系列算法的一系列论文后,总结了博文
http://blog.csdn.net/stdcoutzyx/article/details/42091205。
另一方面则集中在进行高维图像索引方面,刚开始做不细表。
感悟与思考
要读就读好论文
一月份读过的那些论文,当时读的时候觉得很高端,但后面读的英文文献多了,发现虽然也号称CS类三大期刊,但论文的启发性还是有限。要读论文重点我觉得还是顶级会议顶级期刊的英文文献。这一点,老师曾教导过很多次,但始终不以为然。后面意识到了,但已经浪费了不少时间。
不过我觉得这些时间浪费的值,第一在于浪费的时间其实比较少,第二我现在对这个教训记忆深刻,因为是我自己切身感受得到的。
白走的冤枉路
事实证明,三到六月份的三个事情(餐馆建模、智慧城市、网格简化)中除了第三个外,其他两个都是无疾而终。浪费了我宝贵的几乎三个月的时间。现在回想起来,真是痛心疾首。因为错过了阿里的比赛,虽然不一定参加比赛就一定能冲进决赛拿到名次神马的,但是这两个事使我不能较为全心全意的去做这个事情,每每想起这层,很是痛心。经过这件事情后,我觉得教训很多:
- 没有提前去做判断,没有判断这件事情是不靠谱的还是靠谱的,或者说没有判断准这件事情的靠谱与否。如果是不靠谱的,就不用投入这么多时间浪费了。
- 没有搞清楚自己想要的是什么,我是一个技术人员,即便那些事靠谱,也不能提高我的核心竞争力,那么我也不应该投入时间去做这件事情。
- 不会拒绝,不敢拒绝。作为弱势群体的学生,甚至走到社会上,学会去拒绝是一个很重要的能力,如果我敢于向导师拒绝做这个事情而去承担更加技术性的事情,那么也能避免这种损失。当然,拒绝的时候要讲究技巧,不要引发更糟糕的后果。
- 环境很重要,以前的我以为学校之间差距不大,重点是个人的努力,但是在今年我结识了一些不是很强的学校走出来的同学,交流之中,我对那些同学的努力也非常敬佩,但是学生的水平还是差距蛮大的。我想,这也许就是我没意识到的学校之间环境所引起的差距,清华甚至国外名校如斯坦福、MIT的同学就是这么甩我几条几十条街的吧。所以,今天的困境某种程度上也是当初目光短浅的后果。但事已如此,不必后悔,努力抓住所能遇到的机遇才是重要的。
总而言之,我还是喜欢做技术类的务实的事情,务虚的事情我做不来,或者说当下没步入社会的我是做不出来的。以后遇到同样的事情还是要发扬一下老罗的精神——天生骄傲,不想做的事情能拒绝就拒绝,记得有一句话对自由的定义很精辟:
自由不是想做什么就做什么,而是想不做什么就不做什么。
我想说,这也是我现阶段所能理解的“自由”的最理想状态。
有用的脱口秀
逻辑思维是我今年三月份开始看的脱口秀节目,是罗胖(罗振宇,非老罗(罗永浩))主持的。
该节目套路是,一个团队在幕后读书,可能是一本也可能是讲述同一件事情的几本,然后总结其思想,并由老罗那张胖胖的诙谐可爱的脸和神出鬼没的口才表达和讲述出来,听起来完全不觉得枯燥。而更有意义的是,每本书总结道理的同时,罗胖会引申出一些更为引人深思的道理。
每次看完一起逻辑思维,总能达到一种效果,那就是我感受到一种震撼。虽然说罗胖是互联网拜物教教徒,而我从事的也是互联网行业,有一些同行的意味。但是我觉得其中讲述为人处世的一些视频反而是令我触动最大的。
逻辑思维出了很多期,每一期我都坚持看下来,虽然不可能记住每一期都讲了什么道理,但是我觉得其实潜移默化中我已经深受影响了。
当然,另一个老罗(罗永浩)的脱口秀也很精彩,只不过罗胖是讲的别人的道理,而老罗在以自己为例,现身说法,讲述着一个又一个的天生骄傲的理想主义者的创业故事。他的两个标签:天生骄傲、理想主义者,我向往这有一天我能把这两个标签贴到自己身上。
迷人的科幻世界
除了《全频道阻塞干扰》外,大刘的书应该是全看了。不得不说,我觉得对大刘的“把中国的科幻文学提升至世界水平”的美誉一点也没有夸张,最近听说《三体》要拍成电影,甚是期待,不过有些担心国内制作水平,千万别毁了这部小说啊。
自从看了科幻小说以后,就对武侠没感觉了。一方面觉得武侠中的武功很虚,完全是吹出来的,不像美国的super heros那样多少还有一点科学背景;另一方面总觉得武侠总得依托于历史,而中国的文化似乎有一种从历史中走不出来的感觉,无论是电视剧还是电影,大都有一些历史色彩,而武侠又是依赖历史比较重的,因为离开了古代这一设定就没法吹了。作为对武侠最后一丝感觉的《英雄志》,孙野狗又总是放鸽子,真是累觉不爱。而最近于妈翻拍的《笑傲江湖》《神雕侠侣》又让我觉得金庸古龙武侠其实不是武侠,就是言情。我觉得跟一个纯粹的武侠小说迷如英雄志迷并列倒没有什么,与言情武侠小说迷并列我觉得有点low啊。嘿嘿!
喜欢科幻多于武侠的另一个因素是科幻世界拥有一个更加广阔的想象空间,从人到星球再到整个宇宙,都是想象力的舞台。而武侠,则一受限于时代,二受限于人这一要素。
2015,我要在我的科幻迷之路上走的更远。
痛苦的转向
大四起,开始弄NLP的一些事情,主要研究文本分类。而2014,我开始转向图像,这就需要学习很多图像处理方面的特有算法。一方面,老师总是催着出成果,另一方面,又是初出茅庐的新手处处遇难。那段时间,真的很累。
不过还好,虽然我之前弄的主要是文本分类问题,但我其实感兴趣的是里面的机器学习算法。这点上,机器学习就像是内功,图像处理和NLP其实是外家功夫,对我这种稍有点内力的少年,过程虽然痛苦但还可以熬得过去。
说到机器学习,虽然看过的模型很多,但羞愧的是,ML公开课笔记一直没有总结完。而Ng的新课已然层出不穷。我不知道该不该再继续按照07年网易上那个老课继续总结下去了。踌躇。
自以为对ML颇有理解,但经过了今年的几番挫败之后,觉得
- 原理没有理解清楚
- 不会灵活应用
感觉自己的ML研究之路还有很长要走。
白走的冤枉路2
八月到十月,一直被一个叫cuda-convnet的库折磨。这个库是论文中指定的库,但却没有实现论文中的所有特性,而我,则错以为需要自己写代码实现它。于是傻了吧唧的开始看库代码,并试图进行改动。结果低估了卷积神经网络的复杂度,由于跑一次实验非常耗时,所以调参数什么的也异常耗时。结果自然是调了很久都没有复现出论文中的结果。
直到偶然间,发现了cuda-convnet2,一个新版本的库,完美的实现了论文中的特性以及网络结构。很轻松地就重现了论文的结果。
这件事中,可总结的教训如下:
- 搜商不够,遇到问题没有启用搜商的意识。如果早点google之,兴许问题能很快的解决。
- 有程序员的冲动,动不动就去改代码,自以为会编程无所不能。事实上,编程的确能改变世界,不过,程序员最大的威力不在于编程解决问题,而在于快速解决编程问题。我觉得要做一个优秀的程序员,不是要优化“cost=编程水平”这个单一目标函数,而是要优化“cost=a×编程水平+b×快速解决问题”这样一个目标函数。
简言之就是,既要看能力,又要看眼界。而我,能力本就略显不足,眼界就差的远了。2015,我要提升的能力还有很多。
可学习到的一个经验就是,库这种东西,一定要找好,找最符合条件的、最新版本的。一句话,寻库不易,且行且珍惜。
我和我的Mac
作为一个程序员,拥有一个Mac是我一直以来的梦想,我也不知道何时已经变成果粉了。但是拿到mac后,无论是轻便性还是用户界面还是编程体验,体验都是极棒的。
当然,当我还是小白用户的时候,我觉得mac其实还是有点不方便的,很多win下的软件mac都没有或者说mac下的对应版本都是阉割版。不过好在读过卖桃君的书——《MacTalk人生元编程》,加上自己google、百度来的经验,现在对mac的使用已经感觉非常流畅了。每当我从书包中拿出mac的时候,真的有一种关二爷取出宝刀的赶脚。
比如,现在的我,先博客一般是先用Mou写出来,传到github上,然后再转成html贴到csdn博客上来。一气呵成,既能使用github对博文进行版本管理,又能生成比较漂亮的文章页面。
美中不足的是,我目前的研究方向是图像处理,数据量比较大,自己的Mac是跑不起来的,虽然我是air狗,但我相信,对于如此数据量,pro狗也是跑不起来的。只能每天用工作站和服务器。每当我拿出我的Mac时,都抱有一种深深的歉意,有时候真的想为了Mac转到开发网站和Apps,只为了每天都工作在Mac上。
研究与论文
二月份的时候,收到《中文信息学报》的录用通知。去年的那篇论文算是有了着落。
今年七月份,投出一篇图像拼接的论文到CCPR,一个EI小会议。如此,今年算是灌了两次水。不过去长沙参加CCPR会议的经历倒是让我觉得很有收获,第一次去参加会议的新奇感,认识了很多新朋友,也知道了不少新领域。
关于研究方面,上半年确实没有做研究性的项目,所以那时的心情其实很down,很迷茫。不过跟导师讨论之后,下半年做的事情就很符合我的口味了,卷积神经网络、人脸识别、索引等都是我很喜欢做的事情。所以今年我的研究之路其实是很有大起大落的戏剧性的,没有机会的时候望眼欲穿,有机会的时候反而会因为机会太多而无暇分辨。
有的时候我确实需要一颗平常之心,机会不到的时候不要自怨自艾,机会到了的时候又要有能力抓住机会。抓住机会的能力对我来说最为重要,因为我现在还正在奋斗挣扎着抓住这次机会。
做研究方面,其实要感谢导师,对我很理解,我想做研究导师就会安排一些研究性的项目,比较尊重我个人的意愿。相比于学院里的很多其他老师,我觉得我还是挺幸运的。
比赛
今年参加了不少比赛,可似乎去年的比赛已经用光了我的RP,斩获很少。
- 阿里的大数据比赛,奖金最高的比赛,只提交了一次,就把时间投入到三到六月份的那几个无聊事情中去了,没有仔细的搞这个比赛。看到森栋大神一路过关斩将传到决赛拿到百万大奖,心中好生羡慕嫉妒恨。
- CIKM Cup比赛,CIKM是数据挖掘领域仅次于KDD的会议了。其Cup也很有含量,可惜当时花了大部分时间去弄cuda-convnet,这个比赛又没有专心参加。这个比赛我曾经发现了比赛评测程序的bug,并依照此bug一路刷到95%+,后来向官方报告了bug,就又刷回来了,比赛的第一名是盛大的团队,92%+的成绩。深切感觉到,团队作战才是王道。在这再次为我解决cuda-convnet问题时的弱智搜商与代码冲动祭奠一下。
- 百度轻应用Hackathon,和H神和M神一起去参加,做了个在线等位的App,这个比赛主要是百度为了渗透到传统行业中去而举办的,也为后来的百度直达号做了铺垫。这个比赛中我们的队伍拿到了一个小奖,心里还是挺嗨皮的。不过作为做网站和前端的弱菜,这个app我的贡献还是挺小的,只贡献了一小小部分的想法和一小小部分的代码,多亏了H神和M神的大腿一个比一个粗啊。在此我只有顶礼膜拜了。
前两个比赛,都是没有全力参与,但大家可千万别以为我是在说只要我全力参与就能拿奖啊。没有的事,即便全力参与,我能拿奖的概率也是极小的。因为我是单兵作战,不是团队作战。很长时间,我都在寻找着志同道合的队友,能一起参加比赛,闲暇时候就某些算法过过招什么的,可惜一直没找到,学院里搞ML的人就是少啊。可叹可叹。
影响我最大的朋友
我有很多朋友,但今年影响我最大的当属Z神和M神。从他们身上学习到了很多东西。
Z神的知识面比较广,很多东西都知道,当然,我不单指技术,还包括很多很有意思的想法以及思考方式,比如罗胖的《逻辑思维》和老罗的演讲视频就是Z神推荐给我的。当然也是玩伴,作为我唯一长期化娱乐活动的桌球,也经常和Z神一起去玩。Z神的搜商相当强大,甩我几条街。也有点工具控的感觉,mac上的各种软件插件用的炉火纯青,叫我望尘莫及。作为一名非RMB玩家,炉石冲到传说也是醉了。
因为我有一种趋势,就是经常会沉浸到技术中去,可能每天都过着只有技术的生活,但是Z神的存在,就一直中和着我的这种趋势,生活是五彩的,如果只有技术,太苍白了。而且想要做成一些真的能改变世界一小点的程序,只有技术恐怕是办不到的,知识面我觉得要占主要成分。技术只是基石,意识与眼界才最重要。
M神就是参加百度比赛时的那只大腿。也是本科同学,但直到在一个实验室里才厮混的比较熟了。M神是一个孜孜不倦追求极客精神的人,在前端-服务器端构筑的全栈链的每一环节都有相当深厚的造诣。有点装备控,有很多酷炫吊炸天的装备和经历。动手能力强,想打架可以带出去压场,just joke。
从小到大,我都有一种‘好好学生式’的不良因素,自己的想法较少,不会拒绝,而M神,是一个说走就走想做就做的人,羡慕他沉浸在自己喜欢的事情中的那种状态,就是那种“自由”的状态。而这种状态是我以后理想生活的一个很重要的标签。
还有很多朋友对我的影响都很大,但这两位是交流的最多的朋友,所以感触特别的深。
IT类书单
- 《重来:更为简单高效的商业思维》
- 《平台战略》
- 《天才在左,疯子在右》
- 《黑客与画家》
- 《打造FaceBook》
- 《大数据时代》
- 《爆发:大数据时代预见未来的新思维》
- 《删除:大数据时代的取舍之道》
- 《启示录:打造用户喜爱的产品》
- 《程序员修炼之道:从小工到专家》
- 《恰如其分的软件架构》
- 《淘宝技术这十年》
- 《互联网创业密码》
- 《MacTalk:人生元编程》
- 《推荐系统实践》(技术类)
- 《机器学习实战》(技术类)
科幻小说书单
大刘出品的科幻小说,其中,前五个是长篇
- 《超新星纪元》
- 《球状闪电》
- 《三体》(地球往事系列第一部)
- 《三体II:黑暗森林》(地球往事系列第二部)
- 《三体III:死神永生》(地球往事系列第三部)
- 《坍缩》
- 《微观尽头》
- 《中国2185》
- 《微纪元》
- 《天使时代》
- 《带上她的眼睛》
- 《鲸歌》
- 《信使》
- 《混沌蝴蝶》
- 《地火》
- 《乡村教师》
- 《魔鬼积木》
- 《朝闻道》
- 《命运》
- 《纤维》
- 《中国太阳》
- 《思想者》
- 《人生》
- 《海水高山》
- 《白垩纪往事》
- 《圆圆的肥皂泡》
- 《镜子》
- 《赡养人类》
- 《赡养上帝》
- 《山》
- 《太原之恋》
- 《烧火工》
这里推荐一个豆瓣链接,http://www.douban.com/group/topic/26604185/
上面有大刘几乎全部的中短篇。
其他科幻小说
- 《来自新世界》
- 《上海堡垒》
视频单
- 《绿箭侠》
- 《闪电侠》
- 《报告老板》
- 《万万没想到》
人生元分析
经过了上述的事件,再加上现在的状态,用一些标签来定义一下自己吧。
- 执着,很多事情都能坚持着往下去做,比如可以沉迷于学习某种技术。
- 勤奋,这件事的反映就是我对时间规划比较看重,争取时间利用率最大化。但有时候我会盲目的朱元璋式的勤奋,以为自己什么都可以兼顾,比如当比赛与研究都在同时进行的时候,我可能两个都不想放弃,结果是两个可能都做不成。
- 追求卓越,相信大多数人都有这个品质,只不过我们对于卓越的定义不同。对我来说,要在ML领域有一些自己的名号。
- 人事交流,没有拒绝的勇气和技巧,但是我在加强这方面的能力。现在已经好很多了。
- 目标明确,现在的我有了一个更为长期的目标,跟着自己的心走,相信一定能有所成。
- 多彩生活,只有技术的生活虽然对于程序员来说内心已经很满足了,但是一个好的程序员的生活也应该是多姿多彩的。我对于彩色的定义就是除了技术以外,我还有两三个自己的爱好,并在那些爱好的路上走的比较远。
总结
今年的我仍然是一个普普通通的学生,没有处在自己人生的风口浪尖,没有像其他同学那样购名车、买豪宅、出任CEO、赢取白富美。但是感觉我的今年过完,我离自己的理想更近了一步,一个奋斗着并且在为自己奋斗的人,想必我也是幸福的。
想起士兵突击里的一句话,时刻准备着。在程序的世界里,每个程序员都是一个斗士,与bug斗争,与算法搏击,为代码欢笑,为paper流泪。我想说,这个职业,真丫合老子的口味。
关于去年总结中说的找女朋友的问题,今年还是失败了,唉,继续奋斗。
用一首打油诗结束今年的总结:
伯牙子期本难遇,相如文君更难求。快刀Mac所指处,程序园中筑高楼。
致谢
感谢父母,今年太忙,很少回家,而你们却没有怨言,默默支持着我。你们辛苦了。
感谢导师,宽容与理解,能让我做自己感兴趣的事情。
感谢Z神与M神,感谢我所有的朋友们,感谢你们的帮助,感谢你们的理解与包容。如果我做过什么令你们不快的事情,在此致歉,但相信我,我没有任何恶意。
Happy New Year!!