记实习论文投稿经历

记录这一喜悦的时刻,去年在公司做的文章被录用了。相较于去年第一次中计算机会议,这次在体感上的兴奋无疑小了些,但这次会议也真的由衷的开心,无论是想idea、做实验、投稿还是rebuttal。

故事要从去年4月份开始说起了,4月下旬正式接了高德的实习offer,当时就一直在探讨到了这边做什么事情。之后也是在学校老板的支持下,5月中旬很快入了职,当时在公司组里蛮快就找到了想做的点,从6月开始做这个paper,主体工作9月底完成,大概是做了4个月不到,加上rebuttal的两周时间,满打满算就是4.5个月,中间其实还有适应基建,学习rl框架的时间,所以我其实大概摸清了,如果自己有想做的idea,在给予我充分自由的情况下,完成一篇还行的paper,大概的工期是4个月左右。这给了我继续读博的底气,也让我意识到,充分自由、有资源的环境,对一篇工作的顺利生成有多大的帮助。

投稿过程中其实碰到了很多问题,特别感谢组里师兄们的帮助,一开始是在算法实现上,当时我没有rl训练的经验,在搭好数据集和rl的框架后,遇到了蛮多问题,同时我用的那个分布式框架每次初始化到开始train都要好久,所以一度耽误了蛮多时间。集群挂载盘io的问题,vllm的多模态缓存问题,rl训练不稳定的问题,每次train到100个step后模型就开始说胡话等等等等,这中间部门师兄给了很多帮助。包括在创新点的构思上,师兄也给了我蛮多idea上的启发。之后稳定下来,要在有限的时间赶paper,但因为自己之前的实验失败太多次了,同时提了上百张h200的任务,把当月部门gpu额度用完了,导致最终9月中旬没卡用了(9月底的ddl),还记得师兄立马给我向隔壁两个组接了32张h20的使用权,用师兄的话说就是“脸皮都变厚了”。在paper的写作上也得到了部门leader的支持,因为这个文章的初始分不是很好,得知我下决心rebuttal后,师兄和leader也给了我太多回复的建议(虽然中间遇到了审稿人开盒和分数回滚),感谢当时我们尽心尽力的rebuttal。

因为初试分真的不高,其实自己没想过会中的,会更加喜悦一些。另一方面,在学校做research时,大部分时间都是自己一个人上手做,没什么机会得到的hands-on的支持,所以论文是否中完全是自己的情绪。但公司这个工作确实是我们一起努力做出来的,看到最后的圆满结果也由衷的为部门开心。除了工作上的给力,在高德组里的氛围也十分的融洽,没有很push的压力,照常的周末,对实习生宽容的态度等等,组里的师兄师姐都特别nice,因为我还会在这边实习到五月,所以之后有机会可以再详细写下组里整体的实习体验。

快过年了,坦白讲今年真的有在转运,算下来自己的几篇paper都是在今年接受的,而且基本上都是一投就中,我也有了做更solid的工作的底气,希望在这之后自己公司能做出更有影响力的工作吧。

Leave a Reply

Your email address will not be published. Required fields are marked *