Zhuanlan.zhihu.com p 569829982
1 个人背景及定位
- 本科院校:北京某中上游985
- 专业:人工智能
- 排名:3/31(10%,夏令营时前五学期成绩排名)
- 英语:CET-4 581, CET-6 549
- 竞赛:数竞省一、蓝桥杯省一、美赛 H 奖,以及若干校级科创竞赛和奖学金
- 科研:nlp 相关,产出一篇 ICDM 二作和 COLING 一作,均为 CCF-B 类会议,夏令营时均为在投状态(现已被全部接收)
- 未来方向:nlp 相关,不做 cv,对方向选择要求比较高,因此选导师时会比较局限(清北华五中科院,做 nlp 的导师屈指可数,其中不乏毫无希望的强导)
- 地域倾向:江浙沪优先,其余地区平等看待,无优先级大小
根据我参加夏令营的经验,个人认为在初审阶段,各项指标的重要程度大致排序为:院校 ≈ 排名 > 科研 > 竞赛 > 英语,这里的竞赛指的是数学、数模,包括蓝桥杯等普通编程类竞赛,但是如果是 ACM 竞赛,其含金量应该等同于一项优质的科研经历。
就我个人的背景而言,首先,最占优的是本科院校和科研经历。本科就读于中上游 985,科研经历较为丰富,且不是类似于大创、互联网+这种横向课题经历,而是真正的研究经历,方向较为纯粹。其次,竞赛和英语平平无奇,四六级不高不低,竞赛也都是省级奖项,没有什么有含金量的国家级奖项,整体不加分也不减分。最后是排名,这是我整个背景的一大劣势,且这一劣势在初审阶段十分致命。由于疫情原因,大多数夏令营采取了线上的形式,因此海投现象非常严重。于是,不少院校会采用直接筛选排名的方式来初步过滤简历,这对于 10% 的排名来说,简直是有苦说不出。这项劣势在初审阶段也确实得到了验证,例如复旦和人大这两所强 com 学校,都是大概率因为排名的原因未通过初审。
2 院校报名
2.1 投递情况及去向
夏令营:共计投递 18 个院系,入营 9 个,参营 6 个(包含 1 个不发放 offer 的清华计算机系),获得 offer 4 个。具体情况罗列如下。
未入营:
院校/研究所+院系/专业 | 报考层次 |
---|---|
北大cs | 硕士 |
北大ai | 硕士 |
北深 | 硕士 |
复旦cs | 硕士(学硕) |
人大高瓴 | 硕士(学硕) |
中科大cs | 不区分硕博 |
中科大大数据 | 不区分硕博 |
南大cs | 硕士 |
中科院深先院 | 不区分硕博 |
入营但放弃:
院校/研究所+院系/专业 | 报考层次 | 备注 |
---|---|---|
中科院计算所-vipl实验室 | 不区分硕博 | nlp冯洋组,通过一轮笔试,后时间冲突放弃 |
北师大ai | 不区分硕博 | 与上交时间冲突 |
西湖大学工学院 | 直博 | 与上交时间冲突 |
入营且参营:
院校/研究所+院系/专业 | 报考层次 | offer | 备注 |
---|---|---|---|
清华cs | 不区分硕博 | 夏令营不发offer | |
清深ai | 硕士(只有专硕) | √ | |
上交cs | 直博 | √ | |
南大ai | 硕士 | × | 笔试未通过 |
中科院自动化所 | 不区分硕博 | √ | 获得专硕和直博选择权 |
中科院软件所-中文信息处理实验室 | 不区分硕博 | √ | 提前参加考核并通过 |
来张总表:
预推免:开摆,未参加
最终去向:上交计算机系直博(nlp 方向)
2.2 入营分析
未入营:未入营院校主要有北大、复旦、人大和中科大,这四所院校根据强弱 com 两两分类。
北大和中科大属于弱 com,科大有导师推荐入营机制,如果能够提前联系科大的导师,导师是完全有权力直接捞你入营的。当然,也可以不联系导师,通过统一初筛入营,这就对个人背景和成绩的要求比较高了。我当时因为并不是很想去科大,把他当作一个保底选项,因此没有联系导师。结果没有通过初筛,因为成绩排名还是有些拉胯。北大同样的,导师话语权较大,可以直接决定你入营。尤其是硕士,如果不提前联系导师,基本没有希望。我当时并没有联系北大的导师,却很天真的报了硕士(cs 和 ai 都是),想试试运气,结果最后全军覆没,也算是意料之中。
复旦和人大属于强 com,导师在初筛阶段无任何话语权。因此,即使提前联系的导师对你百般赞扬,你仍然有极大的可能收到初筛的拒信。10% 的成绩在强 com 院校的初筛环节是一个很大的劣势,复旦没有入营意料之中,但是人大高瓴的 bar 如此之高,是我之前没有预料到的,当时得知自己没有入营,也难过了好久。本来是当作一个保底选项,结果人家根本看不上我ww
入营:入营院校主要有清华、上交和中科院,逐个分析。
清华 cs 的 bar 比较迷,本来也是不抱任何希望,报着玩玩的,结果入营了(一共也就入了 150 个人)。贵系夏令营不需要提前联系导师,相对强 com。清深 ai 也是报着试试的心态去的(清北的夏令营都没报希望),结果也入营了(一共入营 90 个人)。但是据说清深相对弱 com,提前联系导师会有些作用。我没有提前联系导师也入营了,而且排名也不高,说明清深在初筛的时候不是唯成绩论,可能会比较注重科研经历。
上交的 bar 也比较迷,仅直博来说,之前一直传言说极弱 com,联系导师就能入营,但实际上初筛的时候导师完全没有话语权,提前套磁只是方便你在双选阶段能够更早锁定导师。而且我听说有同学提前联系了导师,两个人都商量好了,结果差点没入营。说明上交的初筛相对强 com,即使是直博。
中科院体系下,要分具体的所来讨论。自动化所超强 com,提前联系导师毫无作用,只有在面试结束收到 offer 后,才有必要正式联系导师双选。计算所极弱 com,报名时就要求联系导师,导师可以自行筛选学生入营。当然,也得要导师看的上你才行。我报名的 nlp 冯洋导师,是今年最火的导师之一,报了 80 多个人,最后筛进了大约 35 人参加笔试考核。所以对于强组大组来说,还是相对强 com 的,导师可能还是会根据简历公平筛人,对于小组来说,可能跟老师说一声就能放进去了。软件所也相对弱 com,有的实验室会提前组织面试,比如我参加的中文信息处理实验室。需要密切关注招生信息。
3 前期准备
3.1 关于面试准备
前期的各种材料,包括成绩单、简历、证书、个人陈述等等就不赘述了,都是需要花大量时间去准备打磨的。我的大三下学期基本是在实验室度过的,因为自己在专业排名上面的劣势,想要多做一些科研成果来弥补排名的缺陷。当然,在这期间,我也更加深入地了解了 nlp 相关领域的更多知识,无形中为面试打下了基础。
至于专业课的复习,就我参加了这么多夏令营的经历而言,当你的科研经历足够丰富的时候,基本上不会被提问到专业课。我在六月底的时候把概率论、数据结构、机器学习这三门课过了一遍,一些重要的知识点也做了笔记记忆了一遍。然而面试时候基本没有派上用场,以为很重要的数据结构从头到尾没有被问过,其余的课程也基本没有被提问到。
关于数学面试,我特地在面自动化所的前两天进行了一个知识点的整理,链接如下,可供后续的保研er参考:
不过这也就带来了另一个需要注意的点,简历上的科研项目经历一定要深挖,如果一问三不知,会是一个很大的减分项。同时,项目衍生出来的相关课题,甚至是这个研究领域,也要多一些了解,并且有一些自己独到的见解或看法,这样在和面试官交谈时能够聊出更多的干货。
至于英文面试,个人认为只需要准备一些常见的问题就可以了,然后花一天时间反复磨嘴皮子,考场上应该不会发挥的太差。我在清深面试的前一天,准备了大概十几个常见的问题,然后大致背了一遍。有了语感之后,你的临场即兴能力会好不少。
机试我也没有刻意准备过,也没有刷过 leetcode。就参营经历而言,除了清华计算机系的机试,其余的只要你能够比较熟练地掌握数组、搜索、模拟、动态规划这些算法,能应付个八九不离十了。
3.2 关于套磁
夏令营的套磁环节,对于低 rank 的同学们来说至关重要。套磁即提前联系导师,有如下好处:(1)对于弱 com 学校,套磁将直接有助于你入营(中科大、中科院计算所等),因为这些学校存在导师推荐入营制度;(2)对于有提前双选要求的学校,套磁将有助于在你通过面试之后,获得导师的优先考虑(上交直博等),在双选阶段拥有核心竞争力;(3)对于强 com 学校(人大、复旦等),套磁也有助于你给老师提前留下印象,在后续选择导师时获得优势。
对于一个老师的了解,无非是学术和人品。关于学术,可以直接查看老师的谷歌学术主页,观察其近期的产出情况,已经是否存在抢一作的现象。同时,也可以直接谷歌搜索老师姓名,观察其出席过的各类学术活动。关于人品,可以直接搜索知乎、研控等网站,能够搜索到五花八门的关于老师的细节信息。
4 夏令营面试经历
接下来是我参加过的几个夏令营的经历复盘。若以下文字有被认为侵犯保密协议之处,请及时联系我,我会第一时间删除。
4.1 清华计算机系
清华 cs 的夏令营不发 offer,只有机试环节,机试排名靠前可以获得直通预推免面试的资格。因此,我并没有把重心放在贵系上,只是抱着体验的态度去参加。贵系的机试极其硬核,算是全国高校 cs 夏令营里面独一档的难度,可以说就是为 ACMer 准备的。况且进入贵系夏令营的有很多 ACM 选手,因此我这种没有任何算法竞赛基础的,只能是当一当分母。
贵系机试共 3 道题,总时长 3 小时,满分 300。第一题比较送分,关于图论和拓扑排序,基本上 10 min 拿到满分。后两题开始坐牢,都是和树有关的题目,最后一题可能是一道树形 DP + 各种优化,我想了半天也没有想出正解,最后暴力搜索骗了一些分。最后以 130 分收场。当然,不出所料没有拿到直通预推免资格。据某绿群群友所说,大概今年需要达到 170 分左右,才可能通过机试。
4.2 清华深研院 AI
我没有想到自己能够通过清深的初审,报名的时候也是抱着试一试的心态去的,连导师都没有联系过,因为据说清深很卡排名。清深 AI 的考核还是相对比较硬核的,先是由各个实验室组织的初试,初试筛掉一批人后进入面试,再根据初试面试的综合表现发放 offer。AI 学部的实验室方向很杂,网络、机器人、知识图谱、CV 等等应有尽有,因此入营的学生也很杂,来自五花八门的专业。我选择了唯一一个跟我研究兴趣匹配的实验室 —— 知识工程研究中心。该实验室的考核方式为笔试 + 机试。
笔试考察了包含数学、机器学习、深度学习、AI 前沿进展在内的相关知识,共 16 道大题,总时长为两小时。总的来说考察知识点很全面,前八题为数学题,基本为概率论计算题,考察较细,难度不低。后八题是 AI 相关,知识点涉及贝叶斯分类、K-means、SVM、反向传播等,以及考察了一些深度学习相关的前沿知识。机试一共三道题,时长两小时。清深的机试相对贵系来说简单了不少,考察了线段树、动态规划、优化搜索等相关算法。满分 300 分,最后拿到了 250 分收尾。
初试个人感觉发挥的还不错,最后也是顺利通过,进入面试。7.5 全天面试,面试共两部分,第一部分英文考核(5min),随机抽一段英文文章,限时朗读并翻译。第二部分是导师问答,首先 5-7 min 自我介绍,之后英文+中文提问。清深的面试相对没有很硬核,基本根据你的简历和初审提交的材料来进行,会偏向于聊天的形式。
- 专业知识:BERT(因为我做 nlp 的)、离散数学(群论、图论)
- 闲聊:科研经历、创新点、未来计划、报了其他什么地方的夏令营,等等
中间出现了一个小插曲,一个老师对着我的成绩单,问我《军事理论》这门课为什么这么低(问完之后其他老师都笑了)。当时意识到可能被压力面了,不过还好稳住了心态,很从容地跟他交流了下去。
结果顺利拿到了预录取 offer,还意外地获得了一个导师的青睐。后来在上交和清深之间纠结了很久,在权衡了导师、研究方向、title、地域等众多因素之后,在八月底的时候放弃了清深的 offer,让后面的同学及时候补。总体来说,清深 AI 的优营率不算高,估计在 20% - 30% 的样子。
4.3 上交计算机系(直博)
考虑到上交直硕的 bar 巨高无比,于是我直接放目光放在了直博上。我在五月底的时候联系了一位做 nlp 的导师(也是我最终确定的导师),断断续续联系了两三次,也参加了老师给的一些考核,完成的还算不错,老师对我也比较满意,也承诺后续会关注我。
后来惊讶的发现,传说中的上交弱 com 直博,其实在初筛的环节导师并没有话语权,只是在双选阶段老师可以把你捞上岸。上交的直博面试相对偏重为走形式,因为需要与导师达成双选后,学院才会颁发优营,而面试只需要 60 分及格,就可以进入师生双选阶段。因此,上交直博的关键在于联系导师,导师直接决定你是否获得 offer。也不要听信所谓的只要有导师收就稳了,真正的强导有这么容易收你吗?弱 com 只会加大你踩坑的几率。
面试主要针对英语和科研经历提问,一个面试组中,对你的研究领域不熟悉的老师可能会偏重于问专业课,对你的领域熟悉的老师会深究科研细节。面试一共 20min,首先是 5min 带 PPT 的自我介绍,介绍结束后是英文问答,问到了我三个关于论文的问题,分别是论文的 reaseach direction、novelty 和 difficulty。科研细节方面还是比较硬核的,怼着 nlp 方向问了许多比较深入的问题,难度不小,如果对这个领域没有过一些研究还真不一定能答上来。还有一个老师因为不属于这个研究领域,让我挑一门专业课讲了一个算法(我选了机器学习)。
后来得知,我联系的这位导师很火,很多人私下联系过。在经过了大浪淘沙的三个月,面对着诸多选择,我最终还是选择留在上交跟随该导师直博。
4.4 中科院自动化研究所
自所是我认为办的最好的一个夏令营之一,它真的是按照“夏令营”的模式来办的。前三天是各个实验室导师代表的讲座,介绍各实验室的情况以及研究进展。同时,还安排了每个实验室单独的师生交流会,以及自所学生的经验分享会。总之是干货满满。
最后两天是面试时间,每个人 12min,包括 1min 自我介绍,3min 数学英语测试,8min 专业问答。之前一直听说自所很喜欢问数学,而且问的比较细,但实际面试时发现并没有想象中那么可怕。我抽到的数学问题是列举一些离散型概率分布,以及举一个伯努利分布的例子,还算是比较平稳。专业问答环节基本围绕简历提问,问到一些科研细节,以及在科研方面的开放型问题,一些见解和看法。同时,也会就你的竞赛经历进行一些提问,我的简历上因为写到了蓝桥杯,所以问了我一个问题“什么是动态规划”,还问我为什么不打 ACM。除此之外,没有问到任何专业知识的内容,剩下就是简单的唠家常环节。
一周后出结果,顺利拿到了直博和专硕的任选权。之后,我联系了模式识别国重的一位知识图谱方向的强导,并且收到了老师的面试邀约。单独面试持续了将近两个小时,老师和组里的一个年轻导盘问了我大概 40 分钟,从专业知识到科研细节,可以说是扒的一干二净。之后让我畅所欲言,让我向他们了解一切想了解的问题。整体的面试氛围还算是比较轻松的,尽管被轮番盘问,感觉自己的发挥还是很不错。
但是!我在联系自所导师的时候过于犹豫(因为当时手握清深和上交),等到正式开始签署双选的那一天才去联系,导致在我之前已经有一大批学生联系过了该老师(我应该是最后一个联系的),其中不乏一两个月前就套磁过的。因此,即使导师私下跟我聊了很多,也让我参加了他们组的集体面试,最终还是没能达成双选意向,大概是因为之前已经有不错的人选了吧。之后我也没再联系其他导师,相当于默拒了。
4.5 中科院软件研究所
直奔中文信息处理实验室去的,参加了七月初的实验室霸面考核,顺利通过了机试(八道编程题),进入了第一轮面试。7.11 参加了实验室的面试,面试分为两个阶段,第一阶段是导师问答,首先用 PPT 进行一个五分钟的自我展示,之后导师提问,一般是对着简历上的内容问一些细节,之后也会唠一些家常,询问一些读研读博的意愿之类的,就我而言没有问到任何专业课知识。第二阶段是手撕代码,考核老师给一道题目,要求先叙述思路,若思路正确,则共享电脑屏幕,用任意语言在任意 IDE 上实现具体代码。
很幸运地得到了孙老师的青睐(据说第一轮霸面只发出了两个 offer),之后面谈了两次,实验室也明确了给我 offer 的意愿。实际上,我对中文实验室的印象还是很好的,水平也很高,拿到了 offer 之后我就直接放弃了计算所 vipl 的考核。后续 7.18 开营,我就直接免去了机试和面试的环节,补了一下实验室的笔试考核便结束了。
当时手握清深、上交和自所的 offer,纠结了很久,考虑到了未来的发展地域(个人想在江浙沪发展),以及一些些 title 的因素,在实验室确认 offer 名单前婉拒了(七月底)。虽然有点可惜,但还是决定尽早释放,不浪费实验室的招生名额。还是要十分感谢实验室孙老师的赏识,感觉自己的能力有被充分认可。
5 预推免花絮
七月份的时候,北大计算语言所的 w 老师给我打来电话,说是看中了我夏令营投的简历,让我预推免报他剩余的一个学硕名额。当时十分兴奋,因为北大语言所是我在夏令营阶段套都不敢套的学校,居然有大牛老师亲自给我打来电话。同时,复旦 nlp 组的 h 老师也告诉我仍有少量学硕专硕名额,让我可以预推免去申请。当时其实是十分心动的,也盘算着预推免冲一下复旦 nlp 组和北大语言所。
9.1 和上交的老师正式签订了直博协议,之后十几天内我反复思考,最终决定放弃报名北大和复旦的预推免,见好就收。一是因为预推免还要参与激烈的竞争,很可能是很多人竞争唯一的一个名额,在经历了夏令营的高强度考核之后,我已经无心再去参与竞争了。二是其实到了清北复交这个层次,在我个人心目中已经很难说谁完全胜过谁了。上交的方向我也比较喜欢,导师也很优秀,前途无量,因此这个结果我已经十分满意。永远有人更好,眼下便是最好。所以我在预推免阶段放弃了报名。
6 写在最后
个人认为,夏令营的面试是一场非常综合的考核。不仅仅取决于你的专业能力,更取决于你的临场反应能力和表达能力。其实老师更青睐的应该是那些专业素质过硬,不怯场,表达谈吐得体且有逻辑性的学生。同时,你的科研、竞赛、项目经历决定了你在面试场上的主动权,你被问到的开放性问题越多,你展示自己的机会就越多,同时容错度也会更大。
对于“鸽”,我在参营之前给自己定好了准则,按照地域来保留或释放 offer。我会在北上各保留一个最优的 offer(当然现在情况是上深各一个,北京的全释放了),之后如果在该地区有了更好的 offer,就释放掉之前的那个。
回首这四个月,我觉得我已经把每一步都做到了最好,从准备材料开始,认真梳理信息,准备简历等文书,再到夏令营时候的尽力发挥,我觉得自己的每一场面试都很稳定,能够把自己的专业水平和临场能力尽可能地展现出来。最后,希望自己博士阶段科研顺利,也希望看到这篇文章的保研路上的小伙伴们,能够踏实地走好每一个流程,最后斩获自己心仪的 offer!