Zhuanlan.zhihu.com p 569715955
基本情况
学校:某江西双非
成绩:rank 1/79
英语:四级 569,六级481
竞赛:美国大学生数学建模竞赛Meritorious Winner、蓝桥杯C/C++组国家二等奖、“泰迪杯”数据挖掘挑战赛三等奖、天梯赛个人三等奖、大学生数学建模竞赛省级一等奖、大学生算法设计挑战赛铜奖等
科研:校级课题结项,有关行业景气度分析研究,用的是bert模型迁移学习;实验室经历,有关药物相互作用关系抽取,用的是传统CNN、RNN、LSTM等模型
夏令营:投递了复旦、吉大、人大、中南(优营,海王)、南京、厦门、华师大、同济、浙软(优营,不发offer)、武大、南大、南邮(优营,不发offer)、华东理工、南方科技(入营,未参加)、中山、中国海洋、东北、南开、北交、华中师大、北师大、苏大(优营)
也就是夏令营阶段只有一个稳的苏大offer,中南是海发offer,报考风险较大。然后浙软优营,确保预推免可以入复试。
预推免:投递了复旦、厦大(入复试,offer,最终去向)、南京、浙软(入复试,offer)、哈工大、华东师大(入复试,未参加)、中山、华南理工、武大
夏令营
中南大学
因为今年中南的报名方式非常简单,所以很多人报名,导致其夏令营也是分批次进行。第一批次听说是入营的同学首先联系课题组,然后在课题组接受考核面试;我是第二批次入营的,只需要进行一个学院统一的面试即可。
面试的内容是“做好3分钟PPT,介绍自己的基本情况、学科竞赛、研究项目等,介绍自己在学科竞赛和科学研究中所承担的工作,并在PPT中展示自己的学科竞赛的获奖证书等”。
最后有英语问答环节,前面许多同学是要求做一个自我介绍,我比较靠后,被问了“请用英语介绍一下CNN和RNN的用途”,感觉答得不是很好。但是最终还是拿到了优营(不过是先报先录,择优录取,大海王了哈哈哈)
苏州大学
苏大的夏令营是分三批进行的,因为苏大的nlp组非常厉害,也是我大一时非常向往的学校。我报的是第二批次,考核分为两部分,一个是上机笔试,一个是报考导师的个人面试。
上机考试可以支持不同的语言,C、C++、Java、Python都可以。这里需要注意的是,C++是真的C++,不是平常上机时用的C and STL。会考继承、多态、异常处理等知识,所以当时我选择题连蒙带猜,竟然对了一半。然后是上机考试,题目难度一般,涉及到模拟、树的遍历、DFS等知识点。
笔试通过后,可以联系苏大的老师,然后进行课题组的面试。一般老师会给我们打个电话,然后问一些问题。我联系的导师问了我几个简历上项目的问答,例如“关系抽取好像是五六年前比较热门的东西,现在还在做吗?”、“数据集是哪里来的?”、“投资者情绪噪声比较多,你们是怎么处理的?”、“投资者情绪、公司高层语调,与其他客观数据的异质性很强,你们是怎么确定权重的呢?”等问题。最后询问未来计划,想要学硕还是专硕。
最后我通过了老师的考核,导师对我的提醒是,“因为报考的人非常多,所以一定要尽快填好系统”。感觉超发了不少offer,当然这也是被鸽了好多次后的无奈之举。
浙江大学(软件学院)
浙软是我入大学以来的梦校了,最终也是成功在预推免阶段拿到了预录取的资格,最后竟然鸽了他,也是感觉不可思议。因为之前的很多工作都是针对浙软进行的,所以对浙软的介绍可能会占很大篇幅。文章最后也会附上我为了准备浙软以及其他院校而整理的许多资料。
浙软考核时间线拉的非常长,有半个多月。分为多个分营,如CAD营、数字孪生与元宇宙营、金融软件与服务营、区块链营、人工智能营、大数据治理与智能分析营、信息产品设计营。
入哪个营并不影响后期的预推免报名,在夏令营期间感觉自己参加的大数据营应该是最简单的,直到后来看到绿群里有人说AI营里有人跟着MO平台的教学视频做出baseline,就拿到了优营。
我入的是大数据治理与智能分析营。前面是很长一段时间的讲座,听的人越来越少(因为考勤不计入考核),很多老师讲座的时候也会录屏,最后把链接发到群里可以重复观看,这里建议把录屏下载下来,方便后期套磁使用。
由于我提早联系了夏令营的老师,结果老师提前给我布置了题目(因此比其他没有联系导师的同学可能多了三四天做文献调研的时间),是有关知识图谱各个阶段(关系实体抽取、构建、存储、推断等)的文献调研,还需要做一个ppt。当时感觉能比其他同学提前开始就特别惊喜,因此夏令营阶段文献调研也非常有干劲。最后是写了很长一篇有关关系抽取的文献调研,同时还做了ppt,自行运行了几个BERT-BiLSTM、BERT的关系抽取模型,以及在aotuDI平台运行了浙大开源项目DeepKE。成果可以见文章末尾,做完后感觉自己优营应该稳了(后来发现是太稳了)。半个月的文献调研让我学到了如何用Endnotes进行文献管理,如何追踪ACL、EMNLP等nlp方向的顶会,如何使用dplp、arXiv等追踪学术动态,如何Google论文等,这些在之后的面试中都经常被提及。
其他导师的题目有:“跑通一个步态检测算法, 评测性能并探讨工业落地可能出现的问题,加分项是能在高并发环境下搭建”、“读一篇论文,尝试在Postgres数据库上实现该设计”、“基于DL的蛋白质相似性学习的文献调研”、“噪声标签学习、长尾分部学习的文献调研”、“评测DivideMix算法在Long-tailed数据集上的性能”等。
大数据营中间还穿插了一次机试,好多人鸽了。机试不计入考核评分,但会给小组负责人参考。机试内容是浙大开设的“高级数据结构”课程的作业难度。中文,四道题,感觉很难,但是因为测试样例设置的不是那么强,所以好多人通过猜答案的方式AC了。
预推免
浙江大学(软件学院)
浙软的考核分为两部分,机试占15%,面试占75%。
本次机试考题较为简单,所以有很多人AC。总共四道题,“输入两个分式,输出相加结果(要化简)”、“一个长方形,中间有一个点分别连接各边的中点,这样划分出四个区域。已知其中三个区域的面积,求剩下那一块的面积”、“例如1/2可以拆分为1/3+1/6,1/a可以拆分为n个整数的倒数,输入a和n,输出符合题意的一组序列”、“已知多条地铁线路的停靠时间,求解小明从目的地到终点的最短到达时间,如果有多条则输出最迟出发时间的那条”
机试考完后开始陆陆续续拉钉钉群,本次se不到400人,招录180人,可以说竞争压力比较小,AI270人,招录30人,可谓神仙打架。当时为了求稳,报了SE,暗自窃喜了许久(因为AI招生人数太小,感觉每一年竞争人数的方差会很大,不想冒险哈哈哈)
面试一个人20min,考察包括英语听力与口语能力、专业基础知识、科研经历与实践能力、综合素质。每位考生需准备5-8分钟的陈述材料(PDF格式),进行全面自述呈现英语能力、专业能力和研究潜力。
好像很多同学是1min英语自我介绍,5min个人陈述,我因为害怕英语问答反应不过来,所以准备的是8min英语个人陈述(自己手写的中文个人陈述,花了两百多块钱去百度人工翻译成了英语,还请女朋友帮我通篇朗读了一下,磨练口语),结果后来老师就没有问我英语问题,感觉这里复试分数加了不少。
问答环节被问到的问题有:“transformer的结构是什么样的?”、“目前你认为最好的排序算法是什么?”、“微分和积分的区别是什么?”、“微分是通过导数推出来的吗?”、“如何评价矩阵的相似性?”、“有学过相似子空间的概念吗?”、“你知道PCA算法吗?它有哪些应用?”、“PageRank是怎么实现的?”、“如何做关联分析?”,大体来说这次项目没问多少,一直在被怼线代。感觉自己答得不算很好,最终面试大概80多分,可能是前面8min英语口语拉上来的哈哈。
厦门大学
厦大是为数不多不歧视双非的院校了,甚至还会卡oq。厦大老师感觉真的好好,在我没有几个offer的时候帮了我不少忙,很是感动,我的导师很温柔,感觉非常尊重学生,最后录取了后和好几个同系的同学聊过,发现他们的导师也好好。听说翔安校区还是二人寝,图书馆特别漂亮,健身房电影院什么都有,高尔夫球场游泳馆都能去,周末还能在环海骑着自行车吹吹海风,学业奖学金每年1.1w,直接把学费给冲抵了。实在太令人向往了!
我报的是人工智能系,复试只有面试,包括3min英文自我介绍,2min英文短文翻译*1,1min英文简答题*1,2min计算机基础题*1,2min人工智能题*2,然后是自由问答时间。
题目不算特别难,我抽到的题目大致是:有关梯度下降的翻译,“一条船可载2个人,现在n个人想要划船跨河,需要花费多少分钟?”,“讲讲神经网络有几大门派?”,“用英语讲讲自己最喜欢的一门课”……
自由问答环节问的有:“你一般是怎么查阅文献的?”、“请讲讲远程监督的原理”、“你觉得研究生阶段最重要的事情是什么?”……
感觉厦大的老师都好好,不会追问很难的问题,同时答得不好时也不会让我感到很尴尬。
最终
最后手头只留下了厦大(学硕)和浙软的offer,在百般纠结下还是选择了厦大。我觉得这两所学校培养自己都绰绰有余了,但是浙软没有提前联系好导师,而厦大的老师又对自己太好了,所以最终来到了厦大。保研就此落下帷幕,开始期待研究生阶段的生活啦,感觉生活上一定非常舒服,心情好了就更有动力科研啦,开心~
下面附上我这段时间备战保研整理的资料,分别是:
01 English QA
02 保研面试题目
03 浙软面试题目集
04 浙软夏令营作品
保研资料
希望对学弟学妹们有用ya~如果保研上有什么困惑可以在知乎上私信我嗯,看到了都会回复哒。
愿每一个追光人总能光芒万丈,一起加油!