4.17上午在360北京总部参加的百人现场面试,蛮震撼的,现场有等候区,有水有零食,还是很贴心的哦,然后在等候区里有个电视实时播报进去面试的人,跟餐厅的叫号系统一样。
前面一个人的时候面的有点长,稍微坐了会,趁空闲又各种排序看了一遍(没问到,可惜了哈哈哈)
接下来分享一下面试的过程:
进去找到自己的面试桌位后问好坐下,递上简历,面试官很和蔼,然后就项目和各个机器学习的知识点提问,最后手写代码
1、自我介绍,介绍了项目和实习经历,本科学通信,面试官问了一下为啥转了专业(现在基本偏CS了,毕竟做NLP),项目是什么级别的等等,相当于暖场了一下
2、介绍了项目,说明自己做了什么,详细的就是面试官根据项目的细节展开了问,具体的各位可以结合自己做的东西替换:
(1)数据哪来的,数据的形式,如何处理,总量是多少,分布情况
(2)达到什么结果
(3)用了哪些模型,详细介绍一下模型:输入输出长什么样;多少层,模型各个层的样子,以及这样设计的用意和原理是什么;用了一些什么优化的方法,为什么要用这些方法;评价指标是什么;选择这个模型的原因。
(4)模型输出后接全连接层的原因,是否有什么改进
3、介绍word2vec原理,如何设计,如何训练,越详细越好;用了什么加速方法,word2vec算法本身有哪些优化,加速方法,最后的一层softmax怎么加速(这个有点没听懂,求大佬指出)
4、介绍GBDT
5、LR的损失函数,为什么要用交叉熵
6、什么样的任务适合用深度学习,什么样的问题不适合
7、CNN中卷积如何使用的,卷积核的样子,如何获取到文本中的特征,如何捕捉句子间的关系
8、C++中的STL(我表示已经忘了,然后就没继续问了)
9、线程和进程的区别,各有哪些资源
10、手撕代码,反转链表(感觉面试官还是对我挺仁慈)我用python写的,第一次手撕代码,有点紧张,忘了写 return,然后写完后还要给他介绍思想。
上来就盯着简历问问,但是又没有能让面试官感兴趣的点。可见低质量的项目or不知名的实习,确实没有太大价值,哪怕写得天花乱坠。丰富的简历在筛选时有点优势,而面试时可能成为把柄甚至坑。这就是找一个大厂实习的重要性。
面试官问的面试题: 二面的面试官还没来,一个程序员和我在过道上聊聊天。给我介绍了一下小米搜索与推荐平台主要做些啥,聊聊爬虫业务,以及能不能用机器学习的模型来跑爬虫,比如百度百科各种词条,人工爬取太低效,需要机器分标签。我当然没概念了,只能陪笑脸+表示感兴趣。说说爬虫中遇到的困难?我说了一些反爬、速度之类的,然后面试官提了一下重复页面怎样过滤。还好之前一晚看到一个布隆过滤器,才接上了话。