百度算法提前批面试复盘

作者 | liu_sy

来源 | 见文末『阅读原文』处

整理 | NewBeeNLP公众号

面试锦囊之面经分享系列，持续更新中

欢迎后台回复"面试"加入讨论组交流噢

文末也有内推，需要的同学自取哈

写在前面

之前通过非定向内推提前批，简历一直处于筛选状态中，然后大概在8.18在牛客看到一个前辈所在部门（推荐搜索）招人，就把简历发给了前辈，然后隔了两三天就通知了面试。

自我介绍
提问项目和广告比赛，问了一些深度学习基础和机器学习基础
神经网络初始化方法。我回答了随机初始化和He初始化。面试官问我随机初始化有什么问题，He初始化解决了什么问题
BN的原理和作用。这里我的回答面试官提出了很多很多疑问，因为网上关于BN的解释也是说法不一，比如说一种常见说法是BN解决了 Internal Covariate Shift，但是他用sigmoid举例，那现在基本都用relu,relu大于0的时候，梯度都为1，也有这种问题吗，我感觉我也没说清楚
softmax层的label 是什么，我回答one-hot向量。
学会了哪些网络训练调参技巧
word2vector原理说一下，我从one-hot说起，最后说了skip gram 和cbow，这一块回答不好。
lstm结构，输入门，输出门，遗忘门怎么计算的（没让我说），问了我他们的作用分别是什么，我也没怎么说出来。
树模型，ID3,C4.5,CART怎么计算分割点的，信息增益和信息增益率的区别，GBDT和RF区别。
代码说思路
有效括号用了什么数据结构（栈）
TOPK （堆），我说反了，最大堆说成最小堆，面试官疯狂暗示，最后弱弱地回答说反了。
一个长度为n的list，元素不重复,从中取出m个数，问这m个数中某一个元素被取出的概率是多少，我没说对。