g p a 怎么算算法解析--688IT编程网

机器学习面试总结

* 在知乎上发过，但是被人指出贴题目是非常不好的行为，所以偷偷地发在这里

* 我基本不上牛客，如果要跟我讨论问题还是请在知乎上联系我

* 发现有错误的，欢迎指出

正则化是解决过拟合问题吗* 里面很多问题，我面试时也没回答好，我也没有标准答案

* 欢迎给我知乎的回答点赞 ^_^

（1）代码题（leetcode类型），主要考察数据结构和基础算法，以及代码基本功

大部分题目都不难，基本是leetcode medium的难度。但是要求在现场白板编程，思路要流畅，能做到一次性Bug-free.

并且，一般都是要给出时间复杂度和空间复杂度最优的做法。对于少数难度很大的题，也不要慌张。一般也不会一点思路也没有，尽力给面试官展现自己的思考过程。面试官也会引导你，给一点小提示，沿着提示把题目慢慢做出来也是可以通过面试的。

以下是我所遇到的一些需要当场写出完整代码的题目：

1 二分查。分别实现C++中的lower_bound和upper_bound.

2 排序。手写快速排序，归并排序，堆排序都被问到过。

3 给你一个数组，求这个数组的最大子段积

时间复杂度可以到O(n)

4 给你一个数组，在这个数组中出不重合的两段，让这两段的字段

和的差的绝对值最大。

时间复杂度可以到O(n)

5 给你一个数组，求一个k值，使得前k个数的方差 + 后面n-k个数的方差最小

时间复杂度可以到O(n)

6 给你一个只由0和1组成的字符串，一个最长的子串，要求这个子串里面0和1的数目相等。

时间复杂度可以到O(n)

7 给你一个数组以及一个数K，从这个数组里面选择三个数，使得三个数的和小于等于K，问有多少种选择的方法？

时间复杂度可以到O(n^2)

8 给你一个只由0和1组成的矩阵，出一个最大的子矩阵，要求这个子矩阵是方阵，并且这个子矩阵的所有元素为1

时间复杂度可以到O(n^2)

9 求一个字符串的最长回文子串

时间复杂度可以到O(n) (Manacher算法)

10 在一个数轴上移动，初始在0点，现在要到给定的某一个x点，每一步有三种选择，坐标加1，坐标减1，坐标乘以2，请问最少需要多少步从0点到x点。

11 给你一个集合，输出这个集合的所有子集。

12 给你一个长度为n的数组，以及一个k值（k n) 求出这个数组中每k个相邻元素里面的最大值。其实也就是一个一维的max pooling

时间复杂度可以到O(n)

13 写一个程序，在单位球面上随机取点，也就是说保证随机取到的点是均匀的。

14 给你一个长度为n的字符串s，以及m个短串（每个短串的长度小于10），每个字符串都是基因序列，也就是说只含有A,T,C,G这四个字母。在字符串中出所有可以和任何一个短串模糊匹配的子串。模糊匹配的定义，两个字符串长度相等，并且至多有两个字符不一样，那么我们就可以说这两个字符串是模糊匹配的。

15 其它一些描述很复杂的题这里就不列了。

（2）数学题或者"智力"题。

不会涉及特别高深的数学知识，一般就是工科数学（微积分，概率论，线性代数）和一些组合数学的问题。

下面是我在面试中被问到过的问题：

1 如果一个女生说她集齐了十二个星座的前男友，她前男友数量的期望是多少？

ps：这道题在知乎上有广泛的讨论，作为知乎重度用户我也看到过。如果一个女生说，她集齐了十二个星座的前男友，我们应该如何估计她前男友的数量？

2 两个人玩游戏。有n堆石头，每堆分别有a1, a2, a3. an个石头，每次一个游戏者可以从任意一堆石头里拿走至少一个石头，也可以整堆拿走，但不能从多堆石头里面拿。无法拿石头的游戏者输，请问这个游戏是否有先手必胜或者后手必胜的策略？

如果有，请说出这个策略，并证明这个策略能保证必胜。

3 一个一维数轴，起始点在原点。每次向左或者向右走一步，概率都是0.5. 请问回到原点的步数期望是多少？

4 一条长度为1的线段，随机剪两刀，求有一根大于0.5的概率。

5 讲一下你理解的矩阵的秩。低秩矩阵有什么特点？在图像处理领域，这些特点有什么应用？

6 讲一下你理解的特征值和特征向量。

7 为什么负梯度方向是使函数值下降最快的方向？简单数学推导一下

（3）机器学习基础

下面是我在面试中被问到过的问题：

1 逻辑回归和线性回归对比有什么优点？

2 逻辑回归可以处理非线性问题吗？

3 分类问题有哪些评价指标？每种的适用场景。

4 讲一下正则化，L1和L2正则化各自的特点和适用场景。

5 讲一下常用的损失函数以及各自的适用场景。

6 讲一下决策树和随机森林

7 讲一下GBDT的细节，写出GBDT的目标函数。 GBDT和Adaboost的区别与联系

8 手推softmax loss公式

9 讲一下SVM, SVM与LR有什么联系。

10讲一下PCA的步骤。PCA和SVD的区别和联系

11 讲一下ensemble

12 偏差和方差的区别。ensemble的方法中哪些是降低偏差，哪些是降低方差？

. 这部分问得太琐碎了，我能记起来的问题就这么多了。我的感觉，这部分问题大多数不是问得很深，所以不至于被问得哑口无言，总有得扯；但是要想给出一个特别深刻的回答，还是需要对机器学习的基础算法了解比较透彻。

（4）深度学习基础

这部分的准备，我推荐花书（Bengio的Deep learning）和 @魏秀参学长的《解析卷积神经网络-深度学习实践手册》

下面是我在面试中被问到过的问题：

2 手推RNN和LSTM结构

3 LSTM中每个gate的作用是什么，为什么跟RNN比起来，LSTM可以防止梯度消失

4 讲一下pooling的作用，为什么max pooling要更常用？哪些情况下，average pooling比max pooling更合适？

5 梯度消失和梯度爆炸的原因是什么？有哪些解决方法？

6 CNN和RNN的梯度消失是一样的吗？

6 有哪些防止过拟合的方法？

7 讲一下激活函数sigmoid，tanh，relu. 各自的优点和适用场景？

8 relu的负半轴导数都是0，这部分产生的梯度消失怎么办？

9 batch size对收敛速度的影响。

10 讲一下batch normalization

688IT编程网

g p a 怎么算算法解析

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

g p a 怎么算算法解析

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式