机器学习算法⼯程师(含⼤量⾯经)--1
本博⽂已经发布在⽜客⽹上的讨论区:
前⾔:
从今年的8⽉1号正式开启秋招到现在,过去三个多⽉了,发⽣了很多事情,经历了N多场笔试和⾯试,深深感慨到本硕双⾮的学⽣算法岗的艰⾟。。。,当经过了8、9⽉份的种种⾯试挂掉后,终于从⼗⽉下旬陆续收到了⼏个offer,⽽且其中还有⾃⼰喜欢的公司,不得不感慨那句《极限挑战》的结束语“这,就是,命!”
奇怪的数字:
对于我的整个秋招情况,有下⾯⼏组数据,我感觉很有意思,⽽且感觉和⾃然数e有关:
发送的申请内推邮件: 100多封邮件
秋招期间投递的数量:120多家公司
收到笔试的公司数量:43家左右
收到⾯试的公司数量:18家=13家+5家(内推⽆笔试)
收到offer 的公司数量:5家左右
如果仔细对⽐⼀下,不难发现,从投递的公司数量120⼀直到收到offer的数量呈现⼀个递减的趋势,关键这还是⼀个等⽐数列,递减的倍数(公⽐)⼤约是1/e=0.368……呃。。。好诡异的数字,感觉这不是个巧合,看来我们普通⼈⼯作还是符合⾃然规律的吧
笔⾯试经验浅谈:
1、发现还是⾛实习转正最⽅便,因为整个实验室他们全部都是实习转正,他们要么去的百度,要么去的滴滴,不管是公司平台还是年薪,都过那些985的学⽣,所以秋招期间整个实验室基本就我⾃⼰⼯作。。
2、内推,渠道:师兄师,相关,北邮⼈和⽔⽊社区论坛,⽜客⽹等等。因为只有进⼊⾯试才能有机会获得offer,可惜今年许多公司连内推都要先笔试,嘞。。。,但是个别公司歧视学校,尤其是我们本硕双⾮的学校,连笔试都不给我机会的公司:华为,⽹易,唯品会,迅雷。。。
3、笔试:不多说,只能刷题吧,⽜客⽹和赛码⽹都⾏,因为今年所有公司选择的笔试平台数量顺序⼤致是:⽜客⽹,赛码⽹,AMCAT,微测⽹。。还是建议刷⽜客,上⾯讨论区的活跃率很⾼。
关于机器学习⽅⾯的话:
1. 书:理论⽅⾯李航的《统计学习⽅法》、周志华的《机器学习》、《深度学习》
2. 实践⽅⾯:《机器学习实战》《利⽤python进⾏数据分析》、hadoop、spark、TensorFlow等等。
3. 视频:吴恩达的<;机器学习><;深度学习>
4. 博客:其实都差不多,随便搜就⾏,还是建议多看书、视频和敲代码。
4、⾯试:这就尴尬了,offer=实⼒+运⽓,缺⼀不可。但是⾯试经验还是很重要的,我是⾯试挂了⼗⼏家公司后才摸清了⾯试官套路,然后后续的其他公司的⾯试就开始反击了。。。但是有的⾯试官很奇葩了,这个时候你就得怼回去了,上去就⼀个字,⼲!
我的⾯试情况和结果:
按照⾯试时间顺序,没给结果的我也归档为挂
1. 便利蜂(内推,⼆⾯挂)
2. 链家(内推,⼀⾯挂)
3. 滴滴(内推,⼆⾯后没给结果,挂)
4. 百度(校招,⼀⾯挂)
5. 云脑科技(内推,⼀⾯挂)
6. 中兴(校招,⼆⾯后没给结果,挂)
7. 京东(校招,⼀⾯挂)
8. (内推,⼀⾯挂)
9. 苏宁(内推,⼀⾯技术,进⼊offer池)
10. 乐信(校招,两⾯技术+⼀⾯HR后给了offer)
11. 新浪(校招,⼀⾯挂)
12. 58到家(线下校招,⼆⾯挂)
13. VIPKID(线下校招,⼆⾯技术后给offer)
14. 美团(三⾯技术+HR⾯后给offer)
15. 去哪⼉(校招,⼀⾯挂)
16. 凤凰(校招,三⾯技术+HR⾯,给了offer)
17. ⽠⼦⼆⼿车(校招,⼀⾯技术,拒绝了后续⾯试)
8. 知乎(校招,三⾯技术,等hr⾯中)
那些线下的不知名公司的⾯试,还有⼀个特殊的⾃荐⾯试,我就不列举了,反正各种⾯试加起来应该超过了⼆⼗⼏家公司。这⾥我想吐槽⼀下360和京东的⾯试,360今年雇的中华英才⽹来安排⾯试,那叫⼀个混乱,说好的给改内推⾯试时间,然后就没有然后了,连校招也不让参加!还有京东,它今年完全是⽞学⾯试,各种坑逼,搞的进⼊⼗⽉份,⼤量学⽣违约,尤其京东物流开始疯狂补招,不,应该说是直接补招发offer。。
2017的应届算法薪资情况:
这个话题有点敏感,但是学⽣还是应该了解⾏情的,⽹上说今年应届算法岗的年薪批发价是30W,呃。。。这个我不敢肯定,但是25W的话,我还是承认的。关于批发价,北⽅的公司⼤概分这么⼏类:
1、普通互联⽹公司:15*15
2、滴滴,今⽇头条,爱奇艺,新浪等:20*(15-16)
3、百度,美团等:17*14.6和16.5*15.5约等于25w
具体的薪资,有个薪资⽹站,⼤家可以看下:
所以整体上看,除了个别加班严重或者融资较多的公司批发价是30W。其他不管是bat还是普通互联⽹公司,年薪⼤都是25W,除⾮你是sp的offer,那样的话年薪>30W,可惜我们⼤都是普通⼈。
我的⾯经:
便利蜂 ⼀⾯(内推⽆笔试,北京公司⾯试,2017.8.14,40min)
1、问实习项⽬
2、特征⼯程做的有哪些?⾮线性可分的情况怎么处理的?
3、SVM的核函数了解多少?
4、L1与L2区别?L1为啥具有稀疏性?
5、xgboost的原理
6、sigmoid函数的导函数的取值范围是多少?其实就是⼀元⼆次⽅程的y值范围,0-1/4
便利蜂 ⼆⾯(电话⾯试,2017.8.24,15min)
1、 实习内容:数据之间的关系和特征?
2、 Python中协成的概念,即微线程,具体可以看廖雪峰的⽹站
3、 C++中vector增删改的时间复杂度,O(1),O(n),O(n)
4、 MySQL中索引⽤的什么数据结构?B-Tree或B+Tree
5、 Hash_table的底层是什么实现的?拉链法,数组+链表
6、 HBase的列式存储解释
7、 ⾯试官建议多注重⼯程⽅⾯的能⼒,全程不问机器学习⽅⾯的问题
链家 ⼀⾯(内推笔试过后,北京公司⾯,2017.8.27,40min)
1、 ⾯试前全体做五道编程题:
1数组中出现次数超过⼀半的数
2括号匹配
3⼀串珠不同颜⾊,求包含所有颜⾊的最短⼦串
4从⽇志中出IP出现次数超过1024次的恶意IP
2、 最⼩⼆乘与极⼤似然函数的关系?从概率统计的⾓度处理线性回归并在似然概率为⾼斯函数的假设下同最⼩⼆乘简历了联系
3、 LR为啥是个线性模型?本质就是线性的,只是特征到结果映射⽤的是sigmoid函数,或者说回归边界是线性的,即
P(Y=1|x)=P(Y=0|x)时有W*x=0
4、 Hadoop中MR是怎么实现联表查询的?
5、 分类的评价标准,准确度,AUC,召回率等等
6、 有的逻辑回归损失函数中为啥要加-1*m
7、 ⽋拟合的解决⽅法?模型简单,加深神经⽹络,svm⽤核函数等等
8、 L2正则的本质?限制解空间范围,缩⼩解空间,控制模型复杂度
9、 SVM引⼊核函数本质?提⾼维度,增加模型复杂度
滴滴校招 (内推笔试后⼀⾯,⽜客视频⾯,2017.9.12,45min)
1、 介绍实验室的项⽬
2、 介绍xgboost、gbdt、rf的区别
3、 树模型的特征选择中除了信息增益、信息增益⽐、基尼指数这三个外,还有哪些?
4、 Sklearn中树模型输出的特征重要程度是本⾝的还是百分⽐?
jsp打开文件5、 介绍下SVM以及它的核函数
6、 熟悉FM算法不?
7、 算法题:两个链表的第⼀个公共节点
滴滴校招 (⼆⾯,⽜客视频⾯,2017.9.12,15min)
1、 ⾯试官⼀直看时间,感觉就是为了⾛个过场
2、 介绍下实验室项⽬
3、 进程和线程的区别?
4、 HBase数据库的优点?
5、 闲聊。。。你想从事哪⽅⾯的算法?c++⽤了⼏年?有啥问我的吗?我是做路径优化的
云脑科技 (散招,AI研发⼯程师,现场⼀⾯,2017.9.14, 5min?)
1、 到公司后先做⼀道题,⼀个⼩时之内做出来:
输⼊:今天,有,很多,笔试
昨天,“全运会,⽐赛”,结束了
明天,“不知,”“有多少笔试”“”
输出:今天 有 很多 笔试
昨天 全运会,⽐赛 结束了
明天 不知,“有多少笔试”
输出与输⼊的关系,即句⼦中有逗号的话,则⽤“”包住;有“”的话,先⽤“”将其包住,再⽤“”将其所在部分包住
2、 做完笔试,⾯试官来了,看了下代码,说你写的代码不是我想要的,谢谢您今天来北京⾯试,WTF ?!
中兴 (⼀⾯基础⾯,天津晋滨国际⼤酒店,2017.9.18,20min)
1、 两个⾯试官,⼀个⼤叔,⼀个⼥的,貌似领导级别
2、 问实习项⽬,重点关注特征⼯程和模型选择⽅⾯,为啥⽤深度学习,当时调参的具体数据是多少?多层的神经⽹络有没有⽤GPU?
3、 有啥问我们的么?我们主要在天津做AI⽅⾯,涉及⾦融,⽐较缺⼈(其实是缺985。。)
中兴 (⼆⾯综合⾯,天津晋滨国际⼤酒店,2017.9.19,20min)
1、 两个很年轻的⾯试官⼩哥,来⾃北京燕郊那⼉的
2、 全程不问任何技术,聊⼈⽣,性格怎样,喜欢看啥书,打游戏不?本科为啥学的数学?blabla。。。
3、 有啥问我们的没?我们来⾃北京燕郊那⼉的,业务主要是通信研发,⽆算法岗位,且他们主要⽤c
京东,⽞学招⼈ (⼀⾯挂,北京海润艾丽华酒店,2017.9.18,20min)
1、 ⾃我介绍,全程不写代码。。。
2、 聊实习项⽬,特征⼯程,模型选择,项⽬中的细节,你是如何选择算法模型的?效果如何?
3、 重点来了,你有什么问我的么?哦,我们是⽆⼈机部门,涉及到视觉,路径规划,通信⽅⾯的算法,基本没有传统机器学习算法业务,WTF?!
(数据开发⼯程师?⼀⾯挂,⼤厦现场⾯,2017.9.19,30min)
1、 两个⾯试官,其中⼀个主要负责问
2、 介绍实习项⽬,怎么判断特征的重要性?rf与gbdt的区别讲下?
3、 对实验室的项⽬丝毫不感兴趣,⾯试官果然不是做算法的。。。
4、 算法题:两个数字链表求和,将结果也存到⼀个链表⾥⾯,注意相加超10时进位就⾏
苏宁 (⼀⾯,天⼤现场⾯试,2017.9.21,70min)
1、 是⼀个年龄不⼩的⾯试官,貌似经理或者总监
2、 ⾃我介绍+聊实习项⽬
3、 RF与xgboost的区别?怎样选取的特征?如何判断这些特征的重要程度?最后RF的层数和深度是多少?
4、 还⽤了深层神经⽹络?⼏层?⽤GPU没?特征维度到底多少?服务器配置?啥?你能把全部数据放进内存?
5、 有啥问我的没?我是搜索部门的,即所有涉及搜索相关的业务。。。
乐信 (⼀⾯,⽜客视频⾯试,2017.9.25,40min)
高级前端开发培训1、 ⾃我介绍,介绍实验室项⽬,发表的论⽂内容
2、 关联规则中,置信度和⽀持度的概念?
3、 MySQL中MYISAM和InnoDB的区别
4、 LR,svm,rf等算法的区别
5、 模型评价指标,解释AUC,准确率和召回率
6、 对于同⼀个数据,怎样根据AUC判断模型的好坏?数据?没听懂。。。
7、 介绍实习的项⽬,服务器配置
8、 有啥问我的么?我们是⼤数据部门,数据仓库、分析、算法,涉及各种与⾦融相关的业务
乐信 (⼆⾯,⽜客视频⾯试,2017.9.28,34min) 10.17晚上HR电话直接给了offer
1、 ⼥⾯试官?后来才知是⼥主管。。全程没有问技术。。
2、 讲实习经历,为啥不留在实习公司呢?
3、 你遇到的问题,是如何解决的?
mysql面试题 知乎4、 介绍了部门,同⼀⾯⾯试官所介绍的
新浪门户 (⼀⾯,新浪⼤厦,2017.10.10,40min)
1、 很严肃的⼀个⾯试官,感觉他⾯试了很多⼈的样纸,不让⾃我介绍,有点⼩傲娇的样纸。。
2、 讨论实验室的项⽬
3、 介绍LR,为啥⽤的是似然函数不⽤最⼩⼆乘?当⽤lr时,特征中的某些值很⼤,意味着这个特征重要程度很⾼?对吗?不对,⽤lr时需要对特征进⾏离散化。。。
4、 L1和L2正则的区别?基于wifi的温度采集与控制系统产品系统架构图
5、 树模型中,特征选择⽅法有哪些?ID3和C4.5分裂后,节点的信息熵是变⼤还是变⼩?变⼩
6、 RF和gbdt的区别
7、 介绍下深度学习,CNN中的卷积和池化
克鲁斯卡尔算法权值相同怎么办8、 Hadoop中shuffle过程
9、 有啥问我的么?我是新浪⼿机客户端部门那⼉的,主要做推荐等等
58到家(⼀⾯,天⼤现场⾯,2017.10.12,1h)
1、 很年轻的⾯试官,感觉⾯试经验不⾜,⼤部分时间是我讲。。。
2、 项⽬期间遇到的问题,怎么解决的?
3、 为啥你的svm训练起来那么慢?
4、 了解贝叶斯不?它的应⽤场景都有哪些?
5、 知道哪些深度学习的框架?
6、 ⽹络分⼏层?TCP和UDP区别?写个快排吧
7、 场景题:⼀个10T的⽂本,⼀个10M的⽂本,从⼤⽂本中出与⼩⽂本中相似度⼤于80%的⽂本,提⽰,⽤SameHash
8、 我们是58速运部门的,主要做路径优化和推荐
58到家(⼆⾯,天⼤现场⾯,2017.10.12,40min)
1、 这个⾯试官是58家政部门的
2、 同⼀⾯,详细介绍了下实习项⽬,从特征⼯程到最后的模型融合
3、 场景题:北京市所有⼩区的客户发出家政请求的可能性(回归问题);或者从家政的全部业务流程中出⼀个具体场景进⾏分析:家政阿姨接到派单通知后,进⾏家政服务的路径选择,可阿姨⼀天顶多服务2-3个家庭,该如何派单?
4、 讨论之前的笔试题编程题:最短回⽂串,但是题⽬中有要求只能向字符串的末尾插⼊字符串,使得新字符串是最短的回⽂串,不是向任意位置插⼊。。。
百度 (⼀⾯,百度⼤厦C座,2017.10.15,1h)
1、 很年轻的⾯试官,问的很⼴,感觉回答出来了80%,依然没过
2、 介绍实验室项⽬,是怎样⽤的KNN进⾏的预测
3、 XGBoost与RF的区别
4、 RF的随机性体现在哪⾥?它的代码中输出的特征重要程度是怎么进⾏计算的?
5、 实习项⽬中的评价标准是什么?accuracy和precision、recall这些⼀样吗?AUC的解释
6、 了解哪些损失函数?区别是啥?
7、 线性模型为何⽤的最⼩⼆乘作为损失函数⽽不⽤似然函数或者交叉熵?
8、 了解哪些深度学习模型?keras底层⽤TensorFlow和theano时,代码有何不同?TensorFlow原理、流程图,session是啥?
9、 编程题:两个数组的最长公共⼦序列和最长递增⼦序列,⽤DP写出来后,让继续优化。。。
陌陌 (⼀⾯,望京soho,2017.10.16,1h)
1、 介绍实验室项⽬,对问题是回归还是分类进⾏了详细探讨。。。
2、 LR与SVM的区别
3、 GBDT与XGBoost的区别?
4、 实习期间遇到的问题,是怎么解决的?
5、 了解FM吗?GBDT的数据在使⽤前有什么需要注意的吗?
6、 做过⼴告点击率预估没?LR+GBDT和GBDT+FM怎么结合的知道不?
陌陌 (⼆⾯,望京soho,2017.10.16,15min)
1、 LR与GBDT的结合了解不
2、 智⼒算法题(说是它的校招笔试题):
f(x)=p,y=0; 1-p,y=1 将这个概率函数转换为T(x)=1/2, y=0或者y=1
提⽰:f(x)执⾏四次可能出现的结果有0,0:p^2 0,1:p*(-1p) 1,0:p*(1-p) 1,1(1-p)^2
⾥⾯有两次结果的概率是⼀样的
陌陌 (HR⾯,望京soho,2017.10.16,20min)
1、 来⼀很结实的HR⼩哥哥。。。很少看见男的HR。。
2、 说说⾃⼰的优缺点
3、 喜欢啥样的⽼板和同事
4、 期望薪资?我们发15个⽉的,还有加班费
5、 如果有其他公司的offer,你会怎么选
VIPKID (⼀⼆⾯,天⼤现场⾯,2017.10.17,40+20min)
1、 ⼀⾯试官是做java后端开发的,有点尬聊。。
2、 简单介绍下实习项⽬,解释了rf和gbdt
3、 项⽬中遇到的问题,怎么解决的?
clip coffee4、 了解各种⼤数据框架不?呵呵哒。。。。
5、 ⼆⾯⾯试官貌似主管或者经理级别
6、 对公司的业务进⾏了详细的介绍,并展⽰了团队在硅⾕的⼈员。。
7、 场景题:如何向⼩学⽣推荐或者预测适合的外教?怎样准备数据和算法?
8、 别⼈⼆⾯后直接HR⾯,我⾯后,被告知加⼀⾯,等待北京算法负责⼈电⾯,什么⿁。。。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论