C++、Python、编程题、智商题等10个⽅向的⾯试常考题型总结
⽬录
Python
C++
智商题
⼤数据
计算机基础
概率题
HR常问问题
开放题
机器学习
编程题
Phython
Python的元组和列表的区别。
a = [1, 2, 3, 4],
b = a, b[0] = 100, 请问print(a)结果是什么
list是怎样实现的。
list有哪⼏种添加元素的⽅法,能否从表头插⼊元素?
如何提⾼Python的运⾏效率
如何获取list中最后⼀个元素
常⽤的数据结构及应⽤场景(list,dict,tuple)
C++
Makefile⽂件,提⽰未定义的引⽤,是什么原因(我答的是使⽤C库忘记加extern,其实应该是没有在makefile指定编译顺序)
STL中set怎么实现的,假设有“I like love”三个词,如何存。每个节点是直接指向这个单词的指针吗)
STL中vector是怎样实现的
const
虚函数
c++如何实现⼀个接⼝?(抽象类、纯虚函数)
c++的数据成员的可见性,继承到⼦类之后的可见性(这⾥我是分了不同继承⽅式讨论的),⼦类友原函数对⽗类private能否可见。
g++中-L,-I,-l的作⽤,有什么区别。-l指定链接库的时候,如何a库依赖b库,是否a库必须放在b库前⾯
传递⼀个指针进某函数体内,为什么不能对它重新分配空间,如果想要分配,应该怎么做?(指针的指针)
如何想让变量a=100的时候中断,如何写gdb代码
如何⽤gdb调试core⽂件,
对stl的了解程度,map的内部实现原理,为什么选择红⿊树,红⿊树的由来,与平衡⼆叉树的区别
拷贝构造函数和重载=符分别在什么情况下被调⽤,实现有什么区别
是否有⽤C++写过实际的⼯程项⽬。
程序有错误如何调试(回答打log,如何段错误,gdb调试core⽂件)
虚函数的⽬的,虚函数和模板类的区别,如何到虚函数
说⼀下TreeMap的实现原理?红⿊树的性质?红⿊树遍历⽅式有哪些?如果key冲突如何解决?
智商题
100张牌,每次只能抽⼀张,抽过的牌会丢掉,怎么选出最⼤的牌。
36匹马,6条跑道,选出最匹,最少赛多少场?
5个海盗抢到了100颗宝⽯,每⼀颗都⼀样的⼤⼩和价值连城。他们决定:抽签决定⾃⼰的号码(1,2,3,4,5)。⾸先,由1号提出分配⽅案(你抽到1号),然后⼤家5⼈进⾏表决,当且仅当超过半数的⼈同意时,按照他的提案进⾏分配,否则将被扔⼊⼤海喂鲨鱼。 如果1号死后,再由2号提出分配⽅案,依此类推。条件:每颗宝⽯都是⼀样的价值。海盗都想保命,尽量多得宝⽯,尽量多杀⼈。问题:你会提出怎样的分配⽅案才能够使⾃⼰的收益最⼤化?
⼀个⼈要过⼀座80⽶的桥,每⾛⼀⽶需要吃⼀颗⾖⼦,他最多可以装60颗⾖⼦,问最少需要吃多少颗⾖⼦才能⾛完桥?证明⼀下为什么你给的答案是最少的?桥长81⽶呢?当桥长n⽶,最多装m颗的时候结果⽤公式怎么表⽰?
⼀个绳⼦烧完需要1个⼩时,假设所有绳⼦的材质都不⼀样,也不均匀,怎么取出1⼩时加 15分钟。
把1~9这9个数填⼊九格宫⾥,使每⼀横、竖、斜相等。
有100个⿊球,100个⽩球。两个桶,桶的容量⽆限,每个球都可以任意放在任何⼀个桶中,没有限制,请设计⼀种分配⽅法,使得⽩⿊球分配到两个桶之后, 某个⼈从某个桶中取出的球是⽩球的概率最⼤化。(这个⼈去第⼀个桶取球的概率是1/2,第⼆个桶也是1/2)
有1亿个货物,不能单个单个检测,只能通过两两对⽐来出其中的次品,请设计⼀个算法来出次品。
有25匹马 ,5个跑道,⼀次只能⽐5匹马,得到跑得最快的前3,⾄少需要⽐⼏次?
有3盏灯,房间外有3个开关,你只有1次机会进⼊房间,怎么判断哪个开关对应哪盏灯?
给⼀堆螺母和螺栓,它们可以⼀⼀对应,但是现在顺序乱了,只能⽤螺母和螺栓⽐较,将它们⼀⼀对应起来。
⼤数据
100亿数字,怎么统计前100⼤的?
10亿个url,每个url⼤⼩⼩于56B,要求去重,内存4G。
1KW句⼦算相似度(还是那套分块+hash/建索引,但是因为本⼈不是做这个的,⽂本处理根本说⼀⽚空⽩,所以就不误导⼤家了),之后就是⼀直围绕⼤数据的题⽬不断深化。
Q1:给定⼀个1T的单词⽂件,⽂件中每⼀⾏为⼀个单词,单词⽆序且有重复,当前有5台计算机。请问如何统计词频?
Q2:每台计算机需要计算200G左右的⽂件,内存⽆法存放200G内容,那么如何统计这些⽂件的词频?
Q3:如何将1T的⽂件均匀地分配给5台机器,且每台机器统计完词频⽣成的⽂件只需要拼接起来即可(即每台机器统计的单词不出现在其他机器中)
⼀个⼤⽂件A和⼀个⼩⽂件B,⾥⾯存的是单词,要求出在⽂件B中但不在⽂件A中的单词。然后⼤⽂件A是⽆法直接存到内存中的。
⼀道题⽬是如果有⼀个⼈注册⼀个qq,如何保证这个qq号码和之前已存在的qq号码不重复呢?
扔硬币,连续出现两次正⾯即结束,问扔的次数期望
有100W个集合,每个集合中的word是同义词,同义词具有传递性, ⽐如集合1中有word a, 集合2中也有word a, 则集合1,2中所有词都是同义词,对这100W个集合进⾏归并,同义词都在⼀个集合当中。
编程软件python怎么读
有⼏个 G 的⽂本,每⾏记录了访问 ip 的 log ,如何快速统计 ip 出现次数最⾼的 10 个 ip,如果只⽤ linux 指令⼜该怎么解决;
海量数据的topk问题
计算机基础
Linux下的⼀些指令,$$(进程id),$?(上⼀条命令退出时状态),怎么查看进程,按照内存⼤⼩,CPU占⽤排序等等。
Linux的命令:pwd、ln、which
Linux线程通信
hash表是怎么实现的?有冲突的时候怎么处理?
linux ⽂件词频统计
介绍⼀下hash,怎么解决冲突。
你说⼀下hashmap的原理
内存泄露出现原因。
悲观锁乐观锁
把两个表按id合并怎么搞?
数据库transaction
浅拷贝深拷贝
第⼆题是两题 sql ,涉及 join,group by,max,min,sum,count 等操作的结合,以及同个题⽬多种写法。
线程安全是什么意思?新线程什么情况下会影响原有线程?
⽹络基础TCP三次握⼿
计算机⽹络:描述他发⼀句hello world到我这边显⽰,中间经历了哪些过程,我从应⽤层开始⼀层层往下分析答的,主要说http和tcp,⽹络层和链路层有些忘,但主要的⼏个协议和⼦⽹划分什么的也答了,⾯试官⽐较满意
词向量的推导,混合⾼斯,linux硬链接,三次握⼿,linux inode
进程线程的区别
概率题
100⼈坐飞机,第⼀个乘客在座位中随便选⼀个坐下,第100⼈正确坐到⾃⼰坐位的概率是?
X是⼀个以p的概率产⽣1,1-p的概率产⽣0的随机变量,利⽤X产⽣1/2概率是0,1/2概率是1的随机变量。
X,Y均服存于 [0,1] 的均匀分布,求X+Y。
⼀个国家重男轻⼥,只要⽣了⼥孩就继续⽣,直到⽣出男孩为⽌,问这个国家的男⼥⽐例?
⼀个有7个格⼦的环,三种颜⾊染⾊,相邻不能颜⾊重复,问多少种⽅案
⼀个袋⼦⾥有很多种颜⾊的球,其中抽红球的概率为1/4,现在有放回地抽10个球,其中7个球为红球的概率是多少?
⼀枚硬币,扔了⼀亿次都是正⾯朝上,再扔⼀次反⾯朝上的概率是多少?
⼀道概率题,54张牌,平均分成三堆,⼤⼩王在同⼀堆的概率?
⼀道概率题,⼀个六位的密码,由0~9组成,问你正过来看和倒过来看密码是⼀样的概率。
⼀道组合数学题。10盏灯,灭三盏,两头的必须亮着,不能灭掉相邻的两盏灯,问组合数?
三个硬币,分别是正正,反反,正反。随机抛⼀个硬币,结果是正⾯,问选的是那个硬币
个⼈玩游戏,100个球,每次挑5个,如何保证必胜。52张牌,四个⼈抽,⿊桃A和红桃A同时在⼀个⼈⼿⾥的概率。
好像是问有70%的⼈喜欢玩游戏,30%的⼈不喜欢玩游戏,现在推送的资源必须是50%游戏,50%⾮游戏。问怎么分配⽐较合理。
有n个elements和1个Compare(A, B)函数,⽤Compare函数作为排序算法中的⽐较算⼦给elements排序。Compare函数有p的可能⽐较错。排序完取Top m个元素,本来就在Top m并被正确分在Top m的元素个数是x。问x的数学期望。
有两个随机数产⽣器,R1以0.7的概率产⽣1,以0.3的概率产⽣0,⽽R2以0.3的概率产⽣1,0.7的概率产⽣0.问如何组合这两种产⽣器,使新得到的随机数产⽣器以0.5的概率产⽣1,0.5的概率产⽣0。随机数产⽣器可复⽤。
有两枚硬币A和B,A正⾯的概率为0.6,B正⾯的概率为0.5.现在扔了⼀枚硬币显⽰为正⾯,问:该枚硬币是A的概率是多少?
概率题:有种癌症,早期的治愈率为0.8,中期的治愈率为0.5,晚期的治愈率为0.2.若早期没治好就会转为中期,中期没治好就会变成晚期。现在有⼀个⼈被诊断为癌症早期,然后被治愈了,问他被误诊为癌症的概率是多少?
给⼀个函数,返回0和1,概率为p和1-p,请你实现⼀个函数,使得返回01概率⼀样。
定⼀个分类器p,它有0.5的概率输出1,0.5的概率输出0。Q1:如何⽣成⼀个分类器使该分类器输出1的概率为0.25,输出0的概率为
0.75?Q2:如何⽣成⼀个分类器使该分类器输出1的概率为0.3,输出0的概率为0.7?
问了⼀个概率题 54张牌,分成6份,每份9张牌,⼤⼩王在⼀起的概率
HR常问问题
常量矿物元素有哪些
为什么不读博、对读博报以什么态度。
为什么选择百度,⾕歌百度都给你offer你选哪个。
为什么选择跨专业学计算机?
为什么选择阿⾥
以后可能要学习很多新技术,你怎么看。
你平时喜欢做什么?看过哪些书?最近在看什么书?
你觉得最有挑战的项⽬是什么。
你觉得最难忘的事情是什么?
你认为你的优(缺)点是什么。
你还有什么想问的?
textarea设置最大行数加班怎么看。
印象最深刻的事?
手机上传照片显示parsererror
压⼒最⼤的情况是什么时候。
在⾯试过程中觉得⾃⼰那些当⾯有进步
场景分析题,有⼀个任务给你,要求⼀个⽉完成,但是以⽬前的能⼒⼀个⽉完成不了,现在你知道有⼀个同事擅长这部分⼯作,但是他有⾃⼰的活,帮助你就可能耽误他的进度,问你咋办。
⼤学令你觉得最不爽的事情是什么
如何学习的?
如何看待加班。
实习期间项⽬,在组内担任的⾓⾊,是否熟悉其他组员的⼯作。
家庭教育观念?
家⾥什么情况?独⽣⼦⼥?
将来的职业规划?
⼯作地点
⼯作地点的问题
平时有什么兴趣爱好。
我觉得我会先去专⼼钻研技术,到达⼀定的
最后问了⼀下我兴趣爱好
有什么问题问我。
有没其他offer
有没有想过去创业公司
现在在哪⾥实习?实习主要做些什么?
简单介绍⼀下⾃⼰
聊聊offer情况,有什么考虑之类的。
聊聊实验室⽣活。
能不能来北京
⾃⼰有什么优点缺点?
⾃⼰本科⽣和研究⽣相⽐有哪些进步
要求⽤两个字评价⼤学⽣涯。
讲⼀下你觉得你突出的地⽅,有亮点的地⽅。
评价⼀下你⾃⼰的优点缺点?
详细介绍项⽬。
说下你的优缺点
说说你的经历。
说说你⾃⼰的性格。
说说研究⽣阶段最有成就的事,遇到问题具体怎么解决的。
请你说⼀下你对应聘该岗位的优势。
遇到的最⼤挫折是什么。
问你的职业规划,遇到挑战怎么处理,有没有之前和同事发⽣过较⼤分歧。
开放题
2016年每个项⽬有个上线和下线时间段,统计每天在线的项⽬数量
⼀堆问题和答案的pair,算它们的相关性
⼀⾯现场⾯,⾃我介绍加挑⼀个项⽬细讲,还有场景题,第⼀题是QQ添加好友按名称搜索时,怎么区别⼴告号,号;
为什么之前没有深度⽹络出现(数据量不够+机器性能)
为今⽇头条设计⼀个热门评论系统,⽀持实时更新。
从项⽬中在哪⼀⽅⾯体会最深。
假设⼀个⽂档,连续的K个词,认为是⼀个时间窗⼝,⼀个时间窗⼝的词有关系,如何得到所有的时间窗⼝。
假设你拥有⼀切搜索数据,问怎么在不同场景下进⾏推荐,具体场景忘了(核⼼点:共线性、语义相似度、主题聚类等等)
假设有100W个单词,如何存储(我答的是trie树,⾯试官问每个节点会有很多⼦节点,每个⼦节点是⼀个指针,占⽤8个字节,如何节省空间,我说不知道,⾯试官提⽰双数组trie树)
假设要对⼀场nba球赛进⾏⾃动解说,会遇到哪些困难,⼜该怎么解决呢?
做过哪些项⽬?项⽬中遇到哪些难点,你是怎样解决的?
关于集调度的⼀些经验 trick 掌握多少;
分词时,为了提⾼效率,怎么存储词典?(键树)如何压缩存储?
在的场景下,如何判断⽤户的职业?开放问题
场景题如何鉴别淘宝上卖假货的商家,价格维度可以⽤什么策略等
如何做⼀个新闻推荐
如何在语料中寻频繁出现的字串,分析复杂度。
如何⽤尽可能少的样本训练模型同时⼜保证模型的性能;
如何预测双⼗⼀⽀付宝的负载峰值。
html空格的特殊符号是什么对推荐算法的未来看法。
平⾯上有n个点,让你设计⼀个数据结构,能够返回这个这n个点中距离某特定点最近的⼀个点。⼀开始讲了下kd树,然⽽太复杂⾯试官不满意,就讲了⼀个类似GeoHash的⽅案。
建⽴⼀个数据结构,基于此写⼀段程序⽤于存储sparse vector,同时编写⼀个函数实现两个sparse vector的相加运算
很多单词,如何计算单词之间的相似度(或者对单词进⾏分类)
怎么预测降⾬量。
我只有⼀⼤批实体词, 如何对他们进⾏聚类(⽆监督聚类), 如何出这些词中, 哪些词之间有关系, 是强关系还是弱关系, 具体是什么关系,(如刘德华和朱丽倩 属于娱乐分类, 是强关系, 关系为夫妻)
拼车软件是如何定价的以及如何优化。
推荐算法(基于⽤户的协同过滤,基于内容的协同过滤)
推荐系统的冷启动问题如何解决
⽂本挖掘中,分词算法?如何选取特征?如何进⾏相似度计算,⽂本聚类结果如何评估?
⽆给定条件,预测蔬菜价格。
有100W个集合,每个集合中有⼀些词,对于每个集合,出他是哪些集合的真⼦集。
有⼀堆已经分好的词,如何去发现新的词?
⽐赛相关问题提特征特征选择等
海量的 item 算⽂本相似度的优化⽅法;
特征⼯程经验。
⽤两分钟介绍⾃⼰的项⽬,创新点在哪⾥。
⽤户给三个item(query),如何给出查询⽹页。
第三题是如何鉴别实施的QQ⽤户;
第⼆题是朋友圈内容的安全鉴别;
第四题是如何做反作弊,例如的刷阅读量。
系统设计题,给⼀个query,如何快速从10亿个query中出和它最相似的 (⾯试官说可以对每个query1000个最相似的,存起来,每天离线更新)
线性代数:特征线性依赖,出现冗余,会导致什么问题?
给⼀堆数据到最佳拟合的直线,数据有较多噪声
给你⼀个系统(⾯试官好像是⽆⼈车部门的),后台的逻辑已经实现了,但是前端加载很慢,怎么检测。
给你两个⽂件a和b,⼤⼩⼤概100M,两个⽂件每⾏⼀个整数,要求到两个⽂件中相同的整数,存到⽂件c⾥,问我怎样尽快的完成这项⼯作?
给出⼀个算法实现如何确定快递邮件上的地址,要求从国家到省市到县到乡镇的⼀个识别,要求效率⾼(有陷阱,⽐如有的⼈把县写到市的前⾯,有⼈喜欢写地域名称的省略词⽐如安徽省写成安徽或者皖)。
给定淘宝上同类⽬同价格范围的两个商品A和B,如何利⽤淘宝已有的⽤户、商品数据、搜索数据、评论数据、⽤户⾏为数据等所有能拿到的数据进⾏建模,判断A和B统计平均性价⽐⾼低。统计平均性价⽐的衡量标准是⼤量曝光,购买者多则⾼。
给很多单词,统计某个⼦串出现次数,我给的⽅法还是⽤Trie,只不过⼀个单词要分成多个插⼊到Trie数中就⾏了。
给很多单词,要求统计出现某个前缀出现次数。
dubbo熔断机制实现统计全球会弹钢琴的⼈数,我⽤机器学习的思路答的,⾯试官还⽐较满意
⾃⼰项⽬中有哪些可以迁移到其他领域的东西。
讲了讲⾃⼰在深度学习的认识,问的问题是⼏个具体场景的设计,包括怎么从海量数据中提取热点问题。
设计 LRU 系统
设计⼀个合理的电梯调度策略,调度两个电梯 ,考虑满⾜基本的接送需求,满⾜能耗最⼩,满⾜⽤户等待时间最短
设计⼀个系统可以实时统计任意ip在过去⼀个⼩时的访问量;
设计⼀个结构存取稀疏矩阵(⾯试官最后告诉我了⼀个极度压缩的存法,相同⾏或列存偏差,我当时没听懂,还不懂装懂,最后还是没记住)
设计实现⼀个git diff
说⼀下最能代表你技术⽔平的项⽬吧?
项⽬:具体问了特征怎么做的。
(难到我了,我想的⽅法不好,⾯试告诉我了他的想法,类似于⼀个进程调度问题,每⼀时刻只可能有⼀个⽤户按按钮,把这条指令接收,判断当前电梯能否满⾜,能满⾜就执⾏,不能满⾜则放⼊⼀个队列⾥,实际情况还要细化)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。