当前位置:首页 > 范文大全 > 公文范文 > 往年百度笔试真题,菁选2篇

往年百度笔试真题,菁选2篇

发布时间:2023-12-17 15:32:03

往年百度笔试真题1  一,简答题(本题共30分)  1、当前计算机系统一般会采用层次结构来存储数据,请介绍下典型的计算机存储系统一般分为哪几个层次,为什么采用分层存储数据能有效提高程序的执行效率?(下面是小编为大家整理的往年百度笔试真题,菁选2篇,供大家参考。

往年百度笔试真题,菁选2篇

往年百度笔试真题1

  一,简答题(本题共30分)

  1、当前计算机系统一般会采用层次结构来存储数据,请介绍下典型的计算机存储系统一般分为哪几个层次,为什么采用分层存储数据能有效提高程序的执行效率?(10分)

  2、 Unix/Linux系统的僵尸进程是如何产生的?有什么危害?如何避免?(10)

  3、简述Unix/Linux系统中使用socket库编写服务器程序的流程,请分别用对应的socket通信函数表示。

  二,算法与程序设计题(本题共45分)

  1,使用C/C++语言写一个函数,实现字符串的反转,要求不能用任何系统函数,且时间复杂度最小。函数原型是:char __reverse_str(char __str)(15分)

  2,给定一个如下输入格式的字符串,(1,(2,3),(4,(5,6),7))括号内的元素可以是数字,也可以另一个括号,请实现一个算法消除嵌套的括号。比如把上面的表达式变成:(1,2,3,4,5,6,7),如果表达式有误请报错。(15分)

  3,相似度计算用于衡量对象之间的相似程度,在数据挖据,自然语言处理中使一个基础性计算,在广告检索服务中往往也会判断网民检索Query和广告Adword的主题相似度。假设Query或者Adword的主题属性定义为一个长度为10000的浮点数据Pr[10000](称之为主题概率数组),其中Pr[i]表示Query或者Adword属于主题Id为i的概率,而Query和Adword的相似度简化定义为两者主题概率数组的内积,即sim(Query,Adword)=sum(QueryPr[i]__AdwordPr[i])(0<==i<10000)、在实际应用场景中,由于大多数主题的概率都为0,所以主题概率数组往往比较稀疏,在实现时会以一个紧凑型数组topic_info_t[]的方式保存,其中100<=数组大小<=1000,并按照topic_id递增排列,0<=topic_id<10000,0

  现在给出Query的topic_info_t数组和N(N>=5000)个Adwords的topic_info—t数组,现要求出Query与Adwords的相似度最大值,即max(sim(Query,Adword[i])(0<=i& query_topic_info,Const vector adwords_topic_info[],Int adwords_number);

  编写代码求时间复杂度最低的算法,并给出时间复杂度分析。(15分)

  三,系统设计题(本题共25分)

  在企业中,对生产数据进行分析具有很重要的意义。但是生产数据通常不能直接用于数据分析,通常需要进行抽取,转换和加载,也就是业界常识的ETL

往年百度笔试真题2

  一,简答题(本题共30分)

  1、当前计算机系统一般会采用层次结构来存储数据,请介绍下典型的计算机存储系统一般分为哪几个层次,为什么采用分层存储数据能有效提高程序的.执行效率?(10分)

  2、 Unix/Linux系统的僵尸进程是如何产生的?有什么危害?如何避免?(10)

  3、简述Unix/Linux系统中使用socket库编写服务器程序的流程,请分别用对应的socket通信函数表示。

  二,算法与程序设计题(本题共45分)

  1,使用C/C++语言写一个函数,实现字符串的反转,要求不能用任何系统函数,且时间复杂度最小。函数原型是:char __reverse_str(char __str)(15分)

  2,给定一个如下输入格式的字符串,(1,(2,3),(4,(5,6),7))括号内的元素可以是数字,也可以另一个括号,请实现一个算法消除嵌套的括号。比如把上面的表达式变成:(1,2,3,4,5,6,7),如果表达式有误请报错。(15分)

  3,相似度计算用于衡量对象之间的相似程度,在数据挖据,自然语言处理中使一个基础性计算,在广告检索服务中往往也会判断网民检索Query和广告Adword的主题相似度。假设Query或者Adword的主题属性定义为一个长度为10000的浮点数据Pr[10000](称之为主题概率数组),其中Pr[i]表示Query或者Adword属于主题Id为i的概率,而Query和Adword的相似度简化定义为两者主题概率数组的内积,即sim(Query,Adword)=sum(QueryPr[i]__AdwordPr[i])(0<==i<10000)、在实际应用场景中,由于大多数主题的概率都为0,所以主题概率数组往往比较稀疏,在实现时会以一个紧凑型数组topic_info_t[]的方式保存,其中100<=数组大小<=1000,并按照topic_id递增排列,0<=topic_id<10000,0

  现在给出Query的topic_info_t数组和N(N>=5000)个Adwords的topic_info—t数组,现要求出Query与Adwords的相似度最大值,即max(sim(Query,Adword[i])(0<=i& query_topic_info,Const vector adwords_topic_info[],Int adwords_number);编写代码求时间复杂度最低的算法,并给出时间复杂度分析。(15分)

  三,系统设计题(本题共25分)

  在企业中,对生产数据进行分析具有很重要的意义。但是生产数据通常不能直接用于数据分析,通常需要进行抽取,转换和加载,也就是业界常识的ETL。

推荐访问:笔试 往年 真题 往年百度笔试真题 菁选2篇 往年百度笔试真题1 百度笔试题库

版权所有:春晖范文网 2014-2024 未经授权禁止复制或建立镜像[春晖范文网]所有资源完全免费共享

Powered by 春晖范文网 © All Rights Reserved.。备案号:滇ICP备140013829号-1