往年百度笔试真题,菁选2篇

发布时间:2023-12-17 15:32:03

往年百度笔试真题1　　一，简答题（本题共30分）　　1、当前计算机系统一般会采用层次结构来存储数据，请介绍下典型的计算机存储系统一般分为哪几个层次，为什么采用分层存储数据能有效提高程序的执行效率？（下面是小编为大家整理的往年百度笔试真题,菁选2篇,供大家参考。

往年百度笔试真题,菁选2篇

往年百度笔试真题1

　　一，简答题（本题共30分）

　　1、当前计算机系统一般会采用层次结构来存储数据，请介绍下典型的计算机存储系统一般分为哪几个层次，为什么采用分层存储数据能有效提高程序的执行效率？（10分）

　　2、 Unix/Linux系统的僵尸进程是如何产生的？有什么危害？如何避免？（10）

　　3、简述Unix/Linux系统中使用socket库编写服务器程序的流程，请分别用对应的socket通信函数表示。

　　二，算法与程序设计题（本题共45分）

　　1，使用C/C++语言写一个函数，实现字符串的反转，要求不能用任何系统函数，且时间复杂度最小。函数原型是：char __reverse_str（char __str）（15分）

　　2，给定一个如下输入格式的字符串，（1，（2，3），（4，（5，6），7））括号内的元素可以是数字，也可以另一个括号，请实现一个算法消除嵌套的括号。比如把上面的表达式变成：（1，2，3，4，5，6，7），如果表达式有误请报错。（15分）

　　3，相似度计算用于衡量对象之间的相似程度，在数据挖据，自然语言处理中使一个基础性计算，在广告检索服务中往往也会判断网民检索Query和广告Adword的主题相似度。假设Query或者Adword的主题属性定义为一个长度为10000的浮点数据Pr[10000]（称之为主题概率数组），其中Pr[i]表示Query或者Adword属于主题Id为i的概率，而Query和Adword的相似度简化定义为两者主题概率数组的内积，即sim（Query，Adword）=sum（QueryPr[i]__AdwordPr[i]）（0<==i<10000）、在实际应用场景中，由于大多数主题的概率都为0，所以主题概率数组往往比较稀疏，在实现时会以一个紧凑型数组topic_info_t[]的方式保存，其中100<=数组大小<=1000，并按照topic_id递增排列，0<=topic_id<10000，0

　　现在给出Query的topic_info_t数组和N（N>=5000）个Adwords的topic_info—t数组，现要求出Query与Adwords的相似度最大值，即max（sim（Query，Adword[i]）（0<=i& query_topic_info，Const vector adwords_topic_info[]，Int adwords_number）；

　　编写代码求时间复杂度最低的算法，并给出时间复杂度分析。（15分）

　　三，系统设计题（本题共25分）

　　在企业中，对生产数据进行分析具有很重要的意义。但是生产数据通常不能直接用于数据分析，通常需要进行抽取，转换和加载，也就是业界常识的ETL

往年百度笔试真题2

　　一，简答题（本题共30分）

　　1、当前计算机系统一般会采用层次结构来存储数据，请介绍下典型的计算机存储系统一般分为哪几个层次，为什么采用分层存储数据能有效提高程序的.执行效率？（10分）

　　2、 Unix/Linux系统的僵尸进程是如何产生的？有什么危害？如何避免？（10）

　　3、简述Unix/Linux系统中使用socket库编写服务器程序的流程，请分别用对应的socket通信函数表示。

　　二，算法与程序设计题（本题共45分）

　　1，使用C/C++语言写一个函数，实现字符串的反转，要求不能用任何系统函数，且时间复杂度最小。函数原型是：char __reverse_str（char __str）（15分）

　　三，系统设计题（本题共25分）

　　在企业中，对生产数据进行分析具有很重要的意义。但是生产数据通常不能直接用于数据分析，通常需要进行抽取，转换和加载，也就是业界常识的ETL。

推荐访问:笔试往年真题往年百度笔试真题菁选2篇往年百度笔试真题1 百度笔试题库