百度網上筆試題及答案(僅供參考)<o:p>
<o:p> </o:p>
作者: cb160 發佈日期: 查看數: 78187 出自: <o:p>
<o:p>
編程:
用C語言實現一個revert函數,它的功能是將輸入的字符串在原串上倒序後返回。
2 編程:
用C語言實現函數void * memmove(void *dest,const void *src,size_t n)。memmove
函數的功能是拷貝src所指的內存內容前n個字節
到dest所指的地址上。
3 英文拼寫糾錯:
在用戶輸入英文單詞時,經常發生錯誤,我們需要對其進行糾錯。假設已經有一個包
含了正確英文單詞的詞典,請你設計一個拼寫糾錯
的程序。
(1)請描述你解決這個問題的思路;
(2)請給出主要的處理流程,算法,以及算法的複雜度;
(3)請描述可能的改進(改進的方向如效果,性能等等,這是一個開放問題)。
4 尋找熱門查詢:
搜索引擎會通過日誌文件把用戶每次檢索使用的所有檢索串都記錄下來,每個查詢串
的長度爲1-255字節。假設目前有一千萬個記錄,
這些查詢串的重複度比較高,雖然總數是1千萬,但如果除去重複後,不超過3百萬個
。一個查詢串的重複度越高,說明查詢它的用戶越多,
也就是越熱門。請你統計最熱門的10個查詢串,要求使用的內存不能超過。
(1)請描述你解決這個問題的思路;
(2)請給出主要的處理流程,算法,以及算法的複雜度。
5 集合合併:
給定一個字符串的集合,格式如:
, ,,,
要求將其中交集不爲空的集合合併,要求合併完成後的集合之間無交集,例如上例應
輸出
,,
(1)請描述你解決這個問題的思路;
(2)請給出主要的處理流程,算法,以及算法的複雜度
(3)請描述可能的改進(改進的方向如效果,性能等等,這是一個開放問題)。
////////////////////////////////1
1 題
char *revert(char * str)
return str;
}
///////////////////////////////////
2 題
void * memmove(void *dest,const void *src,size_t n)
return temp;
}
/////////////////////////////////////////////////
3 題
(1)思路 :
字典以字母鍵樹組織,在用戶輸入同時匹配
(2)
流程:
每輸入一個字母:
沿字典樹向下一層,
a)若可以順利下行,則繼續至結束,給出結果;
b)若該處不能匹配,糾錯處理,給出拼寫建議,繼續至a);
算法:
1.在字典中查找單詞
字典採用27叉樹組織,每個節點對應一個字母,查找就是一個字母
一個字母匹配.算法時間就是單詞的長度k.
2.糾錯算法
情況:當輸入的最後一個字母不能匹配時就提示出錯,簡化出錯處理,動態提示
可能 處理方法:
(a)當前字母前缺少了一個字母:搜索樹上兩層到當前的匹配作爲建議;
(b)當前字母拼寫錯誤:當前字母的鍵盤相鄰作爲提示;(只是簡單的描述,可
以有更多的)
根據分析字典特徵和用戶單詞已輸入部分選擇(a),(b)處理
複雜性分析:影響算法的效率主要是字典的實現與糾錯處理
(a)字典的實現已有成熟的算法,改進不大,也不會成爲瓶頸;
(b)糾錯策略要簡單有效 ,如前述情況,是線性複雜度;
(3)改進
策略選擇最是重要,可以採用統計學習的方法改進。
//////////////////////////////////////////////
4 題
(1)思路:
用哈希做
(2)
首先逐次讀入查詢串,算哈希值,保存在內存數組中,同時統計頻度
(注意值與日誌項對應關係)
選出前十的頻度,取出對應的日誌串,簡單不過了。
哈希的設計是關鍵。
//////////////////////////////////////////////////
5 題
(1)思路:先將集合按照大小排列後,優先考慮小的集合是否與大的集合有交集。有
就合併,如果小集合與所有其他集合都沒有交集,則獨立。獨立的集合在下一輪的比
較中不用考慮。這樣就可以儘量減少字符串的比較次數。當所有集合都獨立的時候,
就終止。
(2)處理流程:
1.將集合按照大小排序,組成集合合併待處理列表
2.選擇最小的集合,找出與之有交集的集合,
如果有,合併之;
如果無,則與其它集合是獨立集合,從待處理列表 中刪除。
3.重複直到待處理列表爲空
算法:
1。將集合按照大小從小到大排序,組成待處理的集合列表。
2。取出待處理集合列表中最小的集合,對於集合的每個元素,依次在其他集合中搜索
是否有此元素存在:
1>若存在,則將此小集合與大集合合併,並根據大小插入對應的位置 。轉3
。
2>若不存在,則在該集合中取下一個元素。如果無下一個元素,即所有元素
都不存在於其他集合。則表明此集合獨立,從待處理集合列表中刪除。並加入結果集
合列表。轉3。
3。如果待處理集合列表不爲空,轉2。
如果待處理集合列表爲空,成功退出,則結果集合列表就是最終的輸出。
算法複雜度分析:
假設集合的個數爲n,最大的集合元素爲m
排序的時間複雜度可以達到n*log(n)
然後對於元素在其他集合中查找,最壞情況下爲(n-1)*m
查找一個集合是否與其他集合有交集的最壞情況是m*m*(n-1)
合併的時間複雜度不會超過查找集合有交集的最壞情況。
所以最終最壞時間複雜度爲O(m*m*n*n)
需要說明的是:此算法的平均時間複雜度會很低,因爲無論是查找還是合併,都是處
於最壞情況的概率很小,而且排序後優先用最小集合作爲判斷是否獨立的對象,優先
與最大的集合進行比較,這些都最大的迴避了最壞情況。
(3)可能的改進:
首先可以實現將每個集合裏面的字符串按照字典序進行排列,這樣就可以將查找以及
合併的效率增高。
另外,可能採取恰當的數據結構也可以將查找以及合併等操作的效率得到提高。<o:p>
<o:p> </o:p>