原创 有限狀態機和動態規劃——地圖和本地搜索基本技術

地址識別和有限狀態機 地址的識別和分析是本地搜索必不可少的技術,儘管有許多識別和分析地址的方法,最有效的是有限狀態機。 每一個有限狀態機,都有一個開始狀態和一個終止狀態,以及若干中間狀態。每一個弧上帶有從一個狀態進入下一個狀態的條件。 若

原创 const int *p,int *const p區別

1)先從const int i說起。 使用const修飾的i我們稱之爲符號常量。即,i不能在其他地方被重新賦值了。注意:const int i與int const i是等價的,相同的,即const與int的位置無所謂。 2)const i

原创 餘弦定理和新聞分類

新聞的特徵向量 把文字的新聞變成一組可計算的數字,再設計一個算法類計算任意兩篇新聞的相似性。 找一組數字(或者向量)描述一篇新聞,詞是信息的載體,因此要對每個實詞的重要性進行排序。 在“如何度量網頁相關性”一文中介紹的TF/IDF 的概念

原创 將多個文件夾中音頻合併到一個文件夾中

for /r D:\說話人識別\westwing2 %f in (*.wav) do copy "%f"  d:\test

原创 二叉樹的遍歷與建立

遍歷二叉樹 二叉樹的遍歷,從根結點出發,按照某種次序依次遍歷二叉樹中所有結點,使得每一個結點被訪問一次且僅被訪問一次。 1、二叉樹的遍歷方法:(限制從左到右的習慣) 1、前序遍歷:根左右(第一個結點爲根結點) 2、中序遍歷:左根右(根結點

原创 貝葉斯網絡

1、  貝葉斯網絡 我們在前面的系列中多次提到馬爾可夫鏈 (Markov Chain),它描述了一種狀態序列,其每個狀態值取決於前面有限個狀態。這種模型,對很多實際問題來講是一種很粗略的簡化。在現實生活中,很多事物相互的關係並不能用一條

原创 布隆過濾器

布隆過濾器(Bloom Filter)是1970年由Burton Howard Bloom提出的。它實際上是一個很長的二進制向量和一系列隨機映射函數。布隆過濾器可以用於檢索一個元素是否在一個集合中。它的優點是空間效率和查詢時間都遠遠超