原创 C++學習筆記之異常

程序執行中需要處理異常 動態分配空間時可能不會成功打開文件可能會失敗除法運算時分母可能爲0整數相乘可能溢出指針可能越界…… 異常處理方法一 使用選擇語句(if…else…)判斷異常情況,即時處理正常程序流程和異常處理語句混在一起程序

原创 ICTCLAS代碼學習筆記之CsegGraph類

CsegGraph類的相關筆記,這個類爲詞圖類,主要是詞的有向圖。提供兩個核心函數,一個是原子切分,一個是生成詞圖。爲了保存相關的信息,有三個成員變

原创 ICTCLAS代碼學習筆記之Utility

Utility.h和Utility.cpp是一些常調用的公有函數的集合。聲明瞭一些宏和字符串操作的一些函數,具體說明如下: 定義了句子開始標記CT_

原创 天書般的ICTCLAS分詞系統代碼(二)

原文地址:http://www.cnblogs.com/zhenyulu/articles/657017.html 上篇文章《天書般的ICTCLAS分詞系統代碼(一)》 說了說ICTCLAS分詞系統有些代碼讓人無所適從,需要好一番努力

原创 天書般的ICTCLAS分詞系統代碼(一)

原地址:http://www.cnblogs.com/zhenyulu/articles/653254.html ICTCLAS分詞系統是由中科院計算所的張華平、劉羣所開發的一套獲得廣泛好評的分詞系統,該版的Free版開放了源代碼,爲

原创 C++學習筆記之單向鏈表

例子: struct node { int data; node * next; }; next:指向下一個node類型的結構,連接node 的紐帶 存放學生信息的鏈表節點 struct student {

原创 C++學習筆記之雙向鏈表

定義雙向鏈表的節點: struct node { int data; node * next; //指向後續節點 node * pre; //指向前面的節點 }; 建立雙向鏈表 新節點鏈入鏈尾 原鏈尾節點的後繼指針

原创 C++學習筆記之文件和流

文件 普通文件 二進制文件 文本文件 輸入輸出設備:鍵盤、顯示器、打印機等 標準輸入流(用指針stdin操作)標準輸出流(用指針stdout操作)標準錯誤流(用指針stderr操作)C++採用相同的方式操作普通文件和I/O設備 打開一

原创 ICTCLAS代碼學習筆記之CUnknowWord類

未登錄詞識別(CUnknowWord類) ICTCLAS的未登陸詞識別是基於角色標註的。具體的算法大家可以參照張華平等人03年的文章<Chinese

原创 C++學習筆記之const

const約束 const對象不能調用非const成員函數const成員函數不能調用非const成員函數不能修改const對象構造函數和析構函數可以修改const對象 例子:初始化const數據成員的方法 class Circle {

原创 ICTCLAS代碼學習筆記之CSpan類

CSpan是標註器,詞性標註和角色標註都是使用這個類來完成的,使用的是相同結構的詞典,另標註算法是隱馬模型(HMM)完成的。 類中使用的一些宏變量如

原创 ICTCLAS代碼學習筆記之Cqueue類

主要看Cqueue類,即Queue.h和Queue.cpp兩個文件。Queue所包含的結點類型主要是用於處理最短路徑時的相關信息,即 struct

原创 ICTCLAS代碼學習筆記之CDictionary類

關於ICTCLAS詞典的組織 詞典相關的操作都在自定義的類CDictionary裏,相關文件爲CDictionary.h和CDictionary.cpp; 涉及幾個結構體變量,只註明了變量沒有寫構造函數。struct tagWordRes

原创 ICTCLAS代碼學習筆記之ContextStat類

ContextStat.h和ContextStat.cpp是上下文無關類CContextStat的相關聲明和實現。該類的相關操作只在Cspan類中調

原创 ICTCLAS代碼學習筆記之CResult類

最後一個核心文件CResult類。這個類是最外層的包裝,私有成員變量包括一個切分器(m_Seg)一個詞性標記器m_POSTagger、兩個詞典(核心