BRAT是一個基於web的文本標註工具,主要用於對文本的結構化標註,用BRAT生成的標註結果能夠把無結構化的原始文本結構化,供計算機處理。利用該工具可以方便的獲得各項NLP任務需要的標註語料與安裝.
[1] Windows系統下安裝VirtualBox與Ubuntu的詳細教程
[2] Virtualbox中如何實現主機與虛機(Ubuntu 14.04)之間傳輸文件
[3] Ubuntu 安裝完成以後,一直上不了網
百度也連不上。嘗試了很多辦法,最後發現很簡單——更新firefox 即可,兩條命令。
sudo apt-get update
sudo apt-get install firefox
[4] Ubuntu安裝python2.7
因爲brat只支持python2, Ubuntu自帶python3
sudo apt-get install python2.7
[4] Ubuntu上安裝使用BRAT
more: https://wetest.qq.com/lab/view/31.html
[5] BRAT配置
5.1 annotation.conf
標記類型 configuration
5.1.1定義實體名稱
5.1.2 定義實體關係
5.2 visual.conf annotation顯示配置
5.2.1定義實體顯示別名
5.2.2 指定實體顯示顏色
5.3 數據
5.3.1 在/brat-v1.3_Crunchy_Frog/data/examples下新建自己的項目文件夾,如CervicalCancer
5.3.2 把主文件夾下/brat-v1.3_Crunchy_Frog的annotation.conf, tools.conf, visual.conf複製一份到CervicalCancer下,並按照5.1的步驟修改配置文件
5.3.4 把需要標註的txt文件放入新建的文件夾,同時新建一批同名的空的ann文件
5.3.5按照第4步開始標註