原创 NLP論文翻譯——《Chinese Event Extraction With Inadequate Data》

這是一篇可能不出名,但是很實用的事件抽取論文,也很契合笨妞當下的使用。原文來自於這裏,代碼也比較好用。以下是翻譯記錄。********************************************分割線*************

原创 snake算法總結

snake是一種主動輪廓模型,笨妞對主動輪廓模型的理解:你先給它一個初始輪廓,模型以初始輪廓爲基準逐步迭代,來改進圖像的輪廓,使其更加精確。主動輪廓模型目前用到了2種:CV和snake。前者沒有看算法內部的原理。而snake,以最原始的論

原创 pandas應用—— Dataframe的屬性們

Dataframe包含的書友屬性如下: 先通過一個dict生成dataframe: N = 5 tmp_dict = dict() sum = 0 for i in range(N): n_sum = 'sum_'

原创 pandas應用——讀excel和DataFrame轉字典

1.讀excel表的方法:read_excel() 重要參數 sheetname:選擇要讀的sheet index_col: 定義某一列爲索引,參數的值是列名。 例子: import pandas as pd df = pd.r

原创 在win10上安裝keras

1.keras本身的安裝貌似很容易,但是theano安裝,大家都覺得很吐血,寒意頓生啊。都建議用anaconda,但是我之間已經安裝好了完備的python2.7,各種庫都有了。找了個同樣狀況的博客,照着先玩玩吧。 1.安裝anac

原创 條件隨機場(1)——原理

條件隨機場是給定隨機變量X條件下,隨機變量Y的馬爾科夫隨機場。所以,首先得看馬爾科夫隨機場。之前看概率圖模型的時候,正好看到馬爾科夫隨機場,知識真是相通的。在以前的總結《概率圖模型學習3》中總結過馬爾科夫網的基本理論知識。 下面

原创 windows10和linux配置CRF++的python接口

本笨妞自從用了python之後,就墮落了,能python的基本不java,能java的基本不c。然而CRF++是C版本的,儘管用的時候直接命令行就可以搞定,但還是想弄個python的接口,用起來方便。 我以爲CRF++和libs

原创 條件隨機場(2)——概率計算

1.CRF簡化表示 先回顧一下線性鏈CRF參數化形式 和都可以表示爲隨機變量的函數,因此,可以將和統一成 其中,是轉移特徵的個數,是狀態特徵的個數。特徵函數所代表的特徵集合一共有K個值,。 用來表示特徵的權重,是和的

原创 hive一些基本操作

字符串操作 http://www.cnblogs.com/iiwen/p/5611761.html 函數大全。 http://blog.csdn.net/wisgood/article/details/17376393 函

原创 判別式分類器vs生成式分類器:邏輯迴歸和樸素貝葉斯的比較

本文是二貨算法婦女對ng和Jordan的神論文《On Discriminative vs. Generative classifiers: A comparison of logistic regression and naive

原创 樸素貝葉斯理論進階(1)——cs229(4、5)筆記

樸素貝葉斯分類器是生成式模型的代表,同時樸素貝葉斯和邏輯迴歸都是線性分類器,兩者可以組成了一組生成-判別對。爲了更好的瞭解樸素貝葉斯,又倒回去看了Andrew ng的機器學習視頻第4講和第5講,並做了如下筆記。以下知識基本上都是視

原创 條件隨機場(4)——CRF++分詞訓練和預測

這是CRF的最後一篇總結。這篇總結是訓練分詞模型和預測。CRF、最大熵、隱馬爾科夫模型貌似都可以做分詞、詞性標註、命名實體識別,以前只是在hanLP裏面用這些工具,實際上是不明所以的。現在要開始弄明白其中原理,並自己訓練模型了。好

原创 accuracy、precision、recall、F1、ROC等指標

這篇博文寫得很全 https://www.cnblogs.com/sddai/p/5696870.html 點贊 收藏 分享 文章舉報 老笨妞 發佈了101 篇原創文

原创 在一個裸服務器上安裝python各庫和tensorflow

公司有一臺64G的服務器,對於經常在12G上跑的笨妞來說,這簡直是肥肉啊。於是要來IP,準備用用。 連上才發現完全是一臺centos的裸機。笨妞覺得centos最討厭的地方就是g++的版本很低,貌似還只支持gcc,很多底層是c+

原创 自助法

自助法的原理 引用別人舉得一個特別形象的例子來說明一下什麼是自助法:   一個池塘裏面有很多魚,到底有多少呢?有2000條,但我們並不知道?只有上帝和一個和池塘一樣大的漁網才知道,但是我們不是上帝,也沒有這樣的漁網。於是,拿個大漁網,撈