原创 PaddlePaddle 計算機視覺實戰記錄

本次抗疫相關的paddlepaddle的cv特訓還是有了很大的收穫,特此記錄一下。 首先第一課是cv介紹以及繪圖相關學習,工作中一直用matplot畫圖,統計圖畫的比較少,前端時間看到疫情相關微博上有一些很好的玫瑰圖還很好奇是怎麼畫的,p

原创 樹與二叉樹1之樹的基礎概念

樹是數據結構中非常重要的一部分,我們這裏將會討論以下一些問題 一、樹的基本定義 1、樹的簡介 樹是一種非線性的數據結構,是由n(n >=0)個結點組成的有限集合。 如果n==0,樹爲空樹。 如果n==1,則該樹只有一個特定的結點,根結點

原创 Unity場景優化初探

一、什麼是批處理?   我們知道Unity3D在屏幕上繪製一個圖形本質上調用OpneGL或者DirectX這樣的API,因此在這個過程中會產生一定程度上的性能消耗。DrawCall是OpenGL中描述繪製次數的一個量,例如一個基本的Ope

原创 bert-serving-start: command not found...解決過程

最近在做一個問答系統,大概思路是先將問題encode爲一個向量,然後在問題庫中進行比較,選取最接近的問題,將其答案返回給客戶端 模型中主要的部分在於基於BERT模型,需要將問題先embedding,用到了xiaohan博士的bert as

原创 飛槳深度學習集訓營學習心得

從去年年底參加百度飛槳集訓營以來,目前學習進度已經完成了一小部分,感覺有很大的成長,彌補了自己很多不足,特寫篇心得記錄一下。 先介紹一下背景,我原來做的是機器學習相關,數據降維中流形學習的相關研究,畢業後現在從事的是自然語言處理的工作。當

原创 中文文本標註工具調研以及BRAT安裝使用

背景:最近的工作需要對文本先進行標註,然後纔可以做接下來的文本分類工作。 原來文本數量少的時候可以手工標註,隨着文本數量的增多,需要藉助標註工具,調研了目前常用的幾種: 參考自:https://blog.csdn.net/mengfanz

原创 最大熵模型

熵 熵H(X)又稱自信息,是描述一個隨機變量不確定性大小的量,熵越大則不確定性越大,則需要用更多的信息量來消除這種不確定性。前面《淺談機器學習基礎》中講決策樹的時候就提到了香農熵。 在只掌握關於未知分佈的部分知識的情況下,符合已知知識的概

原创 tensorflow 報錯:Key Variable_4 not found in checkpoint

遇到一個問題,在實際中需要連續導入兩個不同的模型,會發現有一個報錯,解決方法如下 index = getModel1(q1,q2) ... func() ... index2 = getMode

原创 Tensorflow一些常用基本概念與函數

1、tensorflow的基本運作 爲了快速的熟悉TensorFlow編程,下面從一段簡單的代碼開始: import tensorflow as tf #定義‘符號’變量,也稱爲佔位符 a = tf.placeholder("flo

原创 aiohttp異步框架之服務端用法

配置環境 首先檢查你的python版本: $ python3 -V Python 3.6.3 安裝aiohttp: $ pip3 install aiohttp 查看aiohttp版本號: $ python3 -c 'import

原创 Linux命令之curl

curl 是一種命令行工具,作用是發出網絡請求,然後獲取數據,顯示在"標準輸出"(stdout)上面。它支持多種協議,下面列舉其常用功能。 一、查看網頁源碼 直接在 curl 命令後加上網址,就可以看到網頁源碼。以網址 www.sina.

原创 python中dict操作集合

字典是Python是字典中唯一的鍵-值類型,是Python中非常重要的數據結構,因其用哈希的方式存儲數據,其複雜度爲O(1),速度非常快。下面列出字典的常用的用途.一、字典中常見方法列表 複製代碼代碼如下: #方法           

原创 python讀寫excel表格(xlrd/xlwt)

最近需要做文本分類,原始數據存放在excel表格中,首先需要將數據預處理,讀取出來,然後對特徵列中對缺失值置0,有值的爲1作爲label訓練分類器,作爲主要記錄使用過程的常見問題及解決。   python操作excel主要用到xlrd和x

原创 詳解 Word2vec 之 Skip-Gram 模型

2013年,Google開源了一款用於詞向量計算的工具——word2vec,引起了工業界和學術界的關注。首先,word2vec可以在百萬數量級的詞典和上億的數據集上進行高效地訓練;其次,該工具得到的訓練結果——詞向量(word embed

原创 利用TensorFlow進行電影評論的正負判斷(文本分類)及分析

這次是利用TensorFlow進行文本分類,判斷電影評價是正面還是負面的.IMDB數據集包含5萬個評論,其中2.5萬作爲訓練集,2.5萬作爲測試集.訓練集和數據集相當意味着正負樣本數一樣. 一.下載IMDB數據集 IMDB數據集經過處理,