原创 Nvidia Pascal GPU 架構詳解

本文作於 2016/12/25,作者卜居。 寫在前面:本文假定讀者有一定 CUDA 基礎。如果你對 GPU, sm_60/sm_61,CUDA 這些名詞感到陌生,可以看我之前寫的博客《CUDA 從入門到精通》。  1. 前言 Nvidia

原创 NESASM教程——第七天——使用內存

【從哪裏獲得?】 我們做任何其他事情之前,最好展示怎麼使用內存用於我們自己的數據。這個數據可能是任何東西,例如你需要存儲的數字或主角的X/Y座標值。我們將使用自由內存:位於CPU $0000。 【怎樣使用?】 代碼段0用ORG僞指令定位到

原创 Caffe源碼導讀(7):LRN層的實現

LRN全稱爲Local Response Normalization,即局部響應歸一化層,具體實現在CAFFE_ROOT/src/caffe/layers/lrn_layer.cpp和同一目錄下lrn_layer.cu中。該層需要參數有:

原创 Caffe代碼導讀(0):路線圖

【Caffe是什麼?】Caffe是一個深度學習框架,以代碼整潔、可讀性強、運行速度快著稱。代碼地址爲:https://github.com/BVLC/caffe【博客目的】從接觸Caffe、編譯運行、閱讀代碼、修改代碼一路走來,學習到不少

原创 NESASM教程——第五天——主角出場

【主角】 主角和背景比起來,你肯定覺得背景會更簡單。錯!主角才簡單得要命。 製造主角只需要向SPR-RAM寫入一點點內容(主角的x,y座標,tile編號,等等)。 等等,我覺得咱們得先繪製主角的圖片才行,走起~:) 【Tile Layer

原创 SDSoC使用體驗

本文作者:卜居 轉載請保留作者信息。原文網址(http://blog.csdn.net/kkk584520/article/details/47220575)。 本文工程可到我的資源下載(http://download.csdn.net/

原创 Altera OpenCL SDK與Xilinx SDAccel的使用對比

出於工作需求,申請了這兩家的高級語言綜合工具,對典型算法進行了實現和評估(數據暫時保密)。 簡要談談使用體驗。 1. Altera OpenCL SDK 首先需要安裝Quartus(13.1版本以上)和配套的SoC EDS,分別申請兩個

原创 加速器一致性接口

Zynq PS上的加速器一致性接口(Accelerator Coherency Port, ACP)是一個兼容AXI3的64位從機接口,連接到SCU(Snoop Control Unit),爲PL提供異步緩存一致性直接訪問PS的入口。

原创 使用專用硬件加速深度卷積神經網絡

英文論文鏈接:http://research.microsoft.com/apps/pubs/default.aspx?id=240715翻譯:卜居轉載請註明出處:http://blog.csdn.net/kkk584520/articl

原创 cuda-convnet2與caffe對比

出於對性能和多GPU訓練CNN的考慮,這段時間一直在研究cuda-convnet2。搜了下,網上居然一篇像樣的研究cuda-convnet2 代碼的文章都找不到,看來假期有的忙了。Caffe作者賈揚清也在一些場合表達了對Convnet2作

原创 優化基於FPGA的深度卷積神經網絡的加速器設計

英文論文鏈接:http://cadlab.cs.ucla.edu/~cong/slides/fpga2015_chen.pdf翻譯:卜居轉載請註明出處:http://blog.csdn.net/kkk584520/article/deta

原创 在MATLAB下調試Caffe

Caffe本身是C++、CUDA語言編寫的。在調試模型、參數時,根據運行log、snapshot很難實時反饋當前訓練的權值情況,也難以捕捉算法存在的bug。MATLAB則是非常適合算法設計、快速迭代的利器,只需要做少量工作就能編寫出複雜的

原创 Caffe代碼導讀(4):數據集準備

Caffe上面有兩個比較簡單的例子:MNIST和CIFAR-10,前者是用於手寫數字識別的,後者用於小圖片分類。這兩個數據集可以在Caffe源碼框架中用腳本(CAFFE_ROOT/data/mnist/get_mnist.sh和CAFFE

原创 NESASM教程——第十三天——背景

【簡介】 你應該知道什麼是背景,它就是靜態圖片,主角在其間穿梭。背景不難做,但缺少用於NES的背景製作工具確實是個頭疼的問題。 【製作背景】 在Tile Layer Pro中打開你的"our.bkg",繪製一些瓷磚,然後在紙上繪製一個用瓷

原创 Mac下安裝Caffe

2016-11-14 更新:一些讀者反映了新版 Caffe 在 Mac 下編譯時找不到 cblas.h 這個問題,始吾弗信,今親測也發現了這個問題,特別記錄下解決方法。罪魁禍首就是 Makefile Line 361~399:# BLAS