原创 談談顯存的使用分析(二)

二、內存與顯存的數據傳輸類型與使用說明 (1)主機端分頁內存的使用方式 對於C語言,主機端的分頁內存是用calloc或者malloc函數進行一維空間的

原创 談談顯存的使用分析(三)

關於異步數據傳輸的使用方法與性能分析 提供異步執行的函數主要有以下幾類: Ø  Kernel函數,通過配置流參數實現 Ø  以Async結尾的函數 Ø  Device to device內存拷貝函數 Ø  存儲器初始化函數,如cudaMe

原创 D3D學習筆記整理(二)

三、圖形繪製 前面的程序框架可以生成一個不含任何圖形的背景圖像,下面介紹的是如何顯示一個基本的圖形。D3D中定義了6種基本的圖形表示,稱爲圖元。 圖元類型 D3D表示 意義 頂點集合 D3DPT_POINTLIST

原创 一個使用share memory進行性能優化的實例

下面是這段代碼是我的一個算法中用來求和以及求平方和的kernel函數: __global__ static void CompSumAndSquare(int rate,int I_n,int size,int width,int wsi

原创 淺析CUDA編譯流程與配置方法(1)

不知不覺做CUDA程序已經有大半年的時間了,參加CUDA校園競賽也得到一個優秀作品獎,也算是對自己的一個肯定,但是從來沒有好好整理和記錄自己的技術應用心得。由於最近實驗室要求統一自己的CUDA軟件開發環境,當然一個大問題就是編譯選項如何配

原创 知識產權培訓記錄

知識產權培訓報告 ------------------石丹 2014年9月19日   目錄 1, 知識產權培訓內容概述及個人心得體會... 2 2,關於專利的一些基本知識... 3 3,專利與企業發展的關係... 4 4,專利檢索的意義及

原创 淺析CUDA編譯流程與配置方法(3)

三、Nvcc的命令選項的分析說明 Nvcc的選項命令形式大概有以下3類:boolean (flag-)選項,單值選項和列表(multivalued-)選項。 下面是使用規則舉例: -o file -o=file -Idir1,dir2

原创 深入淺出說CUDA程序設計(二)

1.1 並行算法的目標 計算需求是永無止境的,可以說高性能計算是計算機科學研究中的“日不落”課題。並行計算是其中最有效的手段。作爲軟件編程人員,設計編寫並行算法是最爲核心的工作任務。筆者想從3個基本概念:時間重疊、資源重複和資源共享,來讓

原创 深入淺出說CUDA程序設計(三)

第二章 You can do it!這一章將從如何搭建CUDA編程環境說起,讓你一步一步完成你的第一個CUDA程序。本章會不厭其煩的把每一個環節羅列出來,雖然我不能保證未來的CUDA平臺會否有所改變,但我確信可以讓每一個初學者在目前的平臺

原创 D3D學習筆記整理(三)

四、頂點座標變換和設置光照 1,頂點座標變換 我們在計算機圖形學裏已經學過要顯示一個三維景物模型,應用程序必須經歷從世界座標系到屏幕座標系的轉換,這裏主要有三個座標系及相應的變換:世界座標系和模型幾何變換,觀察座標系和取景變換,以及投影座

原创 閒談學習模式識別

我從來沒有在自己的博客裏寫過與專業有關的東西,不久前在一位朋友的博客裏看到一些,覺得自己也可以嘗試寫一些,有些地方還是可以與人好好交流一下的!所以淺析一下我對模式識別的初鄙看法!尤其是有學弟學妹想從事圖像處理和模式識別的,應該會有些啓發吧

原创 D3D學習筆記整理(五)

六、D3D與CUDA的互操作 CUDA與D3D可以進行互操作,也就是說可以將D3D的資源映射到CUDA地址空間,使在CUDA中可以對D3D讀取和寫入數據。CUDA實現這個功能的API有兩組,這裏以運行時API爲例。 實現D3D與CUDA的

原创 D3D學習筆記整理(一)

最近想要把由CUDA計算生成的圖像直接做顯示,所以開始學一下D3D,把我自己學習記錄整理,既可以與同道分享交流,又是對自己的鞭策吧!開篇我還是比較喜歡把要學的東西整理結構理解下,所以從D3D的簡述開始寫吧!     一、D3D簡述 由微軟

原创 談談顯存的使用分析(一)

在基本完成了對nvcc的使用分析解決了實驗室的CUDA環境統一問題後,我轉向解決存儲器傳輸問題。看起來這個部分沒有設計算法那樣光纖,但作爲實驗室GPU組的組長髒活累活得自己幹,抱怨一下下!其實也不算是,看起

原创 D3D學習筆記整理(四)

五、紋理繪製 要使渲染的圖形更真實,可以使用D3D提供的物體表面紋理繪製功能。紋理,也稱紋理貼圖,就是表現物體圖形細節的一幅或多幅二維圖形,紋理繪製的目的就是通過一些特定的方式將紋理映射到物體上,使物體的視覺效果更加栩栩如生。 D3D紋理