原创 David Silver《Reinforcement Learning》課程解讀—— Lecture 2: Markov Decision Process

David Silver《Reinforcement Learning》課程解讀—— Lecture 2: Markov Decision Process MDPs正式描述了強化學習的環境,幾乎所有的強化學習問題都可以描述爲MDPs。 1

原创 David Silver《Reinforcement Learning》課程解讀—— Lecture 4: Model-Free Prediction

David Silver《Reinforcement Learning》課程解讀—— Lecture 4: Model-Free Prediction DP動態規劃能夠解決已知environment的MDP問題,即已知 S,A,P,R,γ

原创 機器學習的分類與主要算法對比

機器學習的分類與主要算法對比 重要引用:Andrew Ng Courera Machine Learning;從機器學習談起;關於機器學習的討論;機器學習常見算法分類彙總;LeNet Homepage;pluskid svm   首先讓我

原创 David Silver《Reinforcement Learning》課程解讀—— Lecture 5: Model-Free Control

David Silver《Reinforcement Learning》課程解讀—— Lecture 5: Model-Free Control 上次課談到了在給定policy的情況下求解未知environment的MDP問題,稱之爲Mo

原创 MATALB中數組、矩陣、向量、行列式的關係

MATALB中數組、矩陣、向量、行列式的關係 正如matlab(矩陣實驗室)這個名字一樣,matlab的數據結構只有數組(array)一種形式: 單個的數就是1*1的矩陣 向量(vector):特指1*n或n*1的數組,前者稱爲行向量,

原创 Qt快速入門

> 轉發自作者:一去丶二三裏 博客地址:http://blog.csdn.net/liang19890820 簡介 Qt Creator是使用Qt開發的IDE。Qt支持Windows、Linux/Unix、Mac

原创 機器學習的明天——遷移學習

機器學習的明天——遷移學習         上個月,柯潔大戰AlphaGo落下帷幕,19歲的男孩少有地在比賽中落淚,賽後他爲我們留下一句話,柯潔說“AlphaGo”看上去像神一樣的存在,好像他是無懈可擊的···         的確,De

原创 利用moveit在ROS RViz下仿真控制UR機械臂

利用moveit在ROS RViz下仿真控制UR機械臂        上一篇博客介紹了UR5機械臂仿真環境的搭建,接下來講介紹一下如何利用ROS官方提供的moveit包在RViz控制UR5運動,以及RViz界面的幾個主要功能介紹。    

原创 UR5機械臂--ROS系統通信建立與實時控制

實驗室近期購置了一臺UR5機械臂,需要給機械臂上ROS系統。於是查詢各種資料、博客,以及翻牆到谷歌找到了一些資料。花了足足一個月時間終於在ROS系統上與UR5本體建立通信,並在RVIZ上控制UR5,記錄安裝調試過程以備後續任務。 1.首

原创 C++程序設計學習筆記

最近在學習北大《C++程序設計》這門公開課,重新複習C++編程知識。筆記記錄在了gitbook上,有興趣的同學可以點擊 北大C++程序設計 學習筆記 進行訪問。 Thanks!

原创 UR5機械臂仿真環境搭建

UR5機械臂仿真環境搭建 重要參考: ROS官網教程 前段時間,實驗室採購了一臺UR5機械臂,今天花了一下午,對照官網教程,完成了仿真環境搭建,期間遇到了一些問題,好在最後都解決了。機械臂的運動規劃和運動控制是一個很火的內容,同時也可以

原创 MATLAB矩陣元素的提取和替換

1. 提取 1 . 單個元素的提取 a=[1,2,3;3,4,5] a = 1 2 3 3 4 5 b=a(1,2) b = 2 2 . 提取矩陣中某一行的元素 a=

原创 MATLAB數組元素引用的三種方法

1. Matlab中數組元素引用有三種方法: 下標法(subscripts) 索引法(index) 布爾法(Boolean) 注意:在使用這三種方法之前,大家頭腦一定要清晰的記住,Matlab中數組元素是按列存儲(與Fortran一

原创 David Silver《Reinforcement Learning》課程解讀—— Lecture 3: Planning by Dynamic Programming

David Silver《Reinforcement Learning》課程解讀—— Lecture 3: Planning by Dynamic Programming DP用來解決MDPs的planning問題,主要解決途徑有poli

原创 淺談GAN生成對抗網絡

淺談GAN——生成對抗網絡 重要引用:深度學習新星:GAN的基本原理、應用和走向 | 硬創公開課;生成對抗網絡(GAN)相比傳統訓練方法有什麼優勢?;通過拳擊學習生成對抗網絡(GAN)的基本原理         最近總是聽老闆提起對抗