原创 強化學習--Pytorch--DQN擴展以及Policy Gradient網絡結構

DQN改進 DQN算法存在過估計問題,可以採用Double DQN方法來進行補償。兩種方法只在下圖不同,其他地方一致。下圖公式爲 q_target 的輸出值, DQN: Double DQN: Policy Gradient

原创 強化學習--Pytorch--DDPG

DDPG介紹及其示例 Deep Deterministic Policy Gradient是DeepMind團隊爲Actor-Critic方法打造的升級版本,其實也就是Actor-critic和DQN的融合版本。下面給出示例程序,

原创 Rospy初次使用記錄-定點飛行

由於接觸到pytorch,所以用python完成與ROS的通信,下面例子爲從程序中摘出來的一部分,用到了ROS消息的訂閱與發佈,服務的通信,可以作爲參考使用: import rospy from mavros_msgs.msg i

原创 強化學習--Pytorch--DQN

DQN的學習效果還是很驚豔的,首先放上本次實驗的代碼。和官方給出的例子一樣,是託舉平衡杆的問題。 給出視頻鏈接:強化學習DQN import torch import torch.nn as nn import torch.nn.

原创 路徑規劃算法--PRM,從原理到Matlab實現

注: 本篇博客轉載自運動規劃入門 | 3. 白話PRM,從原理到Matlab實現,老師講的太好了,我這裏轉載留存下。 上一回,我們講完了A的工作原理,與Dijkstar相比A確實有一定程度上的優化,但是我們最後也提到了,即便如此A

原创 一些做“飛卡智能車”時候的總結

寫在前面的話:       很有幸帶隊參加了11-14屆的全國大學生智能車競賽,經歷了從”飛思卡爾杯”到“恩智浦杯”的轉變。由最初的攝像頭組,到最後的六個組別都有涉及(沒有涉及創意組有點小遺憾);由最初的淘汰於省賽,一個彎道都過不

原创 匿名飛控中的時間分配註解

匿名飛控中仍然採用陀螺儀,加速度計和磁力計修正旋轉矩陣偏差,然後反推歐拉角的做法實現姿態解算過程。其飛控中時間分配如下: 1000Hz任務:四元數更新,傳感器數據的讀取。誰讓是SPI通信呢… 500Hz任務:角速度環控制,以及電

原创 強化學習--Pytorch篇

Q_learning算法 首先祭出強化學習中的基礎方法Q-Learning,算法流程如下圖所示: Q-learning是一個不斷摸索,最終找到最優的方法。個人理解是這樣的: 首先Q表是一個初值都爲0 的表,被學習體只能隨意摸索。

原创 Pytorch深度學習(二)

上一講回顧 上一講我們從零開始實現了Pytorch中的基本操作。 首先從numpy中手寫了基於最小loss(MSE)的線性迴歸程序(示例程序一); 然後從梯度下降的角度考慮,改寫示例程序一,衍生成基於梯度下降的線性迴歸程序(示例

原创 匿名飛控中的低通濾波器解析

寫在前面的話: 針對匿名飛控進行了一系列的研究,該飛控made in China,硬件電路設計簡潔,提供開源PDF文檔,軟件方面 飛控註釋詳細,程序邏輯清晰,入門首選。以下是去年針對匿名中經常使用的低通濾波器整理的筆記,公式符號有

原创 DARPA_FLA項目計劃-簡介(轉載)

作者:路住昌平 轉載鏈接:https://www.jianshu.com/p/875afcaedf8c 項目簡介 DARPA-美國國防高級研究局。 FLA-Fast lightweight autonomy 快速輕量級自主飛行計

原创 ROS導航navigation功能包

如上圖所示,首先要知道導航中的目標點(Goal), 然後 AMCL 會獲取當前座標點,Path Planner即爲路徑規劃,Move_base 主要解決的是本地優化(Path Planner相當於全局規劃,move_base相當

原创 Pytorch深度學習(一)

說起深度學習,目前流行的主要有TensorFlow和Pytorch。其中TensorFlow目前主要應用於工業界,Pytorch在學術界用的比較多。TensorFlow目前正在向2.0轉型,由於2.0與1.0差異較大,所以Tens

原创 四軸&電直中的零碎基礎知識點

電機型號:2204-2300kv 電機。其中2204表示定子,單位mm,即定子11mm, 高4mm; 2300kv表示每升高1V電壓,轉速上升2300r/min, 該電機重27g,最大電流12A,最大升力420g,空載電流0.6

原创 四軸軌跡規劃-Minimum snap總結

理論知識 參考:1. kummar 2011年 論文 Minimum Snap Trajectory Generation and Control for Quadrotors. 2. 香港科技大沈邵劫老師的相關論文; 3. 深藍