原创 內核調度【六】【數據結構】

1、struct util_est /**  * struct util_est - Estimation(估算) utilization of FAIR tasks  * @enqueued: instantaneous(瞬時) est

原创 內核調度【七】【boosted_task_util】

boosted_task_util實際上包含兩個部分,當前task的util加上margin值,margin就是將util的值給他擴大或者縮小一定的倍數 boosted_task_util static inline unsigned

原创 【SuttonBartoIPRLBook2ndEd】【chapter I】

The idea that we learn by interacting with our environment is probably the rst to occur to us when we think about the n

原创 【RL從入門到放棄】【十九】

1、組合策略梯度和值函數的方法

原创 【RL從入門到放棄】【二十六】【OpenAI gym玩打磚塊遊戲】

今天來看看OpenAI 團隊的gym,看看能否受到啓發啊! Gym is a toolkit【工具包】 for developing and comparing reinforcement learning algorithms. It

原创 【deep RL】【OpenAI】【一】

OpenAI地址: https://spinningup.openai.com/en/latest/index.html GitHub地址: https://github.com/openai/spinningup/blob/master

原创 【RL從入門到放棄】【二十二】

現在來看看tensorflow,畢竟要在tensorflow和pytorch之間該改改 1、demo 1、variable  2、graph  3、op  4、session   # -*- coding: utf-8 -*- impo

原创 【RL從入門到放棄】【二十一常見模型分析】

在RL裏面重要且比較容易被忽視的一環是ENv,爲什麼重要,因爲env是對實際情況的理解,尤其是輸入特徵和reward的定義直接影響最終的結果。而網上的很多關於RL的知識點,都主要在涉及agent上,所以對這個基礎的東西是忽略掉了的。 迷宮

原创 【RL從入門到放棄】【二十四】

1、dropout解決過擬合 dropout就是踢掉裏面的一些神經連接 pool可以視爲保留一些參數 import tensorflow as tf import numpy as np import pandas as pd impo

原创 tensorflow中的“tf.name_scope()”有什麼用?

原文鏈接:https://www.jianshu.com/p/635d95b34e14 轉自:https://www.jianshu.com/p/635d95b34e14 1. tf.name_

原创 tf.placeholder函數說明

原文鏈接:https://blog.csdn.net/kdongyi/article/details/82343712 函數形式: tf.placeholder(     dtype,     

原创 JSON怎樣添加註釋

原文鏈接:https://blog.csdn.net/hhthwx/article/details/78699700 今天在寫一個程序的時候發現了一個問題,在json文件中添加註釋之後,程序就出

原创 tensorflow中os.environ["TF_CPP_MIN_LOG_LEVEL"]的值的含義

原文鏈接:https://blog.csdn.net/qq_40549291/article/details/85274581 閒扯一下,最近組內同事跑路或回鄉的甚多,不知是經濟不景氣還是新官上

原创 too many open files(打開的文件過多)解決方法

原文鏈接:https://blog.csdn.net/roy_70/article/details/78423880 一、產生原因 too many open files(打開的文件過多)是Li

原创 【RL】【發展歷史和分類】

發展歷史 分類 現實中的很多例子是:不基於模型的且回報函數也是不知道的。但是網上給出的例子基本上都是基於模型的, 當然模型中的回報函數也是給你定義出來了的,或許你要做的就是調節超參數或者網絡結構,使得他更加快速的 收斂而已。