原创 python第一課

兩個最基本的python程序一·溫度轉化程序#TempConvert.py TempStr = input("請輸入帶有符號的溫度值:") if TempStr[-1] in ['F','f']: C =(eval(TempStr

原创 Python time庫簡要介紹

time庫基本介紹計算機時間的表達提供獲取系統時間並格式化輸出功能提供系統級精確計時功能,用於程序性能分析用法 import time時間獲取函數描述time()獲取當前時間戳,即計算機內部時間值,浮點數如:time.time() 返回

原创 Reinforcement Learning:An Introduction 第三章讀書筆記

有限馬爾科夫決策過程(Finite Markov Decision Processes)在這一章中我們介紹了貫穿本書的馬爾科夫決策過程。這類問題包括評定性的反饋和關聯因素(在不同的情況下選擇不同的行爲)。MDPs是進行序列決策的典型的形式

原创 Python格式輸出實例(小數整數輸出)

源文件f = 1.6 print("1.6直接整型輸出是 %d"%f,end="\n") print("1.6利用浮點數的精度範圍輸出%.0f"%f)輸出1.6直接整型輸出是 1 1.6利用浮點數的精度範

原创 py turtle庫

 Turtle庫是Python語言中一個很流行的繪製圖像的函數庫,想象一個小烏龜,在一個橫軸爲x、縱軸爲y的座標系原點,(0,0)位置開始,它根據一組函數指令的控制,在這個平面座標系中移動,從而在它爬行的路徑上繪製了圖形。turtle繪圖

原创 強化學習:入門 第一章讀書筆記

第一章讀書筆記 引子:  自從嬰兒開始,嬰兒就能夠從與環境的交互中學習。從與環境的交互中學習是差不多所有學習和智能的最基礎的理論。書中我們以人工智能工程師和研究者的身份用計算的方法,研究不同方法的效果。強化學習與其他機器學習相比較而言更注

原创 turtle庫介紹

#pythonDraw.py import turtle turtle.setup(650,350,200,200) turtle.penup() turtle.fd(-250) turtle.pendown()

原创 時序差分學習

第六章 時序差分學習 如果非要說一個強化學習中最核心並且新奇的方法,那麼時序差分學習毫無疑問就是那種方法。TD方法是蒙特卡洛方法和動態規劃思想的結合。所以TD方法有兩個特點:一是可以直接從經驗中學習,不需要環境模型;二是TD方法根據其他的

原创 數據類型及基本操作

整數類型可正可負,沒有取值範圍限制進制 十進制 二進制:以0b或者0B開頭,如0b011,-0B111八進制:以0o或者0O開頭十六進制:以0x或者0X開頭浮點數類型浮點數存在取值範圍和精度存在限制,但常規計算可以忽略,取值範圍約爲+-1

原创 字符編碼

今天中午,我突然想搞清楚Unicode和UTF-8之間的關係,於是就開始在網上查資料。結果,這個問題比我想象的複雜,從午飯後一直看到晚上9點,纔算初步搞清楚。下面就是我的筆記,主要用來整理自己的思路。但是,我儘量試圖寫得通俗易懂,希望能對

原创 基於表方法的規劃和學習方法讀書筆記

基於表方法的規劃和學習方法讀書筆記 在這一章中我們從一種統一的視角結合了強化學習中有模型的方法和無模型的方法。基於模型的方法的主要部分是規劃,無模型的方法主要依賴學習。這兩類方法有共同的基礎,首先都是依靠值函數的計算,再者這些方法都是基於

原创 什麼是好的程序

1.簡單易懂被人一看就懂2.拓展性強

原创 jieba分詞

在命令行輸入 pip intall jieba安裝jieba第三方庫jieba是優秀的中文分詞第三方庫,需要額外安裝提供三種分詞模式原理:利用一箇中文詞庫,確定漢字之間的關聯概率漢字之間概率大的組成詞語,形成分析結果除了分詞,用戶還可以添

原创 py os庫

os庫是Python標準庫,包含幾百個函數OS庫提供通用的、基本的操作系統交互功能,包括路徑操作、進程管理、環境參數等幾類路徑操作函數功能os.path.abspath(path)返回path在當前系統(idle安裝路徑)的絕對路徑os.

原创 第七章 n步自舉讀書筆記

第七章 n步自舉 在本章中,我們結合了前兩章講的蒙特卡洛方法和一步時序差分方法,拓展出n步TD方法。N步方法使我們從TD(0)的一步時間限制中跳出,可以根據問題合理的選擇n的大小。和往常一樣,我們先介紹n步自舉的預測問題,然後在考慮它的控