原创 CNN模型Alexnet

        2012年,Imagenet比賽冠軍的model——Alexnet,它證明了CNN在複雜模型下的有效性,然後GPU實現使得訓練在可接受的時間範圍內得到結果,推動了有監督DL的發展。 模型結構見下圖:          

原创 python中編碼(encode)解碼(decode)講解

一、python3中str與unicode 在python3中,字符串有兩種形式:str和bytes,兩者區別如下: unicode string(str類型):以Unicode code points形式存儲(人認識的形式) byte

原创 Python中進程之間如何通信?

python提供了多種進程通信的方式,包括信號,管道,消息隊列,信號量,共享內存,socket等 主要Queue和Pipe這兩種方式,Queue用於多個進程間實現通信,Pipe是兩個進程的通信。 1.管道:分爲匿名管道和命名管道 匿名管道

原创 幾種常用迴歸算法的比較

type introduce example k-nearest neighbors 原理:是一種常用的監督學習方法,給定測試樣本,基於某種距離度量找出訓練集中與其最靠近的k個訓練樣本,然後基於這k個“鄰居”的信息來進行

原创 Python面試題

1.列出5個常用python標準庫 (1)os:提供與操作系統相關聯的函數 (2)re:正則匹配 (3)sys:通常用於命令行參數 (4)math:數學運算 (5)datatime:處理日期時間 2.簡述with方法打開文件幫我們做了什麼

原创 Python垃圾回收機制

整數:小整數:python對小整數的定義是[-5,257)這些整數對象是提前建立好的,不會被垃圾回收。在一個python的程序中,所有位於這個範圍內的整數使用的都是同一個對象。單個字母同樣也是如此。 大整數:每一個大整數的創建均在內存中分

原创 python中多線程、多進程和協程的區別

進程:是表示資源分配的基本單位,也是調度運行的基本單位。例如,用戶運行自己的程序,系統就創建了一個進程,併爲它分配資源。 線程:是進程中執行運算的最小單位,如果把進程理解爲在邏輯上操作系統所完成的任務,那麼線程就表示完成該任務的許多可能的

原创 Hadoop僞分佈式安裝

一、安裝jdk 1、將壓縮文件上傳到Linux系統 2、解壓:rpm -i /software/file/linux-basic/jdk-8u67-linux-x64.rpm 3、pwd 複製安裝目錄 4、配置環境變量 vi /etc/p

原创 centos普通用戶如何獲得管理員權限

方法一、找到/etc/sudoers文件 使用root用戶打開這個文件,找到 #%wheel    ALL=(ALL)    ALL    這一行  把前面的 #去掉 ,然後保存 保存後,使用管理員修改創建的普通用戶的權限,更改用戶的所屬

原创 redis面試總結

什麼是redis? Redis 是一個基於內存的高性能key-value數據庫。 (有空再補充,有理解錯誤或不足歡迎指正) Reids的特點 Redis本質上是一個Key-Value類型的內存數據庫,很像memcached,整個數據庫統統

原创 pandas讀取文件時報錯OSError: Initializing from file failed

原因:當你用pandas讀取文件報這種錯誤時,一般是因爲你的文件名中帶有中文,例如:         res = pd.read_csv('數據.csv') 修改(方法1):這種情況就會報錯,只需要這樣更改就可以:         f =

原创 如何選擇合適的算法?

sklearn官網給出了算法選擇的依據,可以根據以下圖片結合自己的實際情況選擇合適的算法 總結:如果需要<降低維度>,則使用<主成分分析>。            如果需要<快速的數字預測>,則使用<決策樹>或<邏輯迴歸>。      

原创 安裝VMWare和CentOS詳細教程

下載安裝文件 雙擊安裝 下一步 接受、下一步 修改安裝路徑,路徑中不能有中文 下一步 下一步 下一步 安裝 許可證:VMware 12 專業版永久許可證密鑰: 5A02H-AU243-TZJ49-GTC7K-3C61N

原创 大數據面試題1

大數據面試過程中被問到的一些問題: 1、關係型數據庫中的存儲過程和索引? 2、Hive中的join知識點? 3、手寫代碼 用Saprk實現PageRank的第一輪迭代(初始每個頁面票面值爲1) 4、什麼是多態? 5、什麼情況下表現爲多態?

原创 幾種常用算法的比較

type introduce example k-nearest neighbors 原理:是一種常用的監督學習方法,給定測試樣本,基於某種距離度量找出訓練集中與其最靠近的k個訓練樣本,然後基於這k個“鄰居”的信息來進行