Jupyter Notebooks:一份全面的初學者實用指南

引言

應該使用哪個 IDE/環境/工具?這是人們在做數據科學項目時最常問的問題之一。可以想到,我們不乏可用的選擇——從 R Studio 或 PyCharm 等語言特定的 IDE 到 Sublime Text 或 Atom 等編輯器——選擇太多可能會讓初學者難以下手。

如果說有什麼每個數據科學家都應該使用或必須瞭解的工具,那非 Jupyter Notebooks 莫屬了(之前也被稱爲 iPython 筆記本)。Jupyter Notebooks 很強大,功能多,可共享,並且提供了在同一環境中執行數據可視化的功能。

Jupyter Notebooks 允許數據科學家創建和共享他們的文檔,從代碼到全面的報告都可以。它們能幫助數據科學家簡化工作流程,實現更高的生產力和更便捷的協作。由於這些以及你將在下面看到的原因,Jupyter Notebooks 成了數據科學家最常用的工具之一。

本文中,我們將介紹 Jupyter Notebooks 並深入瞭解它的功能和優勢。

讀完本文之後,你就知道你應該爲你的機器學習項目使用 Jupyter Notebooks 的原因了。你也會知道爲什麼人們會認爲 Jupyter Notebooks 比該領域內的其它標準工具更好。

準備好學習了嗎?現在開始吧!

目錄

Jupyter Notebooks 是什麼?如何安裝 Jupyter Notebooks?開始上手!使用神奇的功能不只限於 Python——在 Jupyter Notebooks 中使用 R、Julia 和 JavaScriptJupyter Notebooks 中的交互式儀表盤——何樂不爲?鍵盤快捷鍵——節省時間且更有生產力!有用的 Jupyter Notebooks 擴展保存和共享你的筆記本JupyterLab——Jupyter Notebooks 的進化最佳實踐和技巧

Jupyter Notebooks 是什麼?

Jupyter Notebooks 是一款開源的網絡應用,我們可以將其用於創建和共享代碼與文檔。

其提供了一個環境,你無需離開這個環境,就可以在其中編寫你的代碼、運行代碼、查看輸出、可視化數據並查看結果。因此,這是一款可執行端到端的數據科學工作流程的便捷工具,其中包括數據清理、統計建模、構建和訓練機器學習模型、可視化數據等等。

當你還處於原型開發階段時,Jupyter Notebooks 的作用更是引人注目。這是因爲你的代碼是按獨立單元的形式編寫的,而且這些單元是獨立執行的。這讓用戶可以測試一個項目中的特定代碼塊,而無需從項目開始處執行代碼。很多其它 IDE 環境(比如 RStudio)也有其它幾種方式能做到這一點,但我個人覺得 Jupyter 的單個單元結構是最好的。

正如你將在本文中看到的那樣,這些筆記本非常靈活,能爲數據科學家提供強大的交互能力和工具。它們甚至允許你運行 Python 之外的其它語言,比如 R、SQL 等。因爲它們比單純的 IDE 平臺更具交互性,所以它們被廣泛用於以更具教學性的方式展示代碼。

如何安裝 Jupyter Notebooks?

你可能已經猜到了,你首先需要在你的機器上安裝 Python。Python 2.7 或 Python 3.3(或更新版本)都可以。

1.Anaconda

對新用戶而言,一般的共識是你應該使用 Anaconda 發行版來安裝 Python 和 Jupyter Notebooks。

Anaconda 會同時安裝這兩個工具,並且還包含相當多數據科學和機器學習社區常用的軟件包。你可以在這裏下載最新版的 Anaconda:https://www.anaconda.com/download

2.pip 方法

如果你因爲某些原因不願意使用 Anaconda,那麼你需要確保你的機器運行着最新版的 pip。該怎麼做呢?如果你已經安裝了 Python,那麼就已經有 pip 了。你可以使用以下代碼升級到最新版的 pip:

#Linux and OSXpip install -U pip setuptools#Windowspython -m pip install -U pip setuptools

pip 安裝好之後,繼續安裝 Jupyter:

#For Python2pip install jupyter#For Python3pip3 install jupyter

你可以在這裏查看官方的 Jupyter 安裝文檔:https://jupyter.readthedocs.io/en/latest/install.html

開始上手!

現在你已經知道這些筆記本是什麼以及如何將其安裝到你的機器上了。現在開始使用吧!

要運行你的 Jupyter Notebooks,只需在命令行輸入以下命令即可!

jupyter notebook

完成之後,Jupyter Notebooks 就會在你的默認網絡瀏覽器打開,地址是:

http://localhost:8888/tree

在某些情況下,它可能不會自動打開。而是會在終端/命令行生成一個 URL,並帶有令牌密鑰提示。你需要將包含這個令牌密鑰在內的整個 URL 都複製並粘貼到你的瀏覽器,然後才能打開一個筆記本。

打開筆記本後,你會看到頂部有三個選項卡:Files、Running 和 Clusters。其中,Files 基本上就是列出所有文件,Running 是展示你當前打開的終端和筆記本,Clusters 是由 IPython 並行提供的。

要打開一個新的 Jupyter 筆記本,點擊頁面右側的「New」選項。你在這裏會看到 4 個需要選擇的選項:

Python 3Text FileFolderTerminal

選擇 Text File,你會得到一個空面板。你可以添加任何字母、單詞和數字。其基本上可以看作是一個文本編輯器(類似於 Ubuntu 的文本編輯器)。你可以在其中選擇語言(有很多語言選項),所以你可以在這裏編寫腳本。你也可以查找和替換該文件中的詞。

選擇 Folder 選項時,你會創建一個新的文件夾,你可以在其中放入文件,重命名或刪除它。各種操作都可以。

Terminal 完全類似於在 Mac 或 Linux 機器上的終端(或 Windows 上的 cmd)。其能在你的網絡瀏覽器內執行一些支持終端會話的工作。在這個終端輸入 python,你就可以開始寫你的 Python 腳本了!

但在本文中,我們重點關注的是筆記本,所以我們從 New 選項中選擇 Python 3。你會看到下面的屏幕:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章