Jupyter Notebookとは?
Jupyter Notebooとは、オープンソースソフトウェアの統合開発環境(IDE)です。統合開発環境とはソフトウェア開発に必要とされるエディタ・言語処理・デバッグ・実行に関するツールを単一の操作環境から利用できるようにしたものです。
Jupyter NotebookではPythonを始めとする40以上の言語を用いた開発を、ウェブブラウザやウェブベースアプリケーションを用いて行うことができます。Jupyter Notebookはデータ分析機能があるため、ビッグデータのデータ分析・統合にも用いることができます。科学技術計算や機械学習等を目的とする方には特におすすめです。
Python標準のpipコマンド、あるいはAnacondaのcondaコマンドを始めとするいくつかのインストール方法が提供されています。 参考:Project Jupyter | Home
Jupyter Notebookのメリット
Jupyter Notebookのメリットは、豊富なライブラリを用いてデータ分析を行えることです。オープンソースソフトウェアのため、無償で利用できます。また、Jupyter Notebookのドキュメントはプログラムコードに加えて、数式や図式を入れることができるためデータ分析の統合開発環境として人気があります。
データ分析の主要ライブラリであるNumPy・SciPy・Matplotlib・SymPy・pandasを、Python・IPythonで利用することを想定しています。
さらに、Jupyter Notebookは実行結果がすぐに出力され、1画面にまとめて表示されるため、逐次確認が可能なこともメリットの1つです。このことは対話型で授業を行う教育現場にも適しており、大学の授業にも取り入れられています。
JupyterLabとJupyter Notebookの違い
JupyterLabとJupyter Notebookは、ともにProject Jupyterのユーザインターフェイスとして位置づけられています。JupyterLabはJupyter Notebookの次世代ユーザインターフェイスを提供するもので、Jupyter Notebookの機能をカバーします。
具体的な違いですが、従来のJupyter Notebookの画面はファイルブラウザとエディタのビューで構成されていました。対してJupyterLabは、ファイルエクスプローラービューとメインビューの統合画面で構成されています。そのためJupyterLabでは、主要な統合開発環境で用いられているマルチドキュメントが単一ウィンドウで表示できるため操作方法が改善されました。
これにより、JupyterLabでは直感的な編集作業ができるように機能強化が図られています。
Jupyter Notebookを使うは?
Jupyter Notebookを使うには、パッケージマネージャを用いてJupyter Notebookをインストールします。インストール後はパッケージ管理システムのラウンチャーを使ったり、直接コマンド起動したりすることでJupyter Notebookを実行することができます。詳しくは以降で説明します。
Jupyter Notebookのインストール方法
Jupyter Notebookのインストールは、通常パッケージ管理システムに付属しているパッケージマネージャ(コマンド)を用います。代表的なパッケージマネージャは、PyPIで用いるpipとAnacondaのcondaです。
これから導入を始める方は、データサイエンスや機械学習用途に用いるのがAnaconda、汎用用途あるいは初心者の利用はPyPIを利用することをおすすめします。pipとcondaはそれぞれ選択したリポジトリに合わせて使用します。以下はそれぞれのインストール方法です。
・pipを用いたインストール方法 以下のいずれかのコマンドでインストールを行います。 $ python -m pip install jupyter $ pip install jupyter
・condaを用いたインストール方法 ここでは簡単なインストール方法として、Anaconda Navigatorを起動します。 Anacondaの最初の起動時には「Environment」「Create」で環境を作成します。 「Home」をクリックし、右画面にアプリケーションを表示します。 Jupyter Notebookの「Install」をクリックするとインストールが開始し、「Launch」で実行可能となります。すでに「Launch」と表示されている場合は追加作業は不要です。
condaコマンドを用いる場合は”conda list”でインストールパッケージを確認し、”conda install -c anaconda jupyter”でインストールすることもできます。
Jupyter Notebookの起動と停止
Jupyter Notebookの起動と停止方法は、以下の方法で行います。通常”http://localhost:8888/” がjupyterのローカルサーバーのHTTP接続で使用されます。
・pipを用いた場合の起動と停止方法 pipを用いた場合は、コマンドプロンプトやターミナルで”jupyter notebook”コマンドで起動します。これにより、ローカルでJupyterのウェブサーバーが起動するため入力画面はそのままにしておきます。
停止時はコマンドプロンプトやターミナルの起動画面を「Ctrl」キーと「c」キーを同時に押して、終了処理を行います。終了処理が完了すると、コマンドプロンプトやターミナルにプロンプトが表示されます。確認表示が出た際は”y”を入力します。
・condaを用いた場合の起動と停止方法 conda(Anaconda)を用いた場合は、Windowsの場合スタートメニューの「Anaconda3 (64-bit)」の下の「Jupyter Notebook」をクリックします。Anaconda NavigatorのアプリケーションからJupyter Notebookの「Launch」をクリックしても起動します。
終了する場合は、Jupyter Notebookのメイン画面右上の「Quit」をクリックしてください。その後”Server stopped”が表示されると終了です。または「File」「Close and Halt」をクリックすると、”Shutdown this notebook’s kernel, and close this window”が表示され、終了です。
終了処理を忘れた場合は、”jupyter notebook stop”コマンドで終了させることもできます。
Jupyter Notebookのコード作成と実行方法
Jupyter Notebookのコード作成は、「File」「New Notebook」「Python3」のメニュー表示をクリックして新規作成します。作成済みのNotebookのファイル読み込みは「File」「Open」でファイル選択します。
入力ラインの青色がコマンドモード、緑色が編集モードです。「Enter」キーでコマンドモードからエディットモードに切り替えます。「Esc」キーはエディットモードからコマンドモードに切り替えます。
コード実行はメニュー下の「▶Run」をクリックします。この他ショートカットで以下の方法でコード実行ができます。 ・「Shift」「Enter」 セルを実行し、下のセルに移動します。 ・「Ctrl」「Enter」 セルを実行します。 ・「Alt」「Enter」 セルを実行し、結果を下のセルに追加します。
なおpyファイルを実行する場合はファイル読み込みではなく、セルで”%run ファイル名.py”と記述し実行します。ファイル名.pyはNotebookファイル(ipynb)と同じフォルダにアップロードされていればパス指定は省略できます。
同様にCSVファイル等を分析のためにファイル読み込みする場合も、同一フォルダにアップロードするか読み込みファイルのアップロード先のパス指定が必要です。ファイルのアップロード方法は以降で説明します。
Jupyter Notebookのコード保存とアップロード方法
Jupyter Notebookのコード保存方法は、「File」「Save and Checkpoint」です。名前を変更する場合は「File」「Save as...」でファイル名を指定します。pyのファイルに保存する場合は、「Download as」「Python(.py)」でPythonファイルをローカルに保存します。
Jupyter Notebookのファイルアップロード方法は、「File」「Open」でフォルダ表示し右上「Upload」ボタンを押してウェブサーバーに必要なファイルをアップロードします。フォルダビューでアップロードしたファイルが追加されればJupyter Notebookで利用可能となります。
Jupyter Notebookで仮想環境を利用するには?
Pythonでは開発プロジェクトを複数作成する際に、仮想環境を作成します。仮想環境により他のプロジェクトへ影響を与えずにモジュールを追加したり、異なるバージョンのモジュールを使用したりできます。Jupyter NotebookでもPythonの仮想環境が利用できます。
Jupyter Notebookを仮想環境で利用するには、以下の手順で追加インストールが必要です。 ・導入済みJupyter Notebookに仮想環境を認識させる environment_kernelsプラグインをベース環境にインストールします。 具体的には”pip install environment_kernels”コマンドを用いインストールします。 ・仮想環境を登録する ”jupyter notebook --generate-config”コマンドで設定ファイルを作成します。 ”$HOME/.Jupyter/jupyter_notebook.py”ファイルが作成されます。 ファイルを修正し、Anacondaの仮想環境のパスを指定します。 修正例:(ユーザ名を含むパスは、環境に合わせて修正が必要です) c.NotebookApp.kernel_spec_manager_class='environment_kernels.EnvironmentKernelSpecManager' c.EnvironmentKernelSpecManager.conda_env_dirs=['C:/Users/ユーザ名/.conda/envs/']
この他にもipykernelを各仮想環境のJupyter Notebookにインストールする方法もありますが、environment_kernelsをインストールした方が簡単に設定できます。
Jupyter Notebookで使うライブラリの日本語化の方法
一般的にデータ分析を行うと日本語化されたグラフ出力が必要です。例えば、Matplotlibはデフォルトでは日本語表記に対応していませんので、プロパティを指定して日本語化する必要があります。具体的には以下のコードをプログラムで指定します。 from matplotlib.font_manager import FontProperties matplotlib.font_manager.FontProperties(fname=r’フォント名’,size=フォントサイズ )
フォント名は”C:\Windows\Fonts”にあるフォント名をパス付で指定します。 使用例: import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties fontp = FontProperties(fname=r'C:\Windows\Fonts\msgothic.ttc', size=24)
もしくは都度引数にfontname="日本語フォント"を指定する方法や、”~/.matplotlib/matplotlibrc”を作成して「font.family : 」にデフォルトフォントとして日本語のフォントを指定する方法などがあります。詳細はライブラリの設定ドキュメントをご参照ください。 参考:matplotlib Documentation
この他にもmatplotlibをベースとする可視化ライブラリのseabornでは、”site-packages\seaborn\rcmod.py”でデフォルトのフォントを指定できます。初期設定ではfont="sans-serif"に設定されています。詳細はライブラリの設定ドキュメントをご参照ください。 参考:seaborn
Jupyter Notebookを使ってデータ分析を効率的に行いましょう
Jupyter Notebookは豊富なデータ分析に活用できる統合開発環境です。近年増大するデータを効率的に分析するためにビッグデータでも利用度が高まっています。Jupyter Notebookの一連の操作方法に慣れたら、データ分析ライブラリやデータ可視化ライブラリを使って高度なグラフ作成にチャレンジすることをおすすめします。
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから