JupyterLabとは?
多くの企業が「デジタル・トランスフォーメーション(DX)」を進める中、AI(人工知能)を活用してビッグデータを分析し、その結果をビジネスに活用する動きが広まっています。
そうしたデータ活用に欠かせないのが、データ分析ツールです。これまでのデータ分析ではプログラムを手書きして、ファイルに保存したプログラムをターミナルなどから実行してきました。現在は、Webブラウザ上で手軽にプログラミングしながら、データ解析や機械学習を実行できる環境が用意されています。
中でも、多くのデータサイエンティストが利用するデータ解析ツールが「JupyterLab」です。なぜJupyterLabは人気があるのでしょうか。その特徴やインストール、起動手順などを解説していきます。
そもそもJupyterLabとは何か
JupyterLabは「ジュピター・ラボ」という読み方のデータ分析ツールです。ブラウザ上で動作するプログラムの対話型実行環境として利用されています。
基本的には、あるプログラムを実行する場合、すべてのコードを記述し、その後出力してから実行するという流れを取ります。対話型実行環境では、コードを1行ずつ書いて逐次実行し、その結果をすぐに確認できる点が特徴です。初心者でもすぐに始められるというメリットがあります。
JupyterLabでは「ノートブック」と呼ばれるファイルにPythonなどのプログラム言語でコードを記述します。ノートブックには「コード」「実行結果」「コードのメモ」などがまとめられています。
それらは、ノートブックの中の「セル」と呼ばれるものに格納され、セル単位で対話的に処理の実行が可能です。実行直後にすぐ表示される結果を逐次確認しながらデータ分析を進めることができます。
【参考】:Jupyter Project公式サイト
JupyterLabの特徴
JupyterLabでは「TensorFlow(テンソルフロー)」などの機械学習や、ディープラーニング用のライブラリなど様々なライブラリを動作させることができます。
また、複雑なデータ分析の結果を3Dグラフなど視覚的に分かりやすく表現し、内容を確認可能です。
さらに、軽量なマークアップ言語の1つである「Markdown(マークダウン)」で文章を記述できるため、コードや実行結果も含めた技術的なドキュメントの作成や共有に役立てる点も特徴の1つです。
JupyterLab誕生の背景
JupyterLabは、オープンソースソフトウェア・サービスを開発目的とする非営利団体「Project Jupyter」が開発したツールです。Project Jupyterでは、数十種類にも及ぶ言語の実行環境をサポートしてきました。JupyterLabはオープンソースで提供されているため、無料で利用できます。また、コミュニティ活動も活発で頻繁に機能アップデートが実施されています。
JupyterLabは2018年、同プロジェクトから「JupyterNotebook」の後継製品として正式発表されました。JupyterNotebookは、以前は「IPythonNotebook」という名称で、Python専用環境でした。Pythonは科学計算やデータ分析用のプログラミング言語として、過去20年以上にわたり多くのデータサイエンティストの人気を獲得しています。
その後、JupyterNotebookは、PythonだけでなくRuby・R・Goなど、40以上の言語をサポートするようになりました。後継であるJupyterLabは、JupyterNotebookの基本機能やコンセプトに大きな変更はなく、より便利な機能が搭載されています。
JupyterLabでできること
ブラウザ上で動作する対話型実行環境であるJupyterLabは、主に統計のモデリングや機械学習などデータ分析での利用が想定されており、グラフや画像の描画、テキストの形式設定など、データの視覚化やレポート作成などの作業に役立つ機能を備えています。
また、視覚的に操作しやすいGUIベースであるため、初心者でも使いやすい点も特徴の1つです。コードで記述した内容をその場で確認できるため、実際のアプリケーションを作る前の動作確認にも利用できます。
JupyterLabの活用メリット
一般的なデータ分析では、CSV形式の表データを取り込んで俯瞰したり、その分布や時系列変化をグラフなどに可視化したりして、データの傾向を調べることが中心です。
また、機械学習に活用する前には、データの誤記や未入力・重複などの不備を修正して、その正確性を高める「データクレンジング」作業をすることもあります。
さらに、分析処理では必要なファイルを作成して実行し、その出力結果であるグラフイメージを取り込み、内容の確認、デバックなどの工程が実施されます。こうした作業を何回も繰り返し実行し続けることは、データ分析をする上で非常に面倒で手間のかかることです。
そうしたデータ分析処理において、JupyterLabを活用するとどのようなメリットがあるのでしょうか。
JupyterLabでは、まず「.ipynb」形式ファイルをツール上で開いてさまざまなライブラリと組み合わせながら、プログラム記述領域である「セル」欄に必要なコードを書いて、セルの実行を指示するだけで済みます。
実行直後にすぐインタラクティブに表示される結果を逐次確認しながら、データ分析をより迅速に進めることが可能です。
データのセキュリティ面でも安全
JupyterLabでは、サーバ上でWebアプリケーションとして起動させ、ブラウザからアクセスできます。そのため、クライアント端末(ホスト)からサーバやストレージへのマウントをする必要がなく、サーバ上のデータにアクセスするため、サーバ内で分析処理を完結できます。
多くの計算リソースを消費することが多いデータ分析では、パブリッククラウドやサーバ上で処理することもあり、重要な内容が含まれたデータをホスト側にダウンロードしたり、残すことを避けたい処理が実施されることもあります。JupyterLabを活用すると、そうしたセキュリティ面に配慮した処理も可能です。
JupyterLabとJupyterNotebookの相違点
JupyterLabとその前身であるJupyterNotebookでは、どのような違いがあるのでしょうか。
まず、挙げられるのが「ユーザーインターフェースの改良」です。JupyterLabでは「.ipynb」「.py」などのテキスト形式ファイルをツール内のタブで展開できるようになりました。2つのタブを並列に開いて作業することが可能です。
また、JupyterNotebookではブラウザの別ページで実施していたフォルダ管理や実行中のノートブックの管理を画面左側のスペースに集約して1本化しています。
さらに、JupyterLabでは「環境設定をより柔軟にカスタマイズできる機能」が数多く搭載されています。たとえば、一般的なエディタのようにコードの行数をセルに割り振ったり、黒や暗い色を基調とした表示方式である「Dark Theme」を簡単に規定したりすることが可能です。
その他にも、「Vim」「Emacs」などのテキストエディタのような独自のキーマップへの変更もより簡単にできるようになりました。
JupyterLabのインストール方法
ここからは、実際にJupyterLabを活用する手順を見ていきましょう。まずは、JupyterLabのインストール方法を紹介します。
JupyterLabのインストールは、主に以下2つの方法があります。
(1)Anaconda(アナコンダ)と一緒にインストールする (2)JupyterLabだけをインストールする
Anaconda(アナコンダ)と一緒にインストールする
Anaconda(アナコンダ)とは、データサイエンスに特化したプラットフォームです。データサイエンスに適したライブラリや便利な機能を用意しており、PythonやRなどのデータサイエンスに良く利用される言語のパッケージも含まれている点が特徴的で、無料で利用できます。
まず、公式サイトにアクセスして、利用端末のOSに合わせたインストーラーをダウンロードします。その後、実行ファイルを起動させてインストーラーの指示に従い、インストール作業を進めます。
【参考】:Anaconda公式サイト
また、Python環境が既に存在する場合、ターミナル(MacOS)やコマンドプロンプト(Windows)で以下のコマンドを入力することでもインストール可能です。
conda install -c conda-forge jupyterlab
JupyterLabだけをインストールする
JupyterLabだけをインストールするには、パッケージ管理ツールなどから実施する方法があります。
インストールの前提として、ローカル環境にPython環境の構築が必要です。Pythonのバージョンには「2.x系列」と「3.x系列」という種類が存在し、一部の機能には互換性がないものも含まれるため、注意してください。
まず、Pythonのパッケージ管理ツール「pip」を利用してインストールする方法をご紹介します。pipはPythonのライブラリ管理ツールとして、Pythonのインストール時に標準で付属されています。
pip install jupyterlab
また、Python.orgが推奨するパッケージ管理ツール「pipenv」でインストールする場合は、次のコマンドを入力してください。
pipenv install jupyterlab
pipenv shell
その他、Dockerやmamba、JupyterHubなどを活用する場合の手順については、以下の公式サイトを参考にしてください。
【参考】:JupyterLab公式インストール
JupyterLabが起動しない原因
JupyterLabをインストールしても正常に起動しないケースもあるようです。その際は、以下の4点を確認してみてください。
まずは、公式ドキュメントに記載されている「推奨ブラウザ(Firefox/Chrome/Safari)であること、その最新バージョンであること」を確認しましょう。バックグラウンドで起動できているがブラウザが開かない場合は、「アドレスバーに手動で『http://localhost:8888/lab』と入力して確認してください。
また、ネットワークにおけるセキュリティ制限がかかっている場合も考えられます。導入しているセキュリティソフトの設定で、Pythonによるサーバ動作を禁止しているかを確認してください。
パッケージ管理ツールと組み合わせてAnacondaを導入した場合、欠損ファイルが発生する可能性も考えられます。Anacondaの再インストールを実施してみてください。
設定変更で「Tabnine」など便利機能も活用
JupyterLabが起動するとブラウザが立ち上がります。より使いこなせるように設定を変更したい場合は、画面左側に表示される「Settings」タブでカスタマイズ可能です。
より詳細な設定内容を規定したい場合は「Advanced Settings Editor」機能を活用してください。
JupyterLabには便利な拡張機能が数多く提供されています。変数の中身を表示できる「jupyterlab-variableInspector」や、AIによる入力補完ができる「Tabnine」などの拡張機能を活用して、操作性や生産性を高めることをおすすめします。
JupyterLabの日本語化
初心者の場合は、JupyterLabの日本語化を設定しておくとより使いやすくなります。ターミナルやコマンドプロンプトを起動し、pip、またはpip3でJupyterLabの日本語化パッケージをインストールしておけば言語選択が可能になり、日本語版を利用できます。
パッケージをインストール後、以下のコマンドを入力してください。
pip install jupyterlab-language-pack-ja-JP
pip3 install jupyterlab-language-pack-ja-JP
【参考】:JupyterLab公式ドキュメント
JupyterLabの終了方法
JupyterLabを終了する場合は、メイン画面の左上の「File」メニューから「Shut Down」をクリックします。その後、表示されるシャットダウンの確認メッセージ内の「Shut Down」ボタンを押すと、JupyterLabを終了することができます。
環境構築の手間が不要な「JupyterLab Desktop」
新しいプログラム言語を学習する際、最初の壁となるのが「環境構築」です。実際、JupyterLabは起動させるまでに時間や苦労がかかることもあります。そうした悩みを解決してくれるツールが「JupyterLab Desktop」です。
JupyterLabは通常、Webブラウザで操作するツールです。一方、JupyterLab Desktopは、PCで動作するデスクトップアプリケーションなので、インストールして実行すれば、すぐにJupyterLabが使えるようになります。
このアプリケーション内にPythonの実行環境やライブラリなどがすべて含まれているため、自分自身で環境を構築する手間がかかりません。また、既存のPythonやAnacondaと競合することもなく、LinuxやMacOS、Windowsなどのクロスプラットフォームで利用可能です。
「環境構築の手間を省きたい」という方は、JupyterLab Desktopを利用することをおすすめします。公式サイトからダウンロードできます。
データサイエンティストへの道のりも開ける
ビジネスの主流がアナログからデジタルに移行しつつある現在、先進技術を活用したデータ活用のニーズは幅広く、そのスキルはあらゆる業種や職種にとっても重要な素養になりつつあります。
IoTやAI、ビッグデータなどを活用し、より多くのデータを扱うシステムが必要になることが予想されるため、JupyterLabのニーズは今後さらに増すと考えられるでしょう。これからエンジニアとして活躍していくためにも、ぜひJupyterLabに関するスキルを習得することをおすすめします。
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから