NumPyとは?
NumPyとは、Pythonの代表的な数値計算ライブラリの1つを指します。NumPyは多次元配列オブジェクトをPythonに実装し、多数の演算関数を提供します。主にデータの読み込み工程やデータの前処理・加工工程で広く用いられています。 参考:NumPy
NumPyのライブラリコードはC言語で作成されています。このためNumPyは高速処理できることが特徴で、初心者から専門家まで人気があります。
NumPy以外の主要ライブラリ
科学技術計算で用いるライブラリは、NumPy以外にもMatplotlibやPandasが用いられます。
MatplotlibとはNumPyをベースにしたグラフ描画ライブラリで、データの可視化に用います。 参考:Matplotlib
Pandasとは数表や時系列データを得意とするデータ操作解析ライブラリです。データを読み込んで並べ替えを行ったり、欠損データの補完を行ってデータ分析しやすい形式に変換したりします。主にデータの読み込み工程やデータの前処理工程で用いられます。 参考:Pandas
MatplotlibとPandasはNumPyに依存関係がありますので、NumPyを同時インストールして利用します。
Pythonのpipとは?
pipは、Python標準のPyPI(Python Package Index)のパッケージをインストール・管理します。PyPIとは、Python Software Foundation(PSF)によるPython用リポジトリを指します。PyPIに登録されているPythonの各ソフトウェアやライブラリは 、pipを用いてインストールすることができます。
pip以外のインストール方法
pip以外のインストール方法として、Anacondaを使う方法があります。Anacondaには、数値計算やデータ解析に必要なライブラリがセットで組み込まれています。250を超えるデータサイエンスや機械学習のパッケージは自動的にインストールされ、利用者はインストール後すぐに開発作業を開始できるメリットがあります。
Anacondaの使い方はGUI、CUIそれぞれが提供されています。GUI版のAnaconda Navigatorでインストール管理・起動管理ができます。CUIはcondaツールを用いて行います。
pipとcondaの違い
pipとcondaの違いは、PyPIとAnacondaのそれぞれに対応したインストール・管理ツールであることです。PyPIとAnacondaは、Python用ソフトウェア公開サービス(リポジトリ)です。
選ぶ際の大まかな基準は、データサイエンスや機械学習用途に用いるのがAnaconda、初心者や汎用用途ではPyPIを利用することをおすすめします。
NumPyのインストール方法
NumPyのインストール方法は、パッケージインストーラを用います。以下に、代表的なパッケージインストーラの基本操作を説明します。pipでは「パッケージ名==バージョン番号」とすることでバージョン指定が可能です。
・pipを用いたインストール方法(MacOS、Linux) $ python -m pip install numpy 、または $ pip install numpy
・pipを用いたインストール方法(Windows) $ py -m pip install numpy
NumPyのpip以外のインストール方法
pip以外のインストール方法の場合も、NumPyのパッケージ名を指定することでインストールできます。Anacondaは、Windows・Linux・MacOSで利用可能です。UbuntuやDebianではsudoを用いることができます。MacOSではHomebrewが使われることが多いです。
・pip以外を用いたインストール方法(sudo) $ sudo apt-get install python-numpy 「パッケージ名=バージョン名」とすることでバージョン指定が可能です。
・pip以外を用いたインストール方法(Homebrew) $ brew install numpy バージョン指定は1度ローカルでハッシュを変更して保存し、インストールします。
なお、Anacondaでは標準でNumPyがインストールされますので、”conda list”やAnaconda Navigatorでインストールされていることをご確認ください。そこでバージョン変更したい場合や、誤ってアンインストールした場合は以下のコマンド、またはAnaconda Navigatorでインストールすることができます。
・pip以外を用いたインストール方法(Anaconda) $ conda install -c anaconda numpy 「パッケージ名=バージョン名」とすることでバージョン指定が可能です。
Anaconda Navigatorの場合は、パッケージの「Not Installed」からNumPyをチェックし「Apply」をクリックします。「Installed」に表示されたら使用可能です。
NumPyがインストールできない場合は?
NumPyがインストールできない場合は、概ね以下のことが考えられます。下記症状に該当するかどうか確認をしてみてください。
・インターネット接続に問題がある pipをはじめとするインストーラはインターネット接続により、リポジトリからパッケージをダウンロード・インストールします。そのため、ネットワーク環境が正しく接続されているか動作確認をしましょう。オフィスからの接続はリポジトリがアクセス制限されている場合もあるため、合わせてご確認ください。
・pipのバージョンが対応していない pipが古いと「WARNING: pip is being invoked by an old script wrapper. This will fail in a future version of pip.」の警告が表示される場合があります。pipが古いため将来問題が生じる可能性がある、というメッセージです。
pipでインストールをする場合、pip自体を最新にすることでパッケージ管理で生じるエラー発生リスクを低減することができます。pip自体のアップグレードは、パッケージのアップグレードと同等です。”python -m pip install --upgrade pip” で最新の状態を維持しましょう。
・pipがそもそも入っていない pipはPython2.7.9・Python3.4からPythonに同梱されています。それ以前のバージョンの場合は、Python自体のバージョンアップまたはpipの個別インストールが必要です。
・システム管理者権限が設定されていない pipのパッケージダウンロード・インストールは、システム管理者の権限が必要です。権限がない一般ユーザの場合は、フォルダ・ディレクトリやファイルのパーミッションでエラーが発生します。
さらに「コマンドが見つかりません」のエラーの場合は、pythonの実行パスが正しく設定されていない事が考えられます。PATH環境変数を確認してパス設定を正しく行ってください。
NumPyをVSCodeで使うには?
VSCode(Visual Studio Code)は、マイクロソフト社が提供する無料コードエディタです。マイクロソフト社のダウンロードサイトから入手します。Anacondaの場合は、VSCodeは利用可能な状態になっていますので「Anaconda Navigator」からインストールすることができます。 参考:Download Visual Studio Code
VSCodeを使ってPythonおよびNumPyを使うには、VSCode Python extensionをインストールする必要があり、Extension Marketplaceから入手可能です。Extension Viewで「VSCode Python extension」を検索すると表示されるので、Installボタンをクリックします。 参考:Visual Studio Code Python extension for Visual Studio Code
NumPyの基本的な使い方は?
NumPyの使い方は、Pythonコードで以下のようにライブラリをインポートします。 “import numpy as np” ”np”はNumPyのドキュメントでも頻繁に利用される名称ですので、問題なければそのまま使用します。
”import”時にエラーとなるなどNumPyが使えない場合は、NumPyがインストールされていない可能性があります。その際は今1度インストール状況を確認してみましょう。インストールしてもエラーが発生する場合は、ライブラリのパスが正しく反映されていない可能性があります。
Pythonインストール時のインストール先のパスを変更した場合には、PATH環境変数への反映を行う必要があります。それでもimportエラーが解消されない場合は、PYTHONPATHを合わせて確認してください。 参考:NumPy Troubleshooting ImportError
NumPyのインストールが完了したらデータ分析に活用してみましょう
NumPyは多次元配列を用いた基本演算の他、データ集計機能が充実しています。科学技術計算では多次元配列を活用しますので、Pythonのデータ分析の代表的なライブラリです。NumPyのインストールが完了したら実際に多次元配列を用いたデータ分析に活用することをおすすめします。
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから