Python関連記事
Pythonライブラリ:Pandasとは?
PandasとはPythonのデータ解析用ライブラリの1つを指し、数表や時系列データを得意とするデータ操作・解析ライブラリです。 参考:Pandas
Pandasは表計算で用いられている行(ロー)と、列(カラム)から成るDataFrame(データフレーム)オブジェクトをサポートします。これにより、高速に表計算やデータベースのデータを読み書きできます。データを読み込んで並べ替えを行ったり、欠損データの補完を行いデータ分析しやすい形式に変換したりします。
ファイルフォーマットは、csv・excel・sql・jsonなど多様なフォーマットをサポートしているため、主にデータの読み込み工程やデータの前処理工程で用いられます。
Pandas以外のデータ解析ライブラリは?
PandasはベースライブラリとしてNumPyを利用します。NumPyはPythonの代表的な数値計算ライブラリの1つで、多次元配列オブジェクトをPythonに実装し、主にデータの読み込み工程やデータの前処理・加工工程で広く用いられています。PandasはNumPyに依存関係がありますので、NumPyを同時にインストールして利用します。 参考:NumPy
次に、Matplotlibを紹介します。MatplotlibとはNumPyをベースにしたグラフ描画ライブラリで、データの可視化に用います。データの可視化はデータ集計・加工の後工程で必要なため、Pandasのインストール時にMatplotlibのインストールも合わせて行うことをおすすめします。 参考:Matplotlib
Pandasのインストーラは?
Pandasをインストールする際に利用するのが、pipです。pipは、Python標準のPyPI(Python Package Index)のパッケージをインストール・管理します。PyPIに登録されているPythonの各ソフトウェアやライブラリは 、pipを用いてインストールすることができます。
Pandasをインストールする方法は、pip以外にAnacondaを使う方法があります。Anacondaには数値計算やデータ解析に必要なライブラリがセットで組み込まれているため、利用者はインストール後すぐに開発作業を開始できるメリットがあります。GUI版のAnaconda Navigator、CUI版のcondaツールがそれぞれ提供されています。
どちらのインストーラを使うかですが、データサイエンスや機械学習用途に用いるのがAnacondaの「conda」、初心者や汎用用途ではPyPIを使う「pip」の利用がおすすめです。
Pandasのインストール方法
Pandasのインストール方法は、パッケージインストーラを用います。以下にpipの基本操作を説明します。pipでは「パッケージ名==バージョン番号」とすることで、バージョン指定が可能です。
・pipを用いたインストール方法(MacOS、Linux) $ python -m pip install pandas、または $ pip install pandas
・pipを用いたインストール方法(Windows) $ py -m pip install pandas 参考:pandas Installation
Pandasのpip以外のインストール方法
pip以外のインストール方法の場合も、Pandasのパッケージ名:”python3-pandas”を指定することでインストールできます。AnacondaのcondaはWindows・Linux・MacOSで利用可能です。UbuntuやDebianでは、sudoを用いることができます。
・pip以外を用いたインストール方法(sudo) $ sudo apt-get install python3-pandas 「パッケージ名=バージョン名」とすることでバージョン指定が可能です。
sudoの他には、OpenSuseはzypper、Fedoraはdnf、Contos/RHELはyumのパッケージマネージャを用いてpython3-pandasをインストールできます。公式サイトでは、最新バージョンの入手はpipまたはcondaでインストールすることが推奨されています。
なお、Anacondaでは標準でPandasや依存ライブラリであるNumPyがインストールされるため、”conda list”やAnaconda Navigatorでインストールされていることをご確認ください。そこでバージョン変更したい場合や、誤ってアンインストールした場合は以下のコマンド、またはAnaconda Navigatorでインストールすることができます。
・pip以外を用いたインストール方法(Anaconda) $ conda install -c anaconda pandas 「パッケージ名=バージョン名」とすることでバージョン指定が可能です。
Anaconda Navigatorの場合は、パッケージの「Not Installed」からPandasをチェックし「Apply」をクリックします。「Installed」に表示されたら使用可能です。
Pandasの基本的な使い方
Pandasの使い方は、Pythonコードで以下のようにライブラリをインポートします。 “import pandas as pd” ”pd”はPandasのドキュメントでも頻繁に利用される名称なため、問題なければそのまま使用します。
”import”時にエラーとなるなどPandasが使えない場合は、Pandasがインストールされていない可能性があります。その際は今1度インストール状況を確認してみましょう。インストールしても“import pandas as pd”とエラーが発生する場合は、ライブラリのパスが正しく反映されていない可能性があります。
Python実行時に「コマンドが見つかりません」のエラーの場合は、Pythonの実行パスが正しく設定されていない事が考えられます。PATHまたはPYTHONPATH環境変数を確認して、パス設定を正しく行ってください。
Pandasのバージョンは、pd.__version__属性を表示すれば確認できます。さらに、pd.show_versions()関数で詳細情報を表示してくれるため、必要に応じてご確認ください。
Pandasのインストール確認方法
Pandasには、ユニットテストの関数があります。pytest 6.0以降とHypothesis 3.58以降があれば、pd.test()でセットアップに問題がないか確認できます。なお、依存ライブラリはNumPy 1.17.3以降、python-dateutil 2.7.3以降、pytz 2017.3以降が必要です。
Pandasがインストールできない場合は?
Pandasがインストールできない場合は、他のPythonライブラリ同様概ね以下のことが考えられます。下記の設定確認をしてみてください。
・システム管理者権限を確認 pipのパッケージダウンロード・インストールは、システム権限がない場合はフォルダ・ディレクトリやファイルのパーミッションでエラーが発生します。システム管理者の権限が設定されていることを確認しましょう。
・pipが最新バージョンか確認 pipが古いとその旨の警告が表示される場合があります。pipを最新にすることでパッケージ管理で生じるエラー発生リスクを低減することができます。pipのアップグレードも、パッケージのアップグレードと同等です。”python -m pip install --upgrade pip” で最新の状態を維持してください。
・pipのインストール状況を確認 pipは、Python2.7.9・Python3.4からPythonに同梱されています。それ以前のバージョンの場合は、Python自体のバージョンアップまたはpipの個別インストールが必要です。また、pipではなくpip3のみが入っている場合は、pip3を使用します。pip3はPython3に同梱されているため、Pandasインストール前に事前確認することをおすすめします。
・インターネット接続を確認 pipをはじめとするインストーラはインターネット接続により、リポジトリからパッケージをダウンロード・インストールします。そのため、ネットワーク環境が正しいかアクセス制限含めて確認してください。
PandasをVSCodeで使うには?
VSCode(Visual Studio Code)は、マイクロソフト社が提供する無料コードエディタです。VSCodeを使ってPythonおよびPandasを使うためには、VSCode Python extensionをインストールする必要があります。
VSCode Python extensionは、Extension Marketplaceから入手します。Extension Viewで「VSCode Python extension」を検索すると表示されますので、Installボタンをクリックします。 参考:Visual Studio Code Python extension for Visual Studio Code
Pandasをインストールしたらデータの読み込み・加工に利用しましょう
PandasはPythonのデータの読み込み工程やデータの前処理工程で用いられます。多様なフォーマットをサポートしており、頻繁に利用されています。無事にインストールできたら実際にデータの読み込みを行ってみましょう。Pandasを使って欠損データの補完やデータ集計等のデータ分析に活用してください。
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから