Pythonライブラリ:Pandasのインストール方法を解説!
Pandas
Pythonライブラリ:Pandasのインストール方法を解説!
開発ツール
アンドエンジニア編集部
2021.10.28
この記事でわかること
Pandasとは、数表や時系列データを得意とするPythonのデータ操作解析ライブラリを指します
Pandasのインストールは、Pythonで使用するpipまたはcondaを利用します
インストールは簡単ですので、すぐに欠損データの補完や集計に活用できます

Python関連記事

Pythonライブラリ:Pandasとは?

Pandas

PandasとはPythonのデータ解析用ライブラリの1つを指し、数表や時系列データを得意とするデータ操作・解析ライブラリです。 参考:Pandas

Pandasは表計算で用いられている行(ロー)と、列(カラム)から成るDataFrame(データフレーム)オブジェクトをサポートします。これにより、高速に表計算やデータベースのデータを読み書きできます。データを読み込んで並べ替えを行ったり、欠損データの補完を行いデータ分析しやすい形式に変換したりします。

ファイルフォーマットは、csv・excel・sql・jsonなど多様なフォーマットをサポートしているため、主にデータの読み込み工程データの前処理工程で用いられます。

Pandas以外のデータ解析ライブラリは?

PandasはベースライブラリとしてNumPyを利用します。NumPyはPythonの代表的な数値計算ライブラリの1つで、多次元配列オブジェクトをPythonに実装し、主にデータの読み込み工程やデータの前処理・加工工程で広く用いられています。PandasはNumPyに依存関係がありますので、NumPyを同時にインストールして利用します。 参考:NumPy

次に、Matplotlibを紹介します。MatplotlibとはNumPyをベースにしたグラフ描画ライブラリで、データの可視化に用います。データの可視化はデータ集計・加工の後工程で必要なため、Pandasのインストール時にMatplotlibのインストールも合わせて行うことをおすすめします。 参考:Matplotlib

Pandasのインストーラは?

Pandasをインストールする際に利用するのが、pipです。pipは、Python標準のPyPI(Python Package Index)のパッケージをインストール・管理します。PyPIに登録されているPythonの各ソフトウェアやライブラリは 、pipを用いてインストールすることができます。

Pandasをインストールする方法は、pip以外にAnacondaを使う方法があります。Anacondaには数値計算やデータ解析に必要なライブラリがセットで組み込まれているため、利用者はインストール後すぐに開発作業を開始できるメリットがあります。GUI版のAnaconda Navigator、CUI版のcondaツールがそれぞれ提供されています。

どちらのインストーラを使うかですが、データサイエンスや機械学習用途に用いるのがAnacondaの「conda」、初心者や汎用用途ではPyPIを使う「pip」の利用がおすすめです。

Pandasのインストール方法

installation

Pandasのインストール方法は、パッケージインストーラを用います。以下にpipの基本操作を説明します。pipでは「パッケージ名==バージョン番号」とすることで、バージョン指定が可能です。

pipを用いたインストール方法MacOS、Linux)  $ python -m pip install pandas、または  $ pip install pandas

pipを用いたインストール方法Windows)  $ py -m pip install pandas 参考:pandas Installation

Pandasのpip以外のインストール方法

pip以外のインストール方法の場合も、Pandasのパッケージ名:”python3-pandas”を指定することでインストールできます。AnacondaのcondaはWindows・Linux・MacOSで利用可能です。UbuntuやDebianでは、sudoを用いることができます。

pip以外を用いたインストール方法sudo)  $ sudo apt-get install python3-pandas  「パッケージ名=バージョン名」とすることでバージョン指定が可能です。

sudoの他には、OpenSuseはzypper、Fedoraはdnf、Contos/RHELはyumのパッケージマネージャを用いてpython3-pandasをインストールできます。公式サイトでは、最新バージョンの入手pipまたはcondaでインストールすることが推奨されています。

なお、Anacondaでは標準でPandasや依存ライブラリであるNumPyがインストールされるため、”conda list”やAnaconda Navigatorでインストールされていることをご確認ください。そこでバージョン変更したい場合や、誤ってアンインストールした場合は以下のコマンド、またはAnaconda Navigatorでインストールすることができます。

pip以外を用いたインストール方法Anaconda)  $ conda install -c anaconda pandas  「パッケージ名=バージョン名」とすることでバージョン指定が可能です。

Anaconda Navigatorの場合は、パッケージの「Not Installed」からPandasをチェックし「Apply」をクリックします。「Installed」に表示されたら使用可能です。

Pandasの基本的な使い方

Pandasの使い方は、Pythonコードで以下のようにライブラリをインポートします。 “import pandas as pd” ”pd”はPandasのドキュメントでも頻繁に利用される名称なため、問題なければそのまま使用します。

”import”時にエラーとなるなどPandasが使えない場合は、Pandasがインストールされていない可能性があります。その際は今1度インストール状況を確認してみましょう。インストールしても“import pandas as pd”とエラーが発生する場合は、ライブラリのパスが正しく反映されていない可能性があります。

Python実行時に「コマンドが見つかりません」のエラーの場合は、Pythonの実行パスが正しく設定されていない事が考えられます。PATHまたはPYTHONPATH環境変数を確認して、パス設定を正しく行ってください。

Pandasのバージョンは、pd.__version__属性を表示すれば確認できます。さらに、pd.show_versions()関数で詳細情報を表示してくれるため、必要に応じてご確認ください。

Pandasのインストール確認方法

Pandasには、ユニットテストの関数があります。pytest 6.0以降とHypothesis 3.58以降があれば、pd.test()セットアップに問題がないか確認できます。なお、依存ライブラリはNumPy 1.17.3以降、python-dateutil 2.7.3以降、pytz 2017.3以降が必要です。

Pandasがインストールできない場合は?

 Pandasがインストールできない場合は、他のPythonライブラリ同様概ね以下のことが考えられます。下記の設定確認をしてみてください。

システム管理者権限を確認 pipのパッケージダウンロード・インストールは、システム権限がない場合はフォルダ・ディレクトリやファイルのパーミッションでエラーが発生します。システム管理者の権限が設定されていることを確認しましょう。

pipが最新バージョンか確認 pipが古いとその旨の警告が表示される場合があります。pipを最新にすることでパッケージ管理で生じるエラー発生リスクを低減することができます。pipのアップグレードも、パッケージのアップグレードと同等です。”python -m pip install --upgrade pip” で最新の状態を維持してください。

pipのインストール状況を確認 pipは、Python2.7.9・Python3.4からPythonに同梱されています。それ以前のバージョンの場合は、Python自体のバージョンアップまたはpipの個別インストールが必要です。また、pipではなくpip3のみが入っている場合は、pip3を使用します。pip3はPython3に同梱されているため、Pandasインストール前に事前確認することをおすすめします。

インターネット接続を確認 pipをはじめとするインストーラはインターネット接続により、リポジトリからパッケージをダウンロード・インストールします。そのため、ネットワーク環境が正しいかアクセス制限含めて確認してください。

PandasをVSCodeで使うには?

VSCode(Visual Studio Code)は、マイクロソフト社が提供する無料コードエディタです。VSCodeを使ってPythonおよびPandasを使うためには、VSCode Python extensionをインストールする必要があります。

VSCode Python extensionは、Extension Marketplaceから入手します。Extension Viewで「VSCode Python extension」を検索すると表示されますので、Installボタンをクリックします。 参考:Visual Studio Code Python extension for Visual Studio Code

Pandasをインストールしたらデータの読み込み・加工に利用しましょう

Analysis

PandasはPythonのデータの読み込み工程やデータの前処理工程で用いられます。多様なフォーマットをサポートしており、頻繁に利用されています。無事にインストールできたら実際にデータの読み込みを行ってみましょう。Pandasを使って欠損データの補完やデータ集計等のデータ分析に活用してください。

気になる人のTwitterをフォローしよう!
アンドエンジニア公式LINEでは
新着記事やエンジニアに役立つ情報をお届け!
日々のキャッチアップをお手伝いします!
マイナビITエージェント

編集部オススメコンテンツ

eyecatch_visual_coder
Adobe製品を使わない"デザイナー"?「ビジュアルコーダー」が考える、自己満足で終わらないWebデザインとは
三角
2020.06.16

アンドエンジニアへの取材依頼、情報提供などはこちらから

お問い合わせ・情報提供
この記事をシェア
Twitter
Facebook
LINE
Hatena

編集部おすすめコンテンツ

アンドエンジニアへの取材依頼、情報提供などはこちらから

Powered by マイナビ AGENT