pandas入門 – データの可視化
概要 今回はpandasを利用したデータの可視化方法について紹介します。pandasにはplot()という関数が用意されております。plot()は内部的にpythonのグラフ描画ライブラリMatplotlib …
概要 今回はpandasを利用したデータの可視化方法について紹介します。pandasにはplot()という関数が用意されております。plot()は内部的にpythonのグラフ描画ライブラリMatplotlib …
概要 データ分析はデータクレンジングに8割の時間を要すると言われます。欠損値の扱いはデータ分析を行う上で重要なファーストステップとなります。 欠損値とは、何らかの理由でデータの一部が抜け落ちている状態です。欠損値があると…
概要 今回はDataFrameのデータの削除方法について紹介したいと思います。カラムや行を指定してデータを削除するにはdrop()を利用します。 列を指定して列データを削除 列を指定して列データを削除するにはdrop(c…
概要 今回は特定のカラムでデータを集約する方法について紹介します。 データを集約することで特定のカラムのデータごとの最大値や平均値などをお求めることができます。 データの集約を行うにはgroupby()を利用します。 特…
2つのDataFrameを縦に結合 2つのDataFrameを縦に結合するにはpandasのconcat()を利用します 。 A B 0 A0 B0 1 A1 B1 2 A2 B2 A B 3 A3 B3 4 A4 B4…
概要 今回はある条件のデータを抽出し確認する方法を紹介します。 特定の列のみ抽出する 次の例では全体からname列のみを抽出します。 1列を選択した場合、返り値のデータ型はSeries型となります 複数の列を抽出する 続…
概要 今回は、pandasのDataFrameのソート(並び替え)とデータの抽出方法について紹介したいと思います。 データのソート まずはデータのソートについて説明します。データのソートを行うにはsort_valuesを…
概要 データ分析を行う際、表形式でデータを読み込むことによって分析が行いやすくなります。 Pandasを利用することによって簡単にCSVやTSVファイルから簡単にデータをデータフレームとして読み込むことができます。 Pa…
概要 データ分析を行う上で、データの行数や列数、どのようなデータの特性があるかを事前に確認することは非常に重要です。 今回はデータの基本統計量の確認方法について解説したいと思います。 基本統計量とは データの基本的な特徴…