データフレーム内の差

ゆうき( @BASEBALLY15 )です^^

今回は,データフレーム内の差を求め,その結果を新たにデータフレームに追加する方法をご紹介します.

(前回に投稿した『Python 大学は今後増えていくのか?ポアソン分布で分析してみた!』内のコードの一部です.)

値の変化量をグラフにしたいときなどに使えるので,知ってて損はないと思います.

それでは,具体的にどのような結果になるのかをご説明します^^

Today’s Code

今回ご紹介するコードを記述することで,以下のようなデータフレームが完成します.

YearJunior collegeUniversity
0昭和25149201
126180203
227205220
328228226
429251227

YearJunior collegeUniversitytransition collegetransition University
0昭和25149201NaNNaN
12618020331.02.0
22720522025.017.0
32822822623.06.0
42925122723.01.0

“TRANSITION COLLEGE “と” TRANSITION UNIVERSITY “の項目が新たに追加され,

下から上を引いた値となっています.ちなみに,for文などは一切使っていません.

それでは,コードをご紹介します.

コード

#transition collegeという項目を追加
university_data["transition college"] = university_data["Junior college"].diff()

#transition Universityという項目を追加
university_data["transition University"] = university_data["University"].diff()

このコードについて,ご説明します.

  1. diff() → データフレーム内の下の値と上の値の差を求める.
  2. 差を求めた結果を新たに,データフレームに追加する.

以下に,このコードまでの流れを載せておきます.

全体の流れ

今回は,全体と同様に『学校基本調査』のデータを使います.

以下に,csvファイルにまとめたものを載せておきます.

ライブラリ

import numpy as np

import pandas as pd

from pandas import Series, DataFrame

コード

#csvファイルの読み込み
university_data = pd.read_csv("nen001.csv")

#表示
university_data
#transition collegeという項目を追加
university_data["transition college"] = university_data["Junior college"].diff()


#transition Universityという項目を追加
university_data["transition University"] = university_data["University"].diff()


#表示
university_data

終わりに

今回は,データフレーム内の値の『差』を求める方法をご紹介しました.

自分自身,このコードを知るまでは,for文で差を求めようとしていました.

やはり,知っているのと知っていないのとでは,コードの見やすさに大きな差がでますね^^

それでは・・・

Q &A

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA