データフレームから文字を抽出

ゆうき( @BASEBALLY15 )です^^

以前に,『新型コロナウイルスの拡大』の未来予測をしましたね.
その時に,データフレームの任意の文字を取り出しましたよね・・・?

はい^^

その方法について,詳しく教えてください・・・

分かりました^^

DataFrameから抽出する

Pythonでデータ分析をするときに,DataFrameを使うことが多いと思います.

その中で,以下の DataFrame のように一部のデータのみを取り出したいと思うことがあると思います.

SnoDateProvince/StateCountryLast UpdateConfirmedDeathsRecovered
0101/22/2020 12:00:00AnhuiChina01/22/2020 12:00:001.00.00.0
1201/22/2020 12:00:00BeijingChina01/22/2020 12:00:0014.00.00.0
2301/22/2020 12:00:00ChongqingChina01/22/2020 12:00:006.00.00.0
3401/22/2020 12:00:00FujianChina01/22/2020 12:00:001.00.00.0
4501/22/2020 12:00:00GansuChina01/22/2020 12:00:000.00.00.0
76576602/04/2020 22:00:00Boston, MAUS2020-01-02 19:43:001.00.00.0
76676702/04/2020 22:00:00Los Angeles, CAUS2020-01-02 19:53:001.00.00.0
76776802/04/2020 22:00:00Orange, CAUS2020-01-02 19:53:001.00.00.0
76876902/04/2020 22:00:00Seattle, WAUS2020-01-02 19:43:001.00.00.0
76977002/04/2020 22:00:00Tempe, AZUS2020-01-02 19:43:001.00.00.0

SnoDateProvince/StateCountryLast UpdateConfirmedDeathsRecovered
353601/22/2020 12:00:00NaNJapan01/22/2020 12:00:002.00.00.0
737401/23/2020 12:00:00NaNJapan01/23/2020 12:00:001.00.00.0
11811901/24/2020 12:00:00NaNJapan01/24/2020 12:00:002.00.00.0
15916001/25/2020 22:00:00NaNJapan01/25/2020 12:00:002.00.00.0
20520601/26/2020 23:00:00NaNJapan01/26/2020 23:00:004.00.01.0
25225301/27/2020 20:30:00NaNJapan01/27/2020 20:30:004.00.01.0

そんな悩みがある方は,以下のコードを記述するだけで,解決するかもしれません!

Today’s Code

coronajapan_df = corona_df[corona_df["Country"]=="Japan"]

これは,以下の図を見てもらうと分かりやすいと思います^^

DataFrame_任意の値を取得

このように,分からなくなったら,一度書き出してみるのがいいですよ^^

以下に,このコードまでの流れを載せておきます.

全コード

ライブラリ

import numpy as np

import pandas as pd

from pandas import Series,DataFrame

import statsmodels.api as sm

import matplotlib.pyplot as plt

import seaborn as sns

sns.set_style("whitegrid")

%matplotlib inline

コード

#csvファイルの読み込み
file_name = "2019_nCoV_data.csv"
corona_df = pd.read_csv(file_name)

#実行
corona_df.head()
#日本のデータを抽出  Today's Codeに投稿する^^
coronajapan_df = corona_df[corona_df["Country"]=="Japan"]

#実行
coronajapan_df

終わりに

今回は,DataFrameから,任意の文字を抽出する方法について,ご紹介しました.

自分自身が学習をしていて,つまずいた部分だったので,こちらのページにまとめました.

皆さんも,ぜひ参考にしてみてください^^

それでは・・・

Q &A

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA