Hospital
โ load dataset
import pandas as pd
df=pd.read_csv("/content/ADMISSIONS.csv", delimiter=',')
df.set_index('row_id', inplace=True)
df.head()
df.set_index('row_id', inplace=True)
โจ 'row_id'๋ฅผ ์ธ๋ฑ์ค๋ก ์ฌ์ฉํ๊ฒ ๋ค.
โจ ์๋ณธ ๊ฐ์ฒด๋ฅผ ์ฌ์ฉํ๊ฒ ๋ค.
index๋ฅผ ์ง์ ํด์ฃผ๋ ์ด์ ๋ dataframe์ ๋์ด์ด๋๊น ํ ํํ๋ก ๋ง๋ค์ด์ฃผ๊ธฐ ์ํด์.
โ๏ธ์ธ๋ฑ์ค ์ธํ ๋ฐ ๋ฆฌ์ : set_index (dataframe ๋ด์ ์ด์ ์ด์ฉํ ์ธ๋ฑ์ค ์ค์ )
dataframe.set_index(keys, drop=True, append=False, inplace=False)
1) keys: ์ธ๋ฑ์ค๋ก ์ธํ ํ๋ ค๋ ์ด์ ๋ ์ด๋ธ, ์ฌ๋ฌ๊ฐ๋ฅผ ์ ํํ๊ณ ์ถ์ ๊ฒฝ์ฐ์๋ ๋ฐฐ์ด ํํ
2) drop: ์ธ๋ฑ์ค๋ก ์ธํ ํ ์ด์ dataframe ๋ด์์ ์ญ์ ํ ์ง ์ฌ๋ถ(์ ํ), ๋จ๊ฒจ๋๊ณ ์ถ์ ๊ฒฝ์ฐ drop=False
3) append: ์ด๋ฏธ ์ธ๋ฑ์ค๊ฐ ์ค์ ๋์ด ์๊ณ ๋ค๋ฅธ ์๋ก์ด ์ธ๋ฑ์ค๋ฅผ ์ถ๊ฐํ๊ณ ์ถ์ ๋ ๋จ๊ฒจ๋๊ณ ์ถ์ ๊ฒฝ์ฐ append=True
4) inplace: ์๋ณธ ๊ฐ์ฒด๋ฅผ ๋ณ๊ฒฝํ ์ง ์ฌ๋ถ(์ ํ), ์๋ณธ dataframe์ ์ ์ฉํ๊ณ ์ถ์ ๊ฒฝ์ฐ inplace=True (df ์ด๋ฆ ๊ทธ๋๋ก ์ธ ๊ฒ์ธ์ง)
โก ์ด ํ์ ์
print(df.shape)
โข ํ๊ท ์ ์์ผ
import datetime
import numpy as np
dateformat="%Y-%m-%d %H:%M:$S"
admit_dur=[]
for i in range(len(df)):
start_datetime=df['admittime'][df.index[i]]
end_datetime=df['dischtime'][df.index[i]]
start_convert=datetime.datetime.strptime(start_datetime, dateformat)
end_convert=datetime.datetime.strptime(end_datetime, dateformat)
admit_day=(end_convert-start_convert).days
admit_dur.append(admit_day)
print("ํ๊ท ์
์์ผ: ", np.mean(admit_dur))
'๐ Data Analysis > ๐ฑ ์ค์ต' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Titanic (0) | 2022.09.19 |
---|---|
Pandas (0) | 2022.09.08 |