๐ Data Analysis/๐ฑ ์ค์ต
๐https://github.com/memoming/memomingChannel GitHub - memoming/memomingChannel: [Youtube] ๋ฉ๋ชจ๋ฐ ์ฑ๋ Official Github [Youtube] ๋ฉ๋ชจ๋ฐ ์ฑ๋ Official Github. Contribute to memoming/memomingChannel development by creating an account on GitHub. github.com โ ๏ธ ๊ฐ์ค: ๋์ด ๋ง์ด ์ฌ๋์ผ์๋ก(์๊ธ์ ๋ง์ด ๋ผ์๋ก) ์์กดํ๋ฅ ์ด ๋์ ๊ฒ์ด๋ค. 1. train.csv ์ฝ์ด์ค๊ธฐ import numpy as np import pandas as pd titanic_csv_filePath="train.csv ํ์ผ ๊ฒฝ๋ก" titanic_df=pd...
โ load dataset import pandas as pd df=pd.read_csv("/content/ADMISSIONS.csv", delimiter=',') df.set_index('row_id', inplace=True) df.head() df.set_index('row_id', inplace=True) โจ 'row_id'๋ฅผ ์ธ๋ฑ์ค๋ก ์ฌ์ฉํ๊ฒ ๋ค. โจ ์๋ณธ ๊ฐ์ฒด๋ฅผ ์ฌ์ฉํ๊ฒ ๋ค. index๋ฅผ ์ง์ ํด์ฃผ๋ ์ด์ ๋ dataframe์ ๋์ด์ด๋๊น ํ ํํ๋ก ๋ง๋ค์ด์ฃผ๊ธฐ ์ํด์. โ๏ธ์ธ๋ฑ์ค ์ธํ ๋ฐ ๋ฆฌ์ : set_index (dataframe ๋ด์ ์ด์ ์ด์ฉํ ์ธ๋ฑ์ค ์ค์ ) dataframe.set_index(keys, drop=True, append=False, inplace=False) 1) keys: ์ธ๋ฑ..
โ๏ธpandas import numpy as np import pandas as pd ๋ฐ์ดํฐ๋ถ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, ํ/์ด๋ก ์ด๋ฃจ์ด์ง ๋ฐ์ดํฐ ๊ฐ์ฒด๋ฅผ ๋ค๋ฃจ๊ธฐ์ ํธ๋ฆฌํ๋ค. pandas์์ ๊ธฐ๋ณธ์ ์ผ๋ก ์ ์๋๋ ์๋ฃ ๊ตฌ์กฐ๋ โ series โกdataframe ์ด๋ค. โ series(vector): index์ value๋ก ์ด๋ฃจ์ด์ง ๋ฐ์ดํฐ ํ์ โกdataframe(matrix): index, column, value๋ก ์ด๋ฃจ์ด์ง ๋ฐ์ดํฐ ํ์ (table ํํ) โ๏ธdataframe์ผ๋ก ๋ก๋ฉ read_csv(): CSVํ์ผ ํฌ๋งท์ dataframe์ผ๋ก ๋ณํํ๊ธฐ ์ํ api CSV=column์ ' , '๋ก ๊ตฌ๋ถํ ํ์ผ ํฌ๋งท data='csvํ์ผ ๊ฒฝ๋ก' df=pd.read_csv(data) sep ์ธ์์ default ๊ฐ์ se..