[데이터 분석] Padas - 4
그룹핑특정 값을 기준으로 몇 개의 그룹으로 분할하여 처리하는 방식df = pd.DataFrame({'A': ['chol','young']*3 +['chol'], 'B': [ 'one','one','two','one','two', 'two','one'], 'C': np.random.randn(7), 'D': np.random.randn(7)})df새로운 데이터프레임 생성 grouped = df.groupby('B')print(grouped) for key,group in grouped: print('key:',key) print(group.head()) print('-'*30) 그룹 객체 만들기..
2023. 11. 11.
[데이터 분석] Pandas - 3
df = pd.DataFrame([[1,2],[3,4]], index= ['A','B'], columns= ['a','b'])df새로운 데이터 프레임 생성(인덱스가 A,B , 컬럼명이 a,b 인 1행이 1,2, 2행이 3,4 로 채워진 2행 2열의 데이터 프레임) 데이터프레임 간의 조합pd.concat()두 개 이상의 데이터 프레임을 행 또는 열 방향으로 연결한다. 열 방향으로 연결하고자 할 경우 axis = 1 인자를 전달한다.(default: axis = 0) 행 방향으로 연결하고자 할 때는 열 이름이 같아야 하고, 열 방향으로 연결하고자 할 때는 행 이름이 같아야 하다.df2 = pd.concat([df,df])df2concat()의 축 기본값이 axis = 0 이기 때문에 열에 방향(아래쪽으로)..
2023. 11. 11.
[데이터 분석] Pandas - 2
예제로 쓰이는 데이터 프레임 원본이다.인덱싱, 슬라이싱# df['a'] 키 에러 (열읽기)df[['A','C']]'a'는 행에 있는 인덱스 이름이기 때문에 df['a']로 읽어올 수 없다. = 열의 순서를 이용해서 인덱싱 할 수 없다.열 위치 값을 이용해서 인덱싱이나 슬라이싱을 이용하려면 columns 속성을 이용한다. # df[0] # 컬럼명으로 인식하게 됨df.columns # 컬럼의 값을 ndarray로 반환# Index(['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], dtype='object')df.columns[0] # 'A'# 위치값을 이용해서 컬럼 이름을 가져올 수 있다.df[df.columns[2:4]] # 데이터 프레임 형식으로 2번째, 3번..
2023. 11. 11.