Q: 다음 padas의 groupby에 대한 설명에 대해 O,X로 판단하시오. 만약 틀린부분이 있다면 옳게 고치시오.
1.groupby는 split,apply,combine 의 과정으로 데이터를 연산한다.
2.df.groupby("A")["B"].sum()의 명령에서 "A"는 sum 연산을 적용받는 컬럼이고 "B"는 묶음의 기준이 되는 컬럼이다.
3.groupby를 통해 2개의 column으로 묶으면 1개의 index가 생성된다.
4.groupby로 추출된 정보는 Aggregation, Transformation, Filteration 의 세가지의 유형의 apply가 가능하다.
5.groupby에서 matrix() 함수를 사용하면 Group으로 묶여진 데이터를 matrix 형태로 전환해줄 수 있다.
답:
1.O
2.X, A, B 가 반대임
3.X, 2개의 column으로 묶으면 2개의 index가 생성된다.
4.O
5.X, unstack() 함수 이용.

Q: 다음 출력 결과가 나오게 하는 명령어 A에 해당하는 것을 고르시오.
import pandas as pd
raw_data = {
'subject_id': ['1', '2', '3', '4', '5', '7', '8', '9', '10', '11'],
'test_score': [51, 15, 15, 61, 16, 14, 15, 1, 61, 16]}
df_a = pd.DataFrame(raw_data, columns = ['subject_id', 'test_score'])

raw_data = {
'subject_id': ['4', '5', '6', '7', '8'],
'first_name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],
'last_name': ['Bonder', 'Black', 'Balwner', 'Brice', 'Btisan']}
df_b = pd.DataFrame(raw_data, columns = ['subject_id', 'first_name', 'last_name'])
df_b

----명령어 A----

출력 결과:

Untitled

  1. pd.merge(df_a, df_b, on='subject_id', how='right')
  2. pd.merge(df_a, df_b, on='subject_id', how='outer')
  3. pd.merge(df_a, df_b, on='subject_id', how='inner')
  4. pd.merge(df_a, df_b, on='subject_id', how='left')
  5. pd.merge(df_a, df_b, left_on='subject_id', right_on='subject_id')

답:2