6주차 문제내기

0번째 칼럼에 'target'칼럼을 0값으로 채움 data.describe() data.info() data.isnull().sum() data.groupby('target').agg(['mean','median']) 출제자: 조준희 출제 의도: csv파일을 부르는 방법을 습득한다. 결측치, 기술통계량, 정보를 출력할 수 있는지를 확인하고 groupby agg함수를 사용해본다. ''' #이론 ''' 1. X axis=1 이여야함, axis=0은 각 열의 값임 출제자: 김시현 출제 의도: apply()함수의 사용 방법을 숙지하고 있는지 확인한다. 2. False. nan은 값이나 순서를 가지지 않기 때문에 '!='을 제외한 연산에는 항상 false를 반환 출제자: 전홍규 출제 의도: NaN에 대한 기초적인 이해를 확인한다. 3. keep = '-' 이라는 패러미터를 이용한다. // 'first, last 를 활용한다'도 답 인정. 출제자: 전홍규 출제 의도: 강의에서 설명한 함수에 대한 기본적인 이해를 묻는다. 4. X 기본적으로 내림차순으로 정렬한다. 출제자 : 전지원 출제 의도 : 함수에 대한 기본적인 내용을 숙지하고 있는지 확인한다. 5. O 복합조건을 만족하는 행을 가져오려면 각 조건을 괄호로 필수적으로 구분을 해주어야 하며, 연산기호 대신 and, or등을 사용하면 오류가 발생한다. '''"> 0번째 칼럼에 'target'칼럼을 0값으로 채움 data.describe() data.info() data.isnull().sum() data.groupby('target').agg(['mean','median']) 출제자: 조준희 출제 의도: csv파일을 부르는 방법을 습득한다. 결측치, 기술통계량, 정보를 출력할 수 있는지를 확인하고 groupby agg함수를 사용해본다. ''' #이론 ''' 1. X axis=1 이여야함, axis=0은 각 열의 값임 출제자: 김시현 출제 의도: apply()함수의 사용 방법을 숙지하고 있는지 확인한다. 2. False. nan은 값이나 순서를 가지지 않기 때문에 '!='을 제외한 연산에는 항상 false를 반환 출제자: 전홍규 출제 의도: NaN에 대한 기초적인 이해를 확인한다. 3. keep = '-' 이라는 패러미터를 이용한다. // 'first, last 를 활용한다'도 답 인정. 출제자: 전홍규 출제 의도: 강의에서 설명한 함수에 대한 기본적인 이해를 묻는다. 4. X 기본적으로 내림차순으로 정렬한다. 출제자 : 전지원 출제 의도 : 함수에 대한 기본적인 내용을 숙지하고 있는지 확인한다. 5. O 복합조건을 만족하는 행을 가져오려면 각 조건을 괄호로 필수적으로 구분을 해주어야 하며, 연산기호 대신 and, or등을 사용하면 오류가 발생한다. '''"> 0번째 칼럼에 'target'칼럼을 0값으로 채움 data.describe() data.info() data.isnull().sum() data.groupby('target').agg(['mean','median']) 출제자: 조준희 출제 의도: csv파일을 부르는 방법을 습득한다. 결측치, 기술통계량, 정보를 출력할 수 있는지를 확인하고 groupby agg함수를 사용해본다. ''' #이론 ''' 1. X axis=1 이여야함, axis=0은 각 열의 값임 출제자: 김시현 출제 의도: apply()함수의 사용 방법을 숙지하고 있는지 확인한다. 2. False. nan은 값이나 순서를 가지지 않기 때문에 '!='을 제외한 연산에는 항상 false를 반환 출제자: 전홍규 출제 의도: NaN에 대한 기초적인 이해를 확인한다. 3. keep = '-' 이라는 패러미터를 이용한다. // 'first, last 를 활용한다'도 답 인정. 출제자: 전홍규 출제 의도: 강의에서 설명한 함수에 대한 기본적인 이해를 묻는다. 4. X 기본적으로 내림차순으로 정렬한다. 출제자 : 전지원 출제 의도 : 함수에 대한 기본적인 내용을 숙지하고 있는지 확인한다. 5. O 복합조건을 만족하는 행을 가져오려면 각 조건을 괄호로 필수적으로 구분을 해주어야 하며, 연산기호 대신 and, or등을 사용하면 오류가 발생한다. '''">

#답안

#실습
'''

import pandas as pd
data=pd.read_csv("/content/Iris.csv")  #csv 파일을 불러온 후 데이터프레임으로 변환
data.head()

data.insert(6,'target',0)  #groupby를 이용하기 위해 target 칼럼을 추가 -> 0번째 칼럼에 'target'칼럼을 0값으로 채움

data.describe()

data.info()

data.isnull().sum()

data.groupby('target').agg(['mean','median'])

출제자: 조준희

출제 의도: csv파일을 부르는 방법을 습득한다.
결측치, 기술통계량, 정보를 출력할 수 있는지를 확인하고 groupby agg함수를 사용해본다.

'''

#이론

'''
1. X 
axis=1 이여야함, axis=0은 각 열의 값임

출제자: 김시현
출제 의도: apply()함수의 사용 방법을 숙지하고 있는지 확인한다.

2. False. 
nan은 값이나 순서를 가지지 않기 때문에 '!='을 제외한 연산에는 항상 false를 반환

출제자: 전홍규
출제 의도: NaN에 대한 기초적인 이해를 확인한다.

3. keep = '-' 이라는 패러미터를 이용한다. // 'first, last 를 활용한다'도 답 인정.

출제자: 전홍규
출제 의도: 강의에서 설명한 함수에 대한 기본적인 이해를 묻는다.

4. X 
기본적으로 내림차순으로 정렬한다.

출제자 : 전지원
출제 의도 : 함수에 대한 기본적인 내용을 숙지하고 있는지 확인한다.

5. O

복합조건을 만족하는 행을 가져오려면 각 조건을 괄호로 필수적으로 구분을 해주어야 하며, 
연산기호 대신 and, or등을 사용하면 오류가 발생한다.
'''

A. 아래의 링크에서 iris 데이터를 다운로드 한 후, 코랩 파일에서 csv파일을 불러오기 (3점)

데이터셋 https://www.kaggle.com/datasets/uciml/iris?select=Iris.csv

B. Iris 데이터셋에 ‘target’ 이름의 칼럼을 추가 (2점)

C. Iris 데이터셋의 정보확인(각 칼럼의 정보, 데이터타입, 기술통계량, 결측치 등) (2점)

D. ‘target 컬럼으로 그룹화를 한 후, 여러가지 연산을 가능하게 해 주는 ‘agg함수’를 이용하여 ‘mean’과 ‘median’을 연산 (3점)

import pandas as pd
data=pd.read_csv("/content/Iris.csv")  #csv 파일을 불러온 후 데이터프레임으로 변환
data.head()

data.insert(6,'target',0)  #groupby를 이용하기 위해 target 칼럼을 추가 -> 0번째 칼럼에 'target'칼럼을 0값으로 채움

data.describe()

data.info()

data.isnull().sum()

data.groupby('target').agg(['mean','median'])
#출제자 조준희
#출제 의도: csv파일을 부르는 방법을 습득한다.
#결측치, 기술통계량, 정보를 출력할 수 있는지를 확인하고 groupby agg함수를 사용해본다.

#Apply 함수

df[introduce]= df.apply(get_introduce, axis=0) 은 df의  introduce의 각 행의 값에
get_introduce함수를 적용하는 코드이다.
 ---> X , (axis=1 이여야함 , axis=0은 각 열의 값임)

출제자: 김시현
출제 의도: apply()함수의 사용 방법을 숙지하고 있는지 확인한다.

#NaN 기초


'''
x=float('nan')
print(x==x) 
'''
#결과값과 그 이유를 작성하시오.

#A: False. nan은 값이나 순서를 가지지 않기 때문에 '!='을 제외한 연산에는 항상 false를 반환
#출제자: 전홍규
#출제 의도: NaN에 대한 기초적인 이해를 확인한다.

#중복 데이터 삭제

#중복된 데이터를 삭제 할 때

'''
df.drop_duplicate()
'''

#라는 함수를 사용한다고 하자.
#어떤 패러미터를 이용하여야 유지시킬 데이터를 결정 할 수 있는가?

#A: keep = '-' 이라는 패러미터를 이용한다. // 'first, last 를 활용한다'도 답 인정.
#출제자: 전홍규
#출제 의도: 강의에서 설명한 함수에 대한 기본적인 이해를 묻는다.

#unique, value_counts

value_counts()는 기본적으로 데이터의 개수를 오름차순으로 정렬해준다. (O,X)

#A: X (기본적으로 내림차순으로 정렬한다.)
#출제자 : 전지원
#출제 의도 : 함수에 대한 기본적인 내용을 숙지하고 있는지 확인한다.