= 80] # df.loc 메서드 사용. #행 - 세 과목의 평균 계산 후 80보다 큰지 작은지로 boolean indexing # 열 - id와 english만 사용 df.loc[(df.math + df.english + df.science) / 3 >= 80, ['id', 'english']] 2번 문제 : s1 = pd.core.series.Series(['김민조', '최강우', '최건우', '최이환']) s2 = pd.core.series.Series(["ENFJ", "ISTJ", "INTJ", "ISFP"]) df = pd.DataFrame(data = dict(name = s1, mbti = s2)) df.to_csv("alphagoBreak.csv", na_rep = '-', index = False)"> = 80] # df.loc 메서드 사용. #행 - 세 과목의 평균 계산 후 80보다 큰지 작은지로 boolean indexing # 열 - id와 english만 사용 df.loc[(df.math + df.english + df.science) / 3 >= 80, ['id', 'english']] 2번 문제 : s1 = pd.core.series.Series(['김민조', '최강우', '최건우', '최이환']) s2 = pd.core.series.Series(["ENFJ", "ISTJ", "INTJ", "ISFP"]) df = pd.DataFrame(data = dict(name = s1, mbti = s2)) df.to_csv("alphagoBreak.csv", na_rep = '-', index = False)"> = 80] # df.loc 메서드 사용. #행 - 세 과목의 평균 계산 후 80보다 큰지 작은지로 boolean indexing # 열 - id와 english만 사용 df.loc[(df.math + df.english + df.science) / 3 >= 80, ['id', 'english']] 2번 문제 : s1 = pd.core.series.Series(['김민조', '최강우', '최건우', '최이환']) s2 = pd.core.series.Series(["ENFJ", "ISTJ", "INTJ", "ISFP"]) df = pd.DataFrame(data = dict(name = s1, mbti = s2)) df.to_csv("alphagoBreak.csv", na_rep = '-', index = False)">
1번 문제 :

import pandas as pd
df = pd.read_csv("excel_exam.csv")
df[['id', 'math']]
df[df.math >= 80]
# df.loc 메서드 사용. 
#행 - 세 과목의 평균 계산 후 80보다 큰지 작은지로 boolean indexing
# 열 - id와 english만 사용
df.loc[(df.math + df.english + df.science) / 3 >= 80, ['id', 'english']]

2번 문제 : 

s1 = pd.core.series.Series(['김민조', '최강우', '최건우', '최이환'])
s2 = pd.core.series.Series(["ENFJ", "ISTJ", "INTJ", "ISFP"])
df = pd.DataFrame(data = dict(name = s1, mbti = s2))
df.to_csv("alphagoBreak.csv", na_rep = '-', index = False)
1. csv 파일을 읽어오는 방법은 pd.read_csv('파일경로/파일이름.csv') 이다.
o
2. df.head()는 df[0:5]와 같다 
o. [01234]
3. .drop()을 통해 하나의 열을 지울 경우 데이터프레임.drop(인덱스,axis=0)와 같이 할 수 있다.
x. axis=1
4. groupby()기능은 열에 있는 데이터가 동일하지 않더라도 하나의 그룹으로 묶어준다
x?
5. print(df[1:3])은 총 3행의 데이터가 출력된다
x. 1과 2의 2행
1. k로 끝나는 columns을 출력하려면 regex='k&'를 사용한다 [2]
x. k$
2. 만든 데이터 프레임에서 none 값을 -로 바꾸고 싶으면 na_rep을 사용하면 된다.[2]
o
3. 데이터 프레임을 만들 때 column의 순서를 보장하기 위해서는 from orderedDict을 사용한다.[2]
x? from collections import OrderedDict 사용
4. df.head() 는 데이터프레임의 상위 데이터 3개를 보여준다.[2]
x. 5게
5. drop() 함수를 사용하여 데이터프레임의 행을 삭제할 때, axis 매개변수를 지정하지 않으면 오류가 발생한다. [1]
x. axis=0이 기본값
6. df.to_csv에서 default값은 index=True, header = True 이다. [1]
o