data copy

: 기본으로 실행

data1 = data.copy()
data1.head(1)

결측치 대체

top_10만 정렬 / nlargest()

https://wikidocs.net/153333

nlargest 함수 ; 정렬 후 추출

top10 Index 추출

top_10_idx = data1['lotSizeSqFt'].nlargest(10).index
print(top_10_idx)

image.png

top10 중 작은 값 추출

min_top_10 = data1.loc[top_10_idx, 'lotSizeSqFt'].min()
print(min_top_10)

image.png

top10의 모든 값 min 값으로 대체

# top10의 lotSizeSqFt 값을 min으로 대체
data1.loc[top_10_idx, 'lotSizeSqFt'] = min_top_10 
print(data1.loc[top_10_idx, 'lotSizeSqFt'])

image.png

lotSizeSqFt 평균 계산 (조건 : 2000년 이상)

# data의 yearBuilt 값이 2000이상, lotSizesqFt 값의 mean
mean_lot_size = data1.loc[data['yearBuilt'] >= 2000, 'lotSizeSqFt'].mean()
# 소수점 첫째자리에서 반올림
print(round(mean_lot_size,1))