[머신러닝] K-최근접 이웃(KNN; K-Nearest Neighbor) 분류사용하지않는공간/Python2021. 4. 7. 15:11
Table of Contents
K-최근접 이웃(KNN; K-Nearest Neighbor)
어떤 데이터에 대한 답을 구할떄 주위의 다른 데이터를 보고 다수를 차지하는 것을 정답으로 함
기본 거리수는 5개를 찾음
KNN에서 거리를 측정하는데 가장 기본적인것은 Euclidean distance 를 많이 사용함.
1. 도미 데이터를 가지고온다
# 도미 데이터
bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0]
bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0, 500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610.0, 650.0, 575.0, 685.0, 620.0, 680.0, 700.0, 725.0, 720.0, 714.0, 850.0, 1000.0, 920.0, 955.0, 925.0, 975.0, 950.0]
2. 도미 데이터를 그래프로 그려 상관관계를 알아본다.
import matplotlib.pyplot as plt
# 도미의 길이와 무게가 어떤 상관관계가 있는지 알아보기위해 그래프 출력함
# 산점도 그래프
plt.scatter(bream_length, bream_weight, c='r')
plt.xlabel('length')
plt.ylabel('weight')
plt.plot()
3. 빙어 데이터를 가져온다.
# 빙어 데이터
smelt_length = [9.8, 10.5, 10.6, 11.0, 11.2, 11.3, 11.8, 11.8, 12.0, 12.2, 12.4, 13.0, 14.3, 15.0]
smelt_weight = [6.7, 7.5, 7.0, 9.7, 9.8, 8.7, 10.0, 9.9, 9.8, 12.2, 13.4, 12.2, 19.7, 19.9]
4. 빙어 데이터와 도미 데이터의 상관관계를 알아본다.
# 빙어와 도미의 상관관계를 그래프로 분석
plt.scatter(bream_length, bream_weight)
plt.scatter(smelt_length, smelt_weight)
plt.xlabel('length')
plt.ylabel('weight')
plt.plot()
참고문헌
빙어의 길이 : gist.github.com/rickiepark/1e89fe2a9d4ad92bc9f073163c9a37a7
도미의 길이 : gist.github.com/rickiepark/b37d04a95a42ef6757e4a99214d61697
Z 점수 : blog.daum.net/sjlee9000/9161788
반응형
'사용하지않는공간 > Python' 카테고리의 다른 글
[Python] 1차원 리스트를 2차원 리스트로 만들기 (0) | 2021.04.07 |
---|---|
[Numpy] 수학용어 (0) | 2021.02.14 |
[Python] 원타임패드, 일회성패드 ( One-Time Pad ) 암호화/복호화 만들기 (0) | 2020.10.06 |
[python] 파이썬 예제 ( 람다함수 ) (0) | 2020.08.07 |
[python] 파이썬 예제 (CSS_Selector, list Comprehension, 이차원리스트) (0) | 2020.08.06 |
@반나무 :: 반나무_뿌리
3년차 WPF 개발자입니다.
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!