일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 코드업
- 소프트맥스함수
- AI 데이터 분석 트랙
- 앨리스
- 시그모이드함수
- 머신러닝
- RFM
- 멋쟁이사자처럼
- 고객세그먼트
- 파이썬
- 데이터분석
- 코딩테스트
- 멋사 ai
- 코드업 기초100제
- 딥러닝
- 2022 AI 온라인 실무 교육
- 데이터마케팅분석
- RFM분석
- 데이터 분석
- Python
- 캐글데이터분석
- 기초100제
- 고객데이터분석
- ai 스쿨 7기
- OneHotEncoding
- ai school
- 코드업100제
- 데이터분석가
- Onehot인코딩
- 멋쟁이사자처럼 ai school 7기
- Today
- Total
초봉5센티미터
TIL 18.머신러닝(2) 본문
지도학습
- 정답 == label == target
분류로 할 수 있는일
- 이미지분류, 스팸 메일 분류기, 이상유저탐지, 물건분류
회귀로 할 수 있는일
- 주식가격예측, 주택가격예측, 기온예측, 강수량예측
회귀 알고리즘 중에서 분류에서 사용할 수 있는것
- 로지스틱회귀
1) fit 학습
2) predict 예측
3) evaluate 모델평가
머신러닝분류
- 학습한 것을 바탕으로 실전 문제를 풀어봄
비지도학습
- 차원축소, 군집분석
fit, transform 주로사용
의사결정나무(스무고개)
- 분류,회귀 사용가능
- 어떤 항목에 대한 관측값과 목표값을 연결시켜주는 예측 모델로서
결정트리를 사용(예측 모델링 방법 중 하나)
분류트리: 트리 모델 중 목표 변수가 유한한 수의 값을 가짐
회귀트리: 결정 트리 중 목표 변수가 연속하는 값, 일반적으로 실수를 가짐
학습과 예측 전체 과정
feature_names : 학습(훈련), 예측에 사용할 컬럼을 리스트 형태로 만들어서 변수에 담아줍니다.
label_name : 정답값
X_train : feature_names 에 해당되는 컬럼만 train에서 가져옵니다.
- 학습(훈련)에 사용할 데이터셋 예) 시험의 기출문제
X_test : feature_names 에 해당되는 컬럼만 test에서 가져옵니다.
- 예측에 사용할 데이터셋 예) 실전 시험문제
y_train : label_name 에 해당 되는 컬럼만 train에서 가져옵니다.
- 학습(훈련)에 사용할 정답 값 예) 기출문제의 정답
model : 학습, 예측에 사용할 머신러닝 알고리즘
model.fit(X_train, y_train) : 학습(훈련), 기출문제와 정답을 가지고 학습(훈련)하는 과정과 유사합니다.
model.predict(X_test) : 예측, 실제 시험을 보는 과정과 유사합니다. => 문제를 풀어서 정답을 구합니다.
score
- 시험을 봤다면 몇 문제를 맞고 틀렸는지 채점
metric
- 점수를 채점하는 공식
# from sklearn.tree import DecisionTreeClassifier 의사결정트리 불러오기
# plot_tree == 의사결정트리 시각화해주는것
# max_depth == 트리의 깊이를 어디까지 제한해서 시각화할지
# feature_names를 지정하지 않으면 x[1], x[2] 처럼 피처이름을 확인하기 어려움
# filled = 클래스 별로 색상을 구분해줌
from sklearn.tree import plot_tree
지니불순도: 집합에 이질적인 것이 얼마나 섞였는지 측정하는 지표,
값이 낮을수록 좋음, 0이되면 트리를 그리는것을 멈춘다. 최악은 0.5
과대적합: 학습데이터에는 높은정확도가 다른데이터로 평가했을 경우 정확도가 낮게 나오는 현상
과소적합: 데이터가 부족하거나 데이터의 특성 자체가 단순하여 기계가 제대로 학습이 되지 않은 상태
'교육 > 멋쟁이사자처럼 AI School 7기' 카테고리의 다른 글
TIL 20. 머신러닝 - 회귀의 측정지표와 그리드서치,랜덤서치 (1) | 2022.10.31 |
---|---|
TIL 19. 머신러닝(3) (0) | 2022.10.26 |
TIL 17. 머신러닝(1) (0) | 2022.10.24 |
TIL 16. 다운캐스팅 (0) | 2022.10.17 |
TIL 15. 의약품처방정보 전처리 (1) | 2022.10.13 |