초봉5센티미터

TIL 17. 머신러닝(1) 본문

교육/멋쟁이사자처럼 AI School 7기

TIL 17. 머신러닝(1)

삶은돼지고기 2022. 10. 24. 23:53
728x90

TIL

- 라이브러리
    - 머신러닝
        - Scikit-learn
    - 딥러닝
        - Tensorflow
        - Keras
        - Pytorch



- Scikit-learn
    - GitHub에서 가장 인기있는 머신러닝 라이브러리 중 하나
    - 장점
        - 예측 데이터 분석을 위한 간단하고 효율적인 도구
        - numpy, scipy, matplotlib 기반으로 누구나 접근 가능하고 다양한 맥락에서 재사용 가능
        - 오픈소스, 상업적 사용 가능
        - 토이 데이터셋을 불러올 수 있다.
    - 단점
        - 딥러닝 및 강화학습 지원 X
    - 기능
        - 분류 (Classification)
            - 개체가 속한 범주 식별
        - 회귀 (Regression)
            - 개체와 연결된 연속 값 속성을 예측
            - 하나의 가설에 미치는 다양한 수치형 변수들과의 인과성 분석
        - 군집화 (Clustering)
            - 유사한 개체를 세트로 자동 그룹화
            - 유사도가 높은 범주끼리 모아주는 것
        - 차원축소 (Dimensionality reduction)
            - 고려할 확률 변수의 수를 줄임
            - 고차원 데이터를 차원을 축소해서 한눈에 볼 수 있게 해줌
            - 파라미터 개수 감소 ⇒ 속도 개선
        - 모델 선택 및 평가 (Model selection and evaluation)
            - 매개변수와 모델을 비교, 검증 및 선택
            - 학습이 잘 된 최적의 모델을 고를 때 사용
        - 전처리 (Preprocessing)
            - 특징 추출 및 정규화
                - Pandas에서 정규화 normalize 사용 
                    - value_counts
                    - crosstab
                - pandas에서 normalize 옵션을 사용했을 때 나오는 결과 
                    - 0-1 사이로 데이터 값 정리
                    - 모두 합쳐서 1

-  분류와 군집화의 차이점
    - 레이블이 있고 없고
    - 분류 ⇒ 지도학습
    - 군집화 ⇒ 비지도 학습

- 머신러닝 알고리즘 유형
    - 지도학습: 정답 O
        - 범주형 : 분류
        - 수치형 : 회귀
    - 비지도학습 : 정답 X
        - 범주형 : 군집화
        - 수치형 : 차원축소

'교육 > 멋쟁이사자처럼 AI School 7기' 카테고리의 다른 글

TIL 19. 머신러닝(3)  (0) 2022.10.26
TIL 18.머신러닝(2)  (0) 2022.10.25
TIL 16. 다운캐스팅  (0) 2022.10.17
TIL 15. 의약품처방정보 전처리  (1) 2022.10.13
TIL 14. EDA: KOSIS 데이터  (0) 2022.10.12
Comments