일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 시그모이드함수
- 2022 AI 온라인 실무 교육
- ai school
- OneHotEncoding
- 소프트맥스함수
- AI 데이터 분석 트랙
- 고객세그먼트
- 멋사 ai
- 데이터분석
- Python
- 멋쟁이사자처럼 ai school 7기
- 앨리스
- 데이터 분석
- 멋쟁이사자처럼
- 데이터분석가
- ai 스쿨 7기
- 딥러닝
- Onehot인코딩
- 캐글데이터분석
- 코딩테스트
- RFM분석
- 머신러닝
- 데이터마케팅분석
- RFM
- 코드업
- 기초100제
- 코드업100제
- 파이썬
- 고객데이터분석
- 코드업 기초100제
- Today
- Total
목록앨리스 (2)
초봉5센티미터

1. 머신러닝을 위한 데이터 전 처리 이해하기 머신러닝 과정 이해하기 데이터 전 처리의 역할 1) 머신러닝의 입력 형태로 데이터 변환(특성 엔지니어링) 2) 결측값 및 이상치를 처리하여 데이터 정제 3) 학습용 및 평가용 데이터 분리 데이터 전 처리가 필요한 이유 실제 데이터는 다양한 형태로 존재한다 ex) 이미지 데이터, 자연어 데이터, 범주형 데이터, 시계열 데이터 등 하지만 실제 데이터는 머신러닝 모델이 이해할 수 없는 형태로 되어있음 -> 대부분의 머신러닝 모델은 숫자 데이터로 입력 받는다 그렇기에 전 처리를 통해 머신러닝 모델이 이해할 수 있는 수치형 자료로 변환한다 2. 범주형 자료 전 처리 타이타닉 생존자 데이터 살펴보기 범주형 데이터는 몇 개의 범주로 나누어진 자료 - 범주의 크기가 의미 ..

1. 자료의 형태를 알아야 하는 이유 머신러닝은 데이터라는 디지털 자료를 바탕으로 수행하는 분석방식이다. 자료의 형태를 파악함은 머신러닝 사용하기 위한 필수 과정으로 아래 물음에 답을 얻을 수 있다 1) 데이터가 어떻게 구성되어 있을까? 2) 어떤 머신러닝 모델을 사용해야 할까? 3) 데이터 전 처리를 어떻게 해야 할까? 수치형 자료 = 양적 자료(Quantitative data) - 수치로 측정이 가능한 자료 ex) 키, 몸무게, 시험 점수, 나이 등 범주형 자료 = 질적 자료(Categorical data) - 수치로 측정이 불가능한 자료 ex) 성별, 지역, 혈액형 등 2. 자료의 형태 구분 시 주의점 범주형 자료와 수치 자료의 구분 ≠ 자료의 숫자 표현 가능 여부 범주형 자료가 숫자로 표현되는 경..