너무 어려운 데이터 분석, 초간단 요약

·
Data Analysis
개요컴퓨터 비전, 자연어 처리 등과 같은 다양한 분야가 있지만 일반적으로 데이터 분석이라 하면 시계열 분석과 정형 데이터 분석으로 나뉨.시계열 분석시간의 흐름에 따라 쌓인 데이터를 말함. 데이터가 많고 시간 시간이 여유있다면 LSTM, 빠르고 데이터 양이 많지 않다면 ARIMA를 사용하되, 데이터의 특성에 따라 SARIMA, ARIMAX등의 파생모델 이용정형 데이터 분석엑셀시트나 데이터베이스처럼 행과 열로 구성된 데이터. 시간에 여유가 있다면 XGBoost, 아니라면 LightGBM. 하지만 LightGBM이 성능은 비슷하거나 더 좋은 경우가 많이 있음. 범주형 변수(성별, 지역 등 글자로 된 데이터)가 많을땐 CatBoost 선형 모델위의 각 분야에 대해서 결과에 대한 해석이 중요할 땐 선형 모델을 추..