본문 바로가기
반응형

SQL2

[데이터 엔지니어링] 01-1. 데이터 엔지니어링 개요 01. 데이터 엔지니어링 필요성 문제 해결을 위한 가설 검증 단계 모든 비즈니스는 동일한 데이터 분석 환경을 갖출 수 없으며 성장 단계에 따라 선택과 집중해야 하는 분석 환경이 다르다. ✅ 비즈니스 성장에 따라 갖추어야 할 3가지 고려사항 Custom 환경 Automation Data Integration 02. 데이터 아키텍쳐시 고려사항 데이터아키텍처(DA, Data Architecture)란, 전사적인 관점에서 데이터를 수집, 저장, 통합하며 이를 체계화 하는 것이다. (1) 비즈니스 모델 상 가장 중요한 데이터는 무엇인가? 어떤 데이터에 집중해야 하고, 어떤 가치를 만들어 내야할 것인가 가 먼저 선행되어야 하며, 데이터 비용/시간 대비 비즈니스 임팩트가 가장 높은 데이터 확보를 목표로 데이터 아키텍.. 2022. 10. 19.
[데이터 분석] 06. 로지스틱 회귀 고객 재구매 여부가 마이너스 값이 나오는데 뭐가 잘못된거죠? ※ 원인과 결과 간 관계 분석법 - 회귀 방법론 - 분류 방법론 결괏값이 수치형으로 나오는 경우 회귀 방법론을 사용한다. (정수, 음수, 분수, 소수) 회귀 방법론에는 t-검정, 분산 분석, 선형 회귀 등이 있으며 선형회귀가 대표적인 방법론이다. ※ 종류 - t-검정 - 분산분석 - 선형회귀 결괏값이 범주형으로 나오는 경우 분류 방법론을 사용한다. (순위나 서열 표시를 위해 숫자를 사용하는 경우-우편변호, 내신등급, 재구매 여부 - 재구매 or 재구매 x 2경우 밖에 없으나 결과를 알 수 없으니 재구매 확률로 보여주는 것 등) 분류 방법론에는 로지스틱 회귀, 판별분석, 서프트 벡터 머신, 의사결정 나무, k-최근접 이웃 등이 있으며 다양한 방법.. 2022. 10. 4.
반응형