본문 바로가기
반응형

분류 전체보기43

[SAC] 예측 시나리오 - 분류모델 예측 시나리오 미래의 이벤트, 추세를 예측해야하는 비즈니스 안건을 해결하기 위해 예측 모델과 리포트를 생성하고 예측 인사이트를 도출할 수 있는 작업이다. 아래 3가지 예측 시나리오를 생성하고 작업해보는 방법을 소개하고자 한다. 분류 – 고객의 행동, 구매 성향 및 실패 리스크를 예측 회귀 - 숫자 값을 예측하고 해당 영향 요인을 식별 (연속된 값 예측) 시계열 예측 – 차원의 각 값에 대해 생성된 개별 예측으로 시계열 예측을 생성 1. 분류 모델 (분류 분석) 과거 관찰값을 훈련 데이터 세트의 기준으로 하여 새로운 관찰값이 속한 범주를 식별하는 분석이며,대상 변수는 이진 명목 변수이다. 아래와 같은 예를 들 수 있다. - 고객이 마케팅 캠페인에 응답할지 미응답 할지 여부 결정 - 은행 대출 신청을 안전 .. 2022. 10. 5.
[데이터 분석] 06. 로지스틱 회귀 고객 재구매 여부가 마이너스 값이 나오는데 뭐가 잘못된거죠? ※ 원인과 결과 간 관계 분석법 - 회귀 방법론 - 분류 방법론 결괏값이 수치형으로 나오는 경우 회귀 방법론을 사용한다. (정수, 음수, 분수, 소수) 회귀 방법론에는 t-검정, 분산 분석, 선형 회귀 등이 있으며 선형회귀가 대표적인 방법론이다. ※ 종류 - t-검정 - 분산분석 - 선형회귀 결괏값이 범주형으로 나오는 경우 분류 방법론을 사용한다. (순위나 서열 표시를 위해 숫자를 사용하는 경우-우편변호, 내신등급, 재구매 여부 - 재구매 or 재구매 x 2경우 밖에 없으나 결과를 알 수 없으니 재구매 확률로 보여주는 것 등) 분류 방법론에는 로지스틱 회귀, 판별분석, 서프트 벡터 머신, 의사결정 나무, k-최근접 이웃 등이 있으며 다양한 방법.. 2022. 10. 4.
[데이터 분석] 05. 변수와 상관관계 데이터를 마구 집어넣어도 될까? Q4. IT지원 팀장) 인과관계와 상관관계를 구분해야한다고 했어요. 상관관계가 있는 변수가 들어가 있다고도 하고요. A. 맞아요. 데이터 분석은 주로 숫자를 분석하는데 숫자의 종류는 크게 변수와 상수로 나뉩니다. ㄴ 변수: 변하는 수 ㄴ 상수: 변하지 않는 수 ※ 변수 ㄴ X 독립변수: 다른 변수에 영향 X (독립변수가 2개이상일 경우 다중선형회귀라고 함) ㄴ Y 종속변수: 다른 변수로부터 영향 O (종속변수가 2개이상일 경우 다변량이라고 함) ※ 변수의 데이터 형태에 따라 ㄴ 범주형: 질적 변수 (이름, 지역) = 문헌연구, 법,제도에 관한 연구, 전문가 의견을 듣는 델파이 기법 사용한 연구 ㄴ 수치형: 양적 변수 (나이, 온도) = 정량적 분석 데이터 분석 - 인과 /.. 2022. 9. 30.
[데이터 분석] 04. 데이터 수집 - 양적요인 vs 질적 요인 이전 포스팅에 이어서,, https://make-extra-money.tistory.com/3 선형회귀: 데이터 분석결과에서 어떤 것을 봐야할까? 앞으로는 통계학에 근거하여 데이터 분석과 분석결과를 해석하는 방법에 대해 알아보도록 한다. 예측: 결과를 맞추는 것 추론: 원인과 결과 간 관계 파악 (데이터 분석 근거한 추론 - 방향의 기 make-extra-money.tistory.com 점주역량이 매출에 가장 큰 영향을 준다고 했는데 물론 관리자의 역량이 중하겠지만, 점주역량을 측정한 데이터가 없다.. 게다가 결과대로라면 매장크기를 계속 늘리면 매출도 무한정 는다는 뜻이 될텐데.. 어딘가 문제가 있어보인다.. 분석 결과 이대로 보고해도 되는걸까...? 분석결과가 상식적으로 좀 안 맞는데요? 그렇다. 매장.. 2022. 9. 30.
[데이터 분석] 03. 선형회귀 - 데이터 분석결과에서 어떤 것을 봐야할까? 앞으로는 통계학에 근거하여 데이터 분석과 분석결과를 해석하는 방법에 대해 알아보도록 한다. 예측: 결과를 맞추는 것 추론: 원인과 결과 간 관계 파악 (데이터 분석 근거한 추론 - 방향의 기울기나 현상의 변화 정도를 구체적인 값으로 제시할 수 있다) 선형회귀: 데이터 분석 결과에서 대체 뭘 보라는 겁니까? 분산분석 (ANOVA: Analysis of Variance) Parameter Estimates 유의확률 (p-value/Pr/Prob) 결정계수(R²) 개별요인의 유의확률 계수(Parameter Estimates) 1. p-value(유의확률): 모형을 신뢰해도 되는지 확인할 때 필요 (분석결과의 유의성 확인하는 첫번째 절차) 유의확률 (p-value/Pr/Prob): 귀무가설이 맞다고 가정할 때 .. 2022. 9. 30.
[데이터 분석] 02. 매출 예측방법 - 객단가/직원/상품회전율/평당 연간매출액 지난 포스팅에 이어 아래 5가지 간이 산출법을 통해 수요 예측/ 매출 예측을 해보도록 하자. 예측 방법 (1) 매출액 = 고객수 × 객단가 × 영업일수 (2) 매출액 = 종업원 1인당 매출액 × 종업원수 × 영업일수 (3) 매출액 = 재고금액 × 상품회전율(연간) (4) 매출액 = 평당 연매출액 × 매장면적 (5) 매출액 = 연간 총인건비 × 인건비 비율 (1) 「객단가」 기준 산출방식 매출액 〓 내점고객수 × 구매율 × 상품 평균단가 × 구매상품수 ◦ 매출액 〓 고객수 × 객단가, 이는 가장 일반적인 산식이다. ◦ 객단가 순위: 백화점 > 전문점 > 리테일 매장 > 식당 > 편의점 순이며, 지역에 따라 객단가의 차이는 있을 수 있다. ◦ 특히 서비스, 요식업의 경우 입점객의 대부분이 이용객으로 볼 수 .. 2022. 9. 30.
반응형