본문 바로가기
반응형

BI10

[데이터 엔지니어링] 01-1. 데이터 엔지니어링 개요 01. 데이터 엔지니어링 필요성 문제 해결을 위한 가설 검증 단계 모든 비즈니스는 동일한 데이터 분석 환경을 갖출 수 없으며 성장 단계에 따라 선택과 집중해야 하는 분석 환경이 다르다. ✅ 비즈니스 성장에 따라 갖추어야 할 3가지 고려사항 Custom 환경 Automation Data Integration 02. 데이터 아키텍쳐시 고려사항 데이터아키텍처(DA, Data Architecture)란, 전사적인 관점에서 데이터를 수집, 저장, 통합하며 이를 체계화 하는 것이다. (1) 비즈니스 모델 상 가장 중요한 데이터는 무엇인가? 어떤 데이터에 집중해야 하고, 어떤 가치를 만들어 내야할 것인가 가 먼저 선행되어야 하며, 데이터 비용/시간 대비 비즈니스 임팩트가 가장 높은 데이터 확보를 목표로 데이터 아키텍.. 2022. 10. 19.
[SAP] BW/4HANA 기능 이해 데이터 수집에 영향을 주는 새로운 SAP BW/4HANA 기능 이해 SAP BW/4HANA에서는 SAP HANA Smart data access 통해 Big data, SAP Vora Access와 같은 새로운 소스 시스템 유형을 통해 대량의 데이터를 연결할 수 있다. BW 쿼리와 변환을 SAP HANA에서 처리하여 정교한 계산을 처리할 수 있으며 기존 소스를 SAP HANA 기반 소스 시스템 유형을 통해 통합할 수 있다. 데이터 관리, 분석, 계획 및 예측 분석을 위해 SAP BW/4HANA는 코드 푸시 다운을 통해 SAP HANA 성능 향상을 활용하며 이는 SAP BW powered by SAP HANA 보다 업그레이드된 기능이다. *SAP BW/4HANA 에서 코드 푸시다운 *SAP BW/4HANA.. 2022. 10. 7.
[SAC] SAP Analytics Cloud - BI 솔루션 SAC (SAP Analytics Cloud) SAP® 란? 독일 소프트웨어 회사 (시장 점유율 세계 1위) SAP에서 판매하는 ERP 시스템인 SAP와 동일한 이름 사용 *ERP (Enterprise Resource Planning) 비즈니스 전반에 걸친 업무 프로세스를 통합적으로 관리할 수 있도록 돕는 시스템 및 소프트웨어 SAC 란? SAP Analytics Cloud SAP®에서 제공하는 BI(Business Intelligence) 솔루션 Cloud 기반으로 데이터 분석, 통합, 처리 툴 *클라우드 기반의 장점 내가 원하는 서비스만 골라 쓸 수 있고 그에 따른 비용을 지불한다는 점 ‘대량의‘ ‘다양한‘ 데이터를 빠르게‘ 최적화된 비용으로 가공할 수 있는 환경 제공한다는 점 장점 SAC 모델링 개.. 2022. 10. 6.
[SAC] 예측 시나리오 - 분류모델 예측 시나리오 미래의 이벤트, 추세를 예측해야하는 비즈니스 안건을 해결하기 위해 예측 모델과 리포트를 생성하고 예측 인사이트를 도출할 수 있는 작업이다. 아래 3가지 예측 시나리오를 생성하고 작업해보는 방법을 소개하고자 한다. 분류 – 고객의 행동, 구매 성향 및 실패 리스크를 예측 회귀 - 숫자 값을 예측하고 해당 영향 요인을 식별 (연속된 값 예측) 시계열 예측 – 차원의 각 값에 대해 생성된 개별 예측으로 시계열 예측을 생성 1. 분류 모델 (분류 분석) 과거 관찰값을 훈련 데이터 세트의 기준으로 하여 새로운 관찰값이 속한 범주를 식별하는 분석이며,대상 변수는 이진 명목 변수이다. 아래와 같은 예를 들 수 있다. - 고객이 마케팅 캠페인에 응답할지 미응답 할지 여부 결정 - 은행 대출 신청을 안전 .. 2022. 10. 5.
[데이터 분석] 06. 로지스틱 회귀 고객 재구매 여부가 마이너스 값이 나오는데 뭐가 잘못된거죠? ※ 원인과 결과 간 관계 분석법 - 회귀 방법론 - 분류 방법론 결괏값이 수치형으로 나오는 경우 회귀 방법론을 사용한다. (정수, 음수, 분수, 소수) 회귀 방법론에는 t-검정, 분산 분석, 선형 회귀 등이 있으며 선형회귀가 대표적인 방법론이다. ※ 종류 - t-검정 - 분산분석 - 선형회귀 결괏값이 범주형으로 나오는 경우 분류 방법론을 사용한다. (순위나 서열 표시를 위해 숫자를 사용하는 경우-우편변호, 내신등급, 재구매 여부 - 재구매 or 재구매 x 2경우 밖에 없으나 결과를 알 수 없으니 재구매 확률로 보여주는 것 등) 분류 방법론에는 로지스틱 회귀, 판별분석, 서프트 벡터 머신, 의사결정 나무, k-최근접 이웃 등이 있으며 다양한 방법.. 2022. 10. 4.
[데이터 분석] 05. 변수와 상관관계 데이터를 마구 집어넣어도 될까? Q4. IT지원 팀장) 인과관계와 상관관계를 구분해야한다고 했어요. 상관관계가 있는 변수가 들어가 있다고도 하고요. A. 맞아요. 데이터 분석은 주로 숫자를 분석하는데 숫자의 종류는 크게 변수와 상수로 나뉩니다. ㄴ 변수: 변하는 수 ㄴ 상수: 변하지 않는 수 ※ 변수 ㄴ X 독립변수: 다른 변수에 영향 X (독립변수가 2개이상일 경우 다중선형회귀라고 함) ㄴ Y 종속변수: 다른 변수로부터 영향 O (종속변수가 2개이상일 경우 다변량이라고 함) ※ 변수의 데이터 형태에 따라 ㄴ 범주형: 질적 변수 (이름, 지역) = 문헌연구, 법,제도에 관한 연구, 전문가 의견을 듣는 델파이 기법 사용한 연구 ㄴ 수치형: 양적 변수 (나이, 온도) = 정량적 분석 데이터 분석 - 인과 /.. 2022. 9. 30.
반응형