본문 바로가기
반응형

데이터분석11

[데이터 엔지니어링] 01-1. 데이터 엔지니어링 개요 01. 데이터 엔지니어링 필요성 문제 해결을 위한 가설 검증 단계 모든 비즈니스는 동일한 데이터 분석 환경을 갖출 수 없으며 성장 단계에 따라 선택과 집중해야 하는 분석 환경이 다르다. ✅ 비즈니스 성장에 따라 갖추어야 할 3가지 고려사항 Custom 환경 Automation Data Integration 02. 데이터 아키텍쳐시 고려사항 데이터아키텍처(DA, Data Architecture)란, 전사적인 관점에서 데이터를 수집, 저장, 통합하며 이를 체계화 하는 것이다. (1) 비즈니스 모델 상 가장 중요한 데이터는 무엇인가? 어떤 데이터에 집중해야 하고, 어떤 가치를 만들어 내야할 것인가 가 먼저 선행되어야 하며, 데이터 비용/시간 대비 비즈니스 임팩트가 가장 높은 데이터 확보를 목표로 데이터 아키텍.. 2022. 10. 19.
[SAC] 분석 디자이너 SAP Analytics Cloud - 분석 디자이너 SAP Analytics Cloud는 신속하고 정확한 의사결정을 내릴 수 있도록 도움을 주는 클라우드 솔루션이다. 기계 학습 기술과 임베드된 인공 지능(AI)은 심층적인 통찰력을 제공하고 중요한 정보에 대한 액세스를 간소화하며 정보에 입각한 의사결정을 지원한다. 분석 디자이너를 활용하여 예측 시나리오를 시뮬레이션해보자. 먼저 어플리케이션 디자인 및 레이아웃 방법에 대한 소개를 간단히 해보고자 한다. 분석 어플리케이션 선택 주 화면 요소 개괄 캔버스 툴바 장치 미리보기 스타일 지정 패널 빌더 패널 오류 및 참조 리스트 기타 워크 플로우 빌더 패널을 사용하여 위젯에 대한 데이터 선택을 지정하려면 데이터세트, 모델 또는 SAP Data Warehouse C.. 2022. 10. 8.
[SAP] BW/4HANA 기능 이해 데이터 수집에 영향을 주는 새로운 SAP BW/4HANA 기능 이해 SAP BW/4HANA에서는 SAP HANA Smart data access 통해 Big data, SAP Vora Access와 같은 새로운 소스 시스템 유형을 통해 대량의 데이터를 연결할 수 있다. BW 쿼리와 변환을 SAP HANA에서 처리하여 정교한 계산을 처리할 수 있으며 기존 소스를 SAP HANA 기반 소스 시스템 유형을 통해 통합할 수 있다. 데이터 관리, 분석, 계획 및 예측 분석을 위해 SAP BW/4HANA는 코드 푸시 다운을 통해 SAP HANA 성능 향상을 활용하며 이는 SAP BW powered by SAP HANA 보다 업그레이드된 기능이다. *SAP BW/4HANA 에서 코드 푸시다운 *SAP BW/4HANA.. 2022. 10. 7.
[SAC] SAP Analytics Cloud - BI 솔루션 SAC (SAP Analytics Cloud) SAP® 란? 독일 소프트웨어 회사 (시장 점유율 세계 1위) SAP에서 판매하는 ERP 시스템인 SAP와 동일한 이름 사용 *ERP (Enterprise Resource Planning) 비즈니스 전반에 걸친 업무 프로세스를 통합적으로 관리할 수 있도록 돕는 시스템 및 소프트웨어 SAC 란? SAP Analytics Cloud SAP®에서 제공하는 BI(Business Intelligence) 솔루션 Cloud 기반으로 데이터 분석, 통합, 처리 툴 *클라우드 기반의 장점 내가 원하는 서비스만 골라 쓸 수 있고 그에 따른 비용을 지불한다는 점 ‘대량의‘ ‘다양한‘ 데이터를 빠르게‘ 최적화된 비용으로 가공할 수 있는 환경 제공한다는 점 장점 SAC 모델링 개.. 2022. 10. 6.
[SAC] 예측 시나리오 - 분류모델 예측 시나리오 미래의 이벤트, 추세를 예측해야하는 비즈니스 안건을 해결하기 위해 예측 모델과 리포트를 생성하고 예측 인사이트를 도출할 수 있는 작업이다. 아래 3가지 예측 시나리오를 생성하고 작업해보는 방법을 소개하고자 한다. 분류 – 고객의 행동, 구매 성향 및 실패 리스크를 예측 회귀 - 숫자 값을 예측하고 해당 영향 요인을 식별 (연속된 값 예측) 시계열 예측 – 차원의 각 값에 대해 생성된 개별 예측으로 시계열 예측을 생성 1. 분류 모델 (분류 분석) 과거 관찰값을 훈련 데이터 세트의 기준으로 하여 새로운 관찰값이 속한 범주를 식별하는 분석이며,대상 변수는 이진 명목 변수이다. 아래와 같은 예를 들 수 있다. - 고객이 마케팅 캠페인에 응답할지 미응답 할지 여부 결정 - 은행 대출 신청을 안전 .. 2022. 10. 5.
[데이터 분석] 06. 로지스틱 회귀 고객 재구매 여부가 마이너스 값이 나오는데 뭐가 잘못된거죠? ※ 원인과 결과 간 관계 분석법 - 회귀 방법론 - 분류 방법론 결괏값이 수치형으로 나오는 경우 회귀 방법론을 사용한다. (정수, 음수, 분수, 소수) 회귀 방법론에는 t-검정, 분산 분석, 선형 회귀 등이 있으며 선형회귀가 대표적인 방법론이다. ※ 종류 - t-검정 - 분산분석 - 선형회귀 결괏값이 범주형으로 나오는 경우 분류 방법론을 사용한다. (순위나 서열 표시를 위해 숫자를 사용하는 경우-우편변호, 내신등급, 재구매 여부 - 재구매 or 재구매 x 2경우 밖에 없으나 결과를 알 수 없으니 재구매 확률로 보여주는 것 등) 분류 방법론에는 로지스틱 회귀, 판별분석, 서프트 벡터 머신, 의사결정 나무, k-최근접 이웃 등이 있으며 다양한 방법.. 2022. 10. 4.
반응형