Stand up lee

[ADSP] 1과목 - 데이터 이해 본문

자격증 준비

[ADSP] 1과목 - 데이터 이해

tubeeee 2021. 5. 19. 17:29

1. 데이터의 이해


1.
데이터의 정의

  • 데이터 정의 : 추론과 추정의 근거를 이루는 사실, 다른 객체와의 상호관계 속에서 가치를 갖는 .
  • 지식 경영 핵심 이슈 :
    암묵지(학습과 경험을 통해 채화되어있음 - 장인의 기술),
    형식지(문서나 매뉴얼처럼 형상화된 지식 - 교과서, 비디오, DB) 
  • 데이터의 유형 :
    정성적 데이터(언어, 문자 , ex. 회사 매출이 증가함, 저장 검색 분석에 많은 비용 소모),
    정량적 데이터(수치, 도형, 기호 , ex. 나이, 주가, 정형화된 데이터로 통계분석 용이)

- DIKW 피라미드 :
Data : A 마트는 빵이 100, B 마트는 빵이 200원이다 -> 객관적 사실
Information : A 
마트의 빵이 B 마트의 빵보다 100 싸다 ->의미 도출
Knowledge : 
물건  A 마트에 가야겠군   ->  고유의 지식 결합
Wisdom : A
마트의 다른 상품도 B마트보단 것이다   -> 이해를 바탕으로 추론, 아이디어

2. 데이터베이스 정의와 특징

출처 내용
EU 체계적조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 있는 독립된 저작물,데이터 또는 기타 소재의 수집물    (가장 기본적인 개념!! )
국내 저작권법 소재를 체계적으로 배열 또는 구성한 편집물개별적으로 소재에 접근하거나 소재를 검색할 있도록
국내 컴퓨터용어사전 동시의 복수 업무 지원할 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장공급하기 위해서 일정한구조에 따라서 편성된 데이터의 집합.       (네트워크 개념이 추가된 !)

- 데이터 정의 

통합된 데이터 동일한 데이터가 중복되어있지 않다는 말임.
저장된 데이터 컴퓨터가 접근할 있는 저장매체에 저장되는 것을 말함.
공용 데이터 여러 사용자가 다른 목적으로 데이터를 이용한다.
변화되는 데이터 갱신 하면서도 항상 현재의 정확한 데이터를 유지해야 한다.
데이터베이스가 저장하는 내용은 데이터베이스의 상태를 나타낸다.

3. 데이터베이스의 활용

- OLTP(On-Line Transaction Processing) : 주문 입력 시스템재고 관리 시스템 / 데이터 갱신 위주 / 단순 자동화
- OLAP(On-Line Analytical Processing) : 
제품 판매 추이구매 성향 파악재무 회계 분석 등에 사용된다. / 데이터 조회 위주 / 의사결정

  • CRM(Customer Relationship Management) : 고객관계관리 / 고객특성에 맞게 마케팅 활동을 계획,지원,평가하는 과정
  • SCM(Supply Chain Management) : 공급망 관리

2 데이터의 가치와 미래


1.
빅데이터의 이해

- 가트너 그룹의 더그 래니의 3V : Volume, Variety, Velocity + Value, Visualization, Veracity
데이터, 기술, 인재 조직이 변화되면서 기존 방식으로 얻을 없었던 통찰 가치 창출

 - 빅데이터가 만들어내는 본질적인 변화

사전처리 -> 사후처리 : 필요한 정보만 수집 -> 가능한 많은 데이터를 모으고 다양한 방식으로 조합
표본조사 -> 전수조사 : 데이터 처리비용 감소, 샘플링이 주지 못하는 정보를 발견할 있음
-> : 많을수록 전체적으로 좋은 결과를 뽑아냄
인과관계 -> 상관관계 : 데이터 기반의 상관관계 분석이 인과관계보다 정확해짐.

2. 빅데이터의 가치와 영향

  • 빅데이터의 가치 산정이 어려운 이유
    데이터 활용방식 : 특정 데이터를 언제 어디서 누가 활용할지 없게 .
    새로운 가치 창출 : 정량, 정형화된 데이터에서 새로운 가치를 창출하므로
    분석 기술의 발전 : 가치가 없던 데이터도 새로운 분석으로 다른 가치를 만들어냄

3. 비즈니스 모델

  • 빅데이터 활용 테크닉

연관규칙학습 : 변인들간 상관관계 있는지
유형분석 : 문서를 분류할 , 특성에 따라 분류
기계학습 : 훈련 데이터로부터 학습한 특성을 활용해 예측
회귀분석 : 독립 변수를 조작하여 종속변수가 어떻게 변하는지 파악
감정 분석 : 특정 주제에 대한 감정을 분석
소셜 네트워크 분석 : 고객간 관계망을 어떻게 구성되는지

4. 위기 요인과 통제 방안

  • 위기 요인
    사생활 침해 : 사용자의 다음 행동 예측
    책임 원칙 훼손
    데이터 오용 : 잘못된 데이터 사용
  • 통제 방안
    동의에서 책임으로 - 사생활 문제
    결과기반 책임 원칙 고수 - 기존의 책임 원칙을 보강하고 강화
    알고리즘에 대한 접근권 제공, 알고리즘의 부당함을 반증할 있는 방법을 공개

5. 미래의 빅데이터

  • 빅데이터 활용의 3요소
    데이터(모든 것의 데이터화), 기술(진화하는 알고리즘), 인력(데이터 사이언티스트)

3 가치 창조를 위한 데이터 사이언스와 전략 인사이트

  1. 빅데이터 분석과 전략 인사이트
  • 분석을 통해 가치를 만드는 것에 집중
  • 직관에 기초한 의사결정보다 데이터에 기초한 의사결정이 중요, 데이터의 양이 아니라 유형의 다양성과 관련되어있음. 

2. 데이터 사이언스의 의미와 역할

  • 데이터 사이언스 의미 : 데이터로부터 의미있는 정보를 추출해냄, 다양한 유형의 데이터를 대상으로 분석, 효과적으로 구현하고 전달
  • 데이터 사이언스의 영역
    분석적 영역 : 머신러닝, 확률모델
    데이터처리와 관련된 IT 영역 : 프로그래밍, 데이터 엔지니어링
    비즈니스 컨설팅 영역 : 커뮤니케이션, 프레젠테이션
  • 데이터사이언티스트의 역할 : 복잡한 대용량 데이터를 구조화, 불완전한 데이터 서로 연결, 문제를 찾고 검증 가능한 가설을 세움
    요구 역량 : 하드스킬(빅데이터에 대한 이론 습득, 분석 기술 숙련), 소프트 스킬(통찰력 있는 분석, 커뮤니케이션)