일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- kotlin recyclerview checkbox error
- expo-cli error
- retrofit
- Kotlin
- watchman error
- ADsP
- 선택정렬
- watchmanresponse
- MySQL
- GitHub
- 쿼리문
- 자료구조
- sockettimeout
- h2 error
- 데이터 이해
- kotlin checkbox error
- Today
- Total
Stand up lee
[ADSP] 1과목 - 데이터 이해 본문
1장. 데이터의 이해
1. 데이터의 정의
- 데이터 정의 : 추론과 추정의 근거를 이루는 사실, 다른 객체와의 상호관계 속에서 가치를 갖는 것.
- 지식 경영 핵심 이슈 :
암묵지(학습과 경험을 통해 채화되어있음 - 장인의 기술),
형식지(문서나 매뉴얼처럼 형상화된 지식 - 교과서, 비디오, DB) - 데이터의 유형 :
정성적 데이터(언어, 문자 등, ex. 회사 매출이 증가함, 저장 검색 분석에 많은 비용 소모),
정량적 데이터(수치, 도형, 기호 등, ex. 나이, 주가, 정형화된 데이터로 통계분석 용이)
- DIKW 피라미드 :
Data : A 마트는 빵이 100원, B 마트는 빵이 200원이다 -> 객관적 사실
Information : A 마트의 빵이 B 마트의 빵보다 100원 더 싸다 ->의미 도출
Knowledge : 물건 살 떄 A 마트에 가야겠군 -> 내 고유의 지식 결합
Wisdom : A마트의 다른 상품도 B마트보단 쌀 것이다 -> 이해를 바탕으로 추론, 아이디어
2. 데이터베이스 정의와 특징
출처 | 내용 |
EU | 체계적, 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물,데이터 또는 기타 소재의 수집물 (가장 기본적인 개념!! ) |
국내 저작권법 | 소재를 체계적으로 배열 또는 구성한 편집물, 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것 |
국내 컴퓨터용어사전 | 동시의 복수 업무 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위해서 일정한구조에 따라서 편성된 데이터의 집합. (네트워크 개념이 추가된 것!) |
- 데이터 정의
통합된 데이터 | 동일한 데이터가 중복되어있지 않다는 말임. |
저장된 데이터 | 컴퓨터가 접근할 수 있는 저장매체에 저장되는 것을 말함. |
공용 데이터 | 여러 사용자가 다른 목적으로 데이터를 이용한다. |
변화되는 데이터 | 갱신 하면서도 항상 현재의 정확한 데이터를 유지해야 한다. 데이터베이스가 저장하는 내용은 곧 데이터베이스의 한 상태를 나타낸다. |
3. 데이터베이스의 활용
- OLTP(On-Line Transaction Processing) : 주문 입력 시스템, 재고 관리 시스템 / 데이터 갱신 위주 / 단순 자동화
- OLAP(On-Line Analytical Processing) : 제품 판매 추이, 구매 성향 파악, 재무 회계 분석 등에 사용된다. / 데이터 조회 위주 / 의사결정
- CRM(Customer Relationship Management) : 고객관계관리 / 고객특성에 맞게 마케팅 활동을 계획,지원,평가하는 과정
- SCM(Supply Chain Management) : 공급망 관리
2장 데이터의 가치와 미래
1. 빅데이터의 이해
- 가트너 그룹의 더그 래니의 3V : Volume, Variety, Velocity + Value, Visualization, Veracity
➞ 데이터, 기술, 인재 및 조직이 변화되면서 기존 방식으로 얻을 수 없었던 통찰 및 가치 창출
- 빅데이터가 만들어내는 본질적인 변화 ★
사전처리 -> 사후처리 : 필요한 정보만 수집 -> 가능한 많은 데이터를 모으고 다양한 방식으로 조합
표본조사 -> 전수조사 : 데이터 처리비용 감소, 샘플링이 주지 못하는 정보를 발견할 수 있음
질 -> 양 : 많을수록 전체적으로 좋은 결과를 뽑아냄
인과관계 -> 상관관계 : 데이터 기반의 상관관계 분석이 인과관계보다 더 정확해짐.
2. 빅데이터의 가치와 영향
- 빅데이터의 가치 산정이 어려운 이유
데이터 활용방식 : 특정 데이터를 언제 어디서 누가 활용할지 알 수 없게 됨.
새로운 가치 창출 : 정량, 정형화된 데이터에서 새로운 가치를 창출하므로
분석 기술의 발전 : 가치가 없던 데이터도 새로운 분석으로 다른 가치를 만들어냄
3. 비즈니스 모델
- 빅데이터 활용 테크닉 ★
연관규칙학습 : 변인들간 상관관계 있는지
유형분석 : 문서를 분류할 때, 특성에 따라 분류
기계학습 : 훈련 데이터로부터 학습한 특성을 활용해 예측
회귀분석 : 독립 변수를 조작하여 종속변수가 어떻게 변하는지 파악
감정 분석 : 특정 주제에 대한 감정을 분석
소셜 네트워크 분석 : 고객간 관계망을 어떻게 구성되는지
4. 위기 요인과 통제 방안
- 위기 요인
사생활 침해 : 사용자의 다음 행동 예측
책임 원칙 훼손
데이터 오용 : 잘못된 데이터 사용 - 통제 방안
동의에서 책임으로 - 사생활 문제
결과기반 책임 원칙 고수 - 기존의 책임 원칙을 좀 더 보강하고 강화
알고리즘에 대한 접근권 제공, 알고리즘의 부당함을 반증할 수 있는 방법을 공개
5. 미래의 빅데이터
- 빅데이터 활용의 3요소
데이터(모든 것의 데이터화), 기술(진화하는 알고리즘), 인력(데이터 사이언티스트)
3장 가치 창조를 위한 데이터 사이언스와 전략 인사이트
- 빅데이터 분석과 전략 인사이트
- 분석을 통해 가치를 만드는 것에 집중
- 직관에 기초한 의사결정보다 데이터에 기초한 의사결정이 중요, 데이터의 양이 아니라 유형의 다양성과 관련되어있음.
2. 데이터 사이언스의 의미와 역할
- 데이터 사이언스 의미 : 데이터로부터 의미있는 정보를 추출해냄, 다양한 유형의 데이터를 대상으로 분석, 효과적으로 구현하고 전달
- 데이터 사이언스의 영역
분석적 영역 : 머신러닝, 확률모델
데이터처리와 관련된 IT 영역 : 프로그래밍, 데이터 엔지니어링
비즈니스 컨설팅 영역 : 커뮤니케이션, 프레젠테이션 - 데이터사이언티스트의 역할 : 복잡한 대용량 데이터를 구조화, 불완전한 데이터 서로 연결, 문제를 찾고 검증 가능한 가설을 세움
요구 역량 : 하드스킬(빅데이터에 대한 이론 습득, 분석 기술 숙련), 소프트 스킬(통찰력 있는 분석, 커뮤니케이션)