일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 테이블삭제
- rename
- 책리뷰
- 30일챌린지
- INSERT
- 보울룸
- Drop
- 직장인일기
- SQLD
- ROWNUM
- SQL
- ERD
- data
- 회사싫어
- 직장생활
- constraint
- 데이터모델링
- 30일글쓰기
- 인덱스
- 넷플릭스
- where절
- 빅데이터
- 홈트
- 환생
- 회사생활
- null
- 일기
- Update
- 전생
- 도전
- Today
- Total
목록문송한 회사생활/DATA 공부 (7)
최보름달
보호되어 있는 글입니다.
기술통계 수집된 자료를 정리, 요약하여 그 집단의 특성을 알기 쉽게 정보화 하는 방법. 자료란? 관심의 대상이 되는 사물이나 사건의 속성을 일정한 규칙에 따라 관찰, 측정한 값. 자료의 분류 질적자료: 문자로 표시되는 자료 (예: 직업, 성별 등) 양적자료: 숫자로 표시되는 자료 (예: 키, 몸무게 등) 양적자료의 분류 이산형 자료: 셀 수 있는 자료 (예: 고객 수 등) 연속형 자료: 셀 수 없는 자료 (예: 길이, 온도 등 모든 가능한 측정값을 세는 것이 불가능한 자료) (? 길이는 셀 수 있는데 왜 셀 수 없는 자료라고 하는 것일까? 잘 모르겠는 부분...) 변수 관심의 대상이 되는 사물이나 사건의 속성으로, 서로 다른 두 개 이상의 값을 가지는 것 변수의 분류 질적변수 명목척도(범주형 자료): 측..
자주 나오는 용어 모집단: 관심 대상이 되는 집단 전체 모수: 모집단의 특성 통계량: 표본의 특성 통계적 추론: 모집단에서 추출된 표본의 통계량으로부터 모수를 추정하고 예측하는 과정 통계의 정의 관심의 대상이 되는 전체집단으로부터 최적의 방법으로 자료를 수집하고, 수집한 자료를 과학적이고 논리적인 이론을 바탕으로 정리 분석하여 최적의 의사결정을 할 수 있도록 정확한 정보를 제공하는 방법론을 연구하는 것. 통계의 분류 기술통계 : 수집된 자료를 정리, 요약하여 그 집단의 특성을 알기 쉽게 정보화 하는 방법. 추측통계 : 모집단의 일부인 표본의 특성을 이용하여 모집단의 특성을 추정하거나 검정하는 방법. 시대고시기획에서 출간한 경영빅데이터 분석사 2급을 요약했습니다.
빅데이터의 어두운 면 사생활 침해 조지 오웰의 1984에서 다뤘더 빅브라더가 사람들의 일상 생활 전반을 감시할 수 있는 기술적 기반이 빅데이터 시대를 통해 구축될 수 있다. 또한, 2, 3차 목적으로 활용될 수 있기에 사회, 경제적 위협으로 변형될 수 있다. 익명화 기술이 발전되고 있지만 아직은 부족함. 책임 원칙 훼손 마이너리티 리포트 처럼 범죄 예측 프로그램에 의해 범행을 저지르기 전에 체포될 수 있다. 지금까지 민주주의 국가에서 채택한 형사 처벌은 잠재적 위협이 아닌 명확한 행동에 대한 결과에 대한 책임이었다. 빅데이터로 행위를 할 가능성이 높다고 처벌하면 민주주의 사회 원칙이 훼손된다. 데이터 요용 데이터를 과신할 때 문제가 발생할 수 있다. 데이터는 미래를 예측하지만 항상 맞는 것은 아니다. 잘..
빅데이터의 정의 big data. 큰 데이터. 단순히 용량만 큰 것이 아니라 복잡성도 증가해서 관리 툴로 다루기 어려운 데이터세트의 집합. 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터. 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처 3V : 데이터의 양, 데이터 유형과 소스 측면의 다양성, 데이터 수집과 처리 측면에서 속도가 급격히 증가하면서 나타난 현상. 대용량 데이터를 활용해 작은 용량에서는 얻을 수 없었던 새로운 통찰이나 가치를 추출해 내는 일. 나아가 이를 활용해 시장, 기업 및 시민과 정부의 관계 등 많은 분야에 변화를 가져오는 일. 기존의 작은 ..
용어의 연역 1950년대 데이터베이스 탄생 1963년 데이터 베이스 용어 공식 사용 1965년 시스템을 통한 체계적 관리와 저장 등의 의미를 담은 '데이터베이스 시스템' 용어 등장 1970년대 데이터 베이스 용어 일반화 데이터베이스 정의 문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠(데이터, 정보, 지식, 저작물 등)를 정보 처리 및 정보의 집합체 데이터베이스 특징 일반적 특징 통합된 데이터이다. 동일한 내용의 데이터는 중복되어 있지 않다. 저장된 데이터다. 컴퓨터가 접근할 수 있는 저장 매체에 저장되어 있어야 한다. 공용 데이터다. 여러 사용자가 서로 다른 목적으로 데이터 베이스의 데이터를 공동으로 이용할 수 있다. 변화된다. 항상 현재의 정확한 데이터를 유지한다. 다양한 측면에서의 ..
데이터의 정의 데이터 = 추론과 추정의 근거를 이루는 사실 데이터는 '객관적 사실'(fact, raw material) 이라는 존재적 특성을 갖는 동시에 '추론, 예측, 전망, 추정을 위한 근거'(basis) 로 기능하는 당위적 특성을 갖고 있다. 데이터와 정보의 관계 DIKW 피라미드 : Data, Information, Knowledge, Wisdom hierarchy 데이터, 정보, 지식을 통해 최종적으로 지혜를 얻어내는 과정을 계층구조로 설명함. 데이터: 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실 정보: 데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가 도출된 것 (다만, 정보는 유용하지 않을 수도 있다) 지식: 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분..