본문 바로가기

데이터분석

(3)
데이터 분석 기초 자료
코세라 통계학-2 1. 수치형 데이터 시각화https://www.coursera.org/lecture/probability-intro/visualizing-numerical-data-9kRJf 분산형 계획 : 두개의 변수에 의해 어떠한 변수값에 의해 데이터에 영향을 미치는지 확인 두변수간의 관계에 따른 분산을 통해 4가지 형태로 분류 가능함방향 : 증가 / 감소모양 : 선형 / 비선형연관성 : 강함 / 약함 이상치 : 특정 관계에 따른 그룹화box plot와 히스토그램은 상호 보안이 가능함 box plot에서 분포의 최고점은 히스토그램에서 중앙값이 되며 꼬리는 각 끝으로 이어져 히스토그램과 같은 분포를 나타내게 된다 2. 데이터에서 중심(중간)을 나타내는 방식https://www.coursera.org/lecture/pr..
코세라 통계학-1 0. 소개https://www.coursera.org/lecture/probability-intro/introduction-UbGdZ모집단 -> 샘플 추출 -> 연구 -> 관계유추 -> 데이터 시각화 및 통계 -> 통계데이터 1. 변수 / 변수타입 / 변수의 관계https://www.coursera.org/learn/probability-intro/lecture/Q0zu3/data-basics 변수숫자변수 : 숫자를 사용 사칙연산이 가능한 변수연속 : 높이불연속 : 높이를 cm로 표기 분류 지정된 분류 : 순서가 중요 (높음/ 중간 / 낮음)비지정 분류변수의 관계 : 두개 이상의 변수로 인해 차원을 그릴수 있다면, 해당 변수들은 특수한 관계를 가지게 된다. 2. 상관관계 / 연관관계 https://www..