기술통계-산포도,사분위범위,변동계수,분산,표준편차
·
기타
산포도 자료의 흩어지거나 밀집되는 정도를 나타내는 척도 산포의 척도 범위,사분위수범위,평균편차,분산,표준편차,변동계수 위치의 측도-백분위수 p번째 백분위수는 전체 자료에서 p%에 위치한 값을 의미한다. 즉 전체 자료를 순서대로 배열하였을 때 전체 관측값을 p%와 (100-P)%로 나눌 수 있는 값이다. p번째 백분위수보다 작은 자료의 개수는 전체의 p%이고 p번째 백분위수보다 큰 자료는 (100-p)% 개가 있다고 이해할 수 있다 사분위수 범위 (RANGE) 변동의 측도 자료의 최대값과 최소값의 차이 자료들의 산포는 측정할 수 없는 단점이 존재 사분위범위 변동의 측도 사분위범위 = 제3사분위수 - 제1사분위수
기술통계값-중심경향값
·
기타
중심경향값 평균(산술평균) 자료의 평균 (산술평균) -모평균과 표본평균 산술평균 중심측도로 가장 많이 사용되는 통계량 자료의 합을 자료의 개수로 나눈 값 표본평균은 자료의 무게 중심으로 이해 극단값(이상치)에 영향을 받음 기하평균의 활용 예제) 내가 살고 있는 소도시는 2년전에는 인구가 만 명밖에 안되던 조용한 곳이였다. 그런데 1년 뒤 인구가 2만명이 되고 공단이 생기는 바람에 또 1년뒤에 인구가 16만명으로 되었다. 만명이던 인구가 1년 후에 2배로, 또 1년후에 8배로 늘어났으면 도대체 1년 평균 몇 배 늘어난 셈인가? ( 2배 x 8배 )^1/2 =4 평균 4배씩 늘어난 것이다. 중위수 ( 중간값, median) 중심 경향값의 로버스트 측도 극단값에 영향을 받지 않는다. 순서화된 배열에 있어서 중..
데이터 변수의 종류
·
기타
## 3주차 -1 ### 날짜 : 222022-09-19 20:41 ### 주제 : ### 수업정리 > 데이터를 부르는 용어가 굉장히 많다. 용어에 따라 정리해보는 시간을 가져보겠다. 정성적 데이터와 정량적 데이터 정성적 데이터란 언어와 문자로 표현된 데이터이다. 사용자의 경험 및 구매 행태를 보여주는 기술적인 데이터이며 흔히 리뷰나 인터뷰 언론보두가 정성적 데이터이다. 명목척도와 순서척도가 속해있다. 정량적 데이터는 수치,도형,기호 등 직접적으로 측정할 수 있는 데이터이다. 쇼핑몰의 별점 성적 등급, % 상승이나 하락 ,남성여성 등 통계에 더 초점을 맞춘 데이터로 측량하거나 분석이 가능한 수량적 데이터를 의미한다. 등간척도와 비율척도가 속해있다. @리뷰를 쓰는건 정성을 들여 쓰니까 정성적 데이터 @별점..
통계학과에 입문하다
·
기타
학기 시작한 기념으로 대학 다니면서 공부하는 통계 공부를 정리하는 공간으로 활용하거나 기타 일상생활을 일기 느낌으로 적기 위해 만들었습니다. 사실 편입을 준비하면서 코딩을 위주로 하는 컴퓨터공학이나 소프트웨어 학과를 생각했었는데 어쩌다 보니까 통계학과에 진학하게 되었다. 집안에서 예전부터 통계학과가 유망하다는 말을 자주 해주시는 어른이 계셔 좀 더 인식이 좋았던 것 같다 통계학과에 입문하면서 좀 더 자세히 알아보다 보니 통계학이라는 게 오는 날 우리 일상생활에 정말 가깝게 있지만 관심이 적었다는 느낌이 들었다. 통계의 정의로 산술적 방법을 기초로 하여 다량의 데이터를 관찰하면서 그것을 정리하고 분석하는 방법을 연구하는 학문이라 한다. 내가 진학한 정보 통계학과는 이러한 정보를 가지고 R 프로그램이나 SQ..