1. 심리측정학의 개념
심리측정학은 심리학에서 요구되는 측정값과 기술에 관련된 활동을 연구하는 학문 분야이다. 눈에 보이지 않는 잠재적인 요소들을 객관적으로 수치화하며 주로 일반적인 실험, 측정, 평가나 교육영역에서 활용된다. 심리측정학이 실제로 활용되는 예시로는 지능 수준 파악이나 성격의 특성 파악, 교육의 성취도 등을 수치화하는 것이 있다.
2. 심리측정학의 기원
심리측정학이 탄생하게 된 역사적 배경은 다음과 같다.
1) 영국
찰스 다윈은 종의 기원이라는 책에서 각각의 객체는 서로 다른 특성을 가지고 있고, 결국에 살아남고 진화되는 객체는 환경에 알맞은 특성을 가지고 적응해 왔기 때문이라고 주장하였다. 이 이론에 영향을 받은 영국의 학자 Galton은 Hereditary Genius라는 책을 통해 다양한 특성을 가진 사람들이 자신이 가진 특성들을 어떻게 더 발전하고 개발해 나갈 수 있는지를 서술하였다. 이 과정에서 사람들의 지능을 측정하기 위한 시도가 이루어졌으며 Galton은 사람들의 정신을 테스트하는 방법을 고안하게 되었다.
2) 독일
독일의 철학자인 Herbart는 인간의 의식에 대한 신비를 과학적인 방법으로 밝혀내는 것에 관심이 있었고, EH Weber는 Herbart의 이론에 영향을 받아 감각 시스템 활성화에 대한 연구하였다. 이후 학자들은 그 이전의 연구 내용을 바탕으로 감각과 자극의 강도는 비례한다는 법칙을 밝혀내었다.
3) 20세기 이후
LL Thurstone은 비교 판단 법칙이라는 이론을 정립하였다. 이 이론은 각기 다른 속성이나 크기 등의 항목을 서로 비교하여 수학적으로 표현하는 모든 과정에 대한 것이다. 정신물리학과 긴밀한 관련을 바탕으로 이론이 정립되어 왔다. 현대에 들어와서는 성격, 학업 성취도, 태도 등의 교육 및 학습과 관련된 데이터를 측정하는데 심리 측정 이론을 사용, 개발 및 적용하고 있다.
3. 측정의 정의
스탠리 스미스 스티븐은 측정이라는 것을 다음과 같이 정의하였다. 측정이란, 어떤 규칙에 따라 사물이나 사건에 숫자를 할당하는 것이다. 반면, 물리학에서는 측정을 다음과 같이 정의한다. 측정이란, 단위에 대한 양적 속성의 일부 크기 비율을 추정하거나 발견하는 것이다. 이 둘의 차이점은 결국 측정에 대한 접근 방식에 따라 나뉜다. 예를 들어, Rasch 모델의 경우에는 규칙에 따라 숫자가 주어지지 않는다. 그러나, 측정에 대한 정확한 판단 기준과 데이터를 제공하는 것을 목표로 한다. 반면, 공분산 행렬을 기반으로 한 측정의 경우에는 평가에서 도출된 원점수를 전제조건으로 삼고, 점수 간의 연관성을 발견하는 것으로 연구를 진행한다.
처음 심리를 측정하고자 한 영역은 지능이었으며, 프랑스에서 개발되었다. 테스트의 이름은 Test Binet-Simon이며 이후에 미국에서 채택되어 Standford-Binet IQ라고 불리었다. 심리 측정학이 주요하게 측정하고자 하는 영역은 성격이었다. 성격을 개념화하여 측정하고자 하는 데 큰 노력을 기울였으나, 지금까지 일반적으로 통용되는 이론은 없다. 지금까지 정립된 도구들은 Big 5, 성격 및 선호 검사, 미네소타 다단계 성격 검사, Myers-Briggs Type Indicator, 코사인 모델 등이 있다.
4. 측정의 주요 개념
1) 신뢰성
실험을 진행할 때 신뢰할 수 있는 측정이 되기 위해서는 시간, 개인 및 상황이 일관되게 구성되어 있어야 하며, 반드시 측정되어야 하는 것을 측정해야 한다. 동일한 테스트를 반복하며 신뢰도를 평가하는 것을 테스트-재테스트 신뢰도라고 하며, 테스트 진행 시 내부적으로 일관성을 유지하면서 두 객체를 비교 분석하여 평가하는 것을 분할 신뢰도하고 한다.
2) 타당성
타당성을 확인하기 위해서는 다양한 방법이 있다. 그 종류로는 기준 관련 타당성, 동시 타당성, 예측 타당성, 구성 타당성, 내용 타당성 등이 있다. 기준 관련 타당성을 확보하기 위해서는 기준을 설정할 때의 수치가 타당한지를 판단하기 위해서는 행동 샘플의 기준을 예측한다. 또한 기분 측정이 검증되었다면, 그와 동시에 동시 타당성이 같이 확립된다. 그리고 이후에 기준을 설정할 때 가장 중심을 두는 목표는 예측 타당성을 확보하는 것이다. 구성 타당성은 측정하려는 값이 다른 구성요소와 관련이 있는 경우 확보되며 테스트하는 각 항목이 적절히 다루어지고 있으면 내용 타당성을 가진다.
3) 품질의 기준
일반적으로 테스트의 품질을 결정하기 위해서는 타당성과 신뢰성이 고려되어야 하고, 이 두 가지의 특성을 포함하기 위해서 협회는 표준을 개발해 왔다. 2014년 미국 교육 연구협회, 미국심리학회, 전국 교육측정 협의회는 교육 및 심리 테스트의 표준에 관한 개정판을 발표하므로 시험을 개발할 때 기준이 도는 표준을 설명하는 툴을 제시하였다. 교육 평가 분야에서는 3가지 평가 표준세트를 발표하였는데, 88년도에 인사 평가 기준, 94년도에 프로그램 평가 기준, 2003년도에 학생 평가 기준이다. 각각의 출판물은 평가에 관한 일련의 표준을 제공함으로써 평가 및 개선에 대한 지침을 제공하고 정확한 교육 평가를 통해 실현할 수 있고 유용한 정보를 얻을 수 있도록 하였다.
5. 논란 및 비판
심리 측정은 각 항목의 상관관계를 통해 도출된 수치를 기반으로 심리 과정을 잠재적으로 파악하기 때문에 수량화가 어렵다는 점과 개념의 정의에 대한 모호성에 대해 비판을 가졌다. 또한 정형화된 테스트를 일반인이 사용함으로써 테스트가 가끔 오용되기도 한다는 비판을 가졌다.