본문 바로가기
연구를 위한 디지털 리터러시

Coh-Metrix: 텍스트 가독성 분석 도구

by 디지털 구루 2021. 7. 25.
바로가기 Coh-Metrix (cohmetrix.com) 

텍스트의 가독성은 보통 문장의 난이도(한 문장당 단어 또는 절의 갯수로 측정)와 단어의 친숙도(단어의 빈도로 측정)로 계산한다. 그런데 Coh-Metrix에서 측정하는 것은 내러티브, 통사구조의 단순성, 어휘 구체성, 지시적 응집성, 심층구조의 응집성이다. 이 점수로 우리가 파악할 수 있는 것은 텍스트가 얼마나 응집성있느냐 하는 것이다.

 

응집성이 떨어지는 텍스트를 읽으면 힘들다. 자세히 읽어야 파악할 수 있기 때문이다. 가르치는 자는 텍스트를 분석하여 학생들이 독해할 때 어떤 장애물을 만나게 될 것인지, 어떻게 극복해야하는지를 준비하여 가르칠 필요가 있다. 이 도구에서 측정하는 값은 다음과 같다. 

 

  • Narritivity: 내러티브적 성격은 텍스트가 스토리와 같은 성격인가 하는 것이다. 점수가 높을수록 흐름을 따라가기 쉬운 텍스트이다. 
  • Syntactic simplicity: 통사구조의 단순성은 문장당 절의 갯수, 문장당 단어의 갯수, 동사가 나타나기 전의 단어의 갯수 등으로 측정된다. 한 문장이 가지는 절, 단어의 갯수가 적을수록, 그리고 동사 앞의 단어 수가 적을수록 쉬운 텍스트이다. 
  • Word concreteness: 어휘 구체성은 구체어와 추상어의 사용빈도가 어떠하냐는 것을 다룬다. 구체어는 인간이 감각적으로 알 수 있는 사물을 나타내는 어휘이다. 추상어는 쉽게 감지할 수 없는 개념을 가리치는 말이다. 구체어가 많을수록 쉬운 텍스트이다. 
  • Referential cohesion: 지시 응집성은 문장 간의 어휘나 개념이 연관성이 높은지 낮은지를 가리킨다. 쉽게 말해 대명사의 쓰임이 얼마나 되느냐이다. 지시 응집력이 높으면 읽는 사람이 텍스트에서 말하는 개념을 연결해서 파악하기가 쉽다. 그러나 읽기 수준이 높아질수록 지시 응집력이 낮아질 수 있으며, 읽는사람이 직접 텍스트가 가지는 개념을 연결할 필요가 있다. 
  • Deep cohesion: 심층 응집성은 하나의 텍스트에 나타난 여러 사건, 개념, 정보들이 얼마나 잘 연결되었는가를 다룬다. 쉽게 말해, 접속사들이 어떻게 쓰였느냐하는 것이다. 접속사 역시 텍스트의 수준이 높아질수록 덜 나타나기 때문에 어려운 텍스트일 때 심층 응집성이 떨어질 수 있다. 
  • Flesch-Kincaid Grade Level: 추가로 가독성 점수 중 하나인 플래시 킨케이드 점수(Kincaid, Fishburne, Rogers, & Chissom, 1975)도 제공한다. 이 점수가 읽기가 적합한 학년이라고 생각하면 된다. 이 점수을 계산하는 공식은 [(.39 * sentence length) + (11.8 * word length) - 15.59] 이다. 

분석결과는 아래 그림처럼 나타난다. 입력한 텍스트는 National Geographic에서 만든 ESL 학생을 위해 만든 교재이다. 왼쪽의 점수를 보면 통사구조가 매우 쉽게 구성되어 있고 대명사는 적지만 접속사가 많이 사용되었음을 알 수 있다. 이런 결과, 주제가 낯설더라도 학생들은 쉽게 파악할 수 있도록 되어있다는 말이다. 학생들을 위해 만든 텍스트라는 것이 통계적으로 보여지고 있다. 

Coh-Metrix 분석 결과 1

아래 그림은 수능 지문 중 하나를 분석한 결과이다. 문장이 복잡하지는 않지만, 스토리를 따라가기 힘들고 어휘가 추상적이며 대명사의 쓰임이 많지 않아 학생들이 이해하기가 쉽지 않다. 스스로 개념간의 관련성을 파악해야하기 때문이다. 

Coh-Metrix 분석 결과 2