메뉴보기메뉴 보기 검색

‘텍스트 마이닝’ 통해 정량·정성 분석 [심층기획-서부지법 점거 난동 1년 추적기]

입력 :
수정 :
폰트 크게 폰트 작게
어떻게 조사했나

더불어민주당(597건)과 국민의힘(599건) 누리집에 게시된 논평·성명·보도자료 등 발표문 전수를 수집했다. 2001년부터 2025년까지 발표된 1196건이다. 김종우 연세대 연구교수(사진·사회학)에게 분석을 의뢰했다.

김 교수는 문서 안에서 단어가 나타나는 횟수와 의미 연결 방식, 글에서 드러난 감정 등을 분석하는 새로운 사회과학 연구 기법과 전통적인 사회학 연구 이론을 접목해 한국 사회의 담론 형성을 연구하는 학자다. 지난해 2월에는 유튜브 생중계 영상을 통해 집회 현장 시민 발언의 언어 연결망을 분석했다. 또 보수 진영 유명 유튜버의 집회 현장에서와 스튜디오에서 발언을 비교해 두 공간의 담론이 사안에 따라 어떻게 변화하고 상호작용하는지 연구하기도 했다.

정치사회학적 이론과 텍스트 마이닝 기법(토픽모델링과 정서 분석)을 결합해 정량적·정성적 분석을 병행했다. 다량의 텍스트 분석 기법인 토픽모델링은 잠재된 주제를 자동으로 추출하는 방법이다. 확률적으로 유사한 주제들을 수차례 뽑도록 해 정확도를 높이는 방식으로 계산한다. 정서 분석은 2022년 서울대학교 심리학과 연구팀에서 12개 플랫폼에서 수집한 한국어 댓글 5만개를 분석해 43가지 레이블로 구분한 데이터셋을 활용했다. 하나의 문서 안에서 가장 많이 드러나는 감정을 하나의 개체로 처리했다. 주요 연도별 인물은 해당 연도 문서에서 가장 많이 언급된 인물군을 개체명 인식 기법으로 다빈출 인물을 중심으로 선별했다. 주변 인물은 한국언론진흥재단 뉴스 빅데이터 분석 서비스 ‘빅카인즈’를 활용해 추렸다. 주요 인물의 이름과 ‘구속영장’이 함께 언급된 기사를 바탕으로 관계도를 분석했다. 빅카인즈에서 제공하는 모든 언론사 기사를 이용했다.

 

취재=윤준호·이예림·소진영 기자

사진=남정탁·최상수 기자

편집=서혜진·도진희 기자 

일러스트·그래픽=권기현·손성하 기자

<관련기사> [심층기획-서부지법 점거 난동 1년 추적기]

 

<1회>누가 법원을 공격했나

①[단독] 사법의 선을 넘은 ‘커뮤니티 애국심’ 

https://www.segye.com/newsView/20260112514687

②‘투사’ 된 듯… 유튜브로 재판 후기 공유 

https://www.segye.com/newsView/20260112514521

③[단독] 박탈감에 분노한 ‘三·無·男’… 뒤틀린 신념이 도화선 됐다

https://www.segye.com/newsView/20260112514500

④“난동범들 사람처럼 안 보였다”…기록 위해 들어간 피고인들

https://www.segye.com/newsView/20260112514518

 

<2회>돈이 되는 애국

⑤ [단독] 변호해 준다더니 재판 방치… 공소부인에 형량만 더 늘어

https://www.segye.com/newsView/20260113515476

⑥막말·조롱·고성… ‘재판지연 논란’ 변호사, 법원 멸시 도 넘어

https://www.segye.com/newsView/20260113515380

⑦[단독] 폭력을 애국으로 ‘미화’… “영치금 받아 감방서 빚 다 갚아”

https://www.segye.com/newsView/20260113515375

⑧[단독] ‘영치금 불법모금’ 사랑제일교회·대표 수사

https://www.segye.com/newsView/20260113515379

 

<3회>폭동의 징후

⑨[단독]정치권 극단적 언어… 사법 불신 부추겼다

https://www.segye.com/newsView/20260114516747

⑩‘텍스트 마이닝’ 통해 정량·정성 분석

https://www.segye.com/newsView/20260114516789

⑪“美 의회 폭동·韓 법원 난동 닮은 꼴… 선동 처벌·극우 연구 필요”

https://www.segye.com/newsView/20260114516788

 

<4회>남겨진 숙제

⑫[단독]“폭력은 정당화 안 돼… 조건부 구속제 도입을”

https://www.segye.com/newsView/20260115516616

⑬“증거인멸 우려” vs “방어권 보장”… ‘조건부 구속’ 26년째 공전

https://www.segye.com/newsView/20260115516181