9일 KAIST(한국과학기술원) 문화기술대학원 차미영 교수 연구팀(제1저자 권세정 박사과정)은 빅데이터 분석을 통해 트위터 내에서 광범위하게 퍼지는 정보의 진위를 90% 이상 정확하게 판별할 수 있는 기술을 개발했다고 밝혔다.
연구팀에 따르면 루머는 우선 일반 정보와 달리 지속적으로 전파된다. 일반 뉴스의 전파 속도가 한번 정점을 찍고 나면 잠잠해지는 데 반해, 루머는 수년간 지속적으로 언급된다는 것. 또 루머가 확산하는 방식이 서로 연관이 없는 임의의 사용자들에 의해 산발적으로 이뤄진다는 특징도 있다.
특히 루머는 '아니다, 사실일지는 모르겠지만, 확실치는 않지만, 내 생각에는, 잘 기억나진 않지만' 등의 단어 사용이 월등히 높았다. 특정 인물이나 기관을 비방하거나 욕설이 포함된 루머의 경우, 더욱 높은 정확도를 보였다. [ad_google01]
연구팀이 루머로 구분한 사례로는 '미국 대선 당시 버락 오바마 대통령 후보가 무슬림이며 반기독교적 성향이 있다', '영화배우 니콜 키드먼이 성전환 수술을 했으며 양성애자이다' 등이 포함됐다.
정보의 전파 초기에는 루머인지 여부를 가리기 어렵지만, 일정시간이 지나 정보 확산이 이뤄지면 빅데이터를 기반으로 해 정보의 진위를 판단하는 것이 가능하다고 연구팀은 밝혔다.
차미영 교수는 "팔로워가 많거나 영향력 있는 연예인이나 정치인 등 유명인의 경우 명성·신뢰를 잃을 수 있기 때문에 정보의 전파에 신중한 모습을 보이는 반면, 루머의 경우 임의의 사용자들이 책임을 회피하는 서두를 던지며 언급하는 모습을 보였다"며 "국내 사례에 대해서도 데이터를 얻을 수 있다면 분석이 가능하다"고 전했다.
서울대 및 마이크로소프트 아시아연구소와 공동 수행한 이번 연구는 지난해 12월 미국 텍사스주에서 열린 데이터마이닝 분야 최고 학술대회인 'IEEE 데이터마이닝 국제회의'에서 발표됐다.
[저작권자ⓒ 한스타미디어. 무단전재-재배포 금지]