연합뉴스 본문 바로가기 메뉴 바로가기

연합뉴스 최신기사
뉴스 검색어 입력 양식

스마일게이트 AI센터, 악플·혐오 발언 데이터셋 구축

송고시간2022-01-20 14:14

beta

스마일게이트 AI센터는 악플 및 혐오 발언 데이터셋을 구축했다고 20일 밝혔다.

스마일게이트 AI센터는 최근 온라인 공간에서 혐오 표현이 광범위하게 증가하고 있는 점을 고려해 이를 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다.

악플 및 혐오 발언 데이터셋은 향후 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 다양한 영역에서 활용될 수 있을 것으로 회사 측이 기대했다.

요약 정보 인공지능이 자동으로 줄인 '세 줄 요약' 기술을 사용합니다. 전체 내용을 이해하기 위해서는 기사 본문과 함께 읽어야 합니다. 제공 = 연합뉴스&줌인터넷®
스마일게이트
스마일게이트

[연합뉴스 자료사진]

(서울=연합뉴스) 최현석 기자 = 스마일게이트 AI센터는 악플 및 혐오 발언 데이터셋을 구축했다고 20일 밝혔다.

스마일게이트 AI센터는 최근 온라인 공간에서 혐오 표현이 광범위하게 증가하고 있는 점을 고려해 이를 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다. 이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.

데이터는 2019년 1월 1일부터 2021년 7월 1일까지 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글에서 수집됐다.

센터는 혐오 관련 데이터의 시의성과 편향성 등을 감안해 55만여 개 데이터를 기반으로 1만 개 데이터셋을 구축했다. '여성·가족' '성소수자' '남성' '인종·국적' '연령' '지역' '종교' '기타혐오' 등 8개의 대상으로 범주화했다. 혐오 발언 분류를 위한 기준 모델도 제시했다.

이번에 수집된 데이터는 스마일게이트 AI센터 깃허브 페이지를 통해 이달 중 공개된다.

스마일게이트 AI센터, 인공지능 윤리성 연구를 위한 혐오 발언 데이터 구축
스마일게이트 AI센터, 인공지능 윤리성 연구를 위한 혐오 발언 데이터 구축

[스마일게이트 제공]

악플 및 혐오 발언 데이터셋은 향후 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 다양한 영역에서 활용될 수 있을 것으로 회사 측이 기대했다.

스마일게이트는 향후 지속적인 연구·개발을 실시해 확보된 기술력을 바탕으로 혐오 표현을 더 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화할 계획이다.

harrison@yna.co.kr

댓글쓰기
에디터스 픽Editor's Picks

영상

뉴스
댓글 많은 뉴스