국내에서도 인공지능(AI) 기업에 뉴스 데이터 학습 대가를 요구하는 소송이 시작됐다. 이를 기점으로 AI 뉴스저작권 관련 논의에 불이 붙을 것으로 관측된다.
17일 업계에 따르면 국내 언론단체 등은 뉴스 데이터의 AI 학습 대가 관련 소송을 진행하고 있거나 소송 여부를 검토하고 있다.
지상파 방송3사는 지난 13일 네이버에 뉴스데이터 AI 무단학습 관련 소송을 제기했다. 네이버가 자사의 AI ‘하이퍼클로바’와 ‘하이퍼클로바X’ 학습에 방송 3사의 기사를 무단으로 활용했다는 이유에서다.
방송 3사가 포함된 한국방송협회는 앞서 네이버를 상대로 두 차례 방송사 뉴스데이터 사용 보상 및 향후 침해 방지 대책을 요구했다. 지난 2023년 12월에는 네이버를 포함한 국내외 IT 기업에 “뉴스콘텐츠뿐 아니라 오디오, 영상 콘텐츠를 AI 학습에 이용하기 위해서는 별도의 보상 협의가 필요하다”는 의견서를 발송한 바 있다. 그러나 네이버에서는 명확한 답변을 내놓지 않은 것으로 전해졌다.
한국방송협회 관계자는 “소송과 관련해 아직 네이버로부터 답변을 받지 못했다”면서 “해외에서는 언론사와 AI 기업 간 학습 데이터 이용에 대한 보상 협의·합의가 이미 이뤄지고 있다. 협회에서도 소송뿐 아니라 협상을 통해 이를 해결할 길을 열어두고 있다”고 설명했다.
한국신문협회도 2023년부터 회원사 및 외부 법률 전문가들과 협의체를 구성해 AI 기업의 뉴스 데이터 학습에 대한 법적 검토를 진행 중이다. 공정거래위원회 제소와 국회 입법 활동 등을 포함해 소송까지 여러 가지 대응 방안을 논의하고 있다.
한국인터넷신문협회는 네이버 등 AI 기업과 소송보다는 협상에 좀 더 집중하고 있다. 대형 언론사뿐 아니라 다양한 언론사의 뉴스 데이터가 정당한 대가를 받고 AI 학습에 활용되는 것을 목표로 하고 있다.
해외에서는 뉴스 데이터 학습 관련 소송이 이미 진행 중이다. 챗GPT 개발사인 오픈AI가 대표적이다. 현재 다수의 언론사와 소송을 진행하고 있다. 뉴스코퍼레이션, AP, 르몽드 등과는 협상을 통해 문제를 해결하기도 했다.
국내에서는 AI 학습용 데이터 대가에 대한 명확한 규정이 아직 마련되지 않았다. 현재로서는 저작권법상 ‘공정이용’ 여부를 법원에서 판단하는 구조다. 공정이용은 저작물의 이용 목적 및 성격 등에 따라 저작자의 이익을 부당하게 해치지 않는 경우 허가를 구하지 않고 저작물을 이용할 수 있다는 개념이다. 다만 AI 관련해서는 판례가 아직 존재하지 않는다.
이에 더해 소송 진행에도 어려움이 따른다. 콘텐츠 창작자들은 자신의 창작물이 AI 학습에 이용됐는지 알 수 없다. AI 기업에서 어떤 학습데이터를 활용했는지 공개하지 않기 때문이다. 이같은 정보비대칭을 해결하고자 문화체육관광부는 AI 학습 활용 데이터 목록공개 의무를 담은 저작권법 개정을 추진하고 있다.
전문가들은 AI 학습 대가 관련 협상 테이블이 열려야 한다고 강조했다. 이대희 고려대학교 법학전문대학원 교수는 “미국의 경우, 우리나라처럼 AI 학습 대가 관련 명확한 법이 없어 저작권 침해 여부를 법원에서 판단 받아야 한다”며 “시간이나 비용이 들기에 시장 상황에 따른 합의가 주로 이뤄지고 있다. 저작권 당사자와 AI 개발자들이 원만하게 협의해야 대한민국 AI 산업 발전에도 도움이 될 것”이라고 말했다.
최경진 가천대학교 법과대학 교수도 “이번 소송은 AI로 인한 충격 해결을 위한 시발점이다. 대화가 되지 않을 때 상대를 소송을 통해 협상테이블로 불러내는 것도 한 가지 방법”이라며 “AI 학습 데이터 관련 대가산정을 본격적으로 해야 할 시점”이라고 이야기했다.
다만 입법 관련 의견은 갈렸다. 이 교수는 “입법으로 문제를 해결하기는 어렵다. 사회적 합의에도 오랜 시간이 걸리고, 법안이 시행되기까지도 시간이 너무 오래 걸려서 AI 발전 속도를 따라가지 못할 것”이라고 설명했다. 반면 최 교수는 “현재로서는 입법으로 문제를 해결하기 어렵지만 최종적으로는 입법으로 문제를 해결하는 것이 가장 적절하다”며 “다양한 이해 당사자의 사회적 논의를 통해 합의가 도출되기를 바란다”고 밝혔다.