
Image by Cristofer Maximilian, from Unsplash
창작자들, 기술 거물들에게 AI 훈련 데이터에 대한 대가 지불을 요구하다
정부들이 기술 분야를 불안하게 만들고 투자를 손상시킬 수 있다는 두려움으로 AI 개발자들이 창의적 및 저널리스틱 콘텐츠를 도용하도록 허용하고 있다는 주장이 이번 주 영국 의회 위원회에서 들려 왔습니다. 이는 The Register에서 처음 보도하였습니다.
시간이 없으신가요? 이것이 주요 포인트입니다!
- 영국 의회는 AI가 보상 없이 저작권이 있는 콘텐츠를 이용하고 있다는 우려를 들었습니다.
- 작곡가 막스 리히터는 AI가 음악가들의 생계와 독창성을 위협한다고 경고했습니다.
- 출판사들은 3,000개의 뉴스 웹사이트에서 데이터를 스크랩하는 1,000개의 봇을 발견했습니다. 이 데이터는 AI 모델을 위해 사용되었습니다.
기술산업의 한 인사가 텍스트와 데이터 마이닝의 “원죄”가 이미 발생했으며 콘텐츠 제작자와 입법자들이 넘어가야 한다고 주장함에도 불구하고, 국회의원들로 구성된 공동위원회는 출판사들과 작곡가로부터 기술산업이 저작권 보호된 자료를 무제한으로 이용하는 것에 분노한 목소리를 들었습니다.
문화, 미디어, 스포츠 위원회와 과학, 혁신, 기술 위원회는 작곡가 막스 리히터에게 “악의적인 행위자들”이 그의 음악을 AI 모델을 학습시키는 데 사용하고 있다면 어떻게 알 수 있을지 물었습니다.
“정말로 제가 할 수 있는 것은 없습니다,” 그는 의원들에게 말했습니다. “음악 AI 모델이 몇 가지 있고, 그것들로 완벽하게 제 스타일의 음악을 생성하는 것은 매우 쉽습니다,”라고 그는 The Register에 보도된 바와 같이 말했습니다.
“그것은 내게 묻지도 않고, 돈을 주지도 않고 제 물건을 빨아들인 경우에만 가능할 것입니다. 이런 일이 대규모로 발생하고 있습니다. 인터넷에 작품이 올라온 거의 모든 아티스트에게 당연히 일어난 일이죠,” 라고 리히터가 덧붙였습니다.
리히터는 주요 영화와 텔레비전 음악에 그의 작품이 활용된 작곡가로, 자동화된 물질이 인간 창작자를 밀어내어 음악가들을 가난하게 만들 것이라고 경고했습니다. “음악 문화가 대중화되어 평범해질 것입니다,” 라고 그는 The Register에 보도된 바와 같이 말했습니다.
“저작권이 침식되는 것을 허용한다면, 이것이 바로 음악 산업에서 가치가 창출되는 방식이기 때문에, 우리는 미래에 아티스트들이 없는 상황에 처하게 될 것입니다.”라고 그는 덧붙였습니다.
전 구글 직원인 제임스 스미스도 이같은 의견을 반복하며, “원죄라 할 수 있는 일이 벌어졌다.”고 말했습니다. 그는 정부가 라이센싱을 대체 수익 모델로 지원하는 데 주력해야 한다고 제안했으며, 이는 The Register에서 보도했습니다.
맷 로저슨, 파이낸셜 타임스의 글로벌 공공 정책 담당 국장은 이와 다른 의견을 밝혔습니다. 그는 AI 회사들이 허락 없이 콘텐츠를 적극적으로 스크레이핑하고 있다며 강조하였습니다. “우리는 바로 앞에 보이는 것들만 처리할 수 있습니다,”라고 그는 더 레지스터가 보도한 바에 따라 말하였습니다.
한 연구에 따르면, 1,000개의 독특한 봇들이 3,000개의 출판사 웹사이트로부터 데이터를 스크레이핑하고 있다고 더 레지스터가 보도하였습니다. 이는 아마도 AI 모델 훈련을 위한 것으로 보입니다.
프로페셔널 퍼블리셔스 어소시에이션의 최고경영자인 사지다 메랄리는 AI 산업이 데이터 스크랩핑에 대한 투명성이 상업적으로 민감하다는 주장을 비판했습니다. “그들이 실제로 걱정하는 것은 퍼블리셔들이 그 데이터를 바꾸어 공정한 가치를 요구할 것이라는 점입니다.”라고 그녀는 더 레지스터(The Register)에 보도된 바에 따라 말했습니다.
AI 훈련 데이터에 대한 논란은 지난 10월, 13,500명이 넘는 아티스트들이 동의 없이 창작물을 스크랩하는 AI 회사에 대한 청원에 서명하면서 확산되었습니다. 이 청원은 작곡가이자 전 AI 경영진인 에드 뉴턴-렉스가 주도하였으며, 줄리안 무어, 톰 요크, 카즈오 이시구로와 같은 공인들이 서명하였습니다.
“AI를 생성하는 회사들이 AI 모델을 구축하기 위해 필요로 하는 세 가지 핵심 자원이 있는데, 그것은 사람, 컴퓨팅, 그리고 데이터입니다. 그들은 첫 번째 및 두 번째에 대해 엄청난 금액을 쓰기도 하는데, 엔지니어 당 천만 달러, 모델 당 십억 달러에 이르기도 합니다. 그러나 그들은 세 번째인 훈련 데이터를 무료로 얻을 것으로 기대합니다.”라고 뉴턴-렉스가 말했습니다.
아티스트 그룹이 OpenAI의 텍스트-비디오 도구인 Sora에 대한 접근을 유출함으로써 긴장이 더욱 고조되었습니다. “Sora PR Puppets“라고 자신들을 칭하는 이들은 Hugging Face를 통해 Sora의 API에 무료로 접근할 수 있게 하여, 사용자들이 OpenAI가 중단하기 전까지 3시간 동안 비디오 클립을 생성할 수 있게 했습니다.
시위자들은 OpenAI가 예술가들을 “PR 꼭두각시”처럼 취급하고, 무려 1570억 달러의 기업을 위해 무급 노동을 착취하고 있다고 주장했습니다. 그들은 공정한 보상을 요구하는 공개서를 발표하고, 예술가들이 자신들의 AI 모델을 개발할 것을 초대했습니다.
예술가들과 출판사들이 AI가 그들의 콘텐츠를 무차별적으로 사용하는 것에 반발하면서, 윤리적인 AI 훈련 방식에 대한 논란은 계속되고 있습니다. 영국 정부는 기술 발전을 억제하지 않으면서 창작 산업을 보호하는 정책을 시행하라는 압력이 점점 늘어나고 있습니다.