본문 바로가기

카테고리 없음

AI 그림에 대하여

사실 이런 글을 쓰게될줄은 몰랐는데, 어쩌다보니 그렇게 됐다.

이야기에 앞서서, 나는 AI기술을 옹호하는 입장이다.

그리고 생성된 이미지에 대한 저작권은 비관적으로 바라본다.

 

말도 많고 탈도 많은 AI기술... 게임 개발자이기 이전에 컴퓨터공학도로서 놀라웠다.

강력한건 알고 있었지만, 여기까지 왔구나 싶었다.

그리고 동시에 환장할만한 상황이 벌어진다. 학습에 사용된 "그림"에 대한 문제다.

머신러닝은 기본적으로 데이터로 이루어진다.

좋은 데이터는 좋은 결과를 만든다는 말이 있을정도로, 머신러닝에서 데이터는 대단히 중요하다.

즉, 그림을 그리는 AI를 위해서는 수많은 그림이 필요하다.

그렇다면 그 그림은 어디서 가져왔는가? 인터넷에 올라온 그림들이다.

잠깐 뭐라고? 내가 그린 그림이 도용당했다고?

 

한바탕 폭풍이 불어닥쳤다.

자신의 그림을 도둑맞고, 나는 하루아침에 실업자 신세가 된 것이다.

.많은 그림관련 종사자들이 분노했다.

한평생 노력해서 닦아온 재능이, 물거품이 된 것이다. 

이게 참 자연스러운 흐름이고, 그렇기에 그림 분야를 발칵 뒤집어놨다.

 

일단 아래의 얘기를 해보고 싶다.

1. 적법한가?

2. 윤리적/도덕적으로 문제가 되는가?

3. 기술적으로 어떤가?

4. 사람을 대신할 수 있을까?

5. 프로그래밍에서의 학습 사례

 

1. 적법한가?

워낙 최근에 나온 기술이라서 법적 근거가 희박한 것으로 알고 있다.

일단 조사로 알고 있는 사실을 몇가지 적어본다.

- AI로 만든 결과물은 저작물로 인정받지 못한 판례가 있다. (퍼블릭 도메인)

- 그림을 "학습"에 사용하는 것은 저작권법 범위 밖이다. 즉, 현재 법망 안에 없다. 

요컨대 AI가 하는 "학습" 은 일반적인 사용과 다르게 취급되고 있다는 것이다

 

2. 윤리적/ 도덕적으로 문제되는가?

법 밖이니 그렇다면 양심에 맡겨야할 것이다.

그러니 이런 쪽으로 접근해보자.

꽤나 자주 보이는 논리가, "인간도 혼자서는 못하지 않느냐?"이다.

틀린말이 아니다 .사람도 결국 보고 모방으로부터 배우는걸로 시작하니까.

그림을 그리는 사람이면 트레이싱, 모작 한번 정도는 해봤을 것이다.

 

반대로 "컴퓨터의 학습과 인간의 학습이 같은가?" 라고 반문한다.

사실 틀린말은 아니다. 일단 인공신경망이 인간의 뇌를 베낀 구조인건 둘째 치더라도,

인간은 유기화학적인 세포로 이루어져있고, 컴퓨터는 전자공학적인 소자들로 이루어져있으니까.

뭔가 확실히 다르긴 하다. 

AI 그림은 결국 사람이 시킨대로 움직이는 물건이다 보니, 자아가 없고 의류 공장에 재봉틀같은 존재에 가까워 보인다.

 

이 부분을 좀 살펴보고자 한다.

일단 사람의 그림에서 문제가 되는 경우를 잠깐 짚어보자.

 

A. 트레이싱, 파쿠리

이 경우는 사람도 문제가 된다.

그냥 그대로 대고 베끼는거기 때문이다.

원작이랑 똑같을 뿐더러, 대상이 된 하나의 그림이 없었으면 애초에 나올수도 없었다.

당연히 도덕적으로도 문제가 된다. 이건 저작권 범위 내이므로 법적으로도 문제가 될 것이다.

 

B. 그림체 베끼기

문제가 되기도 하고, 안되기도 한다.

정도에 따라 다를 것이다

다른사람 그림체 참고하면서 그리다가 자기 그림체를 정립하는 사람들도 있고,

결국 다른 메이저 작가의 마이너 카피로 남을 뿐인 경우도 있다.

경우에 따라 A와 다를 바 없는 사람이 될 수도 있고, 다음에 얘기할 C가 될 수도 있는 것이다.

 

C. 자신이 배워왔던 내용을 기반으로 자신 고유의 그림 그리기

그림을 그리는 사람은 앞선 과정에서 뭔가를 많이 배웠을 것이다.

다른 사람의 그림을 보며 인체, 구도, 채색, 명암 등등을 연구했을 것이다.

어떤 그림이 매력적인지, 무엇이 인기있는지 공부해서 자신의 그림을 적립한다.

그리고 그것은 자신만의 유일무이한 무기가 되고, 창작자로서 독립하는것이다.

 

이번엔 ai의 경우를 적어보자.

A. 해상도를 높여주는 AI

커널과 컨볼루션 개념이 등장하고부터 등장했던 고해상도화 AI가 있다고 치자.

만약 여기에 어떤 이미지를 넣어서 고해상도의 이미지가 나왔다?

그럼 여기에 저작권을 주장할 수 있을까?

생긴게 똑같은데 해상도가 더 높게 보정했다는 걸로 저작권을 주장할순 없을 것이다.

그러니 이런 AI에서는 img2img 방식은 도덕적으로 문제가 될 가능성이 높다.

흔히 말하는 유튜브 불법영상이랑 다를바가 없다.

 

B. 다른 이들의 그림체를 학습한 AI

흔히 보이는 그림 AI라고 생각하자.

이번엔 A랑 달리 좀 더 신기한 일을 한다. 그림체, 채색, 그림그리는 법 따위를 공부해두었다.

컴퓨터비전과 선형대수학적인 기술들의 도움을 받아 AI를 돕는다. 

적어도 이건 그림을 미리 공부한 AI가 기존에 없던 그림을 만들어 낸다.

아무리 AI 그림에 적대적인 사람이어도 A보다는 B가 낫다고 생각할 것이다.

 

C. 자아를 갖고 스스로 행동하여 그림을 그리는 AI

소위말하는 사람과 구분할 수 없는 수준까지 온 강인공지능이다.

이경우엔 앞서 말했듯 철학적인 문제와 연결되는 수준이라, 이쯤되면 그냥 그림만의 문제가 아닐것이다.

어쩌면 머리쓰는일은 로봇에게 죄다 맡기고 허드렛일이나 하고 있을지도 모른다.

하여튼, 논의가 여기 까지 오게 되면 "사람은 무엇인가?" "자아란 무엇인가?"같은 해결 불가능한 주제가 튀어나온다.

AI에게 저작권은 물론이고 시민권도 줘야할지도 모른다. 먼 얘기긴 하지만,

이쯤 되면 단순 기계라고 치부하기 어려울 것이다. 

 

이제 무슨말을 하고 싶은지 대충 눈치 챘을것이다, 결국 사람이든 기계든 A는 확실히 잘못됐고,. C는 문제가 없다.

결국 그 중간인 B인 단계인데, 지금 그림 AI는 A와 C 사이에 있다.

그러다 보니 사람들 의견도 갈리는거다.

"사람도 남거 보고 공부해서 하는거잖아"

"기계가 하는 공부가 사람이랑 같냐?"

하면서, 설전을 벌이는 것이다.

 

따라서 윤리적/도덕적인 문제도 AI가 애매한 위치에 있다보니 입장이 서로 갈리는 상황이 된거다.

더구나 생계랑 엮이다보니 웹소설같이 득이 되는 쪽은 AI를 옹호하고, 그림쪽은 AI를 비판하는 상황이 벌어졌다.

 

사족으로, A같은 인공지능도 결국 B와 비슷하게 어떤 그림을 받아서 학습을 해야한다.

그러나 이런 류의 인공지능은 결과물이 지금처럼 무에서 유를 만드는 수준이 아니기 때문에,

논란이 되었다고 해도 현재만큼 큰 논란이 되지는 않았을 것이다.

오히려 그림을 그리는데 도움이 되니까 뭐 그정도는.. 하고 넘어가지 않았을까

 

3.기술적으로 어떤가?

현재 화제가 되고있는 stable diffusion 모델의 경우, 데이터를 그대로 활용하지 않는다.

말그대로 정보이론에서 나오는 의미의 diffusion을 주는 것이다.

그러니까 쉽게말해 형체를 알아볼수 없도록 한번 이미지를 뭉개고 시작하는건데,

결국 이 뭉개진 데이터를 쓴다고도 말 할 수 있다.

적어도 그림을 그대로 사용하지는 않는다는 것이다. 

KNN처럼 그림 데이터를 그대로 갖고있는다거나 그런것도 아니고,

학습을 통해 굴러가면 신경망의 가중치로 녹아들 뿐이다.

인간으로 따지면 뉴런의 상태가 재조립되는 것과 비슷하다.

 

결국 AI가 그림을 보고 "그림을 그리는 법"을 터득한건 맞는데,

그게 어떤식인지는 알 수 없다. stable diffusion 모델을 제안한 사람도 아마 모를 것이다.

오히려 몇몇 그림들은 인간보다도 독창적으로 맛이 가 있기도 하다(...)

그 원리는 정확히 알 수 없지만, 뉴럴이 어떤 그림을 생성하는 로직을 함수를 "학습"한 상태가 된 것이다.

분명 그림을 보고 배운건 맞는데, 실제로 그 뉴럴넷은 그림 데이터 원본을 이용하지 않는다. 학습 이후에는 원본은 존재하지 않고, 어떤 함수를 생성했을 뿐이다. 사람으로 따지자면, "인체는 이렇게 그려야 해" 라는걸 알고 있지만, 정작 그걸 어디서 배웠는진 모르는 그런 상황인 것이다.

 

그렇다면 이걸 단순히 저작권 위반으로 볼 수 있는가?

단순히 도용해서 "이 그림 내꺼에요"라고 우기거나, 그걸로 돈을 벌어먹는거랑은 결이 다른 문제다.

"아니 그림을 갖다 썼는데 당연히 문제아님?" 이라고 물어볼 수 있다.

예를 들어보자.

유튜브에 영상을 올릴때, 저작권 문제상 모자이크나 블러 처리를 하는 경우를 보자.

이것도 영상 편집 과정에서 그림을 갖다 쓴다. 블러를 하든 모자이크를 하든, 일단 갖다는 쓰게 되어있다.

그렇다면 이것도 저작권상 문제가 된다고 봐야하는데, 그렇게 보는 사람은 없지 않은가?

실제로 diffusion이란 놈 역시 모자이크나 블러에 가까울정도로 원본 이미지를 통계적으로 왜곡한다.

 

그렇다면 "결과가 원본과 똑같지만 않으면 데이터 갖다써도 되겠네?" 라는 질문에도, 애매하다.

만약 블러 대신 업스케일러를 돌려서 올리면 문제가 될 것이다.

결국 이 "데이터 처리"라는 놈은 굉장히 애매한 놈인 것이다.

 

그래서 법적으로도 기존 법망 밖으로 벗어난것이고, 그래서 법제화가 필요한 것이다. 

앞서 A, C 사이의 B 상황이라고 얘기했던 것도 이런 이유에서이다.

 

 

4. 사람을 대신할까?

나는 현재를 기준으로 AI가 사람을 대신할거라고는 생각하진 않는다.

지금도 AI는 여전히 거품이 있다고 생각한다.

물론 1에서 10이 된건 사실인데, 사람들은 30정도로 인식하고 있다.

 

현재 상태로는 하자가 정말 많다. 손에 하자있는건 유명하다.

손을 전보다 잘그린다곤 하지만 여전히 업스케일링 안걸면 형체가 완전히 뭉개진다

그리고 내가 원하는 캐릭터를 원하는 그림체로, 원하는 자세로 뽑는다는건 수고가 상당히 많이들어간다.

기업은 그런 수고 들이면서 퀄리티도 보장 안되는 물건을 쓰는 것 보단 그냥 사람쓰는게 편하다.

 

조건을 약하게 잡으면 퀄리티가 높아지고, 조건을 쎄게 잡으면 퀄리티가 나빠지는 그런 trade-off가 있긴 한데

그런거 고려없이 100번 뽑아서 최대한 예쁘게 뽑은 하나 가지고 AI가 세계를 지배한다! 라고 과장하는것 같기도 하다.

 

그리고 설사 AI 그림을 쓰는 사람을 뽑는다 쳐도 리터칭 할줄 아는 그림 잘그리는 일러레한테 AI를 쓰게 만들지

그림 전혀 못그려서 AI 조금 깔짝거리다가 하자있는곳 제대로 못그려서 inpaint하고 가챠돌리는 사람을 쓰진 않을 것이다.

즉, AI를 서로 끼고 있으면 당연히 기존에 그림 그리던 사람이 이긴다.

 

AI 그림이 등장한 이 시점에서 드는 생각인데,

사람 작가는 캐주얼한 그림체를 가진 작가들이 경쟁력이 높아질 것 같다.

(그림체는 단순하지만 개성있고 인기 있는 낡은창고, 쭐어 등)

결국 AI를 쓴다고 해도 콘티는 먹여야하는데, 콘티 그리는 시간 = 그림 그리는 시간에 가까울 수록

AI는 할 일이 없어진다. 그 사람의 그림체를 학습시킨다고해도 별 의미가 없을 것이다.

 큰 차이 안나면 진짜를 쓰지 굳이 가짜를 쓰진 않을테니까.

 

기존 그림 시장에 큰 영향이 간건 사실이다.

그럼에도 그런 고퀄리티의 그림을 그리는 사람들은 여전히 기업이 찾을것이다.

기업에게는 그사람들에게 지급하는 페이가 크게 부담되는것도 아니고,

지금 AI수준으로는 만족을 못하니까...

 

마지막으로 단순히 그림 떄문에 그사람을 소비하는 것이 아니라는 점도 있다.

그 "사람"이 만든게 좋아서, 그런 이유다.

음악이든 그림이든 만화든 연예인이든 뭐든 "특정 사람"이 좋았던 경험은 한번 쯤 있을 것이다.

미연시 캐릭터가 나한테 고백하는거랑 현실에서 좋아하던 여자가 고백하는거랑은 차이가 있을테니까,

나랑 같이 숨쉬고 소통한다는 점에서 창작자에게 매력을 느끼는 경우도 분명 있다. 

 

AI 기술이 그림에 마냥 재앙이기만 한것은 아니다.

오히려 AI그림이 존재하여 레퍼런스 제공이 굉장히 편리해졌다.

대충 이런느낌이요! 를 쉽게 전달할 수 있는 수단이 생긴 거니까.

 

5. 프로그래밍에서의 학습 사례

사실 내가 AI에 우호적인 가장 큰 이유는,

내가 게임 개발자이기도 하지만 기본적으로 프로그래머라서가 아닐까 싶다.

만약 "님 누가 프로젝트 코드 통쨰로 도용했던데요?" 하면 화가나겠지만.

"님 프로그램 코드 누가 학습 돌렸던데요?" 하면 별로 화가 안날것 같다.

ChatGPT나 Copilot이 그런 존재인데,

흔해빠지고 전형적인 코드에서는 어느정도 코드를 만들어 내지만,

조금만 지엽적으로 바뀌어도 일을 제대로 못한다. 즉 멍청하기 때문이다.

무엇보다 내 코드를 통째로 베끼는것과는 다르다는걸 알고 있다.

그래서 그 AI가 만드는 코드는 내 코드를 참고했더라도 그건 내 코드가 아니다.

사람이 내코드를 보고 만든거랑 별 차이가 없는 것이다.

이에 대해 저작권을 주장하기도 어렵다.

애초에 내가 아니라, 적어도 수천 이상의 프로그래머들의 코드가 들어가있을텐데,

이걸 특정 누군가의 코드라고 볼 수는 없다.

오히려 GPT가 기본적인 라이브러리나 문법들은 쉽게 찾아줘서 나는 더 편해졌다. (멍청한 대답을 많이하긴 하지만...)

학습 데이터를 엄격하게 제한했으면 이런게 나올 수 있었을까?

당연히 불가능하다.

 

그림도 마찬가지일것 같다.

자동 광원, 자동 채색 같은 그림 보조용 AI들도 기본적으로 데이터는 남 그림 가져와서 하는 거라,

만일 학습이 위축된다면 아마 앞으로 나올 수 있는 잠재적인 도구들도 나오지 못하게 될 것이다. 

(멀리갈 필요도 없이, 아주 흔하게 쓰는 포토샵의 물체인식, 물체 제거기능 같은것도 이런 AI가 적용되어있다.)

 

마치며

 

하여간에 법제화가 잘 되기 전까지는 너무 서로 물어뜯지 않았으면 좋겠다.

AI 그림 올리면서 그림 그리는사람 조롱하는 것 좀 그만하고, 

AI 그림 올렸다고 도둑놈이라고 욕부터 하지는 않았으면 좋겠다.

아직은 논란의 여지가 많다. 사람들 생각도 서로 다 다르고...

결국 현재는 쓰는 쪽도 정상, 안쓰는 쪽도 정상이라는 것이다.

법제화도 안됐고, 사회의 도덕이나 윤리를 기준을 들이대기에도 애매한 상황이다.

상업적도 비상업적도 지금 당장은 결정된게 없다.

결론이 양시론이긴 한데, 어쨌든 결국엔 법망 안에 AI 그림을 끌고 오는게 급선무라고 생각한다..

부디 좋은 기술이 사회에 잘 자리잡을수 있기를 빈다.

 

푸불