Ice Cream Season 3

빅데이터 맹신이 가져올 잘못된 미래 - Youtube 추천은 왜 그렇게 안맞을까?

작성일 작성자 fox

구글이 바둑으로 인공지능이니 뭐니 하면서 장난쳤을때, 제 블로그는 시즌 2였을 것이라 생각하는데, 시즌 1이었나요? 어쨌든 구글을 비판했어요...그러나 잠시 사람들이 구글에게 열광했던 때가 있었지요...지금은 구글이 하려했던 수 많은 것들이 되지 않고 있다는 것을 이해할 거에요...


구글은 가능하지도 않는 방법을 가지고 여러분들을 기만했고 그 과정에서 모두 속아서 지금은 국가에서 우리의 사생활 정보 보호 권리까지 기업에게 넘겨버린 상황이지요..이것은 다음 정부에서는 찾아주길 기대하고 있어요...이미 구글이 말했던 시험을 안쳐도 되는 사회를 만드느니, 여러가지 인공지능을 만드느니 했지만, 하나도 안되고 있다는 것을 여러분이 스스로 목격하고 있지 않나요? 그럼에도 그럴듯한 미래의 낙관적 예측은 그대로라는 것은 좀 우습지만요...이제 실패다~! 할때도 되었는데 아직 보조금 처묵처묵이 좋은것이겟죠...


게다가 Youtube에서 여러분들에게 추천을 해주는 경우, 그러한 것들은 같은 방식을 사용해서 추천을 해주고 있어요...그런데 간혹 여러분은 추천을 해주는 경우를 클릭할수도 이겠지요...그러나 그렇지 않은 경우는 얼마나 많았나요? 즉 추천을 보고도 다른 동영상을 찾아서 듣거나 보는 경우는 얼마나 많았느냐? 하는 것이지요...사실 추천은 거의 안맞는 수준이지요...바둑과 같아요...바둑때 두었던 수가 절대적 신의 한수였냐? 하는 것은 아니었지요...그런 수준의 정확도에요...그런 수준의 정확도로는 뭔가 할만한 것이 없어요...인간의 생명을 좌우할수 있는 것에서 정확도가 낮은 인공지능 방식을 적용할수 있을까요? 없다는 것을 알것이에요...심지어 이것은 해보고 아는것이 아니라 그 전에 알수 있어요....왜 정확도가 낮을까? 하는 것에 대해서 생각해 보도록 하지요...


① 변수 설정의 문제.


인공지능은 사람처럼 생각하고 그런것을 만드는 것이 아니에요...사람과 같다는 씩으로 말하는 것은 구글의 거짓말이지요...그들이 말하는 인간의 뉴런과 같다는 점은 바로 반박할수 있어요...시냅스 소포에서 확산하는 신경전달 물질인 아세틸콜린에서 음수값을 어떻게 정의할수 있는냐? 라고 하면 끝나는 문제에요...즉 뉴런과 같지 않다는 뜻이지요...


게다가 각각의 변수는 사람들이 설정해야 하지요...


간단하게 Youtube에서 지금 동영상을 보고 싶은 것을 어떤 변수에 의해서 결정되는냐? 라고 묻는다면 여러분은 변수를 몇개를 말할수 있나요? 그 누구도 정확하게 말할수 없지요. 그 만큼 정확도가 떨어지는 것이에요.


게다가 이 세상의 많은 문제들은 변수들을 정확히 아는 문제보다 모르는 문제가 더 많아요...게다가 그런 인공지능 방식으로 우리를 평가한뒤 차별하는 경우까지 시도하는데, 그런 인공지능은 폐기 수준이지요...그런 것을 이용하는 기업...인공지능을 이용해서 면접본다는 기업이 있는데 망할거에요...


② 빅데이터의 결함


그 다음 단계는 변수들의 상관관계를 알기 위해서 빅데이터를 통해서 수식을 완성시키는 단계에요...


빅데이터를 활용할때 관련된 부분의 값은 또다시 사람들이 분류하는 것이 일반적이지요...


그것을 이용해서 자동으로 수식이 나오게 하는 것인데, 빅데이터가 얼마만큼 있어야 그것을 확신할수 있는 값으로 볼수 있을까요?


일부 데이터는 중복되기도 하지요...이러한 과정에서 빅데이터의 값들은 사람들이 정하기 마련인데 이 과정에서 작업량은 일정 수준의 정확도를 만들기 위해서 다른 방식으로 하는 경우보다 많아질수도 있어요...이런 방식을 쓰는 이유는 작업량 때문일 가능성이 높은데 작업량이 크게 낮다라고 말할수 없으며, 그럼에도 정확도도 높지 않지요...


수 많은 사람들이 아직도 Youtube에서 추천과 비추천을 보고 누르고 안누른 값들을 아마도 Youtube는 수집하고 있고 적용할거에요...이때 분류는 우리가 해주는 것이지요...사람이 하는 것이에요...그럼에도 정확도는 아직도 바닥을 헤매고 있는데, 다른 문제는 얼마나 빅데이터를 수집해야 하겠어요? 차라리 다른 방법 쓰겟지요...


③ 수식은 정확한 것일까?


구글이 인간의 뉴런과 같다고 하는 방식은 너무 우습게도 행정학이나 사회학에서 쓰는 의사결정 나무분석(Decision tree Analysis)이에요...


이 방식은 미래를 예측하는 방식으로 쓰이기는 하나 정확도가 높은 방식은 아니에요...미래를 예측하는 많은 방식중에 하나일 뿐이지요..이것을 프로그래밍 하면 어떻게 될까요?


그래요...그것이 빅데이터로 학습하는 인공지능이에요..이것이 안되는 것은 너무 당연한 것이지요...


이것은 사회학이나 행정학에서 인과관계적 예측방식인데, 이런 것에는 회귀분석, 선형계획, PERT, 대기행렬이론, 모의실험, 이론지도작성, 게임이론, 의사결정나무방식등이 있어요...그런데 인공지능에서 계획 수립 인공지능은 여기서 PERT이용한 것이에요...대단한 것이 아니라는 것이지요...하지만 PERT는 성공했어도 의사결정나무방식으로 모든 것을 하겠다는 것은 대단히 무모한 도전이라는 것이지요...의사결정나무방식으로 되는 것만 빅데이터로 학습하는 인공지능도 되는거에요...그리고 그 범위는 너무 좁지요...PERT가 계획 수립만 되는것처럼 말이지요...


그런데 구글이 인간과 같다고 속여서 그 뒤에 엄청난 일이 일어났는데, 그것이 뉴런과 같다고 속였거든요...구글이 처음 속인것은 아니고 그것을 그렇게 발표당한일이 있었지요...단지 의사결정나무분석인데 말이지요...그래서 그것을 뉴런이라고 생각하고 별의 별 변형방식이 다 생겼어요...물런 그 변형방식은 갈수록 뉴런과 달라지고 있다는 것이 우습지만요 >_<;;; 그런데 그것 자체가 이미 뉴런이 아니라 의사결정나무분석이라는것을 알면 얼마나 황당하겠어요?


이와 같아요...이것은 정확도가 낮은 인공지능 방식이고 폐기될 것이에요...될수 있는 것도 별로 없고요...물런 정확도가 낮은 상태에서 가능한 범위라면 어느정도 쓰일수도 있으나 정확도가 높아야 하는 것들에서는 불가능하다고 말해도 될 상황이고, 시험공부 열심히 해야 하지요...그런 일은 일어나지 않아요. 오히려 다른 방식으로는 100% 정확도를 만들수 있는 방식은 인공지능 분야에서 많고 빅데이터오 쓰지 않아요...역시나 인간과 같은 방식으로 하지 않으며, 저역시 빅데이터를 이용하는 방식이 생각나면 폐기할 수준의 아이디어라서 그냥 블로그에 공개한적이 있지요 >_<;;; 물런 그것은 시즌 2 블로그에서 그랬긴 했는데....


그래요...이것이 현실이에요...인공지능은 여러분을 속이기 위해서...여러분이 책이나 영화등에서 봤던 문과생들이 잘못 예측한 것에 기대어, 기업들이 여러분을 속이기 위함이고 실상은 빅데이터라는 말 뒤에 숨어있는 우리의 사생활 침해이지요...이것을 되찾아 올날을 기다리면 되지요...지금 바둑 이후 2년쯤 지났나요? 바뀐것이 없다 수준이지요...사람들이 끝까지 속진 않을것 아니에요? 될만한 것도 없고, 빅데이터를 사용하지 않는 인공지능으로 하지 않는한 이 상황은 지속되고 사람들이 속았다라고 생각하는 사람들이 늘어날 것이에요...벌써 이미 많은 사람들이 속았다라는 것을 인지하고 있는듯 하고요...


Youtube 추천이 안맞는것! 당연한 것이에요...구글 방식은 추천을 할수 없는 수준의 방식인거죠..빅데이터로 학습하는 인공지능은 폐기될 것이란 것이죠.




맨위로
통합 검색어 입력폼