분류 'MIT' 에 대한 글: 1개

  1. 2010/06/15 페이스북(Facebook)으로 동성애자를 판별한다? (7)
과제 | 수업 :: 2010/06/15 14:48

사용자 삽입 이미지

2009년 가을
미국 MIT대 컴퓨터공학부에 재학 중인 학생들의 연구 프로젝트가 학내 윤리위원회에 회부됐다. 과연 어떤 연구였기에 학부생 프로젝트가 윤리위에까지 올라가서 진행 여부를 승인받아야 했을까?

카터 저니간(Jernigan)과 베람 미스트리(Mistree)란 두 학생은 수업 과제를 하던 도중에 '페이스북을 통해 이용자들의 성(性) 정체성을 찾아낼 수 있지 않을까'라는 아이디어를 떠올렸다. 페이스북 회원들 사이의 인맥 정보를 분석하면, 동성애자 여부를 명확히 밝히지 않은 회원에 대해서도 동성애자인지 이성애자인자를 파악할 수 있지 않을까 생각한 것이다.

하지만 대학 측은 성 정체성은 개인의 은밀한 프라이버시인 만큼 본인 동의 없이 제3자가 알아내려는 행위 자체가 법적으로 논란의 소지가 있다고 보고, 윤리위에서 이 문제를 결정키로 했다. 결국 두 학생은 연구에 사용된 데이터를 절대 공개하지 않겠다는 조건 하에 진행 승인을 받았다.

몇 달 뒤 이 프로젝트의 실험 결과가 발표되자 사람들은 경악했다. 무작위로 추출한 남성 중 게이 남성들을 놀라운 정확도로 판별해 낸 것이다.

사실 이 프로젝트의 주된 목적은 특정인의 성 정체성을 밝히려는 것 자체는 아니었다. 페이스북 회원이 공개하지 않은 정보도 인맥 정보 등을 통해 간접적으로 찾을 수 있음을 증명해 보이려는 것이 연구의 주된 의도였다.

두 학생은 먼저 페이스북에 공개된 개인 정보를 활용했다. 회원 가입 시 입력하는 인적 사항, 학력 등의 정보이다. 인맥 정보도 적극 활용했다. 세계 최대의 소셜네트워크 서비스인 페이스북은 프라이버시에 매우 개방적이어서 누구와 친구를 맺고 있는지와 같은 인맥 정보도 공개를 기본으로 하고 있다. 두 학생은 회원들 간의 인맥 관계를 철저히 분석했다. 가령 분석 대상인 100명의 남자 회원 중 2명이 게이임을 공개적으로 밝혔다면, 나머지 98명이 이들 2명과 어떤 형태의 인맥 링크를 구성하고 있는지를 따져보는 식이다. 아무래도 게이는 게이와 인맥을 맺을 확률이 높다는 데 착안한 것이다.

그러나 그렇게 단순하지만은 않다. 만약 A란 인물이 게이 2명과 인맥 링크가 없다고 해서 A가 게이가 아니라고 속단할 수 없다. 자신이 게이임을 공개하지 않은 게이들과 인맥을 형성할 수도 있기 때문이다.

이런 복잡한 상황을 분석하기 위해 두 학생은 숨은 데이터의 의미까지도 알아내는 '데이터 마이닝' 기법을 이용해 링크의 연관성을 수학적으로 분석해 냈다. 특히 구성원의 정보를 정확히 알고 있는 집단을 바탕으로 하나의 공식을 추출한 뒤, 그 공식을 구성원 정보를 정확히 알지 못하는 집단에 접목시키는 방식이 주로 이용됐다. 두 학생은 게이 여부를 확실히 공개한 1544명의 MIT 남학생(이 가운데 33명이 동성애자)들을 대상으로 게이인 남성과 게이가 아닌 남성이 어떤 형태의 인맥을 형성하는지 분석해 공식을 추출한 뒤, 이를 확대해 응용했다. 예를 들어 앞서 A란 인물의 페이스북 친구들과 비동성애자들과의 인맥 교류가 평균치에 비해 현저히 떨어질 경우 A는 게이일 가능성이 높다고 추정하는 식이다.

비상장주식 거래 전문업체 쉐어스포스트는 최근 페이스북의 시가총액을 약 200억달러로 평가했다. 페이스북 회원은 4억명을 넘고 회원당 평균 인맥 수는 130명이다. 이는 산술적으로 500억이 넘는 인맥 링크가 형성돼 있다는 의미다. 이 엄청난 링크야말로 다른 소셜미디어의 추종을 불허하는, 페이스북의 핵심 가치다.

링크 정보는 다양한 방법으로 이용될 수 있다. 예를 들어 신용카드 업체에서 고객의 구매 정보와 함께 고객의 페이스북 인맥을 함께 분석하면 지역별, 연령별, 계층별 세분화된 마케팅 전략을 세울 수 있다. 기업에서 신입 사원을 채용할 때 면접자의 페이스북 인맥 링크를 통해 다양한 개인 성향을 추측할 수도 있다. 더 나아가 정치 성향 분석 방법에 대해 학자들이 연구하고 있다.

하지만 페이스북은 앞서 보았듯 개인이 의도하지 않은 정보 공개도 결과적으로 가능하게 한다는 점에서 가시를 숨긴 장미와 같은 면도 있다.

[장영재 MIT 공학박사·마이크론테크놀로지 프로젝트 매니저
트위터 youngjaejang ]

이 글을 접하면서 느꼈다. 우리나라의 싸이월드. 얼마나 폭발적이었나?
우리나라 대학생들이 이를 두고 분석을 해봤다는 얘기는 못들었다.
물론 나도 못했지만, 학생들의 입장에서는 무한한 창의력을 바탕으로 충분히 도전을 할 수 있었던 부분이라는 생각이들면서 좀 아쉽기도 하다.
IT강국 대한민국. 신세대들이 넘지 못하는 문학적 열등감. 그로 인한 피해의식. 정말 보통 문제가 아니다.//

비공개 개인정보도 4억이라는 인맥을 통해 파악, 입증하면서 마케팅 등 다양한 활용 가능성도 있지만
정보침해 우려도 만만치 않겠다는 생각도 아우르며...//

Creative Commons License
Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-동일조건변경허락 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다. ::: 자유인.Form :::
2010/06/15 14:48 2010/06/15 14:48

:::트랙백 주소 : http://blog.jayuin.co.kr/trackback/191

  1. [컴덱스동향] MIT의 두 학생, 페이스북으로 \'동성애자\' 판별 에서 받음. 2010/06/15 14:52  삭제

    2009년 가을 미국 MIT대 컴퓨터공학부에 재학 중인 학생들의 연구 프로젝트가 학내 윤리위원회에 회부됐다. 과연 어떤 연구였기에 학부생 프로젝트가 윤리위에까지 올라가서 진행 여부를 승인받

:::댓글을 달아 주세요:::

  1. 미루마지 2010/06/15 15:05  수정/삭제  댓글쓰기

    흠 페이스북자료가 이렇게 분석될수도 있군요 좋은 정봅니다^^

    • 자유인 2010/06/16 01:16  수정/삭제

      방문/댓글 감사드립니다.^^
      앞으로 친하게(?) 지내요 ㅎㅎ

  2. lonelycat 2010/06/15 16:53  수정/삭제  댓글쓰기

    싸이월드로는 하고 싶어도 기술적으로 어렵죠.
    공개된 API가 없으니 일촌 파도타기를 일일이 직접 하면서 분석할 수도 없고..

    • 자유인 2010/06/15 21:25  수정/삭제

      잘못 알고 계신듯~
      페이스북과 거의 비슷한 시기에 'cyworld'도 오픈 API를 구현
      했답니다.

  3. Phoebe 2010/06/15 22:11  수정/삭제  댓글쓰기

    요새 믹시가 왜이리 말썽인지 속상해 죽것어요.
    믹시에서 수다 떨던게 그리웁고만 들어와지지도 않네요.ㅜ.ㅠ

    • 자유인 2010/06/15 23:18  수정/삭제

      믹시 말이 참 많죠~!!
      어서 정신을 챙겨야 할텐데요.
      오랜만에 들려주셔서 반갑습니다. 피비 뉘~임^^

  4. 자유의땅 2010/06/16 12:28  수정/삭제  댓글쓰기

    다시 공개하셨네요^^
    좋은 정보 감사합니다.

[로그인][오픈아이디란?]

Powerd by 자유인.Form | Author - 자유인: Will I Ever Be Free?
rss