상세 컨텐츠

본문 제목

Microsoft's Plan B for Search

SNS

by nerdstory 2008. 7. 21. 01:25

본문

Moving past the Yahoo saga, the software giant is buying semantic search engine Powerset as a way of closing the gap with Google

                                                                       2008.07.01, Business Week

Microsoft가 Yahoo! 인수 시도 실패후 Google을 따라 잡기 위해 ‘Semantic web’  검색 엔진 개발업체 Powerset을 인수했다.

시맨틱 웹 기술은 검색하고자 하는 단어의 의미와 문맥 내의 단어가 갖는 의미를 이해하여 검색 결과를 보여준다. 이는 대형 검색 엔진이 검색 단어와 일치하는 웹 페이지 내용을 보여주는 것과 대조적이다.

MS는 7월 1일에 블로그를 통해서 “검색과 웹 페이지 내 단어에 대한 의미 이해가 인터넷에서 구현되도록 하여 검색의 새로운 장을 여는” Powerset의 비전과 뜻을 같이 한다고 밝혔다. MS가 Powerset 인수에 관심이 있다는 소식은 업계 블로그인 VentureBeat에 의해 6월 26일에 보도되었다. 이 기사에 따르면 인수가격은 1억달러가 넘는 것으로 추정된다. MS는 인수가격을 밝히지 않았다.

이번 인수로 인해 MS는 Google에 맞설 힘을 얻게 될 것이다. Powerset과 다른 시맨틱 검색 엔진은 일부 경우에 Google보다 나은 결과를 보여 준다. 건강이나 법률 등 비슷한 키워드를 포함한 웹 페이지가 많은 특정 카테고리의 문제에 대해 자세한 답을 원할 때, 이 검색 엔진들은 진가를 발휘한다. 시맨틱 검색 기술을 여행에 적용하는 Kango와 Powerset의 초창기 투자자인 Eric Tilenius는 “시맨틱 검색은 검색의 제 3단계를 실현한다”고 말했다.

또한 시맨틱 검색은 Google이 모방하기 쉬운 것이 아니다. Google과 MS 등 대형 검색 엔진은 이미 많은 웹 페이지를 탐색하고 분류하고 있다. 따라서 이들의 검색엔진은 매년 새롭게 개설되는 수백만 개의 웹 사이트를 분석하고, 이 사이트를 검색 결과에 포함시키는 데 초점을 맞추고 있다. 시맨틱 검색 기술을 도입하려면 대형 검색 엔진이 제로 베이스에서 다시 시작해야 한다. 즉, 웹 페이지 분석과 분류에 사용되는 근본적으로 다른 방법에 따라 모든 웹 페이지를 다시 탐색하고 분류해야 하는 것이다. 모든 웹을 탐색하기 위해 노력 중인 시맨틱 검색 엔진 Hakia의 CEO Riza Berkan는 “임시로 수정하는 작업은 불가능하다. 우리는 처음부터 시작하고 있으며, 그래야만 성공할 수 있다”고 언급했다.

"Best Shot"

우선 시맨틱 기술 자체를 개발하기가 쉽지 않다. Google이 시맨틱 검색 전문가를 고용했지만, 시맨틱 검색 엔진 기술은 약 10년 동안 개발되어 온 것이다. 하버드 경영대학원의 기술 및 전략 분야 교수인 Andrei Hagiu 는 “MS가 Powerset을 인수한 것은 당연한 결과이며 혁신적인 기술을 보유하기 위한 최선의 시도로서 Google을 능가하게 될 수도 있다”고 말했다.

물론 MS도 모든 웹 페이지를 재탐색 해야 할 지도 모른다. 하지만 Yahoo! 인수를 위해 지불할 용의가 있었던 460억달러보다 훨씬 적은 비용으로 모든 웹 페이지를 탐색하고 ‘읽는’ 데 필요한 서버 등 필수 장비에 투자할 수 있을 것이다. 또한 MS는 Google에 맞먹는 검색 결과를 제공하는 것을 기대하며 리스크와 비용을 감수할 준비가 되어 있다. (조사기관 Hitwise에 따르면 5월에 검색시장 점유율에서 Google이 70%인 반면, MS의 비중은 6% 이하였다)

MS와 Powerset은 다른 부분에서 상호보완적이다. MS는 Google처럼 모든 검색에 대해 답을 주는 하나의 단일 사이트를 구축하는 것이 아니라, 검색 엔진을 특정 카테고리로 분리했다. 예를 들어 비교 쇼핑 검색 엔진 Microsoft Live Cashback, 여행 검색엔진 Farecast, 건강 정보 검색 엔진 health.live.com 등이 있다. 현재 시맨틱 검색 엔진은 카테고리 검색에서 두각을 나타내고 있다. 적은 수의 웹 페이지를 자세히 탐색할 수 있기 때문이다. 전체 웹을 자세하게 탐색하는 것은 짧은 시간 내에 실행하기가 어렵다.

Powerset's Potential Problems

물론 Powerset이 완벽한 대안이 될 수는 없다. 시맨틱 검색에 필요한 프로세싱 능력과 시간이 가장 큰 단점이다. 마이크로프로세서가 한 페이지를 검색하는 데 최대 20초가 걸린다. 따라서 대부분의 시맨틱 검색 사이트는 웹 페이지의 일부만 탐색하고 있다. 현재 Powerset의 사이트는 Wikipedia의 정보만 탐색하고 있다. 또 다른 시맨틱 검색 엔진인 Cognition은 건강과 법률 관련 페이지만 탐색하고 있다. 따라서 수년 뒤에야 시맨틱 검색 엔진이 짧은 시간 내에 전체 웹을 탐색할 수 있을 것이다.

두 번째 문제는 Google에 맞서는 시맨틱 검색 엔진이 여러 개 존재한다는 점이다. Hakia는 모든 웹을 분류할 수 있는 검색 엔진을 개발하기 위해 2,100만달러의 자금을 마련하였으며, 언젠가는 Google의 경쟁자가 되는 것을 꿈꾸고 있다. Hakia의 CEO Berkan은 “우리가 대형 검색 엔진의 경쟁자가 될 것임을 약속한다. 5년 내에 검색 시장에 큰 변화가 있을 것이라고 확신한다”고 말했다.

물론 Google에 의해 인수되기를 바라는 검색 엔진도 있다. 이탈리아에 본사를 둔 Expert System은 시맨틱 검색 엔진 Cogito Focus를 개발했다. Expert System의 CEO Brooke Aker는 대형 검색 엔진이 뭉쳐야 시맨틱 기술을 빨리 보급할 수 있다고 생각한다. 그는 “통합이 가까워지고 있다고 본다. 우리에게는 Google같은 대형 서버가 없다”고 말했다.

Microsoft's Challenges

MS가 시맨틱 검색에 필요한 인프라를 구축하더라도, 수년간 씨름 해 온 두 가지 문제에 직면하게 될 것이다. 우선 첫 번째 문제는 멀티미디어이다. 시맨틱 검색은 동영상과 이미지를 인식할 수 있는 우수한 솔루션을 제공하지 않는다. 시맨틱 검색 기술은 동영상이나 이미지를 설명하는 데 사용되는 단어를 탐색할 수 있으나, 동영상의 사운드 트랙이나 이미지를 분석해서 설명이 정확한지 판단할 수는 없다. 현재 Google은 더 나은 기술을 개발하기 위해 노력 중이다. 지난 해 9월, Google은 스캔된 책의 페이지 등 이미지를 분석하기 위해 관련 분야 전문가를 영입했다.

두 번째 문제는 Google의 브랜드 파워다. ‘Google’은 ‘검색’과 동의어가 되었고, 사용자의 충성도가 높다. 검색 시장을 공략하기 위해 시맨틱 검색은 Google보다 더 뛰어나고 연관성이 높은 검색 결과를 제공한다는 명성을 쌓을 필요가 있다.

MS는 결의에 차 있다. MS의 CEO Steve Ballmer는 MS가 장기적인 비전을 가지고 검색 시장 경쟁에 임하고 있다고 여러 번 강조했다. 시장 내 입지를 넓히기 위한 Yahoo! 인수 시도가 무산된 MS가 대안을 실행에 옮길 때이다.

관련글 더보기