Jul 3, 2007

구글 페이지랭크 방식

구글은 소프트웨어와 하드웨어의 특별한 조합으로 이루어졌습니다. 최첨단의 검색 알고리즘과 수천대의 컴퓨터를 도입했기 때문에 대단히 빠른 속도가 가능합니다.

구글 검색의 핵심적인 요소는 페이지 순위(PageRank™) 라는 구글의 설립자 레리 페이지(Larry Page) 와 세르게이 브린(Sergey Brin)이 스탠포드 대학에서 개발한 시스템입니다. 구글의 수 많은 박사들이 구글의 모든 성능을 매일 향상시키고 있지만, 페이지 순위는 계속 구글에게 중심적인 역할을 하고 있습니다.

구글의 페이지 순위(PageRank)는 500변수와 20억의 용어가 있는 세밀한 공식을 사용하여 객관적인 웹 페이지 순위를 계산합니다. 이런 객관적인 순위를 구성하기 위해 구글은 인터넷의 광범위한 구조를 직접 이용합니다. 근본적으로, A라는 페이지에서 B라는 페이지로 연결하는 링크가 있으면, 구글은 그 링크를 일종의 투표로 봅니다. 많이 투표된 페이지는 구글에게 중요하게 보이며, 투표하는 페이지도 구글이 평가합니다. 구글이 “중요하다”고 평가한 페이지의 투표는 더욱 중요하게 평가되어서 투표대상의 페이지도 중요도가 높아집니다.

중요하고 고급인 사이트들은 높은 페이지 순위 점수를 받고, 구글이 검색을 할 때마다 그 점수를 기억 해 둡니다. 물론 결과의 페이지가 중요하다고 해서 검색에 관련성이 높은 것은 아닙니다. 그래서 구글은 페이지 순위와 함께 최첨단 텍스트 검색 기술을 도입해서 검색 하나하나에 관련된 결과를 보여드립니다.

검색어가 페이지에 몇 번 나타나는가를 살펴보는 것을 월등히 초월한, 그 페이지에 대한 (그리고 그 페이지에 링크하는 다른 페이지에 대한) 여러 가지의 전체적인 검사를 해서 검색에 관련성이 가장 높은 결과만 보여드립니다.

그리고 구글이 가장 관련성 높은 결과를 순위 높고, 빠르게 제공하기 때문입니다. 광대한 인터넷의 정보를 사용 가능하게 정리하려면 뛰어난 검색엔진이 필요합니다. 이런 검색엔진 없이는 구체적인 웹 사이트를 찾는 것이 거의 불가능 할 것입니다.

페이지 내용에 대한 변치 않는 요약과는 달리, 구글의 URL 내용은 페이지에서 직접 불러오기 때문에 매우 유용합니다. 더 이상 관계없는 페이지를 로드 하는데 시간을 낭비하실 필요가 없습니다. 구글은 수집한 웹 문서들을 저장합니다.

서버의 오류 때문에 접속을 못하실 경우를 대비해서 구글은 수많은 웹 문서들을 저장합니다. 저장된 페이지는 현재의 내용이 아닐 수 있지만 본래의 사이트보다 훨씬 빠르게 뜰 수 있다는 장점이 있습니다. 또한 구글 어스는 위성 사진을 실시간으로 보여주는 프로그램으로 전세계는 물론 국내에서도 많은 사랑을 받긴 하나 한국어로 변역된 프로그램이 아직 나오지 않아서 여려모로 불편을 주지만 많은 카페에서 메뉴얼을 보여주는것으로 그나마 해결이 되기는 합니다.

이런 장점들이 있음에도 한국에서는 점유율이 높지 않습니다. 네이버 등에서 밀리고 있죠. 앞으로 구글이 한국 시장에서 어떻게 그 점유율을 높여갈지 지켜 볼 일입니다.