구글 페이지랭크 PR지수란 무엇인가?

[vc_row][vc_column width=”1/2″][vc_single_image border_color=”grey” img_link_target=”_self” image=”3181″ style=”vc_box_rounded” img_link_large=”yes” img_size=”full”][vc_column_text]

래리 페이지와 세르게이 브린

[/vc_column_text][/vc_column][vc_column width=”1/2″][vc_column_text]페이지랭크(PageRank)는 월드와이드웹과 같은 하이퍼링크 구조를 가지는 문서에 상대적 중요도에 따라 가중치를 부여하는 방법이다. 이 알고리즘은 서로간에 인용과 참조로 연결된 임의의 연결에 적용할 수 있다.

페이지랭크의 수식과 공식은 오늘날의 구글이 있게 했다.

페이지랭크는 스탠퍼드대학교에 재학 중이던 래리 페이지와 세르게이 브린이 새로운 검색 엔진에 대한 연구 기획의 일부로 개발한 것이다. 이 기획은 1995년 시작되어, 1998년 구글이라 불리는 시범 서비스로 발전하였다. 페이지와 브린은 페이지랭크에 기반한 검색 기술을 바탕으로 구글 사를 설립하였다.[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=”1/1″][vc_column_text]

PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

구글 페이지랭크 기본공식

[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=”1/1″][vc_column_text]알고리즘 내용설명

페이지 랭크는 더 중요한 페이지는 더 많은 다른 사이트로부터 링크를 받는다는 관찰에 기초하고 있다. 예를들어 페이지 A가 페이지 B,C,D 로 총 3개의 링크를 걸었다면 B는 A의 페이지 랭크 값의 1 / 3 만큼을 가져온다.

 

또한 페이지 랭크에서는 랜덤 서퍼(Random Sufer)라는 페이지를 임의로 방문하며 탐색하는 모델을 가정한다. 이 모델에서는 위 예의 A페이지를 방문한 서퍼는 A페이지를 보고 만족하여 탐색을 중단하거나, 혹은 A페이지에서 만족하지 못하여 다른 페이지를 방문할 것이다. 이러한 확률(Damping Factor)을 \alpha라 한다면, B페이지는  만큼 페이지 랭크를 받게 된다.

 

페이지 랭크는 이와 같은 방법을 통해 페이지간 페이지 랭크 값을 주고 받는 것을 반복 하다 보면, 전체 웹 페이지가 특정한 페이지 랭크 값을 수렴한다는 사실을 통해 각 페이지의 최종 페이지 랭크를 계산한다.(출처 wiki)[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=”1/2″][vc_column_text]쉽게 풀어 설명하자면
구글에서는 모든 홈페이지 및 웹페이지에 PR지수의 점수를 부여하고  PR점수의 고저 에 따라 해당문서의 신뢰도 및 유용성을 판단하는 기준으로 삼는다고 생각하면 된다..즉 PR지수 8은 PR지수 5보다 신뢰 할 수 있고 유용하다고 보는 것이다. 초기의 단순한 링크의 개수를 새던 알고리즘 방식에서 더욱 발전하여 다양한 알고리즘이 추가 되어 PR지수가 결정 된다..[/vc_column_text][/vc_column][vc_column width=”1/2″][vc_column_text css_animation=”bottom-to-top”]PR지수 는 왜 중요한가?

인터넷에는 문서와.페이지,이미지들이 데이터 형태로 어마어마한 형태로 쌓여 있고 정보이용자는  그 안에서 원하는 형태의 데이터를 찾으려고 시도 한다 그 대표적인 창구가 검색엔진인데 그 검색엔진에는 앞에서 말한 것과 같이 검색의 결과 중 어떤 결과물을 상위페이지로 출력 할 것인지를 결정할 때 PR지수에 의해 영향을 받을 수 있다..

유사한 문서들이 검색결과에 나올 경우 PR지수가 높은 페이지가 결과적으로 조금 더 상위결과로 출력 될 수 있다[/vc_column_text][/vc_column][/vc_row]