순위

최종 수정 2026.03.25

순위(ranking)는 항목 집합 간의 관계로, 흔히 목록으로 기록되며, 임의의 두 항목에 대해 첫 번째 항목이 두 번째 항목보다 "순위가 높거나", "순위가 낮거나", "순위가 같은" 관계를 나타낸다.^3 수학에서 이는 객체의 약순서 또는 전예순서로 알려져 있다. 서로 다른 두 객체가 동일한 순위를 가질 수 있으므로, 이것이 반드시 객체의 전순서인 것은 아니다. 순위 자체는 전순서를 이룬다. 예를 들어, 재료는 경도에 따라 전예순서를 이루지만, 경도의 등급은 전순서를 이룬다. 두 항목의 순위가 같으면 동순위(타이)로 간주한다.

세부적인 측정값을 서수의 나열로 축소함으로써, 순위는 특정 기준에 따라 복잡한 정보를 평가할 수 있게 해준다. 예를 들어, 인터넷 검색 엔진은 찾은 페이지를 관련성 추정치에 따라 순위를 매길 수 있으며, 이를 통해 사용자가 원하는 페이지를 빠르게 선택할 수 있다.

순위를 통해 얻은 데이터의 분석에는 일반적으로 비모수 통계학이 필요하다.

동점 처리 전략

순위를 고유하게 부여하는 것이 항상 가능한 것은 아니다. 예를 들어, 경주나 대회에서 두 명(또는 그 이상)의 참가자가 순위에서 동점을 이룰 수 있다.[^4] 서수 측정을 계산할 때, 순위를 매기는 두 개(또는 그 이상)의 값이 동일할 수 있다. 이러한 경우, 아래의 순위 부여 전략 중 하나를 채택할 수 있다.

이러한 순위 전략을 구분하는 일반적인 약칭 방법은 네 개의 항목에 대해 생성되는 순위 번호로 나타내는 것인데, 첫 번째 항목이 두 번째와 세 번째 항목(서로 동일한 값) 앞에 위치하고, 이 둘은 모두 네 번째 항목 앞에 위치하는 경우이다.[^5] 이러한 이름들은 아래에도 제시되어 있다.

표준 경쟁 순위 ("1224" 순위)

경쟁 순위에서는 동일한 값을 가진 항목들이 같은 순위 번호를 받고, 그 다음 순위 번호에 공백이 생긴다. 이 공백에서 빠지는 순위 번호의 수는 동일한 값을 가진 항목의 수보다 하나 적다. 동등하게 표현하면, 각 항목의 순위 번호는 1에 자신보다 높은 순위의 항목 수를 더한 값이다. 이 순위 전략은 대회에서 자주 채택되는데, 두 명(또는 그 이상)의 경쟁자가 순위에서 동점인 경우에도 그 아래에 있는 모든 사람의 순위에 영향을 미치지 않기 때문이다 (즉, 정확히 한 명만 자신보다 높은 점수를 받았을 때만 2위가 되고, 정확히 두 명이 더 높은 점수를 받았을 때 3위가 되며, 정확히 세 명이 더 높은 점수를 받았을 때 4위가 되는 식이다).

따라서 A가 B와 C(서로 동일한 값) 앞에 위치하고, B와 C가 모두 D 앞에 위치한다면, A는 순위 번호 1("1위")을 받고, B는 순위 번호 2("공동 2위")를 받으며, C도 순위 번호 2("공동 2위")를 받고, D는 순위 번호 4("4위")를 받는다.

이 방법은 IBM SPSS[^1]에서 "Low"로, R 프로그래밍 언어[^2]에서 동점 처리 방법 중 "min"으로 불린다.

수정 경쟁 순위 ("1334" 순위)

때로는 경쟁 순위에서 동일 순위 항목 집합의 뒤가 아닌 앞에 순위 번호 공백을 두기도 한다 (표준 경쟁 순위에서처럼 뒤에 두는 것이 아니라). 이 공백에서 빠지는 순위 번호의 수는 동일한 값을 가진 항목의 수보다 하나 적은 것으로 동일하다. 동등하게 표현하면, 각 항목의 순위 번호는 자신과 동일하거나 그 위에 있는 항목의 수와 같다. 이 순위 방식은 경쟁자가 자신을 제외한 한 명만 더 높은 점수를 받았을 때만 2위가 되고, 두 명만 더 높은 점수를 받았을 때 3위가 되는 것을 보장한다.

따라서 A가 B와 C(서로 동일한 값) 앞에 위치하고, B와 C가 모두 D 앞에 위치한다면, A는 순위 번호 1("1위")을 받고, B는 순위 번호 3("공동 3위")을 받으며, C도 순위 번호 3("공동 3위")을 받고, D는 순위 번호 4("4위")를 받는다. 이 경우, 아무도 순위 번호 2("2위")를 받지 못하며 그 자리는 공백으로 남게 된다.

이 방법은 IBM SPSS[^1]에서 "High"로, R 프로그래밍 언어[^2]에서 동점 처리 방법 중 "max"로 불린다.

밀집 순위 ("1223" 순위)

밀집 순위에서는 동일한 값을 가진 항목들이 같은 순위 번호를 받고, 다음 항목들은 바로 이어지는 순위 번호를 받는다. 동등하게 표현하면, 각 항목의 순위 번호는 1에 순위 순서상 자신보다 위에 있는 고유한 항목의 수를 더한 값이다.

따라서 A가 B와 C(서로 동일한 값) 앞에 위치하고, B와 C가 모두 D 앞에 위치한다면, A는 순위 번호 1("1위")을 받고, B는 순위 번호 2("공동 2위")를 받으며, C도 순위 번호 2("공동 2위")를 받고, D는 순위 번호 3("3위")을 받는다.

이 방법은 IBM SPSS[^1]에서 "Sequential"로, R 프로그래밍 언어[^6]에서 동점 처리 방법 중 "dense"로 불린다.

서수 순위 ("1234" 순위)

서수 순위에서는 동일한 값을 가진 항목들을 포함하여 모든 항목이 고유한 서수 번호를 받는다. 동일한 값을 가진 항목들에 고유한 서수 번호를 부여하는 것은 무작위로 또는 임의로 할 수 있지만, 일반적으로 임의적이면서도 일관된 체계를 사용하는 것이 바람직한데, 이렇게 하면 순위를 여러 번 매겨도 안정적인 결과를 얻을 수 있기 때문이다. 임의적이면서도 일관된 체계의 예로는 다른 속성(예: 경쟁자 이름의 알파벳 순서)을 순위 순서에 포함시켜 두 항목이 정확히 일치하지 않도록 하는 것이 있다.

이 전략에서, A가 B와 C(서로 동일한 값) 앞에 위치하고, B와 C가 모두 D 앞에 위치한다면, A는 순위 번호 1("1위")을 받고 D는 순위 번호 4("4위")를 받으며, B가 순위 번호 2("2위")를 받고 C가 순위 번호 3("3위")을 받거나 C가 순위 번호 2("2위")를 받고 B가 순위 번호 3("3위")을 받는다.

컴퓨터 데이터 처리에서 서수 순위는 "행 번호 매기기"라고도 한다.

이 방법은 R 프로그래밍 언어[^2]에서 동점 처리 방법 중 "first", "last", "random" 메서드에 해당한다.

분수 순위 ("1 2.5 2.5 4" 순위)

동일한 값을 가진 항목들은 같은 순위 번호를 받는데, 이는 서수 순위에서 받았을 번호들의 평균이다. 동등하게 표현하면, 순위 번호는 1에 자신보다 높은 순위의 항목 수를 더하고, 자신과 동일한 항목 수의 절반을 더한 값이다. 이 전략은 순위 번호의 합이 서수 순위에서와 동일하다는 속성을 가진다. 이러한 이유로, 보르다 점수 계산과 통계적 검정(아래 참조)에서 사용된다.

따라서 A가 B와 C(서로 동일한 값) 앞에 위치하고, B와 C가 모두 D 앞에 위치한다면, A는 순위 번호 1("1위")을 받고, B와 C는 각각 순위 번호 2.5("공동 2위/3위"의 평균)를 받으며, D는 순위 번호 4("4위")를 받는다.

다음은 예시이다: 데이터 집합 1.0, 1.0, 2.0, 3.0, 3.0, 4.0, 5.0, 5.0, 5.0이 있다고 가정하자.

서수 순위는 1, 2, 3, 4, 5, 6, 7, 8, 9이다.

v = 1.0의 경우, 분수 순위는 서수 순위의 평균이다: (1 + 2) / 2 = 1.5. 마찬가지로, v = 5.0의 경우, 분수 순위는 (7 + 8 + 9) / 3 = 8.0이다.

따라서 분수 순위는: 1.5, 1.5, 3.0, 4.5, 4.5, 6.0, 8.0, 8.0, 8.0이다.

이 방법은 IBM SPSS[^1]에서 "Mean"으로, R 프로그래밍 언어[^2]에서 동점 처리 방법 중 "average"로 불린다.

통계

스포츠

교육

리그 테이블은 다양한 교육 기관의 학업 성과를 비교하는 데 사용된다. 대학 순위는 여러 요소의 조합에 따라 고등 교육 기관의 순서를 매긴다. 기관 전체뿐만 아니라 특정 프로그램, 학과, 단과대학도 순위가 매겨진다. 이러한 순위는 보통 잡지, 신문, 정부 및 학계에 의해 작성된다. 예를 들어, 영국 대학의 리그 테이블은 The Independent, The Sunday Times, The Times에 의해 매년 발표된다.[^7] 이러한 순위의 주된 목적은 다양한 기준에 근거하여 잠재적 지원자들에게 영국 대학에 관한 정보를 제공하는 것이다. 마찬가지로, 인도와 같은 국가에서도 리그 테이블이 개발되고 있으며, 유명 잡지인 Education World가 TheLearningPoint.net의 데이터를 기반으로 이를 발표하고 있다.

잉글랜드 학교의 순위가 광범위한 사회적 조건을 고려하지 못하는 경직된 기준에 따라 매겨져 실패하는 학교를 더욱 악화시킨다는 불만이 제기되고 있다. 이는 가장 적극적으로 참여하는 학부모들이 그러한 학교를 기피하게 되어, 결국 의욕이 없는 학부모의 자녀들만 해당 학교에 다니게 되기 때문이다.[^8]

비즈니스

비즈니스에서 리그 테이블은 특정 산업 내 사업 활동의 선두 주자를 나열하며, 수익, 이익 및 기타 관련 핵심 성과 지표(시장 점유율 및 고객 기대 충족도 등)를 기준으로 기업의 순위를 매겨 사람들이 중요한 데이터를 신속하게 분석할 수 있도록 한다.[^9]

응용

특정 지표에 기반한 순위 방법론은 정책 입안자와 국제기구가 각국의 사회경제적 맥락을 평가하기 위해 사용하는 가장 일반적인 체계 중 하나이다. 주요 사례로는 인간개발지수(유엔), 기업환경평가지수(세계은행), 부패인식지수(국제투명성기구), 경제자유지수(헤리티지 재단) 등이 있다. 예를 들어, 세계은행의 기업환경평가지수는 190개국의 기업 규제와 그 시행을 측정한다. 각국은 최종 순위를 산출하기 위해 종합되는 10개의 지표에 따라 순위가 매겨진다. 각 지표는 하위 지표로 구성되는데, 예를 들어 부동산 등기 지표는 토지 등록 시스템의 시간, 절차, 비용 및 품질을 측정하는 4개의 하위 지표로 구성된다. 이러한 종류의 순위는 점수 부여를 위한 주관적 기준에 기반한다. 때때로 채택된 매개변수가 경험적 관찰과 불일치를 일으킬 수 있으며, 따라서 이러한 기준의 적용으로부터 잠재적 편향과 역설이 발생할 수 있다.[^10]

기타 예시

  • 정치 분야에서 순위는 국가의 경제적, 사회적, 환경적, 거버넌스 성과를 비교하는 데 초점을 맞출 수 있다. 정치인 자체도 활동 범위에 따라 순위가 매겨지기도 한다.[^11]
  • 신용 등급과 관련하여, 증권의 순위는 발행 회사가 청산될 경우 해당 증권이 어디에 위치하는지, 즉 회사의 자본 구조에서의 선순위를 의미한다. 예를 들어, 자본 채권은 후순위 증권으로, 청산 시 선순위 채무보다 후순위에 놓인다. 다시 말해, 후순위 채무 보유자가 자금을 받기 전에 선순위 채무 보유자가 먼저 지급받게 된다.
  • 검색 엔진은 질의 의존적 방법과 질의 독립적 방법을 조합하여 사용자의 검색어에 대한 예상 관련성에 따라 웹 페이지의 순위를 매긴다. 질의 독립적 방법은 특정 검색어와의 일치 여부와 관계없이 페이지의 추정 중요도를 측정하려고 시도한다. 질의 독립적 순위는 보통 링크 분석에 기반하며, HITS 알고리즘, PageRank, TrustRank 등이 그 예이다.[^12] 질의 의존적 방법은 페이지의 중요도와 관계없이 특정 검색어와 페이지가 얼마나 일치하는지를 측정하려고 시도한다. 질의 의존적 순위는 보통 페이지 자체, URL, 또는 해당 페이지를 가리키는 앵커 텍스트에서 다양한 검색어의 일치 횟수와 위치를 고려하는 휴리스틱에 기반한다.
  • 웹계량학에서는 웹에서의 존재감(웹 페이지 수)과 이러한 콘텐츠의 영향력에 따라 기관의 순위를 매길 수 있으며, 세계 대학 웹계량학 순위가 그 예이다.
  • 비디오 게임에서 플레이어에게 순위가 부여될 수 있다. "랭크업"이란 다른 플레이어에 비해 더 높은 순위를 달성하는 것을 의미하며, 특히 플레이어의 기술에 의존하지 않는 전략을 사용하는 경우를 가리킨다.
  • TrueSkill 순위 시스템은 Microsoft Research에서 Xbox Live를 위해 개발한 기술 기반 순위 시스템이다.
  • 비블리오그램은 텍스트에서 일반 명사구의 순위를 매긴다.
  • 언어학에서 항목의 지위(보통 "하향 전이" 또는 "계층 이동"으로 알려진 과정을 통해)는 절에서 최상위 계층과의 관계를 나타낸다. 예를 들어, "I want to eat the cake you made today"라는 문장에서 "eat"은 최상위 계층에 있지만, "made"는 명사구 "the cake you made today"의 일부로서 하향 전이된다. 이 명사구는 마치 단일 명사처럼 기능하며(즉, I want to eat it), 따라서 그 안의 동사("made")는 "eat"과는 다른 계층에 놓인다.
  • 학술 저널은 때때로 영향력 지수, 즉 특정 저널의 논문을 인용한 이후 논문의 수에 따라 순위가 매겨진다.

같이 보기

  • 순서형 데이터
  • 백분위 순위
  • 평가 (동음이의)

외부 링크


Here is the translated Markdown:

참고 문헌

[^1]: 순위 사례: 동점

[^2]: rank 함수 - RDocumentation

[^4]: Sulich, Adam. 유럽연합 청년 노동 시장과 통합의 위기

[^5]: The Data School - Alteryx에서 그룹별 순위 매기기 - 파트 1 - 표준 경쟁, 밀집, 서수 순위

[^6]: R: 빠른 표본 순위

[^7]: 영국 대학 순위. (2024-06-05)

[^8]: Chris Roberts, Heavy Words Lightly Thrown: The Reason Behind Rhyme, Thorndike Press, 2006 ( ISBN 0-7862-8517-6 )

[^9]: Business Ranking Annual. Gale Research International, Limited. (2000년 10월)

[^10]: RIEDS, Italian Review of Economics Demography and Statistics. 세계은행 기업환경평가 프로젝트와 순위 기반 통계 방법: 시간 지표의 역설

[^11]: Tofallis, Chris. 국회의원의 다차원적 순위. (2022)

[^12]: Brin, Sergey. 대규모 하이퍼텍스트 웹 검색 엔진의 구조