В чем разница между функциями RANK() и DENSE RANK() в oracle?

в чем разница между RANK() и DENSE_RANK() функции? Как узнать nth salary в следующем emptbl таблицы?

DEPTNO  EMPNAME    SAL
------------------------------
10       rrr    10000.00
11       nnn    20000.00
11       mmm    5000.00
12       kkk    30000.00
10       fff    40000.00
10       ddd    40000.00
10       bbb    50000.00
10       ccc    50000.00

если в таблице данные, имеющие nulls что будет, если я хочу узнать nth зарплату?

7 ответов


ранг дает вам рейтинг в пределах вашего упорядоченного раздела. Галстукам присваивается тот же ранг, при этом следующий рейтинг(ы) пропускается. Итак, если у вас есть 3 предмета в ранге 2, следующий ранг будет ранжирован 5.

DENSE_RANK снова дает вам рейтинг в вашем упорядоченном разделе, но ряды последовательны. Никакие ранги не пропускаются, если есть ранги с несколькими элементами.

что касается нулей, это зависит от предложения ORDER BY. Вот простой тестовый сценарий, который вы можете играть С, чтобы увидеть, что происходит:

with q as (
select 10 deptno, 'rrr' empname, 10000.00 sal from dual union all
select 11, 'nnn', 20000.00 from dual union all
select 11, 'mmm', 5000.00 from dual union all
select 12, 'kkk', 30000 from dual union all
select 10, 'fff', 40000 from dual union all
select 10, 'ddd', 40000 from dual union all
select 10, 'bbb', 50000 from dual union all
select 10, 'xxx', null from dual union all
select 10, 'ccc', 50000 from dual)
select empname, deptno, sal
     , rank() over (partition by deptno order by sal nulls first) r
     , dense_rank() over (partition by deptno order by sal nulls first) dr1
     , dense_rank() over (partition by deptno order by sal nulls last) dr2
 from q; 

EMP     DEPTNO        SAL          R        DR1        DR2
--- ---------- ---------- ---------- ---------- ----------
xxx         10                     1          1          4
rrr         10      10000          2          2          1
fff         10      40000          3          3          2
ddd         10      40000          3          3          2
ccc         10      50000          5          4          3
bbb         10      50000          5          4          3
mmm         11       5000          1          1          1
nnn         11      20000          2          2          2
kkk         12      30000          1          1          1

9 rows selected.

вот ссылка к хорошему объяснению и некоторым примерам.


эта статья здесь прекрасно объясняет это. по сути, вы можете смотреть на это так:

CREATE TABLE t AS
SELECT 'a' v FROM dual UNION ALL
SELECT 'a'   FROM dual UNION ALL
SELECT 'a'   FROM dual UNION ALL
SELECT 'b'   FROM dual UNION ALL
SELECT 'c'   FROM dual UNION ALL
SELECT 'c'   FROM dual UNION ALL
SELECT 'd'   FROM dual UNION ALL
SELECT 'e'   FROM dual;

SELECT
  v,
  ROW_NUMBER() OVER (ORDER BY v) row_number,
  RANK()       OVER (ORDER BY v) rank,
  DENSE_RANK() OVER (ORDER BY v) dense_rank
FROM t
ORDER BY v;

вышеперечисленное даст:

+---+------------+------+------------+
| V | ROW_NUMBER | RANK | DENSE_RANK |
+---+------------+------+------------+
| a |          1 |    1 |          1 |
| a |          2 |    1 |          1 |
| a |          3 |    1 |          1 |
| b |          4 |    4 |          2 |
| c |          5 |    5 |          3 |
| c |          6 |    5 |          3 |
| d |          7 |    7 |          4 |
| e |          8 |    8 |          5 |
+---+------------+------+------------+

по словам

  • ROW_NUMBER() присваивает уникальное значение каждой строке
  • RANK() приписывает тот же номер строки тому же значению, оставляя "отверстия"
  • DENSE_RANK() приписывает тот же номер строки тому же значению, не оставляя никаких "отверстий"

SELECT empno,
       deptno,
       sal,
       RANK() OVER (PARTITION BY deptno ORDER BY sal) "rank"
FROM   emp;

     EMPNO     DEPTNO        SAL       rank
---------- ---------- ---------- ----------
      7934         10       1300          1
      7782         10       2450          2
      7839         10       5000          3
      7369         20        800          1
      7876         20       1100          2
      7566         20       2975          3
      7788         20       3000          4
      7902         20       3000          4
      7900         30        950          1
      7654         30       1250          2
      7521         30       1250          2
      7844         30       1500          4
      7499         30       1600          5
      7698         30       2850          6


SELECT empno,
       deptno,
       sal,
       DENSE_RANK() OVER (PARTITION BY deptno ORDER BY sal) "rank"
FROM   emp;

     EMPNO     DEPTNO        SAL       rank
---------- ---------- ---------- ----------
      7934         10       1300          1
      7782         10       2450          2
      7839         10       5000          3
      7369         20        800          1
      7876         20       1100          2
      7566         20       2975          3
      7788         20       3000          4
      7902         20       3000          4
      7900         30        950          1
      7654         30       1250          2
      7521         30       1250          2
      7844         30       1500          3
      7499         30       1600          4
      7698         30       2850          5

ранг(): используется для ранжирования записи в группе строк.

dense_rank () : функция DENSE_RANK действует как функция RANK, за исключением того, что она присваивает последовательные ранги.

запрос -

select 
    ENAME,SAL,RANK() over (order by SAL) RANK
from 
    EMP;

выход -

+--------+------+------+
| ENAME  | SAL  | RANK |
+--------+------+------+
| SMITH  |  800 |    1 |
| JAMES  |  950 |    2 |
| ADAMS  | 1100 |    3 |
| MARTIN | 1250 |    4 |
| WARD   | 1250 |    4 |
| TURNER | 1500 |    6 |
+--------+------+------+

запрос -

select 
    ENAME,SAL,dense_rank() over (order by SAL) DEN_RANK
from 
    EMP;

выход -

+--------+------+-----------+
| ENAME  | SAL  |  DEN_RANK |
+--------+------+-----------+
| SMITH  |  800 |         1 |
| JAMES  |  950 |         2 |
| ADAMS  | 1100 |         3 |
| MARTIN | 1250 |         4 |
| WARD   | 1250 |         4 |
| TURNER | 1500 |         5 |
+--------+------+-----------+

select empno
       ,salary
       ,row_number() over(order by salary desc) as Serial
       ,Rank() over(order by salary desc) as rank
       ,dense_rank() over(order by salary desc) as denseRank
from emp ;

Row_number() -> используется для генерации серийного номера

Dense_rank() даст непрерывный ранг, но ранг будет пропускать ранг в случае столкновения ранга.


единственная разница между функциями RANK() и DENSE_RANK() заключается в случаях, когда существует "связь"; т. е. в случаях, когда несколько значений в наборе имеют одинаковый рейтинг. В таких случаях RANK () будет присваивать не последовательные "ранги" значениям в наборе (что приводит к разрывам между целочисленными значениями ранжирования при наличии связи), тогда как DENSE_RANK() будет присваивать последовательные ранги значениям в наборе (таким образом, не будет разрывов между целочисленными значениями ранжирования в случае галстук.)

например, рассмотрим множество {25, 25, 50, 75, 75, 100}. Для такого набора RANK () вернется {1, 1, 3, 4, 4, 6} (Обратите внимание, что значения 2 и 5 пропущены), тогда как DENSE_RANK() вернет {1,1,2,3,3,4}.


Rank() функция SQL генерирует ранг данных в упорядоченном наборе значений, но следующий ранг после предыдущего ранга-row_number этой конкретной строки. С другой стороны, функция SQL Dense_Rank() генерирует следующее число вместо генерации row_number. Ниже приведен пример SQL, который прояснит концепцию:

Select ROW_NUMBER() over (order by Salary) as RowNum, Salary, 
RANK() over (order by Salary) as Rnk, 
DENSE_RANK() over (order by Salary) as DenseRnk from (
Select 1000 as Salary union all
Select 1000 as Salary union all
Select 1000 as Salary union all
Select 2000 as Salary union all
Select 3000 as Salary union all
Select 3000 as Salary union all
Select 8000 as Salary union all
Select 9000 as Salary) A

Он будет генерировать следующий вывод:

----------------------------
RowNum  Salary  Rnk DenseRnk
----------------------------
1       1000    1   1
2       1000    1   1
3       1000    1   1
4       2000    4   2
5       3000    5   3
6       3000    5   3
7       8000    7   4
8       9000    8   5