Как найти повторяющиеся значения в таблице в Oracle?

каков самый простой оператор SQL, который возвращает повторяющиеся значения для данного столбца и количество их вхождений в таблице базы данных Oracle?

например: у меня JOBS таблица со столбцом JOB_NUMBER. Как я могу узнать, есть ли у меня дубликат JOB_NUMBERS, и сколько раз они дублируются?

13 ответов


select column_name, count(column_name)
from table
group by column_name
having count (column_name) > 1;

иначе:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

работает нормально (достаточно быстро), когда есть индекс column_name. И это лучший способ удалить или обновить повторяющиеся строки.


самый простой, что я могу придумать:

select job_number, count(*)
from jobs
group by job_number
having count(*) > 1;

вам не нужно даже иметь счет в возвращаемых столбцов, если вам не нужно знать фактическое количество дубликатов. например,

SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1

Как насчет:

SELECT <column>, count(*)
FROM <table>
GROUP BY <column> HAVING COUNT(*) > 1;

чтобы ответить на приведенный выше пример, это будет выглядеть так:

SELECT job_number, count(*)
FROM jobs
GROUP BY job_number HAVING COUNT(*) > 1;

в случае, если несколько столбцов определяют уникальную строку (e.G таблица отношений ) там вы можете использовать следующие

использовать строку ID например, emp_dept(empid, deptid, startdate, enddate) предположим, что empid и deptid уникальны и идентифицируют строку в этом случае

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.rowid <> ied.rowid and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

и если такая таблица имеет первичный ключ, используйте первичный ключ вместо rowid, e.G id-это pk тогда

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.id <> ied.id and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

делаешь

select count(j1.job_number), j1.job_number, j1.id, j2.id
from   jobs j1 join jobs j2 on (j1.job_numer = j2.job_number)
where  j1.id != j2.id
group by j1.job_number

даст вам идентификаторы дублированных строк.


SELECT   SocialSecurity_Number, Count(*) no_of_rows
FROM     SocialSecurity 
GROUP BY SocialSecurity_Number
HAVING   Count(*) > 1
Order by Count(*) desc 

Я обычно использую Oracle Analytic функции функции row_number().

скажем, вы хотите проверить дубликаты, которые у вас есть относительно уникального индекса или первичного ключа, построенного на столбцах (c1, c2, c3). Тогда вы пойдете этим путем, воспитывая ROWID s строк, где количество строк, принесенных ROW_NUMBER() is >1:

Select * From Table_With_Duplicates
      Where Rowid In
                    (Select Rowid
                       From (Select Rowid,
                                    ROW_NUMBER() Over (
                                            Partition By c1 || c2 || c3
                                            Order By c1 || c2 || c3
                                        ) nbLines
                               From Table_With_Duplicates) t2
                      Where nbLines > 1)

вот запрос SQL для этого:

select column_name, count(1)
from table
group by column_name
having count (column_name) > 1;

Я знаю его старый поток, но это может помочь кому-то.

Если вам нужно напечатать другие столбцы таблицы при проверке на дублирование ниже:

select * from table where column_name in
(select ing.column_name from table ing group by ing.column_name having count(*) > 1)
order by column_name desc;

также при необходимости можно добавить некоторые дополнительные фильтры в предложение where.


1. решение

select * from emp
    where rowid not in
    (select max(rowid) from emp group by empno);

также вы можете попробовать что-то вроде этого, чтобы перечислить все повторяющиеся значения в таблице, скажем reqitem

SELECT count(poid) 
FROM poitem 
WHERE poid = 50 
AND rownum < any (SELECT count(*)  FROM poitem WHERE poid = 50) 
GROUP BY poid 
MINUS
SELECT count(poid) 
FROM poitem 
WHERE poid in (50)
GROUP BY poid 
HAVING count(poid) > 1;