Разделенный запятыми значений столбцов в Oracle

у меня есть значения, возвращаемые с 255, разделенных запятыми. Есть ли простой способ разделить их на столбцы без наличия 255 substr?

ROW  | VAL
----------- 
1    | 1.25, 3.87, 2, ... 
2    | 5, 4, 3.3, ....

to

ROW | VAL | VAL | VAL ...
--------------------- 
1   |1.25 |3.87 | 2 ...     
2   | 5   | 4   | 3.3 ...

4 ответов


можно использовать regexp_substr():

select regexp_substr(val, '[^,]+', 1, 1) as val1, 
       regexp_substr(val, '[^,]+', 1, 2) as val2, 
       regexp_substr(val, '[^,]+', 1, 3) as val3, 
       . . .

Я бы предложил вам создать столбец из 255 чисел в Excel (или другой электронной таблице) и использовать электронную таблицу для создания кода SQL.


остерегайтесь! Выражение regexp_substr формата '[^,]+' не вернет ожидаемое значение, если в списке есть нулевой элемент, и вы хотите, чтобы этот элемент или один после него. Рассмотрим этот пример, где 4-й элемент равен NULL, и я хочу, чтобы 5-й элемент и, следовательно, ожидал, что " 5 " будет возвращен:

SQL> select regexp_substr('1,2,3,,5,6', '[^,]+', 1, 5) from dual;

R
-
6

сюрприз! Он возвращает 5-й ненулевой элемент, а не фактический 5-й элемент! Неверные данные возвращаются, и вы можете даже не поймать его. Попробовать это вместо этого:

SQL> select regexp_substr('1,2,3,,5,6', '(.*?)(,|$)', 1, 5, NULL, 1) from dual;

R
-
5

Итак, в приведенном выше исправленном REGEXP_SUBSTR говорится, что нужно искать 5-е вхождение 0 или более символов с разделителями-запятыми, за которыми следует запятая или конец строки (позволяет использовать следующий разделитель, будь то запятая или конец строки) и при обнаружении возвращать 1-ю подгруппу (данные, не включающие запятую или конец строки).

образец поиска '(.*?)(,|$)' пояснил:

(             = Start a group
.             = match any character
*             = 0 or more matches of the preceding character
?             = Match 0 or 1 occurrences of the preceding pattern
)             = End the 1st group
(             = Start a new group (also used for logical OR)
,             = comma
|             = OR
$             = End of the line
)             = End the 2nd group

EDIT: дополнительная информация добавлена и упрощена регулярное выражение.

см. Этот пост для получения дополнительной информации и предложения, чтобы инкапсулировать это в функцию для повторного использования: регулярное выражение для выбора n-го значения из списка, позволяющего nulls Это сообщение, где я обнаружил формат '[^,]+' есть проблема. К сожалению, это формат regex, который вы чаще всего увидите в качестве ответа на вопросы о том, как анализировать список. Я содрогаюсь при мысли о том, что все неверные данные возвращаются '[^,]+'!


если у вас есть только одна строка, и время, чтобы создать свой


select * from (
  select rownum r , collection.*  
    from TABLE(cto_table(',','1.25, 3.87, 2, 19,, 1, 9, ')) collection
)
PIVOT ( 
  LISTAGG(column_value) within group (order by 1) as val 
  for r in (1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
)

для справки: вот как создать cto_table функция:

CREATE OR REPLACE TYPE t_my_list AS TABLE OF VARCHAR2(100);
CREATE OR REPLACE
FUNCTION cto_table(p_sep in Varchar2, p_list IN VARCHAR2)
  RETURN t_my_list
AS
  l_string VARCHAR2(32767) := p_list || p_sep;
  l_sep_index PLS_INTEGER;
  l_index PLS_INTEGER := 1;
  l_tab t_my_list     := t_my_list();
BEGIN
  LOOP
    l_sep_index := INSTR(l_string, p_sep, l_index);
    EXIT
  WHEN l_sep_index = 0;
    l_tab.EXTEND;
    l_tab(l_tab.COUNT) := TRIM(SUBSTR(l_string,l_index,l_sep_index - l_index));
    l_index            := l_sep_index + 1;
  END LOOP;
  RETURN l_tab;
END cto_table;
/

можно использовать иерархический запрос. поворот можно сделать с помощью case и group by.

with value_t as
( 
  select row_t,row_number() OVER (partition by row_t order by rownum )rn,
  regexp_substr(val, '[^,]+', 1, LEVEL) val from Table1
CONNECT BY LEVEL <= regexp_count(val, '[^,]+') 
AND prior row_t = row_t 
AND prior sys_guid() is not null
  ) select row_t, max( case when rn = 1 THEN val end ) val_1,
  max( case when rn = 2 THEN val end ) val_2,
  max( case when rn = 3 THEN val end ) val_3
  from value_t
  group by row_t;