как конвертировать csv в таблицу в oracle
Как я могу сделать пакет, который возвращает результаты в формате таблицы при передаче значений в CSV.
select * from table(schema.mypackage.myfunction('one, two, three'))
должен возвратить
one
two
three
я попробовал что-то из спросить Тома но это работает только с типами sql.
Я использую oracle 11g. Есть что-то встроенное?
5 ответов
следующие работы вызвать его, как выберите * из таблицы (разделитель ('a,b,c, d'))
create or replace function splitter(p_str in varchar2) return sys.odcivarchar2list
is
v_tab sys.odcivarchar2list:=new sys.odcivarchar2list();
begin
with cte as (select level ind from dual
connect by
level <=regexp_count(p_str,',') +1
)
select regexp_substr(p_str,'[^,]+',1,ind)
bulk collect into v_tab
from cte;
return v_tab;
end;
/
увы, в 11г нам еще предстоит handroll наших собственных ПЛ/tokenizers SQL, используя SQL-типов. В 11gr2 Oracle дала нам агрегирующую функцию для объединения результатов в строку CSV, поэтому, возможно, в 12i они обеспечат обратную возможность.
Если вы не хотите создавать тип SQL, особенно Вы можете использовать встроенный SYS.DBMS_DEBUG_VC2COLL, как это:
create or replace function string_tokenizer
(p_string in varchar2
, p_separator in varchar2 := ',')
return sys.dbms_debug_vc2coll
is
return_value SYS.DBMS_DEBUG_VC2COLL;
pattern varchar2(250);
begin
pattern := '[^('''||p_separator||''')]+' ;
select trim(regexp_substr (p_string, pattern, 1, level)) token
bulk collect into return_value
from dual
where regexp_substr (p_string, pattern, 1, level) is not null
connect by regexp_instr (p_string, pattern, 1, level) > 0;
return return_value;
end string_tokenizer;
/
вот он в действии:
SQL> select * from table (string_tokenizer('one, two, three'))
2 /
COLUMN_VALUE
----------------------------------------------------------------
one
two
three
SQL>
подтверждение: этот код является вариантом некоторый код, который я нашел в блоге Танела Подера.
вот еще одно решение, использующее регулярное выражение matcher полностью в sql.
SELECT regexp_substr('one,two,three','[^,]+', 1, level) abc
FROM dual
CONNECT BY regexp_substr('one,two,three', '[^,]+', 1, level) IS NOT NULL
для оптимальной производительности лучше избегать использования иерархических (CONNECT BY) запросов в функции splitter.
следующая функция splitter работает намного лучше при применении к большим объемам данных
CREATE OR REPLACE FUNCTION row2col(p_clob_text IN VARCHAR2)
RETURN sys.dbms_debug_vc2coll PIPELINED
IS
next_new_line_indx PLS_INTEGER;
remaining_text VARCHAR2(20000);
next_piece_for_piping VARCHAR2(20000);
BEGIN
remaining_text := p_clob_text;
LOOP
next_new_line_indx := instr(remaining_text, ',');
next_piece_for_piping :=
CASE
WHEN next_new_line_indx <> 0 THEN
TRIM(SUBSTR(remaining_text, 1, next_new_line_indx-1))
ELSE
TRIM(SUBSTR(remaining_text, 1))
END;
remaining_text := SUBSTR(remaining_text, next_new_line_indx+1 );
PIPE ROW(next_piece_for_piping);
EXIT WHEN next_new_line_indx = 0 OR remaining_text IS NULL;
END LOOP;
RETURN;
END row2col;
/
эта разница в производительности может наблюдаться ниже (я использовал функцию splitter, как было указано ранее в этом обсуждении).
SQL> SET TIMING ON
SQL>
SQL> WITH SRC AS (
2 SELECT rownum||',a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z'||rownum txt
3 FROM DUAL
4 CONNECT BY LEVEL <=10000
5 )
6 SELECT NULL
7 FROM SRC, TABLE(SYSTEM.row2col(txt)) t
8 HAVING MAX(t.column_value) > 'zzz'
9 ;
no rows selected
Elapsed: 00:00:00.93
SQL>
SQL> WITH SRC AS (
2 SELECT rownum||',a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z'||rownum txt
3 FROM DUAL
4 CONNECT BY LEVEL <=10000
5 )
6 SELECT NULL
7 FROM SRC, TABLE(splitter(txt)) t
8 HAVING MAX(t.column_value) > 'zzz'
9 ;
no rows selected
Elapsed: 00:00:14.90
SQL>
SQL> SET TIMING OFF
SQL>
У меня нет 11G, установленного для игры, но есть операция PIVOT и UNPIVOT для преобразования столбцов в строки / строки в столбцы, что может быть хорошей отправной точкой.
http://www.oracle.com/technology/pub/articles/oracle-database-11g-top-features/11g-pivot.html
(фактически проведя некоторое дальнейшее исследование, это не выглядит подходящим для этого случая - он работает с фактическими строками / столбцами, но не наборами данных в столбец.)
существует также DBMS_UTILITY.comma_to_table и table_to_comma для преобразования списков CSV в таблицы pl/sql. Есть некоторые ограничения (транспортная обработка строк и т. д.), Но может быть хорошей отправной точкой.
Я склоняюсь к использованию подхода типа с простой функцией, которая делает comma_to_table, а затем строку канала для каждой записи в результате comma_to_table (к сожалению, DBMS_UTILITY.comma_to_table-это процедура, поэтому не может вызывать из SQL).