Получить схему таблицы в Redshift

Здравствуйте я пытаюсь получить схему существующей таблицы. Я разработчик mysql и пытаюсь работать с amazon redshift. Как экспортировать схему существующей таблицы. В mysql мы можем использовать команду show create table.

SHOW CREATE TABLE tblName;

9 ответов


Если вы хотите получить структуру таблицы с помощью инструкции create, ограничений и триггеров, вы можете использовать утилиту pg_dump

pg_dump -U user_name -s -t table_name -d db_name
Note: -s used for schema only dump
if you want to take the data only dump , you can use -a switch.

это выведет синтаксис create со всеми ограничениями. Надеюсь, это поможет вам.


этот запрос даст вам полное определение схемы, включая тип/ключ распределения атрибутов Redshift, ключ сортировки, первичный ключ и кодировки столбцов в виде инструкции create, а также предоставляет инструкцию alter table, которая устанавливает владельца текущему владельцу. Единственное, что он не может сказать вам, это внешние ключи. Я работаю над последним, но есть текущая проблема привилегий в RS, которая мешает нам запрашивать правильные таблицы. Этот запрос может использовать некоторые настройка, но у меня не было времени или необходимости работать дальше.

select pk.pkey, tm.schemaname||'.'||tm.tablename, 'create table '||tm.schemaname||'.'||tm.tablename
||' ('
||cp.coldef
-- primary key
||decode(pk.pkey,null,'',pk.pkey)
-- diststyle and dist key
||decode(d.distkey,null,') diststyle '||dist_style||' ',d.distkey)
--sort key 
|| (select decode(skey,null,'',skey) from  (select 
' sortkey(' ||substr(array_to_string(
                 array( select ','||cast(column_name as varchar(100))  as str from
                       (select column_name from information_schema.columns col where  col.table_schema= tm.schemaname and col.table_name=tm.tablename) c2
                        join 
                        (-- gives sort cols
                          select attrelid as tableid, attname as colname, attsortkeyord as sort_col_order from pg_attribute pa where 
                          pa.attnum > 0  AND NOT pa.attisdropped AND pa.attsortkeyord > 0
                        ) st on tm.tableid=st.tableid and c2.column_name=st.colname   order by sort_col_order
                      )
                ,'')
              ,2,10000) || ')' as skey
))
||';'
-- additional alter table queries here to set owner
|| 'alter table '||tm.schemaname||'.'||tm.tablename||' owner to "'||tm.owner||'";'   
from 
-- t  master table list
(
SELECT substring(n.nspname,1,100) as schemaname, substring(c.relname,1,100) as tablename, c.oid as tableid ,use2.usename as owner, decode(c.reldiststyle,0,'EVEN',1,'KEY',8,'ALL') as dist_style
FROM pg_namespace n, pg_class c,  pg_user use2 
WHERE n.oid = c.relnamespace 
AND nspname NOT IN ('pg_catalog', 'pg_toast', 'information_schema')
AND c.relname <> 'temp_staging_tables_1'
and c.relowner = use2.usesysid
) tm 
-- cp  creates the col params for the create string
join
(select 
substr(str,(charindex('QQQ',str)+3),(charindex('ZZZ',str))-(charindex('QQQ',str)+3)) as tableid
,substr(replace(replace(str,'ZZZ',''),'QQQ'||substr(str,(charindex('QQQ',str)+3),(charindex('ZZZ',str))-(charindex('QQQ',str)+3)),''),2,10000) as coldef
from
( select array_to_string(array(
SELECT  'QQQ'||cast(t.tableid as varchar(10))||'ZZZ'|| ','||column_name||' '|| decode(udt_name,'bpchar','char',udt_name) || decode(character_maximum_length,null,'', '('||cast(character_maximum_length as varchar(9))||')'   )
-- default
|| decode(substr(column_default,2,8),'identity','',null,'',' default '||column_default||' ')
-- nullable
|| decode(is_nullable,'YES',' NULL ','NO',' NOT NULL ') 
-- identity 
|| decode(substr(column_default,2,8),'identity',' identity('||substr(column_default,(charindex('''',column_default)+1), (length(column_default)-charindex('''',reverse(column_default))-charindex('''',column_default)   ) )  ||') ', '')
-- encoding
|| decode(enc,'none','',' encode '||enc)
 as str 
from  
-- ci  all the col info
(
select cast(t.tableid as int), cast(table_schema as varchar(100)), cast(table_name as varchar(100)), cast(column_name as varchar(100)), 
cast(ordinal_position as int), cast(column_default as varchar(100)), cast(is_nullable as varchar(20)) , cast(udt_name as varchar(50))  ,cast(character_maximum_length as int),
 sort_col_order  , decode(d.colname,null,0,1) dist_key , e.enc
from 
(select * from information_schema.columns c where  c.table_schema= t.schemaname and c.table_name=t.tablename) c
left join 
(-- gives sort cols
select attrelid as tableid, attname as colname, attsortkeyord as sort_col_order from pg_attribute a where 
 a.attnum > 0  AND NOT a.attisdropped AND a.attsortkeyord > 0
) s on t.tableid=s.tableid and c.column_name=s.colname
left join 
(-- gives encoding
select attrelid as tableid, attname as colname, format_encoding(a.attencodingtype::integer) AS enc from pg_attribute a where 
 a.attnum > 0  AND NOT a.attisdropped 
) e on t.tableid=e.tableid and c.column_name=e.colname
left join 
-- gives dist col
(select attrelid as tableid, attname as colname from pg_attribute a where
 a.attnum > 0 AND NOT a.attisdropped  AND a.attisdistkey = 't'
) d on t.tableid=d.tableid and c.column_name=d.colname
order by ordinal_position
) ci 
-- for the working array funct
), '') as str
from 
(-- need tableid
 SELECT substring(n.nspname,1,100) as schemaname, substring(c.relname,1,100) as tablename, c.oid as tableid 
 FROM pg_namespace n, pg_class c
 WHERE n.oid = c.relnamespace 
 AND nspname NOT IN ('pg_catalog', 'pg_toast', 'information_schema')
 ) t 
)) cp on tm.tableid=cp.tableid
-- primary key query here
left join 
(select c.oid as tableid, ', primary key '|| substring(pg_get_indexdef(indexrelid),charindex('(',pg_get_indexdef(indexrelid))-1 ,60) as pkey
 from pg_index i , pg_namespace n, pg_class c 
 where i.indisprimary=true 
 and i.indrelid =c.oid
 and n.oid = c.relnamespace
)  pk on tm.tableid=pk.tableid
-- dist key
left join
(  select 
-- close off the col defs after the primary key 
')' ||
' distkey('|| cast(column_name as varchar(100)) ||')'  as distkey, t.tableid
from information_schema.columns c
join 
(-- need tableid
SELECT substring(n.nspname,1,100) as schemaname, substring(c.relname,1,100) as tablename, c.oid as tableid 
FROM pg_namespace n, pg_class c
WHERE n.oid = c.relnamespace 
AND nspname NOT IN ('pg_catalog', 'pg_toast', 'information_schema')
) t on c.table_schema= t.schemaname and c.table_name=t.tablename
join 
-- gives dist col
(select attrelid as tableid, attname as colname from pg_attribute a where
a.attnum > 0 AND NOT a.attisdropped  AND a.attisdistkey = 't'
) d on t.tableid=d.tableid and c.column_name=d.colname

) d on tm.tableid=d.tableid 
where tm.schemaname||'.'||tm.tablename='myschema.mytable'

недавно я написал скрипт python для клонирования схем таблиц между кластерами redshift. Если вам нужны только столбцы и типы столбцов таблицы, вы можете сделать это через:

select column_name,
  case
    when data_type = 'integer' then 'integer'
    when data_type = 'bigint' then 'bigint'
    when data_type = 'smallint' then 'smallint'
    when data_type = 'text' then 'text'
    when data_type = 'date' then 'date'
    when data_type = 'real' then 'real'
    when data_type = 'boolean' then 'boolean'
    when data_type = 'double precision' then 'float8'
    when data_type = 'timestamp without time zone' then 'timestamp'
    when data_type = 'character' then 'char('||character_maximum_length||')'
    when data_type = 'character varying' then 'varchar('||character_maximum_length||')'
    when data_type = 'numeric' then 'numeric('||numeric_precision||','||numeric_scale||')'
    else 'unknown'
  end as data_type,
  is_nullable,
  column_default
 from information_schema.columns
 where table_schema = 'xxx' and table_name = 'xxx' order by ordinal_position
;

но если вам нужны типы сжатия и distkey / sortkeys, вам нужно запросить другую таблицу:

select * from pg_table_def where tablename = 'xxx' and schemaname='xxx';

Я не нашел там никаких полных решений. И написал скрипт python:

https://github.com/cxmcc/redshift_show_create_table

Он будет работать как pg_dump, плюс работа с основными функциями redshift, SORTKEY / DISTKEY/DISTSTYLES и т. д.


в Postgres вы бы запросили каталог.

С psql используйте сокращения для различных команд, список которых вы получите с помощью \? (для справки). Поэтому любой из них:--6-->

\d yourtable
\d+ yourtable

для использования в приложении вам необходимо изучить соответствующие запросы. Это относительно просто, запустив psql -E (для скрытых запросов echo) вместо plain psql.

Если вам нужен точный оператор create table, см. ответ @Anant.


вам нужно получить его программно или из приглашения psql?

в psql используйте: \d+ tablename

программно вы можете запросить стандартные представления INFORMATION_SCHEMA ANSI, задокументированные здесь:

http://www.postgresql.org/docs/9.1/static/information-schema.html

представление information_schema.Таблицы и INFORMATION_SCHEMA.Представления столбцов должны иметь то, что вам нужно.


как показать таблицу не работает на Redshift:

show table <YOUR_TABLE>;
ERROR: syntax error at or near "<YOUR_TABLE>"

мы можем использовать таблицу pg_table_def, чтобы получить схему:

select "column", type, encoding, distkey, sortkey, "notnull" 
from pg_table_def
where tablename = '<YOUR_TABLE>';

примечание: если схема не находится на пути поиска, добавьте ее в путь поиска с помощью:

set search_path to '$user', 'public', '<YOUR_SCHEMA>';

один из простых способов сделать это-использовать утилиту, предоставляемую AWS. Все, что вам нужно сделать, это создать представление в базе данных, а затем запросить это представление, чтобы получить любую таблицу ddl. Преимущество использования этого представления заключается в том, что оно даст вам sortkey и distkey, которые использовались в оригинальной команде create table.

https://github.com/awslabs/amazon-redshift-utils/blob/master/src/AdminViews/v_generate_tbl_ddl.sql

после создания представления, чтобы получить ddl любой таблицы. Вам нужно запросить вот так -

select ddl from table where tablename='table_name' and schemaname='schemaname';

Примечание: схема администратора может быть еще не существует в кластере. Таким образом, вы можете создать это представление в public schema.


команда ниже будет работать:

mysql > show create table test.users_info;

Redshift/postgress >pg_dump -U root-w --no-password -h 62.36.11.547 -p 5439  -s -t test.users_info ;