SQL: как получить все отдельные символы в столбце во всех строках

есть ли элегантный способ в SQL Server найти все отдельные символы в одном столбце varchar (50) во всех строках?

бонусные очки, если это можно сделать без курсоров :)

например, скажем, мои данные содержат 3 строки:

productname
-----------
product1
widget2
nicknack3

отдельный инвентарь символов будет "productwigenka123"

4 ответов


учитывая, что ваш столбец является varchar, это означает, что он может хранить только символы из кодов от 0 до 255, на любой кодовой странице. Если вы используете только диапазон кодов 32-128 ASCII, то вы можете просто увидеть, есть ли у вас какой-либо из символов 32-128, один за другим. Следующий запрос делает это, глядя в sys.предметы.имя:

with cteDigits as (
    select 0 as Number
    union all select 1 as Number
    union all select 2 as Number
    union all select 3 as Number
    union all select 4 as Number
    union all select 5 as Number
    union all select 6 as Number
    union all select 7 as Number
    union all select 8 as Number
    union all select 9 as Number)
, cteNumbers as (
    select U.Number + T.Number*10 + H.Number*100 as Number
    from cteDigits U
    cross join cteDigits T
    cross join cteDigits H)
, cteChars as (
    select CHAR(Number) as Char
    from cteNumbers 
    where Number between 32 and 128)
select cteChars.Char as [*]
from cteChars
cross apply (
    select top(1) *
    from sys.objects
    where CHARINDEX(cteChars.Char, name, 0) > 0) as o
for xml path('');

вот запрос, который возвращает каждый символ в отдельной строке вместе с количеством вхождений. Предполагая, что ваша таблица называется "продукты"

WITH ProductChars(aChar, remain) AS (
   SELECT LEFT(productName,1), RIGHT(productName, LEN(productName)-1) 
      FROM Products WHERE LEN(productName)>0
   UNION ALL
   SELECT LEFT(remain,1), RIGHT(remain, LEN(remain)-1) FROM ProductChars
      WHERE LEN(remain)>0
)
SELECT aChar, COUNT(*) FROM ProductChars
GROUP BY aChar

объединить их все в одну строку, (как указано в вопросе), изменение финала SELECT to

SELECT aChar AS [text()] FROM
  (SELECT DISTINCT aChar FROM ProductChars) base
FOR XML PATH('')

выше использует хороший хак, который я нашел здесь, который эмулирует GROUP_CONCAT из MySQL.

первый уровень рекурсии развернут так, чтобы запрос не возвращал пустой строки в выходных данных.


используйте это (должно работать на любых РСУБД с поддержкой CTE):

select x.v into prod from (values('product1'),('widget2'),('nicknack3')) as x(v);

Тестовый Запрос:

with a as 
(
    select v, '' as x, 0 as n from prod 
    union all
    select v, substring(v,n+1,1) as x, n+1 as n from a where n < len(v)
)
select v, x, n from a -- where n > 0
order by v, n
option (maxrecursion 0)

Окончательный Запрос:

with a as 
(
    select v, '' as x, 0 as n from prod 
    union all
    select v, substring(v,n+1,1) as x, n+1 as n from a where n < len(v)
)
select distinct x from a where n > 0
order by x
option (maxrecursion 0)

Oracle версии:

with a(v,x,n) as 
(
    select v, '' as x, 0 as n from prod 
    union all
    select v, substr(v,n+1,1) as x, n+1 as n from a where n < length(v)
)
select distinct x from a where n > 0

Если у вас есть числа или таблица подсчета, которая содержит последовательный список целых чисел, вы можете сделать что-то вроде:

Select Distinct '' + Substring(Products.ProductName, N.Value, 1)
From dbo.Numbers As N
    Cross Join dbo.Products
Where N.Value <= Len(Products.ProductName)
For Xml Path('')

Если вы используете SQL Server 2005 и выше, вы можете создать таблицу чисел на лету, используя CTE:

With Numbers As
    (
    Select Row_Number() Over ( Order By c1.object_id ) As Value
    From sys.columns As c1
        Cross Join sys.columns As c2
    )
Select Distinct '' + Substring(Products.ProductName, N.Value, 1)
From Numbers As N
    Cross Join dbo.Products
Where N.Value <= Len(Products.ProductName)
For Xml Path('')