SQL: как получить все отдельные символы в столбце во всех строках
есть ли элегантный способ в SQL Server найти все отдельные символы в одном столбце varchar (50) во всех строках?
бонусные очки, если это можно сделать без курсоров :)
например, скажем, мои данные содержат 3 строки:
productname
-----------
product1
widget2
nicknack3
отдельный инвентарь символов будет "productwigenka123"
4 ответов
учитывая, что ваш столбец является varchar, это означает, что он может хранить только символы из кодов от 0 до 255, на любой кодовой странице. Если вы используете только диапазон кодов 32-128 ASCII, то вы можете просто увидеть, есть ли у вас какой-либо из символов 32-128, один за другим. Следующий запрос делает это, глядя в sys.предметы.имя:
with cteDigits as (
select 0 as Number
union all select 1 as Number
union all select 2 as Number
union all select 3 as Number
union all select 4 as Number
union all select 5 as Number
union all select 6 as Number
union all select 7 as Number
union all select 8 as Number
union all select 9 as Number)
, cteNumbers as (
select U.Number + T.Number*10 + H.Number*100 as Number
from cteDigits U
cross join cteDigits T
cross join cteDigits H)
, cteChars as (
select CHAR(Number) as Char
from cteNumbers
where Number between 32 and 128)
select cteChars.Char as [*]
from cteChars
cross apply (
select top(1) *
from sys.objects
where CHARINDEX(cteChars.Char, name, 0) > 0) as o
for xml path('');
вот запрос, который возвращает каждый символ в отдельной строке вместе с количеством вхождений. Предполагая, что ваша таблица называется "продукты"
WITH ProductChars(aChar, remain) AS (
SELECT LEFT(productName,1), RIGHT(productName, LEN(productName)-1)
FROM Products WHERE LEN(productName)>0
UNION ALL
SELECT LEFT(remain,1), RIGHT(remain, LEN(remain)-1) FROM ProductChars
WHERE LEN(remain)>0
)
SELECT aChar, COUNT(*) FROM ProductChars
GROUP BY aChar
объединить их все в одну строку, (как указано в вопросе), изменение финала SELECT
to
SELECT aChar AS [text()] FROM
(SELECT DISTINCT aChar FROM ProductChars) base
FOR XML PATH('')
выше использует хороший хак, который я нашел здесь, который эмулирует GROUP_CONCAT
из MySQL.
первый уровень рекурсии развернут так, чтобы запрос не возвращал пустой строки в выходных данных.
используйте это (должно работать на любых РСУБД с поддержкой CTE):
select x.v into prod from (values('product1'),('widget2'),('nicknack3')) as x(v);
Тестовый Запрос:
with a as
(
select v, '' as x, 0 as n from prod
union all
select v, substring(v,n+1,1) as x, n+1 as n from a where n < len(v)
)
select v, x, n from a -- where n > 0
order by v, n
option (maxrecursion 0)
Окончательный Запрос:
with a as
(
select v, '' as x, 0 as n from prod
union all
select v, substring(v,n+1,1) as x, n+1 as n from a where n < len(v)
)
select distinct x from a where n > 0
order by x
option (maxrecursion 0)
Oracle версии:
with a(v,x,n) as
(
select v, '' as x, 0 as n from prod
union all
select v, substr(v,n+1,1) as x, n+1 as n from a where n < length(v)
)
select distinct x from a where n > 0
Если у вас есть числа или таблица подсчета, которая содержит последовательный список целых чисел, вы можете сделать что-то вроде:
Select Distinct '' + Substring(Products.ProductName, N.Value, 1)
From dbo.Numbers As N
Cross Join dbo.Products
Where N.Value <= Len(Products.ProductName)
For Xml Path('')
Если вы используете SQL Server 2005 и выше, вы можете создать таблицу чисел на лету, используя CTE:
With Numbers As
(
Select Row_Number() Over ( Order By c1.object_id ) As Value
From sys.columns As c1
Cross Join sys.columns As c2
)
Select Distinct '' + Substring(Products.ProductName, N.Value, 1)
From Numbers As N
Cross Join dbo.Products
Where N.Value <= Len(Products.ProductName)
For Xml Path('')