SQL-запрос через промежуточную таблицу

даны следующие таблицы:

Recipes
| id | name
| 1  | 'chocolate cream pie'
| 2  | 'banana cream pie'
| 3  | 'chocolate banana surprise'

Ingredients
| id | name
| 1  | 'banana'
| 2  | 'cream'
| 3  | 'chocolate'

RecipeIngredients
| recipe_id | ingredient_id
|     1     |      2
|     1     |      3
|     2     |      1
|     2     |      2
|     3     |      1
|     3     |      3

Как построить SQL-запрос, чтобы найти рецепты, где ингредиенты.name = 'шоколад' и ингредиенты.имя = 'сливки'?

6 ответов


это называется реляционным делением. Обсуждаются различные техники здесь.

одна альтернатива еще не задана, двойник не существует

SELECT r.id, r.name
FROM Recipes r
WHERE NOT EXISTS (SELECT * FROM Ingredients i
                  WHERE name IN ('chocolate', 'cream')
                  AND NOT EXISTS
                      (SELECT * FROM RecipeIngredients ri
                       WHERE ri.recipe_id = r.id
                       AND ri.ingredient_id = i.id))

использование:

  SELECT r.name
    FROM RECIPES r
    JOIN RECIPEINGREDIENTS ri ON ri.recipe_id = r.id
    JOIN INGREDIENTS i ON i.id = ri.ingredient_id
                      AND i.name IN ('chocolate', 'cream')
GROUP BY r.name
  HAVING COUNT(DISTINCT i.name) = 2

ключевым моментом здесь является то, что количество должно равняться количеству имен ингредиентов. Если это не отдельный счетчик, есть риск ложных срабатываний из-за дубликатов.


если вы ищете несколько ассоциаций, то самый простой способ написать запрос-использовать несколько EXISTS условия вместо одной прямой JOIN.

SELECT r.id, r.name
FROM Recipes r
WHERE EXISTS
(
    SELECT 1
    FROM RecipeIngredients ri
    INNER JOIN Ingredients i
        ON i.id = ri.ingredient_id
    WHERE ri.recipe_id = r.id
    AND i.name = 'chocolate'
)
AND EXISTS
(
    SELECT 1
    FROM RecipeIngredients ri
    INNER JOIN Ingredients i
        ON i.id = ri.ingredient_id
    WHERE ri.recipe_id = r.id
    AND i.name = 'cream'
)

если вы точно знаете, что ассоциации уникальны (т. е. один рецепт может иметь только один экземпляр каждого ингредиента), то вы можете немного обмануть, используя подзапрос группировки с COUNT функция и, возможно, ускорить его (производительность будет зависеть от СУБД):

SELECT r.id, r.Name
FROM Recipes r
INNER JOIN RecipeIngredients ri
    ON ri.recipe_id = r.id
INNER JOIN Ingredients i
    ON i.id = ri.ingredient_id
WHERE i.name IN ('chocolate', 'cream')
GROUP BY r.id, r.Name
HAVING COUNT(*) = 2

или, если рецепт может иметь несколько экземпляров одного и того же ингредиент (без UNIQUE ограничение RecipeIngredients таблица ассоциаций), вы можете заменить последнюю строку на:

HAVING COUNT(DISTINCT i.name) = 2

select r.*
from Recipes r
inner join (
    select ri.recipe_id
    from RecipeIngredients ri 
    inner join Ingredients i on ri.ingredient_id = i.id
    where i.name in ('chocolate', 'cream')
    group by ri.recipe_id
    having count(distinct ri.ingredient_id) = 2
) rm on r.id = rm.recipe_id

SELECT DISTINCT r.id, r.name
FROM Recipes r
INNER JOIN RecipeIngredients ri ON
    ri.recipe_id = r.id
INNER JOIN Ingredients i ON
    i.id = ri.ingredient_id
WHERE
    i.name IN ( 'cream', 'chocolate' )

редактировать следующий комментарий, спасибо! Это правильный путь:

SELECT DISTINCT r.id, r.name
FROM Recipes r
INNER JOIN RecipeIngredients ri ON
    ri.recipe_id = r.id
INNER JOIN Ingredients i ON
    i.id = ri.ingredient_id AND
    i.name = 'cream'
INNER JOIN Ingredients i2 ON
    i2.id = ri.ingredient_id AND
    i2.name = 'chocolate'

иначе:

версия 2 (как хранимая процедура) пересмотрена

select   r.name
from   recipes r
where   r.id  = (select  t1.recipe_id
        from  RecipeIngredients t1 inner join
     RecipeIngredients     t2 on t1.recipe_id = t2.recipe_id
     and     t1.ingredient_id = @recipeId1
     and     t2.ingredient_id = @recipeId2)

редактирование 2: [прежде чем люди начнут кричать] :)

это может быть помещено в верхней части версии 2, что позволит запрашивать по имени, а не передавать идентификатор.

select @recipeId1 = recipe_id from Ingredients where name = @Ingredient1
select @recipeId2 = recipe_id from Ingredients where name = @Ingredient2

я протестировал версию 2, и она работает. Большинств потребители где соединять на таблице ингридиента, в этом случае совершенно не был необходим!

редактировать 3: (результаты испытаний);

когда эта хранимая процедура выполняется, это результаты.

результаты имеют формат (первый Recipe_id ; второй Recipe_id, результат)

1,1, Failed
1,2, 'banana cream pie'
1,3, 'chocolate banana surprise'
2,1, 'banana cream pie'
2,2, Failed
2,3, 'chocolate cream pie'
3,1, 'chocolate banana surprise'
3,2, 'chocolate cream pie'
3,3, Failed

очевидно, что этот запрос не обрабатывает случай, когда оба ограничения одинаковы, но работает для всех других случаев.

Edit 4: (обработка того же случая ограничения):

заменить эту строку:

r.id = (select t1...

в

r.id in (select t1...

работает с неудачными случаями, чтобы дать:

1,1, 'banana cream pie' and 'chocolate banana surprise'
2,2, 'chocolate cream pie' and 'banana cream pie'
3,3, 'chocolate cream pie' and 'chocolate banana surprise'