Декартовое произведение произвольных множеств в Java
знаете ли вы некоторые аккуратные Java-библиотеки, которые позволяют сделать декартовое произведение из двух (или более) наборов?
например: у меня есть три комплекта. Один с объектами класса Person, второй с объектами класса Gift и третий с объектами класса GiftExtension.
Я хочу создать один набор, содержащий все возможные тройки Person-Gift-GiftExtension.
количество наборов может отличаться, поэтому я не могу сделать это во вложенном цикле foreach. При некоторых условиях мой приложение должно сделать продукт пары человек-подарок, иногда это тройной человек-подарок-GiftExtension, иногда могут даже быть наборы человек-подарок-GiftExtension-GiftSecondExtension-GiftThirdExtension и т. д.
9 ответов
Edit: предыдущие решения для двух наборов удалены. Посмотреть историю изменений для деталей.
вот способ сделать это рекурсивно для произвольного числа множеств:
public static Set<Set<Object>> cartesianProduct(Set<?>... sets) {
if (sets.length < 2)
throw new IllegalArgumentException(
"Can't have a product of fewer than two sets (got " +
sets.length + ")");
return _cartesianProduct(0, sets);
}
private static Set<Set<Object>> _cartesianProduct(int index, Set<?>... sets) {
Set<Set<Object>> ret = new HashSet<Set<Object>>();
if (index == sets.length) {
ret.add(new HashSet<Object>());
} else {
for (Object obj : sets[index]) {
for (Set<Object> set : _cartesianProduct(index+1, sets)) {
set.add(obj);
ret.add(set);
}
}
}
return ret;
}
обратите внимание, что невозможно сохранить какую-либо общую информацию типа с возвращаемыми наборами. Если бы вы заранее знали, сколько наборов вы хотите взять продукт, вы могли бы определить общий Кортеж для хранения этого количества элементов (например,Triple<A, B, C>
), но нет возможности имеют произвольное количество общих параметров в Java.
Это довольно старый вопрос, но почему бы не использовать cartesianProduct гуавы?
метод ниже создает декартовое произведение списка списка строк:
protected <T> List<List<T>> cartesianProduct(List<List<T>> lists) {
List<List<T>> resultLists = new ArrayList<List<T>>();
if (lists.size() == 0) {
resultLists.add(new ArrayList<T>());
return resultLists;
} else {
List<T> firstList = lists.get(0);
List<List<T>> remainingLists = cartesianProduct(lists.subList(1, lists.size()));
for (T condition : firstList) {
for (List<T> remainingList : remainingLists) {
ArrayList<T> resultList = new ArrayList<T>();
resultList.add(condition);
resultList.addAll(remainingList);
resultLists.add(resultList);
}
}
}
return resultLists;
}
пример:
System.out.println(cartesianProduct(Arrays.asList(Arrays.asList("Apple", "Banana"), Arrays.asList("Red", "Green", "Blue"))));
даст это:
[[Apple, Red], [Apple, Green], [Apple, Blue], [Banana, Red], [Banana, Green], [Banana, Blue]]
количество наборов может отличаться, поэтому я не удается сделать это во вложенном цикле foreach.
две подсказки:
- A x B x C = A x (B x C)
- рекурсия
работа с индексами является альтернативой, которая является быстрой и эффективной для памяти и может обрабатывать любое количество наборов. Реализация Iterable позволяет легко использовать в цикле for-each. См. пример использования метода #main.
public class CartesianProduct implements Iterable<int[]>, Iterator<int[]> {
private final int[] _lengths;
private final int[] _indices;
private boolean _hasNext = true;
public CartesianProduct(int[] lengths) {
_lengths = lengths;
_indices = new int[lengths.length];
}
public boolean hasNext() {
return _hasNext;
}
public int[] next() {
int[] result = Arrays.copyOf(_indices, _indices.length);
for (int i = _indices.length - 1; i >= 0; i--) {
if (_indices[i] == _lengths[i] - 1) {
_indices[i] = 0;
if (i == 0) {
_hasNext = false;
}
} else {
_indices[i]++;
break;
}
}
return result;
}
public Iterator<int[]> iterator() {
return this;
}
public void remove() {
throw new UnsupportedOperationException();
}
/**
* Usage example. Prints out
*
* <pre>
* [0, 0, 0] a, NANOSECONDS, 1
* [0, 0, 1] a, NANOSECONDS, 2
* [0, 0, 2] a, NANOSECONDS, 3
* [0, 0, 3] a, NANOSECONDS, 4
* [0, 1, 0] a, MICROSECONDS, 1
* [0, 1, 1] a, MICROSECONDS, 2
* [0, 1, 2] a, MICROSECONDS, 3
* [0, 1, 3] a, MICROSECONDS, 4
* [0, 2, 0] a, MILLISECONDS, 1
* [0, 2, 1] a, MILLISECONDS, 2
* [0, 2, 2] a, MILLISECONDS, 3
* [0, 2, 3] a, MILLISECONDS, 4
* [0, 3, 0] a, SECONDS, 1
* [0, 3, 1] a, SECONDS, 2
* [0, 3, 2] a, SECONDS, 3
* [0, 3, 3] a, SECONDS, 4
* [0, 4, 0] a, MINUTES, 1
* [0, 4, 1] a, MINUTES, 2
* ...
* </pre>
*/
public static void main(String[] args) {
String[] list1 = { "a", "b", "c", };
TimeUnit[] list2 = TimeUnit.values();
int[] list3 = new int[] { 1, 2, 3, 4 };
int[] lengths = new int[] { list1.length, list2.length, list3.length };
for (int[] indices : new CartesianProduct(lengths)) {
System.out.println(Arrays.toString(indices) //
+ " " + list1[indices[0]] //
+ ", " + list2[indices[1]] //
+ ", " + list3[indices[2]]);
}
}
}
вот Iterable, который позволяет использовать упрощенный for-loop:
import java.util.*;
// let's begin with the demo. Instead of Person and Gift,
// I use the well known char and int.
class CartesianIteratorTest {
public static void main (String[] args) {
List <Object> lc = Arrays.asList (new Object [] {'A', 'B', 'C', 'D'});
List <Object> lC = Arrays.asList (new Object [] {'a', 'b', 'c'});
List <Object> li = Arrays.asList (new Object [] {1, 2, 3, 4});
// sometimes, a generic solution like List <List <String>>
// might be possible to use - typically, a mixture of types is
// the common nominator
List <List <Object>> llo = new ArrayList <List <Object>> ();
llo.add (lc);
llo.add (lC);
llo.add (li);
// Preparing the List of Lists is some work, but then ...
CartesianIterable <Object> ci = new CartesianIterable <Object> (llo);
for (List <Object> lo: ci)
show (lo);
}
public static void show (List <Object> lo) {
System.out.print ("(");
for (Object o: lo)
System.out.print (o + ", ");
System.out.println (")");
}
}
как это делается? Нам нужен Iterable, чтобы использовать упрощенный for-loop, и итератор должен быть возвращен из Iterable. Мы возвращаем список объектов - это может быть набор вместо списка, но набор не имеет индексированного доступа, поэтому было бы немного сложнее реализовать его с помощью Set вместо List. Вместо общего решения Object был бы хорош для многих целей, но дженерики допускают больше ограничений.
class CartesianIterator <T> implements Iterator <List <T>> {
private final List <List <T>> lilio;
private int current = 0;
private final long last;
public CartesianIterator (final List <List <T>> llo) {
lilio = llo;
long product = 1L;
for (List <T> lio: lilio)
product *= lio.size ();
last = product;
}
public boolean hasNext () {
return current != last;
}
public List <T> next () {
++current;
return get (current - 1, lilio);
}
public void remove () {
++current;
}
private List<T> get (final int n, final List <List <T>> lili) {
switch (lili.size ())
{
case 0: return new ArrayList <T> (); // no break past return;
default: {
List <T> inner = lili.get (0);
List <T> lo = new ArrayList <T> ();
lo.add (inner.get (n % inner.size ()));
lo.addAll (get (n / inner.size (), lili.subList (1, lili.size ())));
return lo;
}
}
}
}
математическая работа выполняется в " get " -методе. Подумайте о 2 наборах из 10 элементов. У вас есть в общей сложности 100 комбинаций, перечисленных от 00, 01, 02, ... 10, ... до 99. Для 5 x 10 элементов 50, для 2 X 3 элементов 6 комбинаций. Модуль размера подсписка помогает выбрать один элемент для каждой итерации.
Iterable я наименее интересная вещь здесь:
class CartesianIterable <T> implements Iterable <List <T>> {
private List <List <T>> lilio;
public CartesianIterable (List <List <T>> llo) {
lilio = llo;
}
public Iterator <List <T>> iterator () {
return new CartesianIterator <T> (lilio);
}
}
реализовать Iterable, который позволяет для каждого вида цикла, мы должны реализовать iterator (), а для итератора мы должны реализовать hasNext (), next () и remove ().
результат:
(A, a, 1, )
(B, a, 1, )
(C, a, 1, )
(D, a, 1, )
(A, b, 1, )
(B, b, 1, )
(C, b, 1, )
(D, b, 1, )
...
(A, a, 2, )
...
(C, c, 4, )
(D, c, 4, )
объем памяти (и обработка), необходимый для Декартового продукта, может выйти из-под контроля довольно быстро. Наивная реализация может истощить память и занять много времени. Было бы неплохо знать операции, которые вы планируете выполнить в таком наборе, чтобы предложить стратегию реализации.
в любом случае, сделайте что-то вроде наборов.SetView в коллекциях google. Это набор, который получает поддержку других наборов по мере их добавления. Идея их проблема заключается в том, чтобы избежать вызова addAll. Идея код проблема, чтобы избежать NxMxK добавляет к набору.
коллекции Google можно найти здесь и упомянутый класс здесь
здесь Iterator
это дает декартовое произведение двумерного массива, где компоненты массивов представляют множества из вопроса (всегда можно преобразовать фактическое Set
для массивов):
public class CartesianIterator<T> implements Iterator<T[]> {
private final T[][] sets;
private final IntFunction<T[]> arrayConstructor;
private int count = 0;
private T[] next = null;
public CartesianIterator(T[][] sets, IntFunction<T[]> arrayConstructor) {
Objects.requireNonNull(sets);
Objects.requireNonNull(arrayConstructor);
this.sets = copySets(sets);
this.arrayConstructor = arrayConstructor;
}
private static <T> T[][] copySets(T[][] sets) {
// If any of the arrays are empty, then the entire iterator is empty.
// This prevents division by zero in `hasNext`.
for (T[] set : sets) {
if (set.length == 0) {
return Arrays.copyOf(sets, 0);
}
}
return sets.clone();
}
@Override
public boolean hasNext() {
if (next != null) {
return true;
}
int tmp = count;
T[] value = arrayConstructor.apply(sets.length);
for (int i = 0; i < value.length; i++) {
T[] set = sets[i];
int radix = set.length;
int index = tmp % radix;
value[i] = set[index];
tmp /= radix;
}
if (tmp != 0) {
// Overflow.
return false;
}
next = value;
count++;
return true;
}
@Override
public T[] next() {
if (!hasNext()) {
throw new NoSuchElementException();
}
T[] tmp = next;
next = null;
return tmp;
}
}
основная идея состоит в том, чтобы лечить count
как число multi-radix (цифра i
имеет свой собственный радиус, который равен длине i
'й "набор"). Всякий раз, когда мы должны решить next
(то есть, когда hasNext()
называется и next
и null
), мы раскладываем количество его цифр в этой системе счисления. Эти цифры используются в качестве индексов, из которых мы черпаем элементы из разных наборов.
пример использования:
String[] a = { "a", "b", "c"};
String[] b = { "X" };
String[] c = { "r", "s" };
String[][] abc = { a, b, c };
Iterable<String[]> it = () -> new CartesianIterator<>(abc, String[]::new);
for (String[] s : it) {
System.out.println(Arrays.toString(s));
}
выход:
[a, X, r]
[b, X, r]
[c, X, r]
[a, X, s]
[b, X, s]
[c, X, s]
Если вам не нравятся массивы, код тривиально конвертируется в использование коллекций.
я думаю, это более или менее похоже на ответ, данный "неизвестным пользователем", только без рекурсии и коллекций.