как найти членов, которые существуют по крайней мере в двух списках в списке списков

у меня есть массив списков:

var stringLists = new List<string>[] 
{ 
    new List<string>(){ "a", "b", "c" },
    new List<string>(){ "d", "b", "c" },
    new List<string>(){ "a", "d", "c" }
};

Я хочу извлечь все элементы, которые являются общими по крайней мере в 2 списках. Поэтому для этого примера я должен получить все элементы ["a", "b", "c", "d"]. Я знаю, как найти элементы, общие для всех, но не мог придумать никакого способа решить эту проблему.

4 ответов


вы можете использовать что-то вроде этого:

var result = stringLists.SelectMany(l => l.Distinct())
                        .GroupBy(e => e)
                        .Where(g => g.Count() >= 2)
                        .Select(g => g.Key);

просто для удовольствия некоторые итеративные решения:

var seen = new HashSet<string>();
var current = new HashSet<string>();
var result = new HashSet<string>();
foreach (var list in stringLists)
{
    foreach(var element in list)
        if(current.Add(element) && !seen.Add(element))
            result.Add(element);

    current.Clear();
}

или:

var already_seen = new Dictionary<string, bool>();
foreach(var list in stringLists)
    foreach(var element in list.Distinct())
         already_seen[element] = already_seen.ContainsKey(element);

var result = already_seen.Where(kvp => kvp.Value).Select(kvp => kvp.Key);

или (вдохновленный Тим):

int tmp;
var items = new Dictionary<string,int>();

foreach(var str in stringLists.SelectMany(l => l.Distinct()))
{
    items.TryGetValue(str, out tmp);
    items[str] = tmp + 1;
}

var result = items.Where(kv => kv.Value >= 2).Select(kv => kv.Key);

вы могли бы использовать Dictionary<string, int>, ключ-это строка, а значение-count:

Dictionary<string, int> itemCounts = new Dictionary<string,int>();
for(int i = 0; i < stringLists.Length; i++)
{
    List<string> list = stringLists[i];
    foreach(string str in list.Distinct())
    {
        if(itemCounts.ContainsKey(str))
           itemCounts[str] += 1;
        else
            itemCounts.Add(str, 1);
    }
}
var result = itemCounts.Where(kv => kv.Value >= 2);

я использую list.Distinct() так как вы хотите только подсчитать случаи в разных списках.

по запросу, вот метод расширения, который вы можете повторно использовать с любым типом:

public static IEnumerable<T> GetItemsWhichOccurAtLeastIn<T>(this IEnumerable<IEnumerable<T>> seq, int minCount, IEqualityComparer<T> comparer = null)
{
    if (comparer == null) comparer = EqualityComparer<T>.Default;
    Dictionary<T, int> itemCounts = new Dictionary<T, int>(comparer);

    foreach (IEnumerable<T> subSeq in seq)
    {
        foreach (T x in subSeq.Distinct(comparer))
        {
            if (itemCounts.ContainsKey(x))
                itemCounts[x] += 1;
            else
                itemCounts.Add(x, 1);
        }
    }
    foreach(var kv in itemCounts.Where(kv => kv.Value >= minCount))
        yield return kv.Key;
}

использование просто:

string result = String.Join(",", stringLists.GetItemsWhichOccurAtLeastIn(2)); // a,b,c,d

выполните следующие действия:

  1. создать элемент словаря - > список индексов
  2. цикл по всем спискам
  3. для списка номер i: элемент foreach в списке: добавить i в список в словаре в позиции:dictionary[element].Add(i) (если еще нет)
  4. подсчитайте, сколько списков в словаре имеют две записи

можно использовать SelectMany чтобы сгладить список и затем выбрать все elemeents, которые возникают дважды или более:

var singleList = stringLists.SelectMany(p => p);
var results = singleList.Where(p => singleList.Count(q => p == q) >= 2).Distinct();