как найти членов, которые существуют по крайней мере в двух списках в списке списков
у меня есть массив списков:
var stringLists = new List<string>[]
{
new List<string>(){ "a", "b", "c" },
new List<string>(){ "d", "b", "c" },
new List<string>(){ "a", "d", "c" }
};
Я хочу извлечь все элементы, которые являются общими по крайней мере в 2 списках. Поэтому для этого примера я должен получить все элементы ["a", "b", "c", "d"]
. Я знаю, как найти элементы, общие для всех, но не мог придумать никакого способа решить эту проблему.
4 ответов
вы можете использовать что-то вроде этого:
var result = stringLists.SelectMany(l => l.Distinct())
.GroupBy(e => e)
.Where(g => g.Count() >= 2)
.Select(g => g.Key);
просто для удовольствия некоторые итеративные решения:
var seen = new HashSet<string>();
var current = new HashSet<string>();
var result = new HashSet<string>();
foreach (var list in stringLists)
{
foreach(var element in list)
if(current.Add(element) && !seen.Add(element))
result.Add(element);
current.Clear();
}
или:
var already_seen = new Dictionary<string, bool>();
foreach(var list in stringLists)
foreach(var element in list.Distinct())
already_seen[element] = already_seen.ContainsKey(element);
var result = already_seen.Where(kvp => kvp.Value).Select(kvp => kvp.Key);
или (вдохновленный Тим):
int tmp;
var items = new Dictionary<string,int>();
foreach(var str in stringLists.SelectMany(l => l.Distinct()))
{
items.TryGetValue(str, out tmp);
items[str] = tmp + 1;
}
var result = items.Where(kv => kv.Value >= 2).Select(kv => kv.Key);
вы могли бы использовать Dictionary<string, int>
, ключ-это строка, а значение-count:
Dictionary<string, int> itemCounts = new Dictionary<string,int>();
for(int i = 0; i < stringLists.Length; i++)
{
List<string> list = stringLists[i];
foreach(string str in list.Distinct())
{
if(itemCounts.ContainsKey(str))
itemCounts[str] += 1;
else
itemCounts.Add(str, 1);
}
}
var result = itemCounts.Where(kv => kv.Value >= 2);
я использую list.Distinct()
так как вы хотите только подсчитать случаи в разных списках.
по запросу, вот метод расширения, который вы можете повторно использовать с любым типом:
public static IEnumerable<T> GetItemsWhichOccurAtLeastIn<T>(this IEnumerable<IEnumerable<T>> seq, int minCount, IEqualityComparer<T> comparer = null)
{
if (comparer == null) comparer = EqualityComparer<T>.Default;
Dictionary<T, int> itemCounts = new Dictionary<T, int>(comparer);
foreach (IEnumerable<T> subSeq in seq)
{
foreach (T x in subSeq.Distinct(comparer))
{
if (itemCounts.ContainsKey(x))
itemCounts[x] += 1;
else
itemCounts.Add(x, 1);
}
}
foreach(var kv in itemCounts.Where(kv => kv.Value >= minCount))
yield return kv.Key;
}
использование просто:
string result = String.Join(",", stringLists.GetItemsWhichOccurAtLeastIn(2)); // a,b,c,d
выполните следующие действия:
- создать элемент словаря - > список индексов
- цикл по всем спискам
- для списка номер i: элемент foreach в списке: добавить i в список в словаре в позиции:
dictionary[element].Add(i)
(если еще нет) - подсчитайте, сколько списков в словаре имеют две записи
можно использовать SelectMany
чтобы сгладить список и затем выбрать все elemeents, которые возникают дважды или более:
var singleList = stringLists.SelectMany(p => p);
var results = singleList.Where(p => singleList.Count(q => p == q) >= 2).Distinct();