notepad++ проверьте наличие повторяющихся строк

пример

40000 + строк с guids, как это:

GUID: 0981723409871243

поиск по всем GUID для дубликатов

пример:

GUID: 124432408213
GUID: 08917234071423
GUID: 0189742381
GUID: 08917234071423
GUID: 0817423423
GUID: 124432408213

у меня есть TextFX и сравнить, но как бы я нашел эту часть есть 2 124432408213 и 2 08917234071423

из 40 000 строк с возможными дубликатами я не могу легко обнаружить их, мне нужен способ найти дубликаты.

это будет что-то вроде GUID:" поиск текста после guid " следующая строка затем продолжите поиск каждого GUID...Я мог бы написать пользовательскую программу, которая может это сделать, но...пытается избежать необходимости делать это TextFX довольно мощная, просто не вижу способа сделать что-то подобное...

Я должен добавить немного больше информации, вот например:

[блок1] guid:???? подробнее: ??? [/блок1]

так форматируется каждый блок..

2 ответов


используйте TextFx для сортировки входных строк и сохранения дубликатов. Затем выполните поиск регулярных выражений, установив Закладка Строку на Марк tab. Текст поиска должен быть ^(GUID:\s*\d+\r\n) затем нажмите пометить все**. Следующий меню => Поиск =>закладки =>удалить неотмеченные строки чтобы удалить все, кроме дубликатов, или использовать Menu =>Поиск =>закладки =>Копировать Строки С Закладками и вставьте строки, где требуется. Если есть четыре или более одинаковых линий, то выше может закончить с одной записью для каждой пары, другой TextFX сортировки удаления дубликатов должны удалить излишки.

на [block1] guid: ???? more info: ??? [/block1] case регулярное выражение более сложное, но ^(\[block1\] guid:\s*\d+ more info:\s*\d+ \[/block1\]\r\n) находит и помечает дубликаты в:

[block1] guid: 1234 more info: 5678 [/block1]
[block1] guid: 1235 more info: 5678 [/block1]
[block1] guid: 1235 more info: 5678 [/block1]
[block1] guid: 1236 more info: 5678 [/block1]
[block1] guid: 1236 more info: 5678 [/block1]

в Linux или аналогичной команде, такой как sort -c inputFileName | grep -v "^\s*1\s" или sort inputFileName | unic -c | grep -v "^\s*1\s" или sort inputFileName | uniq -d должны работать в зависимости от того, какие команды и параметры доступный.


хотя мой ответ может помочь вам сейчас... Скопируйте строки в 2 вкладки новостей, затем используйте TextFX для дублирования вкладки сортировки 1 и уникальной вкладки сортировки 2. Затем переместите вкладку 2 в другое представление, наконец, используйте сравнение.