diff для вывода только имен файлов

Я ищу, чтобы запустить команду Linux, которая будет рекурсивно сравнивать два каталога и выводить только имена файлов по-разному. Это включает в себя все, что присутствует в одном каталоге, а не в другом или наоборот, и текстовые различия.

6 ответов


со страницы diff man:

-q сообщить только, отличаются ли файлы, а не детали различий.
-r при сравнении каталогов рекурсивно сравните все найденные подкаталоги.

командной например:

diff -qr dir1 dir2

пример вывода (зависит от локали):

$ ls dir1 dir2
dir1:
same-file  different  only-1

dir2:
same-file  different  only-2
$ diff -qr dir1 dir2
Files dir1/different and dir2/different differ
Only in dir1: only-1
Only in dir2: only-2

вы также можете использовать rsync

rsync -rv --size-only --dry-run /my/source/ /my/dest/ > diff.out

Если вы хотите получить список файлов, которые находятся только в одном каталоге, а не в их подкаталогах и только их имена файлов:

diff -q /dir1 /dir2 | grep /dir1 | grep -E "^Only in*" | sed -n 's/[^:]*: //p'

Если вы хотите рекурсивно перечислить все файлы и каталоги, которые отличаются своими полными путями:

diff -rq /dir1 /dir2 | grep -E "^Only in /dir1*" | sed -n 's/://p' | awk '{print "/"}'

таким образом, вы можете применять различные команды для всех файлов.

например, я мог бы удалить все файлы и каталоги, но не директория dir2 в dir1:

diff -rq /dir1 /dir2 | grep -E "^Only in /dir1*" | sed -n 's/://p' | awk '{print "/"}' xargs -I {} rm -r {}

в моей системе linux, чтобы получить просто имена

diff -q /dir1 /dir2|cut -f2 -d' '

подход работает diff -qr old/ new/ есть один существенный недостаток: он может пропустить файлы во вновь созданных каталогах. Е. Г. в приведенном ниже примере файл data/pages/playground/playground.txt - это не выход diff -qr old/ new/ в то время как каталог data/pages/playground/ is (поиск детская площадка.txt в вашем браузере для быстрого сравнения). Я также опубликовал следующее решение на Unix & Linux Stack Exchange, но я также скопирую его здесь:

для создания списка новых или измененных файлов программно лучшее решение, которое я мог придумать, используя rsync, вроде и uniq:

(rsync -rcn --out-format="%n" old/ new/ && rsync -rcn --out-format="%n" new/ old/) | sort | uniq

позвольте мне объяснить на этом примере: мы хотим сравнить два выпуска dokuwiki, чтобы увидеть, какие файлы были изменены и какие из них были недавно созданы.

мы получаем смолы с wget и извлекаем их в каталоги old/ и new/:

wget http://download.dokuwiki.org/src/dokuwiki/dokuwiki-2014-09-29d.tgz
wget http://download.dokuwiki.org/src/dokuwiki/dokuwiki-2014-09-29.tgz
mkdir old && tar xzf dokuwiki-2014-09-29.tgz -C old --strip-components=1
mkdir new && tar xzf dokuwiki-2014-09-29d.tgz -C new --strip-components=1

запуск rsync один из способов может пропустить вновь созданный файлы как сравнение rsync и diff показывает здесь:

rsync -rcn --out-format="%n" old/ new/

дает следующий результат:

VERSION
doku.php
conf/mime.conf
inc/auth.php
inc/lang/no/lang.php
lib/plugins/acl/remote.php
lib/plugins/authplain/auth.php
lib/plugins/usermanager/admin.php

запуск rsync только в одном направлении пропускает вновь созданные файлы, а в другом - удаленные файлы, сравните вывод diff:

diff -qr old/ new/

дает следующий результат:

Files old/VERSION and new/VERSION differ
Files old/conf/mime.conf and new/conf/mime.conf differ
Only in new/data/pages: playground
Files old/doku.php and new/doku.php differ
Files old/inc/auth.php and new/inc/auth.php differ
Files old/inc/lang/no/lang.php and new/inc/lang/no/lang.php differ
Files old/lib/plugins/acl/remote.php and new/lib/plugins/acl/remote.php differ
Files old/lib/plugins/authplain/auth.php and new/lib/plugins/authplain/auth.php differ
Files old/lib/plugins/usermanager/admin.php and new/lib/plugins/usermanager/admin.php differ

запуск rsync в обоих направлениях и сортировка вывода для удаления дубликатов показывает, что каталог data/pages/playground/ и файл data/pages/playground/playground.txt изначально пропустил:

(rsync -rcn --out-format="%n" old/ new/ && rsync -rcn --out-format="%n" new/ old/) | sort | uniq

дает следующий результат:

VERSION
conf/mime.conf
data/pages/playground/
data/pages/playground/playground.txt
doku.php
inc/auth.php
inc/lang/no/lang.php
lib/plugins/acl/remote.php
lib/plugins/authplain/auth.php
lib/plugins/usermanager/admin.php

rsync запускается с аргументами тезисы:

  • -r для "рекурсии в каталоги",
  • -c также сравнить файлы одинакового размера и только "пропустить на основе контрольной суммы, а не mod-time & size",
  • -n "выполнить пробный запуск без изменений", и
  • --out-format="%n" в "выводить обновления в указанном формате", который здесь "%n " только для имени файла

вывод (список файлов) из rsync в обоих направлениях объединяется и сортируется с помощью sort, и этот отсортированный список затем конденсируется путем удаления всех дубликатов с uniq


rsync -rvc --delete --size-only --dry-run source dir target dir