diff для вывода только имен файлов
Я ищу, чтобы запустить команду Linux, которая будет рекурсивно сравнивать два каталога и выводить только имена файлов по-разному. Это включает в себя все, что присутствует в одном каталоге, а не в другом или наоборот, и текстовые различия.
6 ответов
со страницы diff man:
-q
сообщить только, отличаются ли файлы, а не детали различий.-r
при сравнении каталогов рекурсивно сравните все найденные подкаталоги.
командной например:
diff -qr dir1 dir2
пример вывода (зависит от локали):
$ ls dir1 dir2
dir1:
same-file different only-1
dir2:
same-file different only-2
$ diff -qr dir1 dir2
Files dir1/different and dir2/different differ
Only in dir1: only-1
Only in dir2: only-2
Если вы хотите получить список файлов, которые находятся только в одном каталоге, а не в их подкаталогах и только их имена файлов:
diff -q /dir1 /dir2 | grep /dir1 | grep -E "^Only in*" | sed -n 's/[^:]*: //p'
Если вы хотите рекурсивно перечислить все файлы и каталоги, которые отличаются своими полными путями:
diff -rq /dir1 /dir2 | grep -E "^Only in /dir1*" | sed -n 's/://p' | awk '{print "/"}'
таким образом, вы можете применять различные команды для всех файлов.
например, я мог бы удалить все файлы и каталоги, но не директория dir2 в dir1:
diff -rq /dir1 /dir2 | grep -E "^Only in /dir1*" | sed -n 's/://p' | awk '{print "/"}' xargs -I {} rm -r {}
подход работает diff -qr old/ new/
есть один существенный недостаток: он может пропустить файлы во вновь созданных каталогах. Е. Г. в приведенном ниже примере файл data/pages/playground/playground.txt
- это не выход diff -qr old/ new/
в то время как каталог data/pages/playground/
is (поиск детская площадка.txt в вашем браузере для быстрого сравнения). Я также опубликовал следующее решение на Unix & Linux Stack Exchange, но я также скопирую его здесь:
для создания списка новых или измененных файлов программно лучшее решение, которое я мог придумать, используя rsync, вроде и uniq:
(rsync -rcn --out-format="%n" old/ new/ && rsync -rcn --out-format="%n" new/ old/) | sort | uniq
позвольте мне объяснить на этом примере: мы хотим сравнить два выпуска dokuwiki, чтобы увидеть, какие файлы были изменены и какие из них были недавно созданы.
мы получаем смолы с wget и извлекаем их в каталоги old/
и new/
:
wget http://download.dokuwiki.org/src/dokuwiki/dokuwiki-2014-09-29d.tgz
wget http://download.dokuwiki.org/src/dokuwiki/dokuwiki-2014-09-29.tgz
mkdir old && tar xzf dokuwiki-2014-09-29.tgz -C old --strip-components=1
mkdir new && tar xzf dokuwiki-2014-09-29d.tgz -C new --strip-components=1
запуск rsync один из способов может пропустить вновь созданный файлы как сравнение rsync и diff показывает здесь:
rsync -rcn --out-format="%n" old/ new/
дает следующий результат:
VERSION
doku.php
conf/mime.conf
inc/auth.php
inc/lang/no/lang.php
lib/plugins/acl/remote.php
lib/plugins/authplain/auth.php
lib/plugins/usermanager/admin.php
запуск rsync только в одном направлении пропускает вновь созданные файлы, а в другом - удаленные файлы, сравните вывод diff:
diff -qr old/ new/
дает следующий результат:
Files old/VERSION and new/VERSION differ
Files old/conf/mime.conf and new/conf/mime.conf differ
Only in new/data/pages: playground
Files old/doku.php and new/doku.php differ
Files old/inc/auth.php and new/inc/auth.php differ
Files old/inc/lang/no/lang.php and new/inc/lang/no/lang.php differ
Files old/lib/plugins/acl/remote.php and new/lib/plugins/acl/remote.php differ
Files old/lib/plugins/authplain/auth.php and new/lib/plugins/authplain/auth.php differ
Files old/lib/plugins/usermanager/admin.php and new/lib/plugins/usermanager/admin.php differ
запуск rsync в обоих направлениях и сортировка вывода для удаления дубликатов показывает, что каталог data/pages/playground/
и файл data/pages/playground/playground.txt
изначально пропустил:
(rsync -rcn --out-format="%n" old/ new/ && rsync -rcn --out-format="%n" new/ old/) | sort | uniq
дает следующий результат:
VERSION
conf/mime.conf
data/pages/playground/
data/pages/playground/playground.txt
doku.php
inc/auth.php
inc/lang/no/lang.php
lib/plugins/acl/remote.php
lib/plugins/authplain/auth.php
lib/plugins/usermanager/admin.php
rsync
запускается с аргументами тезисы:
-
-r
для "рекурсии в каталоги", -
-c
также сравнить файлы одинакового размера и только "пропустить на основе контрольной суммы, а не mod-time & size", -
-n
"выполнить пробный запуск без изменений", и -
--out-format="%n"
в "выводить обновления в указанном формате", который здесь "%n " только для имени файла
вывод (список файлов) из rsync
в обоих направлениях объединяется и сортируется с помощью sort
, и этот отсортированный список затем конденсируется путем удаления всех дубликатов с uniq