Рекурсивный и Count Grep

нужно искать каталоги с большим количеством подкаталогов для строки внутри файлов:

Я:

grep -c -r "string here" *

Как я могу подсчитать общее количество находок?

Как я могу выводить в файл только те файлы, по крайней мере один экземпляр?

6 ответов


это работает для меня (это возвращает общее количество строк здесь в каждом файле). Тем не менее, он не отображает общее для всех файлов поиска. Вот как вы можете получить его:

grep -c -r 'string' file > out && \
    awk -F : '{total += } END { print "Total:", total }' out

список будет в out и общая сумма будет отправлена в STDOUT.

вот вывод на Python2.5.4 дерево каталогов:

grep -c -r 'import' Python-2.5.4/ > out && \
    awk -F : '{total += } END { print "Total:", total }' out
Total: 11500

$ head out
Python-2.5.4/Python/import.c:155
Python-2.5.4/Python/thread.o:0
Python-2.5.4/Python/pyarena.c:0
Python-2.5.4/Python/getargs.c:0
Python-2.5.4/Python/thread_solaris.h:0
Python-2.5.4/Python/dup2.c:0
Python-2.5.4/Python/getplatform.c:0
Python-2.5.4/Python/frozenmain.c:0
Python-2.5.4/Python/pyfpe.c:0
Python-2.5.4/Python/getmtime.c:0

если вы просто хотите получить строки с вхождениями 'string', перейдите к следующему:

grep -c -r 'import' Python-2.5.4/ | \
    awk -F : '{total += ; print , } END { print "Total:", total }'

что будет вывод:

[... snipped]
Python-2.5.4/Lib/dis.py 4
Python-2.5.4/Lib/mhlib.py 10
Python-2.5.4/Lib/decimal.py 8
Python-2.5.4/Lib/new.py 6
Python-2.5.4/Lib/stringold.py 3
Total: 11500

вы можете изменить способ печати файлов ($1) и количество файлов ($2).


используя замену процесса Bash, это дает то,что я считаю, это результат, который вы хотите? (Пожалуйста, уточните вопрос, если это не так.)

grep -r "string here" * | tee >(wc -l)

Это grep -r обычно, с выходом, идущим как в stdout, так и в


некоторое решение с AWK:

grep -r "string here" * | awk 'END { print NR } 1'

следующий-общее количество, количество файлов и количество совпадений для каждого, отображая первое совпадение каждого из них (чтобы отобразить все совпадения, измените условие на ++f[]):

grep -r "string here" * | 
    awk -F: 'END { print "\nmatches: ", NR, "files: ", length(f); 
                   for (i in f) print i, f[i] } !f[]++'

выход для первого решения (поиск в Каталоге для "boost::". Я вручную вырезал слишком длинные строки, чтобы они подходили горизонтально):

list_inserter.hpp:            return range( boost::begin(r), boost::end(r) );
list_of.hpp:            ::boost::is_array<T>,
list_of.hpp:            ::boost::decay<const T>,
list_of.hpp:            ::boost::decay<T> >::type type;
list_of.hpp:        return ::boost::iterator_range_detail::equal( l, r );
list_of.hpp:        return ::boost::iterator_range_detail::less_than( l, r );
list_of.hpp:        return ::boost::iterator_range_detail::less_than( l, r );
list_of.hpp:        return Os << ::boost::make_iterator_range( r.begin(), r.end() );
list_of.hpp:            return range( boost::begin(r), boost::end(r) );
list_of.hpp:            return range( boost::begin(r), boost::end(r) );
list_of.hpp:            return range( boost::begin(r), boost::end(r) );
ptr_list_of.hpp:                          BOOST_DEDUCED_TYPENAME boost::ptr_...
ptr_list_of.hpp:        typedef boost::ptr_vector<T>       impl_type;
13

выход для второго

list_inserter.hpp:            return range( boost::begin(r), boost::end(r) );
list_of.hpp:            ::boost::is_array<T>,
ptr_list_of.hpp:                          BOOST_DEDUCED_TYPENAME boost::ptr_...

matches:  13 files:  3
ptr_list_of.hpp 2
list_of.hpp 10
list_inserter.hpp 1

цвета в результат хороший (--color=always для grep), но они ломаются, когда их пропускают через awk здесь. Так что лучше не включайте их, если вы не хотите, чтобы все ваши терминалы были окрашены впоследствии :) Ура!


Я бы попробовал комбинацию find и grep.

find . | xargs grep -c "string here"

в любом случае,grep -c -r "string here" * работает для меня (Mac OS X).


grep -rc "my string" ./ | grep :[1-9] >> file_name_by_count.txt

работает как шарм.


для вывода только имен файлов с совпадениями используйте:

grep -r -l "your string here" .

Он выведет одну строку с именем файла для каждого файла, который соответствует искомому выражению.