Как считать все строки кода в каталоге рекурсивно?
У нас есть приложение PHP и мы хотим подсчитать все строки кода под определенным каталогом и его подкаталогами. Нам не нужно игнорировать комментарии, так как мы просто пытаемся получить приблизительную идею.
wc -l *.php
Эта команда отлично работает в пределах заданного каталога, но игнорирует подкаталоги. Я думал, что это может сработать, но оно возвращается 74, что определенно не так...
find . -name '*.php' | wc -l
Какой правильный синтаксис для подачи во всех файлах?
Ответы
Ответ 1
Попробуйте:
find . -name '*.php' | xargs wc -l
Также может помочь инструмент SLOCCount.
Это даст точные исходные строки кода для любого
иерархия, на которую вы указываете, а также некоторые дополнительные характеристики.
Сортированный вывод: find . -name '*.php' | xargs wc -l | sort -nr
Ответ 2
Для другого однострочного:
( find ./ -name '*.php' -print0 | xargs -0 cat ) | wc -l
работает с именами с пробелами, выводит только одно число.
Ответ 3
Если использовать по-прежнему последнюю версию Bash (или ZSH), она намного проще:
wc -l **/*.php
В оболочке Bash для этого требуется установить параметр globstar
, в противном случае оператор **
glob не является рекурсивным. Чтобы включить этот параметр, выполните
shopt -s globstar
Чтобы сделать это постоянным, добавьте его в один из файлов инициализации (~/.bashrc
, ~/.bash_profile
и т.д.).
Ответ 4
Вы можете использовать утилиту cloc
которая создана именно для этой цели. Он сообщает каждому количество строк на каждом языке, а также количество комментариев и т.д. CLOC доступен в Linux, Mac и Windows.
Пример использования и вывода:
$ cloc --exclude-lang=DTD,Lua,make,Python .
2570 text files.
2200 unique files.
8654 files ignored.
http://cloc.sourceforge.net v 1.53 T=8.0 s (202.4 files/s, 99198.6 lines/s)
-------------------------------------------------------------------------------
Language files blank comment code
-------------------------------------------------------------------------------
Javascript 1506 77848 212000 366495
CSS 56 9671 20147 87695
HTML 51 1409 151 7480
XML 6 3088 1383 6222
-------------------------------------------------------------------------------
SUM: 1619 92016 233681 467892
-------------------------------------------------------------------------------
Ответ 5
В UNIX-подобных системах есть инструмент под названием cloc
, который предоставляет статистику кода.
Я запустил случайную директорию в нашей базе кода, в которой говорится:
59 text files.
56 unique files.
5 files ignored.
http://cloc.sourceforge.net v 1.53 T=0.5 s (108.0 files/s, 50180.0 lines/s)
-------------------------------------------------------------------------------
Language files blank comment code
-------------------------------------------------------------------------------
C 36 3060 1431 16359
C/C++ Header 16 689 393 3032
make 1 17 9 54
Teamcenter def 1 10 0 36
-------------------------------------------------------------------------------
SUM: 54 3776 1833 19481
-------------------------------------------------------------------------------
Ответ 6
Вы не указали, сколько там файлов или какой желаемый результат. Это то, что вы ищите:
find . -name '*.php' | xargs wc -l
Ответ 7
Еще один вариант :)
$ find . -name '*.php' | xargs cat | wc -l
Изменение: это даст общую сумму, а не файл за файлом.
Edit2: добавить .
после find
чтобы заставить его работать
Ответ 8
Удивительно, но нет ответа на основе find -exec
и awk
. Вот так:
find . -type f -exec wc -l {} \; | awk '{ SUM += $0} END { print SUM }'
Этот фрагмент находит все файлы (-type f
). Чтобы найти по расширению файла, используйте -name
:
find . -name '*.py' -exec wc -l '{}' \; | awk '{ SUM += $0; } END { print SUM; }'
Ответ 9
POSIX
В отличие от большинства других ответов здесь, они работают в любой системе POSIX, для любого количества файлов и с любыми именами файлов (кроме отмеченных).
Строки в каждом файле:
find . -name '*.php' -type f -exec wc -l {} \;
# faster, but includes total at end if there are multiple files
find . -name '*.php' -type f -exec wc -l {} +
Строки в каждом файле, отсортированные по пути к файлу
find . -name '*.php' -type f | sort | xargs -L1 wc -l
# for files with spaces or newlines, use the non-standard sort -z
find . -name '*.php' -type f -print0 | sort -z | xargs -0 -L1 wc -l
Строки в каждом файле, отсортированные по количеству строк по убыванию
find . -name '*.php' -type f -exec wc -l {} \; | sort -nr
# faster, but includes total at end if there are multiple files
find . -name '*.php' -type f -exec wc -l {} + | sort -nr
Всего строк во всех файлах
find . -name '*.php' -type f -exec cat {} + | wc -l
Ответ 10
Для подсчета строк кода в каталоге есть небольшой инструмент sloccount. Следует отметить, что он делает больше, чем вы хотите, поскольку он игнорирует пустые строки/комментарии, группирует результаты на язык программирования и вычисляет некоторые статистические данные.
Ответ 11
Более распространенный и простой, как для меня, предположим, что вам нужно подсчитывать файлы с разными расширениями имен (скажем, также нативными)
wc $(find . -type f | egrep "\.(h|c|cpp|php|cc)" )
Спасибо за отзыв, я исправил его.
Ответ 12
То, что вы хотите, это просто for
цикла:
total_count=0
for file in $(find . -name *.php -print)
do
count=$(wc -l $file)
let total_count+=count
done
echo "$total_count"
Ответ 13
только для источников:
wc `find`
для фильтрации, просто используйте grep
wc `find | grep .php$`
Ответ 14
Простое, быстрое, будет использовать все возможности поиска/фильтрации find
, не сработает, если слишком много файлов (переполнение числа аргументов), отлично работать с файлами со смешными символами в их имени, без используя xargs
, не запускает бесполезно большое количество внешних команд (благодаря +
для find
-exec
). Вот вы:
find . -name '*.php' -type f -exec cat -- {} + | wc -l
Ответ 15
Вы также можете попробовать CLOC (требуется Perl)
Ответ 16
Я знаю, что вопрос отмечен как bash, но кажется, что проблема, которую вы пытаетесь решить, также связана с PHP.
Себастьян Бергманн написал инструмент под названием PHPLOC, который делает то, что вы хотите, и, кроме того, дает вам обзор сложности проекта. Это пример его отчета:
Size
Lines of Code (LOC) 29047
Comment Lines of Code (CLOC) 14022 (48.27%)
Non-Comment Lines of Code (NCLOC) 15025 (51.73%)
Logical Lines of Code (LLOC) 3484 (11.99%)
Classes 3314 (95.12%)
Average Class Length 29
Average Method Length 4
Functions 153 (4.39%)
Average Function Length 1
Not in classes or functions 17 (0.49%)
Complexity
Cyclomatic Complexity / LLOC 0.51
Cyclomatic Complexity / Number of Methods 3.37
Как вы можете видеть, предоставленная информация намного более полезна с точки зрения разработчика, потому что она может примерно рассказать вам, насколько сложным является проект, прежде чем вы начнете работать с ним.
Ответ 17
Угадав, что никто никогда не увидит, что это похоронено сзади... Тем не менее, ни один из ответов до сих пор не сталкивается с проблемой имен файлов с пробелами. Кроме того, все, использующие xargs
, терпят неудачу, если общая длина путей в дереве превышает ограничение по размеру оболочки оболочки (по умолчанию - несколько мегабайт в Linux). Вот тот, который исправляет эти проблемы довольно прямо. Подоболочка заботится о файлах с пробелами. awk
суммирует поток отдельных файлов wc
, поэтому никогда не должно заканчиваться пространство. Он также ограничивает файлы exec
только файлами (пропусками каталогов):
find . -type f -name '*.php' -exec bash -c 'wc -l "$0"' {} \; | awk '{s+=$1} END {print s}'
Ответ 18
WC -L? лучше использовать GREP -C ^
wc -l? Неправильно!
Команда wc подсчитывает новые коды строк, строки не! Когда последняя строка в файле не заканчивается новым кодом строки, это не будет считаться!
если вам все еще нужны строки подсчета, используйте grep -c ^, полный пример:
#this example prints line count for all found files
total=0
find /path -type f -name "*.php" | while read FILE; do
#you see use grep instead wc ! for properly counting
count=$(grep -c ^ < "$FILE")
echo "$FILE has $count lines"
let total=total+count #in bash, you can convert this for another shell
done
echo TOTAL LINES COUNTED: $total
наконец, обратите внимание на wc -l trap (количество входящих, а не строк!!!)
Ответ 19
Если вы хотите, чтобы ваши результаты сортировались по количеству строк, вы можете просто добавить | sort
или | sort -r
(-r
для убывающего порядка) к первому ответу, например:
find . -name '*.php' | xargs wc -l | sort -r
Ответ 20
Что-то другое:
wc -l `tree -if --noreport | grep -e'\.php$'`
Это отлично работает, но в текущей папке или одной из ее подпапок вам нужно иметь хотя бы один файл *.php
, иначе wc
stalls
Ответ 21
Это очень легко с zsh globs:
wc -l ./**/*.php
Если вы используете Bash, вам просто нужно обновить. Нет абсолютно никакой причины использовать bash.
Ответ 22
очень просто
find /path -type f -name "*.php" | while read FILE
do
count=$(wc -l < $FILE)
echo "$FILE has $count lines"
done
Ответ 23
Если вам нужно всего лишь общее количество строк, пусть говорят ваши PHP файлы, вы можете использовать очень простую однострочную команду даже под Windows, если у вас установлен GnuWin32. Вот так:
cat `/gnuwin32/bin/find.exe . -name *.php` | wc -l
Вам нужно указать, где именно находится find.exe, иначе Windows, на которой FIND.EXE(из старых DOS-подобных команд) будет выполняться, поскольку это, вероятно, до GnuWin32 в среде PATH и имеет разные параметры и результаты.
Обратите внимание, что в приведенной выше команде вы должны использовать обратные кавычки, а не одинарные кавычки.
Ответ 24
Выдавать самые длинные файлы (т.е. возможно, эти длинные файлы нуждаются в некоторой рефакторинговой любви?) и исключая некоторые каталоги поставщиков:
find . -name '*.php' | xargs wc -l | sort -nr | egrep -v "libs|tmp|tests|vendor" | less
Ответ 25
Для Windows простой и быстрый инструмент LocMetrics.
Ответ 26
Вам не нужны все эти сложные и трудно запоминающиеся команды. Вам просто нужен инструмент с именем line-counter.
Быстрый обзор
Вот как вы получаете инструмент
$ pip install line-counter
Используйте команду line
, чтобы получить количество файлов и количество строк в текущем каталоге (рекурсивно)
$ line
Search in /Users/Morgan/Documents/Example/
file count: 4
line count: 839
Если вы хотите более подробно, просто используйте line -d
.
$ line -d
Search in /Users/Morgan/Documents/Example/
Dir A/file C.c 72
Dir A/file D.py 268
file A.py 467
file B.c 32
file count: 4
line count: 839
И лучшая часть этого инструмента, вы можете добавить к нему .gitignore
как файл конфигурации. Вы можете настроить правила, чтобы выбирать или игнорировать, какие файлы следует считать так же, как и то, что вы делаете в '.gitignore'.
Больше описания и использования здесь: https://github.com/MorganZhang100/line-counter
Ответ 27
Если вы работаете в Linux (и я так понимаю), я рекомендую мой инструмент polyglot. Это значительно быстрее, чем sloccount
или cloc
и это более функционально, чем sloccount
.
Вы можете вызвать его с
poly .
или же
poly
так что это гораздо более удобный для пользователя, чем какой-то замысловатый скрипт bash.
Ответ 28
В OS X, по крайней мере, команды find + xarg + wc, перечисленные в некоторых других ответах, печатают "total" несколько раз в больших списках, и нет полной полной информации. Я смог получить одно общее количество файлов .c, используя следующую команду:
find . -name '*.c' -print0 |xargs -0 wc -l|grep -v total|awk '{ sum += $1; } END { print "SUM: " sum; }'
Ответ 29
Я использовал этот inline- script, который я запускаю из каталога src-project:
for i in $(find . -type f); do rowline=$(wc -l $i | cut -f1 -d" "); file=$(wc -l $i | cut -f2 -d" "); lines=$((lines + rowline)); echo "Lines["$lines"] " $file "has "$rowline"rows."; done && unset lines
Это производит этот вывод:
Lines[75] ./Db.h has 75rows.
Lines[143] ./Db.cpp has 68rows.
Lines[170] ./main.cpp has 27rows.
Lines[294] ./Sqlite.cpp has 124rows.
Lines[349] ./Sqlite.h has 55rows.
Lines[445] ./Table.cpp has 96rows.
Lines[480] ./DbError.cpp has 35rows.
Lines[521] ./DbError.h has 41rows.
Lines[627] ./QueryResult.cpp has 106rows.
Lines[717] ./QueryResult.h has 90rows.
Lines[828] ./Table.h has 111rows.
Ответ 30
в то время как мне нравятся сценарии, которые я предпочитаю, так как он также показывает сводку для каждого файла, если общий
wc -l `find . -name "*.php"`