linux环境下统计目录下所有文件的行数

文章目录

前言
wc命令
- 常用选项
统计文件行数
总结

前言

工作中时常有统计数据行和代码行的需求，虽然能依次打开每个文件数一下，但是这样操作效率太低了，如果是在linux环境中，可以使用一个常用的命令 wc，一起记录一下常见的用法吧。

wc命令

wc命令，~~（全称water closet，洗手间，哦，错了）~~，全称word count？我也没找到，作用就是输出每个文件包含的行数、单词数和字节数，这三项是基础信息也是最常用的信息，此外它还可以输出文件中字符数量、输出文件中最长行的长度。

使用方法非常简单，直接在命令末尾添加文件名就行了

$ wc README.md
  35   60 2460 README.md
1
2

上面的信息显示，README.md文件中包含25行内容，存在60个单词，共有2460个字节，可能是因为该文件中包含中文，所以单词数统计不太准确。

常用选项

该命令各选项含义如下：

- l: 统计行数
- w: 统计字数
- c：统计字节数
- m：统计字符数
- L：统计最长行的长度

其中 - l 使我们统计行数的利器

统计文件行数

wc 命令搭配一些其他的命令能更方便的完成统计工作

统计1个文件行数

$ wc -l README.md
35 README.md
1
2

统计2个文件行数

wc 命令后名跟多个文件名时会打印出每个文件的行数，并且在最后一行显示所有文件总行数

$ wc -l README.md test.txt
  35 README.md
   3 test.txt
  38 total
1
2
3
4

统计当前目录下python代码文件数量

$ find ./ -name "*.py" | wc -l
317
1
2

统计当前目录下python代码文件行数

$ find ./ -name "*.py" | xargs cat | wc -l
38538
1
2

统计当前目录下python代码文件非空行数

$ find ./ -name "*.py" | xargs cat | grep -v ^$ | wc -l
35320
1
2

实现的方式就是在输出文件内容的过程中过滤掉空行，但我认为统计代码行数时不应该过滤空行，适当的留白也是优秀代码的一部分

统计当前目录下2种代码文件的总行数

一个项目中使用的代码往往不止一种，所以在统计代码行数时要考虑多种代码文件，可以写多个-name选项或者使用正则表达式

$ find ./ -regex '.*\.\(py\|h\)' | xargs cat | wc -l
39795
$ find ./ -regextype posix-extended -regex '.*\.(py|h)' | xargs cat | wc -l
39795
$ find ./ -name "*.py" -o -name "*.h" | xargs cat | wc -l
39795
1
2
3
4
5
6

总结

wc 命令是用来查询文件行数的核心命令，不加选项时默认输出文件行数、单词数、字节数
wc 命令配合 find、xargs、cat 等命令可以统计出目录内指定类型文件的总行数
find 查找多个文件的常用写法 find ./ -regex '.*\.\(py\|h\)' 或 find ./ -name "*.py" -o -name "*.h"
查项目全部代码量终极大招：find ./ -regex '.*\.\(py\|lua\|go\|h\|hpp\|cpp\|c\|cc\)' | xargs cat | wc -l

==>> 反爬链接，请勿点击，原地爆炸，概不负责！<<==

确实挺难的，再坚持一下~

相关阅读:
【Leetcode HOT100】不同路径 c++
Annotorious入门教程：图片注释工具
蓝牙协议栈基础学习笔记
全栈开发可能需要的环境及工具
原来栈和队列之间其实也是可以互相转换的啊
【原创】常用元器件(电阻)选型之阻值有多少-cayden20220910
DDD的哲学意味（上）
MyBtis 替换符号查询 SQL 代替符号
【@胡锡进】大模型量化分析- 南京银行 601009.SH
短信验证码接口风险分析

原文地址：https://blog.csdn.net/shihengzhen101/article/details/128141483