写了一个比较粗糙的C语言代码行数统计脚本,目前还有些bug,而且效率也不高。脚本主要就是去除大部分的注释后统计行数,相当于做了一部分预处理的工作。下面是代码:
#!/bin/bash filename=$1 echo "`whoami`" if [ $# -lt 1 ];then echo "usage : ./scripts filename" exit -1 fi if [ ! -f $filename ];then echo "$filename is not a file" exit 0; fi user="`whoami`" if [ "$user" != "root" ];then echo "use scripts with root" exit 0; fi #删除空行,空行包括:tables + space sed '/^[[:blank:]]*$/d' $filename > "${filename}_backup" #删除 // 所在的行 sed -i '/^[[:blank:]]*\/\//d' "${filename}_backup" #/*xxxxx*/ #打印/*所有的开始行 grep -n '[[:blank:]]*/[*]' "${filename}_backup" | awk 'BEGIN{FS=":"}{print $1}' > "start.txt" #打印*/所有的结束行 grep -n '[*]/[[:blank:]]*' "${filename}_backup" | awk 'BEGIN{FS=":"}{print $1}' > "end.txt" #合并两个文件,final.txt里面每行就是/*xx....\n....xx*/这种类型注释的开始行和起始行号 paste "start.txt" "end.txt" > "final.txt" while read line do #得到起始行 START=`echo "$line" | awk 'BEGIN{FS="\t"}{print $1}'` #得到结束行 END=`echo "$line" | awk 'BEGIN{FS="\t"}{print $2}'` #这里有一个bug,如是/*xxxx*/中的/*和*/在同一行出现,并且有代码也在同一行 # printf("hello world\n"); /*打印字符串*/ # /*打印字符串*/ #上面两种情况的就没法判断,希望大家优化 if [ $START -eq $END ];then continue fi #删除/*到*/中间所有行 sed -i "${START},${END}d" "${filename}_backup" done < "final.txt" wc -l "${filename}_backup" rm -f "final.txt" "start.txt" "end.txt"
脚本只能实现大概的代码行数的统计,不能做到精确统计!
因为没有做很多的测试,而且也不排除有些比较少见的注释我没考虑到,另外脚本的效率也比较差,用了很多tmp文件。
所以希望大家多提提意见!