awk 统计字符个数

admin · 发表于 2023-6-17 08:19:29

在每个 Unix 机器上的任何 shell 中使用任何 awk：

$ awk 'sub(/^ +/,""){print a[++c] $0; next} {a[NR]=$0}' file
<ma x="1">ab</ma><r x="1">0</r>
<ma x="2">af</ma><r x="2">0</r>
<ma x="3">ji</ma><r x="3">0</r>
如果前导空格实际上是制表符，则将 ^ + 替换为 ^\t+。如果它可以是两者的混合，则在 POSIX awk 中使用 ^[[:space:]]+ 或在任何 awk 中使用 ^[ \t]+。

,
这对你有用吗？

此处 rows 是文件名....

awk '{m=gensub(/.+ (x="[^"]+).*/,"\\1","1",$0);gsub(/^ +/,"",$0);a[m]=a[m] $0}END{for(i in a){print a[i]}}' rows
<ma x="1">ab</ma><r x="1">0</r>
<ma x="2">af</ma><r x="2">0</r>
<ma x="3">ji</ma><r x="3">0</r>
我们找到变量定义 x="??"并将其存储在 m 中；我们剥离前导空白；我们将整行分配给基于 m 的数组；然后我们遍历数组并打印它。

注意：gensub 是特定于 GNU awk 的非 posix 扩展。并且 awk 散列数组不能保证保持顺序；以上复制粘贴的输出顺序正确纯属巧合。

,
lastline=$(wc -l < log) | awk -F'"' -v line=$lastline '{ if(NR<=line/2) arr[NR]=$0; gsub(/^ +/,$0); if(NR>line/2) print arr[NR-line/2] $0}' log
考虑到 x 值按行顺序递增，我只并排打印文件的前半部分和后半部分，而不是存储和匹配 x 值。

wc -l 是获取行数，在本例中为 6，因此文件行被拆分为 3 - 3 内的 awk

		自动登录	找回密码
密码			注册

awk 统计字符个数

浏览过的版块