小知识:linux awk 多文件操作2种实现方法

我们经常会将2个有关联文本文件进行合并处理。分别从不同文件获取需要的列,然后,整体输出到一起。awk进行多文件处理时候,常常会遇到2个方面问题,第一个是怎么样合并多个文件为一个文件。第二个问题就是怎么样将多行合并为一行显示。我这里说下我的处理2种方法,还有实现思路。

实例文本:

复制代码

代码如下:

[chengmo@centos5 shell]$ awk FNR==1{print “\r\n”FILENAME}{print $0} a.txt b.txt 

a.txt 

100 wang man

200 wangsan woman 

300 wangming man

400 wangzheng man

b.txt 

100 90 80 

200 80 70 

300 60 50 

400 70 20

需要合并得到结果:

100     wang    man 90  80

200 wangsan woman 80    70

300 wangming man 60     50

400 wangzheng man 70    20

awk多文件操作方法一:

实现思路:

通过外部命令合并文件,然后通过排序,然后通过awk进行合并操作。

首先:

复制代码

代码如下:

[chengmo@centos5 shell]$ cat a.txt b.txt | sort -n -k1 |awk {print}

100 90 80 

100 wang man

200 80 70 

200 wangsan woman 

300 60 50 

300 wangming man

400 70 20 

400 wangzheng man

现在需要把:第一列相同的处理合并到一行,这里需要用“next”语句。它操作,可以参考awk 多行合并【next 使用介绍】(常见应用4)

继续:

复制代码

代码如下:

[chengmo@centos5 shell]$ cat a.txt b.txt | sort -n -k1 |awk NR%2==1{fd1=$2″\t”$3;next}{print $0″\t”fd1} 

100 wang man 90 80 

200 wangsan woman 80 70 

300 wangming man 60 50 

400 wangzheng man 70 20 

需要把几行合并,经常用到方法是:NR%num 然后将行值保存下来,next该行。在输出时候打印出来。

awk多文件操作方法二

实现思路

不借助第3放工具打开,直接通过awk 打开多个文件。然后可以通过:FILENAME获得当前处理文件名。NR总记录 FNR当前文件记录,以及ARGC传入参数总数,ARGV是数组,各个参数值。

看下这些实例:

复制代码

代码如下:

[chengmo@centos5 shell]$ awk BEGIN{print ARGC,ARGV[0],ARGV[1],ARGV[2]}{print FILENAME,NR,FNR,$0} a.txt b.txt 

3 awk a.txt b.txt 

a.txt 1 1 100 wang man

a.txt 2 2 200 wangsan woman 

a.txt 3 3 300 wangming man

a.txt 4 4 400 wangzheng man

b.txt 5 1 100 90 80 

b.txt 6 2 200 80 70 

b.txt 7 3 300 60 50 

b.txt 8 4 400 70 20 

程序代码:

复制代码

代码如下:

[chengmo@centos5 shell]$ awk  

BEGIN{ 

if(ARGC<3) 

exit 1; 

file=””; 

aData[FILENAME,$1]=ARGV[1]==FILENAME?$0:$2″\t”$3; 

END{ 

for(k in aData) 

split(k,idx,SUBSEP); 

if(idx[1]==ARGV[1] && (ARGV[2],idx[2]) in aData) 

print aData[ARGV[1],idx[2]],aData[ARGV[2],idx[2]] | “sort -n -k1”; 

} a.txt b.txt 

100 wang man 90 80 

200 wangsan woman 80 70 

300 wangming man 60 50 

400 wangzheng man 70 20

代码说明:

这里用到2维数组,aData[文件名,关联列对应值] ,这种方法可以将多个文件内容。放入一个统一二维数组。然后循环数组,通过if((i,j} in array) 查找对应列值,在其它文件中是否存在。

以上是2种实现方法,其中第一种思路较为简单,很容易理解。第二种处理起来较为复杂。有更好方法大家给我分享。

声明: 猿站网有关资源均来自网络搜集与网友提供,任何涉及商业盈利目的的均不得使用,否则产生的一切后果将由您自己承担! 本平台资源仅供个人学习交流、测试使用 所有内容请在下载后24小时内删除,制止非法恶意传播,不对任何下载或转载者造成的危害负任何法律责任!也请大家支持、购置正版! 。本站一律禁止以任何方式发布或转载任何违法的相关信息访客发现请向站长举报,会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。本网站的资源部分来源于网络,如有侵权烦请发送邮件至:2697268773@qq.com进行处理。
建站知识

小知识:linux shell 正则表达式(BREs,EREs,PREs)差异比较

2023-6-6 7:36:25

建站知识

小知识:linux下通过awk查看ip连接数(常见应用一)

2023-6-6 7:52:54

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索