2024-06-06
linux相关
00

目录

连接两个文本文件
从文本文件中剪切列或域
将大文件进行分割
sh
cat a b | sort | uniq > c # c is a union b 并集 cat a b | sort | uniq -d > c # c is a intersect b 交集 cat a b b | sort | uniq -u > c # c is set difference a - b 差集

连接两个文本文件

格式:join [选项] 文件1文件2 说明:join用来将来自两个文本文件的行连在一起,两个输入文件必须已经分过类,每个文件里都有一些元素与另一个文件相关,由于这种关系,join将两个文件连在一起。 参数: -an n为一数字,用于连接时从文件n中显示不匹配行。例如, - a 1显示第一个文件的不匹配行,- a 2为从第二个文件中显示不匹配行。 -o n.m n为文件号,m为域号。1 . 3表示只显示文件1第三域,每个n,m必须用逗号分隔,如1 . 3,2 . 1。 -j n m n为文件号,m为域号。使用其他域做连接域。 -t 域分隔符。用来设置非空格或t a b键的域分隔符。例如,指定冒号做域分隔符- t: 范例: join –o 1.1,2.2 names.txt town.txt

从文本文件中剪切列或域

格式:cut [选项] 文件名 参数: -c list 指定剪切字符数。 -f field 指定剪切域数。 -d 指定与空格和tab键不同的域分隔符。 -c 用来指定剪切范围,如下所示: -c 1,5-7 剪切第1个字符,然后是第5到第7个字符。 -f 格式与- c相同。 -f 1,5 剪切第1域,第5域。 范例: cut –d: -f3 pers

将大文件进行分割

格式:split [选项] 输入文件名 输出文件名前缀 参数:-a 指定后缀的长度(缺省为2) -b 每个输出文件的字节大小 -l 每个输出文件的行数 范例:split –l 1000 bigfile.txt outfile

本文作者:曹子昂

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!