Saturday, September 3. 2005

wc - Word, line and byte/character count

wc命令非常简单。一共有4个参数:

  • "-l"统计输入中有多少行: wc -l a.sh则输出"13 a.sh",表示a.sh中有13行
  • "-m"统计输入中有多少个字符: wc -m a.sh则输出"163 a.sh",表示a.sh中有163个字符
  • "-c"统计输入中有多少个字节: wc -c a.sh输出"163 a.sh",表示a.sh中有163个字节
  • "-w"统计输入中有多少个单词:wc -w a.sh输出"32 a.sh",表示a.sh中有32个单词(统计办法仅仅是以空格分割,并非真正的单词数)

几点注意:

  1. 可以同时指定多个参数来统计多项值,但是输出的格式始终按照line, byte, word, filename的顺序,不管参数的顺序如何给出;
  2. "-m"和"-c"参数的区别在于,在有些地区中可能使用多字节字符,所以多个字节可能被认做一个字符。如果当前locale不支持多字节字符,那么这两个参数的效果是一样的。

cut - Cut out selected fields of each line of a file

cut命令用于从文件或者标准输入中读取内容并截取每一行的特定部分并送到标准输出。

截取的方式有三种,一是按照字符位置,二是按照字节位置,三是使用一个分隔符将一行分割成多个field,并提取指定的fields。

cut命令有5个参数,其中-c,-b,-f分别表示"character", "byte"以及"field"截取方式。当采用field模式截取时,需要用"-d"参数指定一个分隔符,分割符只能为单个字符。另外还有一个"-s",suppress,表示如果行中没有给出的分割符则不输出该行(默认为如果没有分隔符则将该行原封不动输出)

以下为几个例子:

  • 按字符截取:echo hello, world | cut -c 8-12 则输出"world"(截取字符串中从第8到第12个共12个字符)
  • 按分隔符截取:echo hello, world | cut -f 2 -d " "则输出"world"(截取以空格分割的第二部分)
  • echo Long, long ago | cut -f 2,3 -d " "则输出" Long, ago"(截取以空格分割的第2、3部分,注意输出的结果也以-d指定的分隔符分割)
  • 使用"-s"安静地忽略没有给出地分隔符地行:echo hello |cut -d "!" -f 1 -s则什么也不输出(因为行中没有"!"字符)

如果命令执行成功则返回0,遇到错误则返回一个大于0的数字。

(Page 1 of 1, totalling 2 entries)

Categories

All categories

Calendar

« 2010 年 September »
Mon Tue Wed Thu Fri Sat Sun
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30      

Archives

Quicksearch

友情链接

Syndicate This Blog

XML RSS 1.0 feed
XML RSS 2.0 feed

Blog Administration

Open login screen

访问统计

Locations of visitors to this page
The articles in this sites are copyrighted, except those marked as reshipped
MII Record: 05029638