每个程序员都应该知道的8个Linux命令

jopen 11年前
   <p> 英文原文链接:<a href="/misc/goto?guid=4958524080878003969">8 Linux Commands Every Developer Should Know</a></p>    <p> 每个程序员,在职业生涯的某个时刻,总会发现自己需要知道一些 Linux 方面的知识。我并不是说你应该成为一个 Linux 专家,我的意思是,当面对 linux 命令行任务时,你应该能很熟练的完成。事实上,学会了下面 8 个命令,我基本上能完成任何需要完成的任务。</p>    <p> 注意:下面的每个命令都有十分丰富的文档说明。这篇文章并不是来详尽的展示每个命令的各种功用的。我在这里要讲的是这几个最常用的命令的最常见用法。如果你对 linux 命令并不是很了解,你想找一些这方面的资料学习,那这篇文章将会给你一个基本的指导。</p>    <p> 让我们从处理一些数据开始。假设我们有两个文件,分别记录的订单清单和订单处理结果。</p>    <blockquote>    order.out.log 8:22:19 111, 1, Patterns of Enterprise Architecture, Kindle edition, 39.99 8:23:45 112, 1, Joy of Clojure, Hardcover, 29.99 8:24:19 113, -1, Patterns of Enterprise Architecture, Kindle edition, 39.99 order.in.log 8:22:20 111, Order Complete 8:23:50 112, Order sent to fulfillment 8:24:20 113, Refund sent to processing   </blockquote>    <p> <strong>cat</strong></p>    <blockquote>     <p><a href="/misc/goto?guid=4958524080978837045">cat</a> – 连接文件,并输出结果</p>    </blockquote>    <p> cat 命令非常的简单,你从下面的例子可以看到。</p>    <blockquote>    jfields$ cat order.out.log 8:22:19 111, 1, Patterns of Enterprise Architecture, Kindle edition, 39.998:23:45 112, 1, Joy of Clojure, Hardcover, 29.998:24:19 113, -1, Patterns of Enterprise Architecture, Kindle edition, 39.99   </blockquote>    <p> 就像它的说明描述的,你可以用它来连接多个文件。</p>    <blockquote>    jfields$ cat order.* 8:22:20 111, Order Complete8:23:50 112, Order sent to fulfillment8:24:20 113, Refund sent to processing8:22:19 111, 1, Patterns of Enterprise Architecture, Kindle edition, 39.998:23:45 112, 1, Joy of Clojure, Hardcover, 29.998:24:19 113, -1, Patterns of Enterprise Architecture, Kindle edition, 39.99   </blockquote>    <p> 如果你想看这些 log 文件的内容,你可以把它们连接起来并输出到标准输出上,就是上面的例子展示的。这很有用,但输出的内容可以更有逻辑些。</p>    <p> <strong>sort</strong></p>    <blockquote>     <p><a href="/misc/goto?guid=4958524081066453367">sort</a> – 文件里的文字按行排序</p>    </blockquote>    <p> 此时 sort 命令显然是你最佳的选择。</p>    <blockquote>    jfields$ cat order.* sort8:22:19 111, 1, Patterns of Enterprise Architecture, Kindle edition, 39.998:22:20 111, Order Complete8:23:45 112, 1, Joy of Clojure, Hardcover, 29.998:23:50 112, Order sent to fulfillment8:24:19 113, -1, Patterns of Enterprise Architecture, Kindle edition, 39.998:24:20 113, Refund sent to processing   </blockquote>    <p> 就像上面例子显示的,文件里的数据已经经过排序。对于一些小文件,你可以读取整个文件来处理它们,然而,真正的 log 文件通常有大量的内容,你不能不考虑这个情况。此时你应该考虑过滤出某些内容,把 cat、sort 后的内容通过<a href="/misc/goto?guid=4958524081157418525">管道</a>传递给过滤工具。</p>    <p> <strong>grep</strong></p>    <blockquote>     <p><a href="/misc/goto?guid=4958524081266802680">grep</a>, egrep, fgrep – 打印出匹配条件的文字行</p>    </blockquote>    <p> 假设我们只对 Patterns of Enterprise Architecture 这本书的订单感兴趣。使用 grep,我们能限制只输出含有 Patterns 字符的订单。</p>    <blockquote>    jfields$ cat order.* sort grep Patterns8:22:19 111, 1, Patterns of Enterprise Architecture, Kindle edition, 39.998:24:19 113, -1, Patterns of Enterprise Architecture, Kindle edition, 39.99   </blockquote>    <p> 假设退款订单 113 出了一些问题,你希望查看所有相关订单——你又需要使用 grep 了。</p>    <blockquote>    jfields$ cat order.* sort grep ":\d\d 113, "8:24:19 113, -1, Patterns of Enterprise Architecture, Kindle edition, 39.998:24:20 113, Refund sent to processing   </blockquote>    <p> 你会发现在 grep 上的匹配模式除了“113”外还有一些其它的东西。这是因为 113 还可以匹配上书目或价格,加上额外的字符后,我们可以精确的搜索到我们想要的东西。</p>    <p> 现在我们已经知道了退货的详细信息,我们还想知道日销售和退款总额。但我们只关心 Patterns of Enterprise Architecture 这本书的信息,而且只关心数量和价格。我现在要做到是切除我们不关心的任何信息。</p>    <p> <strong>cut</strong></p>    <blockquote>     <p><a href="/misc/goto?guid=4958524081350065140">cut</a> – 删除文件中字符行上的某些区域</p>    </blockquote>    <p> 又要使用 grep,我们用 grep 过滤出我们想要的行。有了我们想要的行信息,我们就可以把它们切成小段,删除不需要的部分数据。</p>    <blockquote>    jfields$ cat order.* sort grep Patterns8:22:19 111, 1, Patterns of Enterprise Architecture, Kindle edition, 39.998:24:19 113, -1, Patterns of Enterprise Architecture, Kindle edition, 39.99jfields$ cat order.* sort grep Patterns cut -d"," -f2,5 1, 39.99 -1, 39.99   </blockquote>    <p> 现在,我们把数据缩减为我们计算想要的形式,把这些数据粘贴到 Excel 里立刻就能得到结果了。</p>    <p> cut 是用来消减信息、简化任务的,但对于输出内容,我们通常会有更复杂的形式。假设我们还需要知道订单的 ID,这样可以用来关联相关的其他信息。我们用 cut 可以获得 ID 信息,但我们希望把 ID 放到行的最后,用单引号包上。</p>    <p> <strong>sed</strong></p>    <blockquote>     <p><a href="/misc/goto?guid=4958524081442188326">sed</a> – 一个流编辑器。它是用来在输入流上执行基本的文本变换。</p>    </blockquote>    <p> 下面的例子展示了如何用 sed 命令变换我们的文件行,之后我们在再用 cut 移除无用的信息。</p>    <blockquote>    jfields$ cat order.* sort grep Patterns \> sed s/"[0-9\:]* \([0-9]*\)\, \(.*\)"/"\2, '\1'"/1, Patterns of Enterprise Architecture, Kindle edition, 39.99, '111'-1, Patterns of Enterprise Architecture, Kindle edition, 39.99, '113'lmp-jfields01:~ jfields$ cat order.* sort grep Patterns \> sed s/"[0-9\:]* \([0-9]*\)\, \(.*\)"/"\2, '\1'"/ cut -d"," -f1,4,51, 39.99, '111'-1, 39.99, '113'   </blockquote>    <p> 我们对例子中使用的正则表达式多说几句,不过也没有什么复杂的。正则表达式做了下面几种事情</p>    <ul>     <li>删除时间戳</li>     <li>捕捉订单号</li>     <li>删除订单号后的逗号和空格</li>     <li>捕捉余下的行信息</li>    </ul>    <p> 里面的引号和反斜杠有点乱,但使用命令行时必须要用到这些。</p>    <p> 一旦捕捉到了我们想要的数据,我们可以使用 \1 & \2 来存储它们,并把它们输出成我们想要的格式。我们还在其中加入了要求的单引号,为了保持格式统一,我们还加入了逗号。最后,用 cut 命令把不必要的数据删除。</p>    <p> 现在我们有麻烦了。我们上面已经演示了如何把 log 文件消减成更简洁的订单形式,但我们的财务部门需要知道订单里一共有哪些书。</p>    <p> <strong>uniq</strong></p>    <blockquote>     <p><a href="/misc/goto?guid=4958524081540566629">uniq</a> – 删除重复的行</p>    </blockquote>    <p> 下面的例子展示了如何过滤出跟书相关的交易,删除不需要的信息,获得一个不重复的信息。</p>    <blockquote>    jfields$ cat order.out.log grep "\(Kindle\Hardcover\)" cut -d"," -f3 sort uniq -c 1 Joy of Clojure 2 Patterns of Enterprise Architecture   </blockquote>    <p> 看起来这是一个很简单的任务。</p>    <p> 这都是很好用的命令,但前提是你要能找到你想要的文件。有时候你会发现一些文件藏在很深的文件夹里,你根本不知道它们在哪。但如果你是知道你要寻找的文件的名字的话,这对你就不是个问题了。</p>    <p> <strong>find</strong></p>    <blockquote>     <p><a href="/misc/goto?guid=4958524081631490318">find</a> – 在文件目录中搜索文件</p>    </blockquote>    <p> 在上面的例子中我们处理了 order.in.log 和 order.out.log 这两个文件。这两个文件放在我的 home 目录里的。下面了例子将向大家展示如何在一个很深的目录结构里找到这样的文件。</p>    <blockquote>    jfields$ find /Users -name "order*"Users/jfields/order.in.logUsers/jfields/order.out.log   </blockquote>    <p> find 命令有很多其它的参数,但 99% 的时间里我只需要这一个就够了。</p>    <p> 简单的一行,你就能找到你想要的文件,然后你可以用 cat 查看它,用 cut 修剪它。但文件很小时,你用管道把它们输出到屏幕上是可以的,但当文件大到超出屏幕时,你也许应该用管道把它们输出给 less 命令。</p>    <p> <strong>less</strong></p>    <blockquote>     <p><a href="/misc/goto?guid=4958524081712750460">less</a> – 在文件里向前或向后移动</p>    </blockquote>    <p> 让我们再回到简单的 cat sort 例子中来,下面的命令就是将经过合并、排序后的内容输出到 less 命令里。在 less 命令,使用“/”来执行向前搜索,使用“?”命令执行向后搜索。搜索条件是一个正则表达式。</p>    <blockquote>    jfields$ cat order* sort less   </blockquote>    <p> 如果你在 less 命令里使用 /113.*,所有 113 订单的信息都会高亮。你也可以试试?.*112,所有跟订单 112 相关的时间戳都会高亮。最后你可以用 ‘q’ 来退出 less 命令。</p>    <p> linux 里有很丰富的各种命令,有些是很难用的。然而,学会了前面说的这 8 个命令,你已经能处理大量的 log 分析任务了,完全不需要用脚本语言写程序来处理它们。</p>    <div id="come_from">    <br /> 来自:     <a id="link_source2" href="/misc/goto?guid=4958524081811286678" target="_blank">外刊IT评论</a>    </div>