shell的输入与输出主要包括:
echo命令
read命令
cat命令
管道
tee命令
标准输入、输出和标准错误
重定向
echo [-e] [-n] string
string : 字符串,可以含 shell 变量、转义符等, 一般用双引号括起来
-e : 让 echo 解释 string 中的转义符
-n : 禁止 echo 输出后输出 NEWLINE(换行)
cat [-n][-b][-t][-e] file1 file2 …
cat 是一个简单而通用的命令,可以用它来显示文件内容,创建文件,还可以用它来显示控制字符
-n : 显示行号
-b : 显示行号(不含空行)
-t : 显示制表符
-e : 显示行结束符
创建文件:
1 | cat file1 file2 > newfile #合并文件 |
管道
| : 把一个命令的输出传递给另一个命令作为输入。
例:
1 | ls –l | grep ^d |
tee 命令
把输出的一个副本输送到标准输出,另一个副本拷贝到相应的文件中。
tee [-a] filename
-a : 追加到文件末尾
tee 命令一般与管道结合使用
例:
1 | ls | tee list.out |
grep:
不会对输入文件进行任何修改或影响
grep家族:grep,egrep,fgrep
形式:
grep [选项] pattern file1 file2 …
pattern:可以是正则表达式(用单引号括起来)、 或字符串(加双引号)、或一个单词。
file1 file2 … :文件名列表,作为 grep 命令的输入;grep 的输入也可以来自标准输入或管道;
可以把匹配模式写入到一个文件中,每行写一个,然后使用 -f 选项,将该匹配模式传递给 grep 命令。
grep -f patternfile file1 file2 …
常用选项:
-c 只输出匹配的行的总数
-i 不区分大小写
-h 查询多个文件时,不显示文件名
-l 查询多个文件时,只输出包含匹配模式的文件的文件名
-n 显示匹配的行及行号
-v 反向查找,即只显示不包含匹配模式的行
-s 不显示错误信息
例:
查询多个文件,可以使用通配符 “ * ”
如:1
2grep "math2" *.txt`
grep "12" *`反向匹配
1
ps aux | grep "ssh" | grep –v "grep"
匹配空行
1
2grep -n '^$' datafile
grep -v '^$' datafile > datafile2精确匹配单词: < 和 >
找出所有包含 以 north 开头 的单词的行1
grep '<north' datafile
找出所有包含 以 west 结尾 的单词的行
1
grep 'west>' datafile
找出所有包含 north 单词的行
1
grep '<north>' datafile
递归搜索目录中的所有文件:-r
1
grep -r "north" datafile ~/Teaching/linux/
关于某个字符连续出现次数的匹配
1
2grep 'o{2,}' helloworld
'o{2,4}' , 'o{2,4}' , 'lo{2,4}'
流编辑器sed
sed 是一个精简的、非交互式的编辑器,它在命令行中输入编辑命令和指定文件名,然后在屏幕上查看输出。
sed如何工作的:
sed 逐行处理文件(或输入),并将输出结果发送到屏幕。
即:sed 从输入(可以是文件或其它标准输入)中读取一行,将之拷贝到一个编辑缓冲区,按指定的 sed 编辑命令进行处理,编辑完后将其发送到屏幕上,然后把这行从编辑缓冲区中删除,读取下面一行。重复此过程直到全部处理结束。
sed 只是对文件在内存中的副本进行操作,所以 sed 不会修改输入文件的内容。sed 总是输出到标准输出,可以使用重定向将 sed 的输出保存到文件中。
三种调用方式:
- 在命令行中直接调用
- 将sed命令插入脚本文件,然后调用
- 将sed命令插入到脚本文件,生成sed可执行脚本,在命令行中直接键入脚本名
常见的 sed 编辑命令小结:
p 打印匹配行
s 替换命令
= 显示匹配行的行号
l 显示指定行中所有字符
d 删除匹配的行
r 读文件
a 在指定行后面追加文本
w 写文件
i 在指定行前面追加文本
n 读取指定行的下面一行
c 用新文本替换指定的行
q 退出 sed
在 sed_cmd 中可以使用 shell 变量,此时应使用 双引号。
一些 sed 行命令集:
1 | '/north/p' #打印所有包含 north 的行 |
awk
awk 是一种用于处理数据和生成报告的编程语言
awk 可以在命令行中进行一些简单的操作,也可以被写成脚本来处理较大的应用问题
awk 与 grep、sed 结合使用,将使 shell 编程更加容易
awk如何工作的:
awk 逐行扫描输入 ( 可以是文件或管道等 ),按给定的模式查找出匹配的行,然后对这些行执行 awk 命令指定的操作
也有类似的三种使用方式。
awk的执行过程:
- 如果存在 BEGIN ,awk 首先执行它指定的 actions
- awk 从输入中读取一行,称为一条输入记录
- awk 将读入的记录分割成数个字段,并将第一个字段放入变量 $1 中,第二个放入变量 $2 中,以此类推;$0 表示整条记录; 字段分隔符可以通过选项 -F 指定,否则使用缺省的分隔符。
- 把当前输入记录依次与每一个 awk_cmd 中 pattern 比较: 如果相匹配,就执行对应的 actions; 如果不匹配,就跳过对应的 actions,直到完成所有的 awk_cmd
- 当一条输入记录处理完毕后,awk 读取输入的下一行,重复上 面的处理过程,直到所有输入全部处理完毕。
- awk 处理完所有的输入后,若存在 END,执行相应的 actions
- 如果输入是文件列表,awk 将按顺序处理列表中的每个文件。
awk 中正则表达式中常用到的元字符有:
1 | ^ 只匹配行首 ( 可以看成是行首的标志 ) |
Linux 下使用的 awk 是 gawk
操作由一条或多条语句或者命令组成,语句、命令之间用分号 “ ; ” 隔开。操作中还可以使用流程控制结构的语句
awk 命令:
print 输出列表:打印字符串、变量或表达式,输出列表中各参数之间用逗号隔开;若用空格隔开,打印时各输出之间没有空格
printf ( [格式控制符], 输出列表 ) :格式化打印,语法与 C语言中的 printf 函数类似
next:停止处理当前记录, 开始读取和处理下一条记录
nextfile:强迫 awk 停止处理当前的输入文件而处理输入文件列表中的下一个文件
exit:使 awk 停止执行而跳出。若存在 END 语句,则执行 END 指定的 actions
为了避免碰到 awk 错误,要注意以下事项:
确保整个 awk_script 用单引号括起来
确保 awk_script 内所有引号都成对出现
确保用花括号括起动作语句,用圆括号括起条件语句
如果使用字符串,要保证字符串被双引号括起来 ( 在模式中除外 )
awk 语言学起来可能有些复杂,但使用它来编写一行命令或小脚本并不太难。awk 是 shell 编程的一个重要工具。在shell 命令或编程中,可以使用 awk 强大的文本处理能力