Article / 文章中心

Linux操作系统实战入门教程

发布时间:2022-01-24 点击数:197

Linux指令入门-文本处理

1. 创建资源

创建资源

  1. 单击屏幕右侧 创建资源 ,免费创建当前实验所需云产品资源。

2. 连接终端

  1. 资源创建完毕后,点击右侧 Web Terminal连接ECS服务器。

3. 文本编辑工具Vim

  1. 文本编辑工具Vim

文本编辑工具Vim
vim的三种操作模式
vim有三种操作模式,分别是命令模式(Command mode)、输入模式(Insert mode)和底线命令模式(Last line mode)。

三种模式切换快捷键:

  • 命令模式

在命令模式中控制光标移动和输入命令,可对文本进行复制、粘贴、删除和查找等工作。

使用命令vim filename后进入编辑器视图后,默认模式就是命令模式,此时敲击键盘字母会被识别为一个命令,例如在键盘上连续敲击两次d,就会删除光标所在行。

  • 输入模式

在命令模式下按i或a键就进入了输入模式,在输入模式下,您可以正常的使用键盘按键对文本进行插入和删除等操作。

  • 底线命令模式

在命令模式下按:键就进入了底线命令模式,在底线命令模式中可以输入单个或多个字符的命令。

4. 文本文件查看命令

文本文件查看命令
cat
命令描述:cat命令用于查看内容较少的纯文本文件。

命令格式:cat [选项] [文件]。

命令参数说明:

参数                               说明
-n或--number                       显示行号 -b或--number-nonblank            显示行号,但是不对空白行进行编号 -s或--squeeze-blank              当遇到有连续两行以上的空白行,只显示一行的空白行

命令使用示例:

  1. 将一个自增序列写入test.txt文件中。
for i in $(seq 1 10); do echo $i >> test.txt ; done
  1. 查看文件内容。
cat test.txt
  1. 将文件内容清空。
cat /dev/null > test.txt
  1. 再次检查文件内容。
cat test.txt

more

命令描述:more命令从前向后分页显示文件内容。

如下图是常用操作命令:

命令使用示例:

从第20行开始分页查看系统日志文件/var/log/messages。

more +20 /var/log/messages

less
命令描述:less命令可以对文件或其它输出进行分页显示,与moe命令相似,但使用 less 可以随意浏览文件,而 more 仅能向前移动,却不能向后移动。

命令格式:less [参数] 文件 。

命令参数说明:

参数     说明 -e       当文件显示结束后,自动离开 -m       显示类似more命令的百分比 -N       显示每行的行号 -s       显示连续空行为一行

命令常用操作:

命令使用示例:

查看命令历史使用记录并通过less分页显示。

history | less

head
命令描述:head命令用于查看文件开头指定行数的内容。

命令格式:head [参数] [文件]。

命令参数说明:

参数            说明 -n [行数]    显示开头指定行的文件内容,默认为10 -c [字符数]    显示开头指定个数的字符数 -q    不显示文件名字信息,适用于多个文件,多文件时默认会显示文件名

实例:

head -5 /etc/passwd

tail
命令描述:tail命令用于查看文档的后N行或持续刷新内容。

命令格式:tail [参数] [文件]。

命令参数说明:

参数    说明 -f    显示文件最新追加的内容 -q    当有多个文件参数时,不输出各个文件名 -v    当有多个文件参数时,总是输出各个文件名 -c [字节数]    显示文件的尾部n个字节内容 -n [行数]    显示文件的尾部n行内容

命令使用示例:

查看/var/log/messages系统日志文件的最新10行,并保持实时刷新。

tail -f -n 10 /var/log/messages

按ctrl+c键退出文本实时查看界面。

stat

命令描述:用来显示文件的详细信息,包括inode、atime、mtime、ctime等。

命令使用示例:

查看/etc/passwd文件的详细信息。

stat /etc/passwd

wc

命令描述:wc命令用于统计指定文本的行数、字数、字节数。

命令格式:wc [参数] [文件]。

命令参数说明:

参数    说明 -l    只显示行数 -w    只显示单词数 -c    只显示字节数

命令使用示例:

统计/etc/passwd文件的行数。

wc -l /etc/passwd

file
命令描述: file命令用于辨识文件类型。

命令格式:file [参数] [文件]。

命令参数说明:

参数    说明 -b    列出辨识结果时,不显示文件名称 -c    详细显示指令执行过程,便于排错或分析程序执行的情形 -f [文件]    指定名称文件,其内容有一个或多个文件名称时,让file依序辨识这些文件,格式为每列一个文件名称 -L    直接显示符号连接所指向的文件类别

命令使用示例:

查看/var/log/messages文件的文件类型。

file /var/log/messages

5. 文本文件处理命令

文本文件处理命令

grep

命令描述:grep命令用于查找文件里符合条件的字符串。

grep全称是Global Regular Expression Print,表示全局正则表达式版本,它能使用正则表达式搜索文本,并把匹配的行打印出来。

在Shell脚本中,grep通过返回一个状态值来表示搜索的状态:

0:匹配成功。
1:匹配失败。
2:搜索的文件不存在。
命令格式:grep [参数] [正则表达式] [文件]。

命令常用参数说明:

参数    说明
-c或--count    计算符合样式的列数 -d recurse或-r    指定要查找的是目录而非文件 -e [范本样式]    指定字符串做为查找文件内容的样式 -E 或 --extended-regexp    将样式为延伸的正则表达式来使用 -F 或 --fixed-regexp    将样式视为固定字符串的列表 -G 或 --basic-regexp    将样式视为普通的表示法来使用 -i 或 --ignore-case 忽略字符大小写的差别 -n 或 --line-number    在显示符合样式的那一行之前,标示出该行的列数编号 -v 或 --revert-match    显示不包含匹配文本的所有行

sed

命令描述:sed是一种流编辑器,它是文本处理中非常中的工具,能够完美的配合正则表达式使用。

  1. 处理时,把当前处理的行存储在临时缓冲区中,称为模式空间(pattern space)。
  2. 接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。
  3. 接着处理下一行,这样不断重复,直到文件末尾。

注意:

sed命令不会修改原文件,例如删除命令只表示某些行不打印输出,而不是从原文件中删去。
如果要改变源文件,需要使用-i选项。
命令格式:sed [参数] [动作] [文件]。

参数说明:

参数    说明
-e [script]    执行多个script -f [script文件]    执行指定script文件
-n    仅显示script处理后的结果
-i    输出到原文件,静默执行(修改原文件)

动作说明:

动作 说明 a 在行后面增加内容 c 替换行 d 删除行 i 在行前面插入 p 打印相关的行 s 替换内容

awk

命令描述:和 sed 命令类似,awk 命令也是逐行扫描文件(从第 1 行到最后一行),寻找含有目标文本的行,如果匹配成功,则会在该行上执行用户想要的操作;反之,则不对行做任何处理。

命令格式:awk [参数] [脚本] [文件]。

参数说明:

参数    说明
-F fs    指定以fs作为输入行的分隔符,awk 命令默认分隔符为空格或制表符
-f file    读取awk脚本
-v val=val 在执行处理过程之前,设置一个变量var,并给其设置初始值为val

内置变量:

变量    用途
FS    字段分隔符
$n    指定分隔的第n个字段,如$1、$3分别表示第1、第三列
$0 当前读入的整行文本内容
NF    记录当前处理行的字段个数(列数)
NR    记录当前已读入的行数
FNR    当前行在源文件中的行号

能需要在处理数据前运行一些脚本命令,这就需要使用BEGIN关键字,BEGIN会在awsk读取数据前强制执行该关键字后指定的脚本命令。

和BEGIN关键字相对应,END关键字允许我们指定一些脚本命令,awk会在读完数据后执行它们。

cut

命令描述:cut命令主要用来切割字符串,可以对输入的数据进行切割然后输出。

命令格式:cut [参数] [文件]。

参数说明:

参数    说明 -b    以字节为单位进行分割 -c    以字符为单位进行分割 -d    自定义分隔符,默认为制表符

tr

命令描述:tr命令用于对来自标准输入的字符进行替换、压缩和删除。

命令格式:tr [参数] [文本]。

参数说明:

参数    说明 -c    反选指定字符 -d    删除指定字符 -s    将重复的字符缩减成一个字符 -t [第一字符集] [第二字符集]    删除第一字符集较第二字符集多出的字符,使两个字符集长度相等