Linux入门教程
Last updated
Was this helpful?
Last updated
Was this helpful?
以下内容引用自jyy的操作系统实验课程网站, 并有少量修改和补充. 如果你是第一次使用Linux, 请你一边仔细阅读教程, 一边尝试运行教程中提到的命令.
Linux命令行中的命令使用格式都是相同的:
参数之间用任意数量的空白字符分开. 关于命令行, 可以先阅读. 然后我们介绍最常用的一些命令:
ls
用于列出当前目录(即"文件夹")下的所有文件(或目录).
目录会用蓝色显示. ls -l
可以显示详细信息.
pwd
能够列出当前所在的目录.
cd DIR
可以切换到DIR
目录.
在Linux中, 每个目录中都至少包含两个目录: .
指向该目录自身, ..
指向它的上级目录. 文件系统的根是/
.
touch NEWFILE
可以创建一个内容为空的新文件NEWFILE
, 若NEWFILE
已存在, 其内容不会丢失.
cp SOURCE DEST
可以将SOURCE
文件复制为DEST
文件; 如果DEST
是一个目录, 则将SOURCE
文件复制到该目录下.
mv SOURCE DEST
可以将SOURCE
文件重命名为DEST
文件; 如果DEST
是一个目录, 则将SOURCE
文件移动到该目录下.
mkdir DIR
能够创建一个DIR
目录.
rm FILE
能够删除FILE
文件; 如果使用-r
选项则可以递归删除一个目录.
删除后的文件无法恢复, 使用时请谨慎!
man
可以查看命令的帮助.
例如man ls
可以查看ls
命令的使用方法.
灵活应用man
和互联网搜索, 可以快速学习新的命令.
man
的功能不仅限于此. man
后可以跟两个参数, 可以查看不同类型的帮助(请在互联网上搜索). 例如当你不知道C标准库函数freopen
如何使用时, 可以键入命令
下面给出一些常用命令使用的例子, 你可以键入每条命令之后使用ls
查看命令执行的结果:
第一个例子是统计一个目录中(包含子目录)中的代码行数. 如果想知道当前目录下究竟有多少行的代码, 就可以在命令行中键入如下命令:
如果用man find
查看find
操作的功能, 可以看到find
是搜索目录中的文件. Linux中一个点.
始终表示Shell当前所在的目录, 因此find .
实际能够列出当前目录下的所有文件. 如果在文件很多的地方键入find .
,将会看到过多的文件, 此时可以按CTRL + c
退出.
我们最后的任务是统计这些文件所占用的总行数, 此时可以用man
查看wc
命令. wc
命令的-l
选项能够计算代码的行数. xargs
命令十分特殊, 它能够将标准输入转换为参数, 传送给第一个参数所指定的程序. 所以, 代码中的xargs wc -l
就等价于执行wc -l aaa.c bbb.c include/ccc.h ...
, 最终完成代码行数统计.
以下命令统计/usr/share
目录下各个目录所占用的磁盘空间:
du
是磁盘空间分析工具, du -sc
将目录的大小顺次输出到标准输出, 继而通过管道传送给sort
. sort
是数据排序工具, 其中的选项-n
表示按照数值进行排序, 而-r
则表示从大到小输出. sort
可以将这些参数连写在一起.
然而我们发现, /usr/share
中的目录过多, 无法在一个屏幕内显示. 此时, 我们可以再使用一个命令: more
或less
.
Linux中用户的主目录是/home/用户名称
, 如果你的用户名是user
, 你的主目录就是/home/user
. 用户的home
目录可以用波浪符号~
替代, 例如临时文件目录/home/user/Templates
可以简写为~/Templates
. 现在我们就可以进入主目录并编辑文件了. 如果Templates
目录不存在, 可以通过mkdir
命令创建它:
创建成功后, 键入
可以完成目录的切换. 注意在输入目录名时, tab
键可以提供联想.
进入正确的目录后就可以编辑文件了, 开源世界中主流的两大编辑器是vi(m)
和emacs
, 你可以使用其中的任何一种. 如果你打算使用emacs
, 你还需要安装它
vi
和emacs
这两款编辑器都需要一定的时间才能上手, 它们共同的特点是需要花较多的时间才能适应基本操作方式(命令或快捷键), 但一旦熟练运用, 编辑效率就比传统的编辑器快很多.
进入了正确的目录后, 输入相应的命令就能够开始编辑文件. 例如输入
就能开启一个文件编辑. 例如可以键入如下代码(对于首次使用vi
或emacs
的同学, 键入代码可能会花去一些时间, 在编辑的同时要大量查看网络上的资料):
保存后就能够看到hello.c
的内容了. 终端中可以用cat hello.c
查看代码的内容. 如果要将它编译, 可以使用gcc
命令:
就能够运行改程序. 命令中的./
是不能少的, 点代表了当前目录, 而./hello
则表示当前目录下的hello
文件. 与Windows不同, Linux系统默认情况下并不查找当前目录, 这是因为Linux下有大量的标准工具(如test
等), 很容易与用户自己编写的程序重名, 不搜索当前目录消除了命令访问的歧义.
有时我们希望将程序的输出信息保存到文件中, 方便以后查看. 例如你编译了一个程序myprog
, 你可以使用以下命令对myprog
进行反汇编, 并将反汇编的结果保存到output
文件中:
>
是标准输出重定向符号, 可以将前一命令的输出重定向到文件output
中. 这样, 你就可以使用文本编辑工具查看output
了.
但你会发现, 使用了输出重定向之后, 屏幕上就不会显示myprog
输出的任何信息. 如果你希望输出到文件的同时也输出到屏幕上, 你可以使用tee
命令:
使用输出重定向还能很方便地实现一些常用的功能, 例如
如果myprog
需要从键盘上读入大量数据(例如一个图的拓扑结构), 当你需要反复对myprog
进行测试的时候, 你需要多次键入大量相同的数据. 为了避免这种无意义的重复键入, 你可以使用以下命令:
<
是标准输入重定向符号, 可以将前一命令的输入重定向到文件data
中. 这样, 你只需要将myprog
读入的数据一次性输入到文件data
中, myprog
就会从文件data
中读入数据, 节省了大量的时间.
下面给出了一个综合使用重定向的例子:
这个命令在运行myprog
的同时, 指定其从文件data
中读入数据, 并将其输出信息打印到屏幕和文件output
中. time
工具记录了这一过程所消耗的时间, 最后你会在屏幕上看到myprog
运行所需要的时间. 如果你只关心myprog
的运行时间, 你可以使用以下命令将myprog
的输出过滤掉:
/dev/null
是一个特殊的文件, 任何试图输出到它的信息都会被丢弃, 你能想到这是怎么实现的吗? 总之, 上面的命令将myprog
的输出过滤掉, 保留了time
的计时结果, 方便又整洁.
大规模的工程中通常含有几十甚至成百上千个源文件(Linux内核源码有25000+的源文件), 分别键入命令对它们进行编译是十分低效的. Linux提供了一个高效管理工程文件的工具: GNU Make. 我们首先从一个简单的例子开始, 考虑上文提到的Hello World的例子, 在hello.c
所在目录下新建一个文件Makefile
, 输入以下内容并保存:
返回命令行, 键入make
, 你会发现make
程序调用了gcc
进行编译. Makefile
文件由若干规则组成, 规则的格式一般如下:
我们来解释一下上文中的hello
规则. 这条规则告诉make
程序, 需要生成的目标文件是hello
, 它依赖于文件hello.c
, 通过执行命令gcc hello.c -o hello
来生成hello
文件.
如果你连续多次执行make
, 你会得到"文件已经是最新版本"的提示信息, 这是make
程序智能管理的功能. 如果目标文件已经存在, 并且它比所有依赖文件都要"新", 用于生成目标的命令就不会被执行. 你能想到make
程序是如何进行"新"和"旧"的判断的吗?
上面例子中的clean
规则比较特殊, 它并不是用来生成一个名为clean
的文件, 而是用于清除编译结果, 并且它不依赖于其它任何文件. make
程序总是希望通过执行命令来生成目标, 但我们给出的命令rm hello
并不是用来生成clean
文件, 因此这样的命令总是会被执行. 你需要键入make clean
命令来告诉make
程序执行clean
规则, 这是因为make
默认执行在Makefile
中文本序排在最前面的规则. 但如果很不幸地, 目录下已经存在了一个名为clean
的文件, 执行make clean
会得到"文件已经是最新版本"的提示. 解决这个问题的方法是在Makefile
中加入一行PHONY: clean
, 用于指示"clean
是一个伪目标". 这样以后, make
程序就不会判断目标文件的新旧, 伪目标相应的命令序列总是会被执行.
对于一个规模稍大一点的工程, Makefile
文件还会使用变量, 函数, 调用Shell命令, 隐含规则等功能. 如果你希望学习如何更好地编写一个Makefile
, 请到互联网上搜索相关资料.
使用编辑器编辑文件jw.sh
为如下内容(另外由于教务网站的升级改版, 目前此脚本可能不能实现正确的功能):
运行这个例子需要在命令行中输入bash jw.sh
, 用bash解释器执行这一脚本. 如果希望定期运行这一脚本, 可以使用Linux的标准工具之一: cron
. 将命令添加到crontab就能实现定期自动刷新.
为了理解这个例子, 首先需要一些HTTP协议的基础知识. HTTP请求实际就是来回传送的文本流——浏览器(或我们例子中的爬虫)生成一个文本格式的HTTP请求, 包括header和content, 以文本的形式通过网络传送给服务器. 服务器根据请求内容(header中包含请求的URL以及浏览器等其他信息), 生成页面并返回.
用户登录的实现, 就是通过HTTP头中header中的cookie实现的. 当浏览器第一次请求页面时, 服务器会返回一串字符, 用来标识浏览器的这次访问. 从此以后, 所有与该网站交互时, 浏览器都会在HTTP请求的header中加入这个字符串, 这样服务器就"记住"了浏览器的访问. 当完成登录操作(将用户名和密码发送到服务器)后, 服务器就知道这个cookie隐含了一个合法登录的帐号, 从而能够根据帐号信息发送成绩.
得到包含了成绩信息的html文档之后, 剩下的事情就是解析它了. 我们用了大量的sed
和awk
完成这件事情, 同学们不用去深究其中的细节, 只需知道我们从文本中提取出了课程名和成绩, 并且将没有显示过的成绩显示出来.
我们讲解这个例子主要是为了说明新环境下的工作方式, 以及实践Unix哲学:
每个程序只做一件事, 但做到极致
用程序之间的相互协作来解决复杂问题
每个程序都采用文本作为输入和输出, 这会使程序更易于使用
一个Linux老手可以用脚本完成各式各样的任务: 在日志中筛选想要的内容, 搭建一个临时HTTP服务器(核心是使用nc
工具)等等. 功能齐全的标准工具使Linux成为工程师, 研究员和科学家的最佳搭档.
同样, 用man
查看grep
的功能——"print lines matching a pattern". grep
实现了输入的过滤, 我们的grep
有一个参数, 它能够匹配以.c
或.h
结束的文件. 正则表达式是处理字符串非常强大的工具之一, 每一个程序员都应该掌握其相关的知识. 有兴趣的同学可以首先阅读一个, 然后看一个有趣的小例子: . 正则表达式还可以用来编写一个30行的java表达式求值程序(传统方法几乎不可能), 聪明的你能想到是怎么完成的吗? 上述的grep
命令能够提取所有.c
和.h
结尾的文件.
刚才的find
和grep
命令, 都从标准输入中读取数据, 并输出到标准输出. 关于什么是标准输入输出, 请参考. 连接起这两个命令的关键就是管道符号|
. 这一符号的左右都是Shell命令, A | B
的含义是创建两个进程A
和B
, 并将A
进程的标准输出连接到B
进程的标准输入. 这样, 将find
和grep
连接起来就能够筛选出当前目录(.
)下所有以.c
或.h
结尾的文件.
此时将会看到输出的前几行结果. more
工具使用空格翻页, 并可以用q
键在中途退出. less
工具则更为强大, 不仅可以向下翻页, 还可以向上翻页, 同样使用q
键退出. 这里还有一个.
gcc
的-o
选项指定了输出文件的名称, 如果将-o hello
改为-o hi
, 将会生成名为hi
的可执行文件. 如果不使用-o
选项, 则会默认生成名为a.out
的文件, 它的含义是. 在命令行输入