网络浏览

firefox                全功能的网络浏览器

lynx                    文本模式的网络浏览器

wget                   下载网页和文件


firefox

firefox    [options]    [URL]

firefox是Linux及其他操作系统上最流行的网页浏览器之一,可以在后台启动,命令如下:

$ firefox &


lynx

lynx    [options]    [URL]

lynx是一个纯文本浏览器。它不显示图片,不播放音频和视频,甚至不响应鼠标操作。但是,当你仅仅希望快速查看网页或网络速度很慢或下载网站的HTML时,它有着难以置信的作用。它不运行javascript,甚至不接受cookie,因此特别适合检查可疑URL。如例:

$ lynx    http://www.yahoo.com

注意:所有的浏览动作都是通过键盘操作的。

按键 意义
?                                                                    获取帮助 
k 列出所有快捷键及其意义
^G 取消运行中的命令
q 退出lynx
Enter回车键)
打开当前链接或送出当前的窗体字段
左箭头(<-) 返回前一页
右箭头(->) 前进到下一页,或者单击当前链接                                            
g
到新网址(lynx会提示你输入URL)
p
保存,打印或以邮件发送当前网页
空格 向下卷动
b 向上卷动
向下箭头 将光标移到下一个链接或窗体的下一个字段
向上箭头
将光标移到前一个链接或窗体的前一个字段
^A 跳到页面顶端
^E
跳到页面底端
m 回到首页或主页面
/ 搜索网页中的文本
a 将当前网页加入书签
v
查看书签列表
r
删除书签
= 显示当前页面和链接的属性
\ 查看HTML源代码(再次按该键后回到正常模式)


wget

wget    [options]    URL

wget命令可以用于访问URL所指的网络站点,从该站点下载数据并存储到文件或传送到标准输出上。它非常适合撷取网页,下载文件或撷取任意深度的网站组织结构。比如,撷取Yahoo的首页:

$ wget http://www.yahoo.com

wget还提供了续传的功能。比如由于网络断线,下载被中断,当网络恢复后,运行wget  -c加上原来的URL,wget将从断点继续下载文件的剩余部分。也许wget最有用的功能是无须浏览器也可下载文件:

$ wget http://www.example.com/files/manual.pdf

这点对于下载大文件,如视频或ISO镜像文件特别有用。如果你知道所需文件的名字,甚至可以通过写shell脚本的方式下载它们:

$ for i in 1 2 3;do wget http://example.com/$i.mpeg;done

一个与wget类似的命令是curl,它的默认行为是将数据下载写到标准输出,不像wget是写入文件。

$ curl   > mypage.html

原本是写到标准输出的,现在重定向到了mypage.html上。

wget有超过70个选项,我们只涉及几个重要的选项。

选项                                                             描述
-i     filename 从指定的文件中读取URL,并逐个撷取
-o    filename 将取得的HTML全部写入指定文件中,一页接一页。
-c 续传模式
-t    N N次尝试未获得响应后放弃,N=0表示永不放弃
--progress=dot 下载进度条为点状
--progress=bar 下载进度条为柱状
--spider 不进行实质下载,只检查远程页面是否存在
-nd 不管远程目录树,直接将所有文件撷取到当前目录(默认方式下,wget复制整个目录树)
-r 递归撷取页面结构,包含其子目录
-l   N 最多撷取N层深度的文件(默认为5层)
-k 撷取文件时,修改其中的HTML链接,使其可在本地浏览器中查看。
-p 下载构成完整网页的所有必要文件,比如stylesheets和图像
-L 只跟随相对链接(在单一页面内),而不管绝对链接
-A   pattern 接受模式:只下载名字匹配pattern的文件
-R   pattern 拒绝模式:只下载名字不匹配pattern的文件
-I   pattern 目录包含:只下载名字与pattern匹配的目录下的文件
-X   pattern 目录排除:只下载名字与pattern不匹配的目录下的文件


你可能感兴趣的:(linux)