html与JavaScript回顾

标签中 THEAD TFOOT TBODY
表格由行所组成,行由单元格组成
表格中默认都有一个标签tbody

THEAD TFOOT表格列信息
TBODY 控制表格分行下载,可先显示部分内容,避免全部解析后一起显示

标签 与服务器交互

action属性: 指定数据提交的目的地

get与post
get会把提交的信息显示在地址栏上,post不会
get对于敏感信息不安全 post安全
get最长2083 提交数据体积受地址栏的限制, post没有,可以提交大体积数据
get将提交信息封装在请求行,也就是http消息头之前. post 数据体中,也就是http消息头之后的空行后

对于服务端而言:
表单尽量用post提交,因为涉及到编码问题 tomcat默认的解码方式是 iso8859-1
对于post提交的中文。 在服务器端可以直接用setCharacterEncoding("gbk")就可以解决
对于get提交的中文。 在服务器端只能通过 iso8859-1将数据解码一次,在通过指定码表如GBK进行解码

使用表单的组件不一定要使用form标签,只有需要将数据进行提交的时候才用到form标签

体标签

标签保持数据原样格式输出

标签 段落分隔
加粗
斜体
下划线
下标
上标
由右向左飞入 direction飞入方向(left right up down)
behavior飞入方式 slide常用

头标签

href:
mailto:[email protected] 发送邮件
thunder://.... 迅雷下载
target="_blank" 在新窗口中打开 打开超链接的方式



name 属性 :网页的描述信息
http-equiv 属性:模拟http协议的响应消息头

无指定url则在本页面刷新


rel 属性:描述目标文档与当前文档的关系
type 属性:文档类型
meida:指定目标文档在哪种设备上起作用

正则表达式 (弊端:阅读性较差)
1.匹配 String matches(regex)
2.获取(查找)
Pattern p = Pattern.compile("a*b");
Matcher m = p.matcher("aaaaab");
boolean b = m.matches();

while(m.find()){
System.out.println(m.group());
}

3.切割String split(regex);
4.替换String replaceAll(regex,str)

网络爬虫
通过网络以及IO读取网页中的源文件,并且通过规则获取网页中的符合规则的数据

eg: mial爬虫

String mailreg="[a-zA-Z0-9]{6,12}@[a-zA-Z0-9]+(\\.[a-zA-Z]+)+";

组的含义:将部分进行封装以便重用


特殊字符 避免被解析
<: <
>: >
&: &
空格:  

标题:

....


新浪

被点击后,会启动引所对应解析程序取查找指定主机
1. 先去查找本地主机的hosts文件.如果没有找到该主机对应的ip地址
2. 取公网的 DNS服务器上找对应的ip地址

定位标记
页首

回到页首

文本区域