【正则表达式】正则表达式应用

JavaScript表单验证





Insert title here


    
姓名:
身份证:

Java中Web页面信息提取

提取Web页面中的城市中文名和英文名

Web页面





国际主要城市


    

国际主要城市

  • 纽约NewYork
  • 伦敦London
  • 东京Tokyo
  • 巴黎Paris
  • 香港HongKong
  • 新加坡Singapore
  • 悉尼Sydney
  • 米兰Milano
  • 上海Shanghai
  • 北京Beijing
  • 马德里Madrid
  • 莫斯科Moscow
  • 首尔Seoul
  • 曼谷Bangkok
  • 多伦多Toronto
  • 布鲁塞尔Brussels
  • 芝加哥Chicago
  • 吉隆坡KualaLumpur

信息提取

package com.imooc.regex;

import java.io.BufferedReader;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.InputStreamReader;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexSample {
    public static void main(String[] args) {
        StringBuilder content = new StringBuilder();
        try {
            FileInputStream fis = new FileInputStream("D:/workspace/regex/WebContent/sample.html"); //原始的文件输入流,擅长处理二进制数据
            InputStreamReader isr = new InputStreamReader(fis,"UTF-8"); //转换为可读的字符串流
            BufferedReader bufferedReader = new BufferedReader(isr); //从缓冲流读取,提高读取效率
            String lineText = "";
            while((lineText = bufferedReader.readLine()) != null) {
//              System.out.println(lineText);
                content.append(lineText + "\n");
            }
            bufferedReader.close();
            System.out.println(content);
        
        } catch (Exception e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        
        //1.创建正则表达式对象
        Pattern p = Pattern.compile("
  • ([\\u4e00-\\u9fa5]{2,10})([a-zA-Z]+)
  • "); //2.匹配正则表达式 Matcher m = p.matcher(content); //3.查找匹配的结果 while(m.find()) { // System.out.println(m.group(0)); //完整匹配信息 String chs = m.group(1); //分组1 String eng = m.group(2); //分组2 System.out.println(chs + "-" + eng); } } }

    你可能感兴趣的:(【正则表达式】正则表达式应用)