Java 获取Html文本中的img标签下src中的内容方法

如下所示:

/**
  * 得到网页中图片的地址
  * @param sets html字符串
  */
 public Set getImgStr(String htmlStr) {
  Set pics = new HashSet();
  String img = "";
  Pattern p_image;
  Matcher m_image;
  String regEx_img = "]*?>";
  p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
  m_image = p_image.matcher(htmlStr);
  while (m_image.find()) {
   // 得到数据
   img = m_image.group();
   // 匹配中的src数据
   Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
   while (m.find()) {
    pics.add(m.group(1));
   }
  }
  return pics;
 }

以上这篇Java 获取Html文本中的img标签下src中的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

你可能感兴趣的:(Java 获取Html文本中的img标签下src中的内容方法)