抓取百度搜索高亮词汇

public static Set<String> getBaiDuHighlightKeyWords(String str) {
  String url = "http://www.baidu.com/s?wd="
    + str
    + "&ie=utf-8";
  Set<String> keySet = new HashSet<String>();
  try {
   Document doc = Jsoup.connect(url).timeout(6000).get();
   Elements elements = doc.select("h3 em");
   for (int i = 0; i < elements.size(); i++) {
    keySet.add(StringUtils.outTag(elements.get(i).toString()));
   }
  } catch (IOException e) {
   e.printStackTrace();
  }
  return keySet;
 }

  引用包:    Jsoup1.7

 

你可能感兴趣的:(搜索,JSoup,搜索高亮,抓取,百度搜索)