Jsoup爬取360电影网上的信息

跟我上一篇写的博客差不多,就不在多说了,直接贴上java代码了

package com.xiedong.Jsoup;



import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

/**
 * @author 谢栋
 * @data 2016年3月24日 下午8:52:33
 */
public class Parsre_html {

	public static void main(String[] args) throws Exception {
		// TODO Auto-generated method stub

		article();
	}
	
	public static void article1() throws Exception
	{
		Document doc=Jsoup.connect("http://www.360kan.com/").get();
		
		
		
		Elements listClass=doc.getElementsByAttributeValue("class", "eb-nav-item   js-ebnav");
		  
		for(Element ListElement : listClass)
		{
			Elements listName =ListElement.getElementsByTag("a");
			
			for(Element element : listName )
			{
				//得到的是一个节点值    首页
				System.out.println(element.getElementsByAttribute("href"));
				//得到的是里面的内容       http://www.360kan.com
				System.out.println(element.attr("href"));
				
				
				System.out.println(element.text().trim());
			}
		}
	}

	
	
	 public static void article()  {
		 Document doc;
		try {
			doc = Jsoup.connect("http://www.360kan.com/").get();
			

			Elements listClass=doc.getElementsByAttributeValue("class", "b-topslider-item js-g-slide-item g-slide-item");
			
			for(Element listElement : listClass)
			{
				Elements listName=listElement.getElementsByTag("a");
				for(Element element :listName)
				{
					String href=element.attr("href");
					String text=element.text().trim();
					
					System.out.println(href);
					System.out.println(text);
				}
			}
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
			
	 }		
			
	 

	 
}


你可能感兴趣的:(Android)