SAX解析 XML的Demo

下面我们就用上面介绍的 Java SDK 中的SAX 方式来实现解析 XML 形式的地震数据的 Demo例子。

三. 实例开发

我们要解析的为美国地质调查局USGS 提供的地震数据, xml 数据地址为:

http://earthquake.usgs.gov/earthquakes/catalogs/1day-M2.5.xml

http://earthquake.usgs.gov/earthquakes/catalogs/7day-M2.5.xml

http://earthquake.usgs.gov/earthquakes/catalogs/7day-M5.xml

分别为1 天以内 2.5 级以上、 7 天内 2.5 级以上和 7 天内 5 级以上地震数据。

Xml数据的格式如下所示:

[xhtml]  view plain copy
  1. <?xml version="1.0"?>  
  2. <feed xmlns="http://www.w3.org/2005/Atom" xmlns:georss="http://www.georss.org/georss">  
  3.   <updated>2010-09-15T04:41:18Z</updated>  
  4.   <title>USGS M2.5+ Earthquakes</title>  
  5.   <subtitle>Real-time, worldwide earthquake list for the past day</subtitle>  
  6.   <link rel="self" href="http://earthquake.usgs.gov/earthquakes/catalogs/1day-M2.5.xml" mce_href="http://earthquake.usgs.gov/earthquakes/catalogs/1day-M2.5.xml"/>  
  7.   <link href="http://earthquake.usgs.gov/earthquakes/" mce_href="http://earthquake.usgs.gov/earthquakes/"/>  
  8.   <author><name>U.S. Geological Survey</name></author>  
  9.   <id>http://earthquake.usgs.gov/</id>  
  10.   <icon>/favicon.ico</icon>  
  11.   <entry>  
  12.       <id>urn:earthquake-usgs-gov:ak:10078833</id>  
  13.       <title>M 2.9, Southern Alaska</title>  
  14.       <updated>2010-09-15T04:14:03Z</updated>  
  15.       <link rel="alternate" type="text/html" href="http://earthquake.usgs.gov/earthquakes/recenteqsww/Quakes/ak10078833.php" mce_href="http://earthquake.usgs.gov/earthquakes/recenteqsww/Quakes/ak10078833.php"/>  
  16.       <summary type="html">  
  17.         <!--[CDATA[<img src="http://earthquake.usgs.gov/images/globes/60_-155.jpg" mce_src="http://earthquake.usgs.gov/images/globes/60_-155.jpg" alt="59.909&#176;N 153.124&#176;W" align="left" hspace="20" /><p>Wednesday, September 15, 2010 04:14:03 UTC<br>Tuesday, September 14, 2010 08:14:03 PM at epicenter</p><p><b>Depth</b>: 98.90 km (61.45 mi)</p>]]-->  
  18.       </summary>  
  19.       <georss:point>59.9094 -153.1241</georss:point>  
  20.       <georss:elev>-98900</georss:elev>  
  21.       <category label="Age" term="Past hour"/>  
  22.   </entry>  
  23.    <entry>  
  24.     <!-- 还有entry条目,省略-->  
  25.   </entry>  
  26. </feed>  

下面我们就来完成用Java SAX 的方式解析以上 XML 形式的 USGS 地震数据的 Android 例子。

我们要完成的效果图如下图1 所示:

SAX解析 XML的Demo_第1张图片

1 ListView 列表显示的地震数据

解析完地震数据后用ListView 列表的方式显示每条地震的震级和地名信息。

新建一个Android 工程 AndroidXMLDemoSax 。

首先新建添加一个类EarthquakeEntry ,用来保存一条地震信息,类的内容为:

[java]  view plain copy
  1. public class EarthquakeEntry {  
  2.     //定义变量  
  3.     private Date date;  
  4.     private Location location;  
  5.     private String place;  
  6.     private String link;  
  7.     private double magnitude;  
  8.     private double elev;  
  9.     //构造函数  
  10.     public EarthquakeEntry()  
  11.     {  
  12.           
  13.     }  
  14.     public EarthquakeEntry(Date _date, String _place, String _link, Location _location, double _magnitude, double _elev)  
  15.     {  
  16.         this.date = _date;  
  17.         this.location = _location;  
  18.         this.place = _place;  
  19.         this.link = _link;  
  20.         this.magnitude = _magnitude;  
  21.         this.elev = _elev;  
  22.     }     
  23.     //set方法  
  24.     public void setDate(Date _date)  
  25.     {  
  26.         this.date = _date;  
  27.     }  
  28.     public void setLocation(Location _location)  
  29.     {  
  30.         this.location = _location;  
  31.     }  
  32.     public void setPlace(String _place)  
  33.     {  
  34.         this.place = _place;  
  35.     }  
  36.     public void setLink(String _link)  
  37.     {  
  38.         this.link = _link;  
  39.     }  
  40.     public void setMagnitude(double _magnitude)  
  41.     {  
  42.         this.magnitude = _magnitude;  
  43.     }  
  44.     public void setElev(double _elev)  
  45.     {  
  46.         this.elev = _elev;  
  47.     }  
  48.     //get方法  
  49.     public Date getDate()  
  50.     {  
  51.         return this.date;  
  52.     }  
  53.     public Location getLocation()  
  54.     {  
  55.         return this.location;  
  56.     }  
  57.     public String getPlace()  
  58.     {  
  59.         return this.place;  
  60.     }  
  61.     public String getLink()  
  62.     {  
  63.         return this.link;  
  64.     }  
  65.     public double getMagnitude()  
  66.     {  
  67.         return this.magnitude;  
  68.     }  
  69.     public double getElev()  
  70.     {  
  71.         return this.elev;  
  72.     }  
  73.       
  74.     @Override  
  75.     public String toString() {  
  76.         String earthquakeString = " M" + magnitude + " " + place;  
  77.         return earthquakeString;  
  78.     }  
  79.     }  

比较简单,定义和一条地震内容对应的变量,并设置set 和 get 函数,并且重写 toString()函数在 ListView 输出时用。

 

接着新建添加一个类SaxEarthquakeHandler ,继承 DefaultHandler ,完成解析地震数据的具体逻辑实现,内容如下:

[java]  view plain copy
  1. public class SaxEarthquakeHandler extends DefaultHandler{  
  2.     //xml解析用到的Tag  
  3.     private String kEntryElementName = "entry";  
  4.     private String kLinkElementName = "link";  
  5.     private String kTitleElementName = "title";  
  6.     private String kUpdatedElementName = "updated";  
  7.     private String kGeoRSSPointElementName = "point";  
  8.     private String kGeoRSSElevElementName = "elev";  
  9.     //用于保存xml解析获取的结果  
  10.     private ArrayList<EarthquakeEntry> earthquakeEntryList;  
  11.     private EarthquakeEntry earthquakeEntry;  
  12.     private StringBuilder currentDataBuilder;  
  13.     private Boolean startEntryElementFlag = false;  
  14.       
  15.     //获取解析的地震列表  
  16.     public ArrayList<EarthquakeEntry> getEarthquakeEntryList()  
  17.     {  
  18.         return this.earthquakeEntryList;  
  19.     }  
  20.     //具体的xml解析回调函数  
  21.     @Override  
  22.     public void startDocument() throws SAXException {  
  23.         super.startDocument();  
  24.         //在开始解析时先创建实例  
  25.         earthquakeEntryList = new ArrayList<EarthquakeEntry>();  
  26.         currentDataBuilder = new StringBuilder();  
  27.     }  
  28.     @Override  
  29.     public void endDocument() throws SAXException {  
  30.         // TODO Auto-generated method stub  
  31.         Log.v("Sax""End");          
  32.     }  
  33.     //解析每一个标签Tag  
  34.     @Override  
  35.     public void startElement(String uri, String localName, String qName,  
  36.             Attributes attributes) throws SAXException {  
  37.         super.startElement(uri, localName, qName, attributes);  
  38. //      Log.v("Sax_StartElement", localName);  
  39.         if(localName.equalsIgnoreCase(kEntryElementName))  
  40.         {  
  41.             earthquakeEntry = new EarthquakeEntry();  
  42.             startEntryElementFlag = true;   
  43.         }  
  44.         else if ((localName.equalsIgnoreCase(kLinkElementName))&&(startEntryElementFlag == true)) {  
  45.             String relAttribute = attributes.getValue("rel");  
  46.             if(relAttribute.equalsIgnoreCase("alternate"))  
  47.             {  
  48.                 String webLink = attributes.getValue("href");  
  49.                 earthquakeEntry.setLink(webLink);  
  50.             }  
  51.         }  
  52.     }  
  53.     @Override  
  54.     public void characters(char[] ch, int start, int length)  
  55.             throws SAXException {  
  56.         super.characters(ch, start, length);  
  57.         currentDataBuilder.append(ch, start, length);  
  58.     }  
  59.     @Override  
  60.     public void endElement(String uri, String localName, String qName)  
  61.             throws SAXException {  
  62.         super.endElement(uri, localName, qName);  
  63.         if(startEntryElementFlag == true)  
  64.         {     
  65.             String currentData = currentDataBuilder.toString();  
  66.             if (localName.equalsIgnoreCase(kTitleElementName)) {  
  67.                 //提取强度信息  
  68.                 String magnitudeString = currentData.split(" ")[1];  
  69.                 int end =  magnitudeString.length()-1;  
  70.                 magnitudeString = magnitudeString.substring(0, end);  
  71.                 double magnitude = Double.parseDouble(magnitudeString);  
  72.                 earthquakeEntry.setMagnitude(magnitude);  
  73.                 //提取位置信息  
  74.                 String place = currentData.split(",")[1].trim();  
  75.                 earthquakeEntry.setPlace(place);  
  76.             }  
  77.             else if (localName.equalsIgnoreCase(kUpdatedElementName)) {  
  78.                 //构造更新时间  
  79.                 SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd'T'HH:mm:ss'Z'");  
  80.                 Date qdate = new GregorianCalendar(0,0,0).getTime();  
  81.                 try {  
  82.                   qdate = sdf.parse(currentData);  
  83.                 } catch (ParseException e) {  
  84.                   e.printStackTrace();  
  85.                 }  
  86.                 earthquakeEntry.setDate(qdate);  
  87.             }  
  88.             else if (localName.equalsIgnoreCase(kGeoRSSPointElementName)) {  
  89.                 //提取经纬度信息  
  90.                 String[] latLongitude = currentData.split(" ");  
  91.                 Location location = new Location("dummyGPS");  
  92.                 location.setLatitude(Double.parseDouble(latLongitude[0]));  
  93.                 location.setLongitude(Double.parseDouble(latLongitude[1]));  
  94.                 earthquakeEntry.setLocation(location);  
  95.             }  
  96.             else if (localName.equalsIgnoreCase(kGeoRSSElevElementName)) {  
  97.                 //提取海拔高度信息  
  98.                 double evel;  
  99.                 //因为USGS数据有可能会输错,比如为"--10000",多了一个"-"号  
  100.                 try {  
  101.                     evel = Double.parseDouble(currentData);  
  102.                 } catch (Exception e) {  
  103.                     // TODO: handle exception  
  104.                     e.printStackTrace();  
  105.                     evel = 0;  
  106.                 }  
  107.                 Log.v("Sax_Elev", String.valueOf(evel));  
  108.                 earthquakeEntry.setElev(evel);  
  109.             }  
  110.             else if(localName.equalsIgnoreCase(kEntryElementName))  
  111.             {  
  112.                 earthquakeEntryList.add(earthquakeEntry);  
  113.                 startEntryElementFlag = false;  
  114.             }  
  115.             currentDataBuilder.setLength(0);  
  116.         }  
  117.     }     
  118.     }  

首先定义了 xml解析和保存解析结果等相关的一些变量,接着定义一个 get 函数

//获取解析的地震列表

public  ArrayList<EarthquakeEntry> getEarthquakeEntryList()

{

return   this . earthquakeEntryList ;

}

返回解析的地震列表数据。

然后就是具体的xml 解析回调函数的重写实现,因为继承了类 DefaultHandler ,包含了SAX 处理相关的 4 个 Handler 的所有回调函数的空实现,因此我们只需覆盖我们需要的回调函数。这是我们只重写了和文档内容处理相关的 ContentHandler 中 startDocument endDocument  startElement  characters ,和 endElement 这几个回调函数,在实际应用中你可能还需添加错误处理或者其他的回调函数,只需重写覆盖即可。

回调函数中具体的处理逻辑和你的XML 数据的内容有关,以上实现了解析 USGS 的地震数据的处理逻辑,并添加了注释,如果有兴趣你可以对照着 USGS 的 XML 数据格式来看,这就不具体的讲了。

和地震相关的存储类和SAX 处理回调函数都完成了,接下来我们就来调用SaxEarthquakeHandler 开始解析并显示数据。

先修改res/layout 下的 main.xml 为:

[xhtml]  view plain copy
  1. <?xml version="1.0" encoding="utf-8"?>  
  2. <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"  
  3.     android:orientation="vertical"  
  4.     android:layout_width="fill_parent"  
  5.     android:layout_height="fill_parent"  
  6.     >  
  7.   <ListView  
  8.     android:id="@+id/list"  
  9.     android:layout_width="fill_parent"   
  10.     android:layout_height="fill_parent"  
  11.   />  
  12.     </LinearLayout>  

 

添加了一个用于显示的ListView 控件。

接着添加AndroidXMLDemoSax.java 文件的内容。

先添加获取xml 数据源的方法:

[java]  view plain copy
  1. private InputStream readEarthquakeDataFromInternet()  
  2.     {  
  3.         //从网络上获取实时地震数据  
  4.         URL infoUrl = null;  
  5.         InputStream inStream = null;  
  6.         try {  
  7.             infoUrl = new URL("http://earthquake.usgs.gov/earthquakes/catalogs/1day-M2.5.xml");  
  8.             URLConnection connection = infoUrl.openConnection();  
  9.             HttpURLConnection httpConnection = (HttpURLConnection)connection;  
  10.             int responseCode = httpConnection.getResponseCode();  
  11.             if(responseCode == HttpURLConnection.HTTP_OK)  
  12.             {  
  13.                 inStream = httpConnection.getInputStream();  
  14.             }  
  15.         } catch (MalformedURLException e) {  
  16.             // TODO Auto-generated catch block  
  17.             e.printStackTrace();  
  18.         } catch (IOException e) {  
  19.             // TODO Auto-generated catch block  
  20.             e.printStackTrace();  
  21.         }  
  22.         return inStream;  
  23.         }  

这是从 USGS的网站上读取 XML 数据并以 InputStream  的形式返回。因为需要用到联网功能,所以还得在 manifest.xml文件中添加联网权限:

< uses-permission   android:name = "android.permission.INTERNET"   />

这是联网获取XML 数据,也可以从本地读取 XML 数据,因为校园网会打不开 USGS 的网站,因此复制了一份 USGS 的地震数据以文件的形式保存在 assets 文件夹下,并使用如下函数读取:

[java]  view plain copy
  1. private InputStream readEarthquakeDataFromFile()  
  2.     {  
  3.         //从本地获取地震数据  
  4.         InputStream inStream = null;  
  5.         try {  
  6.             inStream = this.getAssets().open("USGS_Earthquake_1M2_5.xml");  
  7.         } catch (IOException e) {  
  8.             // TODO Auto-generated catch block  
  9.             e.printStackTrace();  
  10.         }  
  11.         return inStream;  
  12.         }  

有了XML 数据,就可以接下来进行解析了。

[java]  view plain copy
  1.  //获取地震数据流  
  2.       InputStream earthquakeStream = readEarthquakeDataFromFile();  
  3.       //Sax方式进行xml解析  
  4.     SAXParserFactory factory = SAXParserFactory.newInstance();  
  5.     try {  
  6.     SAXParser parser = factory.newSAXParser();  
  7.     SaxEarthquakeHandler saxHandler = new SaxEarthquakeHandler();  
  8.     parser.parse(earthquakeStream, saxHandler);  
  9.     //获取解析后的列表数据  
  10.     earthquakeEntryList = saxHandler.getEarthquakeEntryList();  
  11. catch (Exception e) {  
  12.     // TODO Auto-generated catch block  
  13.     e.printStackTrace();  
  14.     }  

最后添加定义相关变量,用把解析的数据用ListView 显示:

[java]  view plain copy
  1. //定义显示的List相关变量  
  2. ListView list;  
  3. ArrayAdapter<EarthquakeEntry> adapter;  
  4.     ArrayList<EarthquakeEntry> earthquakeEntryList;  
  5.   
  6.     //用ListView进行显示  
  7.     list = (ListView)this.findViewById(R.id.list);  
  8.     adapter = new ArrayAdapter<EarthquakeEntry>(this, android.R.layout.simple_list_item_1, earthquakeEntryList);  
  9.         list.setAdapter(adapter);  

完成了,可以保存运行看下效果。

 

以上使用的是javax.xml.parsers 包中的 SAXParser 来实现, SAXParser 包装了底层的 XMLReader ,实现起来更加方便。但是我们也可以使用 XMLReader 来实现解析,下面就看下使用具体的 XMLReader 的方式,实现代码如下所示:

[java]  view plain copy
  1.         //使用org.xml.sax包中的XMLReader进行xml解析  
  2.         XMLReader xmlReader = null;  
  3.         //获取XMLReader的方式有两种  
  4.         //方式一:使用javax.xml.parsers.SAXParser的getXMLReader()方法  
  5. //        try {  
  6. //          xmlReader = SAXParserFactory.newInstance().newSAXParser().getXMLReader();  
  7. //      } catch (Exception e) {  
  8. //          // TODO Auto-generated catch block  
  9. //          e.printStackTrace();  
  10. //      }  
  11.         //方式二:使用org.xml.sax.helpers.XMLReaderFactory的createXMLReader()方法  
  12.         try {  
  13.             //设置系统的"org.xml.sax.driver",XMLReaderFactory创建createXMLReader()时要用到  
  14.             System.setProperty("org.xml.sax.driver","org.xmlpull.v1.sax2.Driver");  
  15.             xmlReader = XMLReaderFactory.createXMLReader();  
  16.         } catch (SAXException e) {  
  17.             // TODO Auto-generated catch block  
  18.             e.printStackTrace();  
  19.         }  
  20.         SaxEarthquakeHandler saxHandler = new SaxEarthquakeHandler();  
  21.         xmlReader.setContentHandler(saxHandler);  
  22.         //XMLReader的输入为InputSource  
  23.         InputSource inSource = new InputSource(earthquakeStream);  
  24.         try {  
  25.             xmlReader.parse(inSource);  
  26.         } catch (Exception e) {  
  27.             // TODO Auto-generated catch block  
  28.             e.printStackTrace();  
  29.         }  
  30.         //获取解析后的列表数据  
  31.             earthquakeEntryList = saxHandler.getEarthquakeEntryList();  

其中获取XMLReader 的方式有两种,一种是先获取 SAXParser ,然后通过getXMLReader() 方法来获取,

xmlReader = SAXParserFactory.newInstance().newSAXParser().getXMLReader();

另一种是直接使用XMLReader 的工厂类 XMLReaderFactory 调用 createXMLReader()方法创建,

xmlReader = XMLReaderFactory. createXMLReader ();

 不管是那种方式,只有获得了XMLReader 实例,接下来的操作都是一样的,先注册文档内容的事件处理器实例,

xmlReader.setContentHandler(saxHandler);

然后调用parse方法开始解析,

xmlReader.parse(inSource);

这样就用XMLReader进行了XML解析。

四. 总结

在这部分中我们首先学习了Android 上和 XML 解析相关的各个包的简单介绍,并且从有这么多个相关的包我们可以知道 Android 为 XML 的读写提供了相当大的支持。

然后具体学习了Android 上使用 SAX 方式解析 XML 的基本知识,使用 javax.xml.parsers 包中的 SAXParser 进行解析,及使用 org.xml.sax 包中的 XMLReader 进行解析两种方式分别的步骤,最后用解析 USGS 地震数据的 Demo 例子来实现介绍的内容。

这部分介绍的SAX 方式是属于原来 Java 就有的 XML 处理方式,同时, Android 平台为了使解析 XML 还能更加方便和更加健壮,提供了 android.sax 包来进行 SAX 进行 XML ,这部分内容我们以后我们继续接着学习。

你可能感兴趣的:(SAX解析 XML的Demo)