Nutch1.3集成Solr3.4网页快照功能实现(四)

在工程中找到“solrindex-mapping.xml”修改如下:

<fields>

        <field dest="content" source="content"/>

 

        <field dest="cache_content" source="cache_content"/>

 

        <field dest="site" source="site"/>

        <field dest="title" source="title"/>

        <field dest="host" source="host"/>

        <field dest="segment" source="segment"/>

        <field dest="boost" source="boost"/>

        <field dest="digest" source="digest"/>

        <field dest="tstamp" source="tstamp"/>

        <field dest="id" source="url"/>

        <copyField source="url" dest="url"/>

    </fields>

Solr应用中修改“schema.xml”添加对应的Field,如下:

<field name="url" type="string" indexed="true" stored="true"/>

  <field name="content" type="textMaxWord" indexed="true" stored="true"/>

  <field name="cache_content" type="binary" indexed="false" stored="true"/>

  <field name="segment" type="string" indexed="false" stored="true"/>

  <field name="boost" type="float" indexed="true" stored="true"/>

  <field name="digest" type="string" indexed="false" stored="true"/>

  <field name="host" type="string" indexed="true" stored="false"/>

  <field name="cache" type="string" indexed="true" stored="false"/>

  <field name="site" type="string" indexed="true" stored="false"/>

  <field name="anchor" type="string" indexed="true" stored="false" multiValued="true"/>

  <field name="tstamp" type="string" indexed="false" stored="true"/>

重启服务,大功告成,solr查询返回结果如下所示:

 

本文出自 “果壳中的宇宙” 博客,转载请与作者联系!

你可能感兴趣的:(Nutch,Solr,休闲,网页快照,Nutch集成Solr)