当前位置:首页 > 后端开发 > solr 配置clustering

solr 配置clustering

7个月前 (05-20)62

首先是在solrconfig.xml,添加

 <searchComponent
    name="clusteringComponent"
    enable="${solr.clustering.enabled:true} "
    class="org.apache.solr.handler.clustering.ClusteringComponent" >
    <!-- Declare an engine -->
    <lst name="engine">
      <!-- The name, only one can be named "default" -->
      <str name="name">default</str>
      <!--
           Class name of Carrot2 clustering algorithm. Currently available algorithms are:
          
           * org.carrot2.clustering.lingo.LingoClusteringAlgorithm
           * org.carrot2.clustering.stc.STCClusteringAlgorithm
          
           See http://project.carrot2.org/algorithms.html for the algorithm's characteristics.
        -->
      <str name="carrot.algorithm">org.carrot2.clustering.lingo.LingoClusteringAlgorithm</str>
      <!--
           Overriding values for Carrot2 default algorithm attributes. For a description
           of all available attributes, see: http://download.carrot2.org/stable/manual/#chapter.components.
           Use attribute key as name attribute of str elements below. These can be further
           overridden for individual requests by specifying attribute key as request
           parameter name and attribute value as parameter value.
        -->
      <str name="LingoClusteringAlgorithm.desiredClusterCountBase">20</str>
    </lst>
    <lst name="engine">
      <str name="name">stc</str>
      <str name="carrot.algorithm">org.carrot2.clustering.stc.STCClusteringAlgorithm</str>
    </lst>
  </searchComponent>
  <requestHandler name="/clustering" class="solr.SearchHandler">
     <lst name="defaults">
       <bool name="clustering">true</bool>
       <str name="clustering.engine">default</str>
       <bool name="clustering.results">true</bool>
       <!-- The title field -->
       <str name="carrot.title">name</str>
       <str name="carrot.url">id</str>
       <!-- The field to cluster on -->
       <str name="carrot.snippet">features</str>
       <!-- produce summaries -->
       <bool name="carrot.produceSummary">true</bool>
       <!-- the maximum number of labels per cluster -->
       <!--<int name="carrot.numDescriptions">5</int>-->
       <!-- produce sub clusters -->
       <bool name="carrot.outputSubClusters">false</bool>
    </lst>    
    <arr name="last-components">
      <str>clusteringComponent</str>
    </arr>
  </requestHandler>

 

 

然后在%solr_home%/lib目录下添加扩展包:

从下载的solr项目中将

dist/apache-solr-clustering-*.jar,

contrib/clustering目录下的所有jar包,

contrib/clustering/downloads 目录下的所有jar包

加入到%solr_home%/lib.

 

在加入扩展包时,遇到一个问题,就是下载的solr项目下contrib/clustering/downloads的目录下没有jar包,这个需要运行contrib/clustering目录下的 build.xml

所以先安装Ant,然后运行 cmd,进入doc界面,进入contrib/clustering目录,运行 ant命令

便会下载相应的jar 包,包括

simple-xml-1.7.3.jar,pcj-1.2.jar,colt-1.2.0.jar, nni.jar四个包

但是可能build.xml指定的下载nni.jar包时的路径有问题,所以没有下载成功。所以自已得去网下搜索下载它。

 

 

 

 

运行solr:

http://localhost:8080/solr/clustering?q=*:*&rows=10

 

 

作者:源远流长
来源链接:https://blog.csdn.net/duck_genuine/article/details/5767096

标签: Solr

“solr 配置clustering” 的相关文章

Solr的核心配置之操作数据库

Solr的核心配置之操作数据库

上一篇文章中进行Solr的安装和启动,那么本篇就聊下Solr核心的配置。 1、核心的配置 当Solr的服务器在独立模式下启动的配置称为核心。...

Solr主要配置文件之solrconfig.xml。

        在配置方面,solrconfg.xml文件不仅指定了Solr如何处理索引、突出显示、分类...

solr suggest智能提示配置

  目录 配置文件 Java代码 遇到的问题 回到顶部 配置文件 solrcon...

solr配置同义词,停止词,和扩展词库(IK分词器为例)

solr配置同义词,停止词,和扩展词库(IK分词器为例)

定义 同义词:搜索结果里出现的同义词。如我们输入”还行”,得到的结果包括同义词”还可以”。 停止词:在搜索时不用出现在结果里的词。比如i...

apache solr 安装

某个项目中用到了全文搜索引擎apache solr。之前一直是在命令行用java –jar start.jar来启动solr的。这样的方式只能用在开发时。因为一旦...

solr和Lucene的配置方式和应用

solr和Lucene的配置方式和应用

solr字段类型 类 说明 BinaryField 二进制数据...

solr入门教程

solr入门教程

  solr在java中的使用:http://blog.csdn.net/u012385190/article/details/53115546...

Solr 3.5 + Tomcat7 + mmseg4j + 搜狗词库 -配置并运行

机器上已安装 : Tomcat 7    jdk1.7    mysql 5.0 访问 http://www....

设置solr.solr.home的三种方式

solr/home是solr实例化core核的依据和入口,是必不可少的配置。 在tomcat中有三种方式可以完成其配置。   1、在web.xml...

Linux安装Tomcat-Nginx-FastDFS-Redis-Solr-集群——【第五集之网络配置】

Linux安装Tomcat-Nginx-FastDFS-Redis-Solr-集群——【第五集之网络配置】

还有对第五集的补充:https://www.cnblogs.com/lirenhe/p/10405069.html 1,如果不为这个linux系统或者这台虚拟机配置IP,就不能实现...