Solr 配置第三方分词器也是十分简单,这里以IK分词器为例。点击下载我自编译的 IK 分词器,支持到 JDK 1.8 + Lucene 6.6.2。

Step1:IK 分词器的jar包放到 D:\apache-tomcat-8.5.16\webapps\solr\WEB-INF\lib 目录下。

Step2: 将 IK 分词器的配置文件放到 D:\apache-tomcat-8.5.16\webapps\solr\WEB-INF\classes 文件夹下,文件夹如果不存在手动创建:

这三个配置文件作用及内容不再赘述,查看文章:《Lucene初探——基于Lucene 6.6.2》

Step3:managed-schema 配置文件中添加IK分词器的类型,以及创建使用 IK 分词器的域:

1
2
3
4
5
6
7
8
<!-- IK分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

<!-- IK分词器的域 -->
<field name="title_ik" type="text_ik" indexed="true" stored="true" />
<field name="content_ik" type="text_ik" indexed="true" stored="false" multiValued="true"/>

Step4: 重新启动 Solr 服务,测试一下 IK 分词器的效果: