Hjelpen utnytter funksjonaliteten i søkemotoren i Lucene. Den tillater indeksering av symbolstrømmer (ordstrømmer). Analysatorene oppretter symboler fra tegnstrømmen. De undersøker tekstinnholdet og skaffer symboler til bruk med indeksen. Tekststrømmene kan symboliseres på mange unike måter. En enkel analysator kan symbolisere strømmer av blanktegn, en annen kan utføre filtrering av symboler, basert på applikasjonens behov. Siden dokumentasjonen for det meste består av lesbar tekst, er det ønskelig at analysatorer som brukes av hjelpefunksjonen, utfører språk- og grammatikkfølsom symbolisering og normalisering av indeksert tekst. For noen språk øker kvaliteten av søk betydelig hvis det utføres fjerning av stoppord og bruk av ordstammer i den indekserte teksten.
Analysatoren for dette utvidelsespunktet vil overstyre den som er oppgitt av hjelpefunksjonen for Eclipse for et gitt språkmiljø.
<!ELEMENT extension (analyzer*)>
<!ATTLIST extension
point CDATA #REQUIRED
id CDATA #IMPLIED
name CDATA #IMPLIED>
<!ELEMENT analyzer EMPTY>
<!ATTLIST analyzer
locale CDATA #REQUIRED
class CDATA #REQUIRED>
<extension id=
"com.xyx.XYZ"
point=
"org.eclipse.help.base.luceneAnalyzer"
>
<analyzer locale=
"ll_CC"
class=
"com.xyz.ll_CCAnalyzer"
/>
</extension>
Verdien av class-attributtet må representere en klasse som utvider org.apache.lucene.analysis.Analyzer. Det anbefales at denne analysatoren utfører filtrering av små bokstaver for språk der det er mulig å øke antall søketreff ved å skille mellom små og store bokstaver.
Copyright (c) 2000, 2005 IBM Corporation and others.
All rights reserved. This program and the accompanying materials are made
available under the terms of the Eclipse Public License v1.0 which accompanies
this distribution, and is available at http://www.eclipse.org/legal/epl-v10.html