De Help benut de voorzieningen van het Lucene-zoeksysteem, waarmee reeksen woorden kunnen worden geïndexeerd. Op basis van de tekstreeks worden tokens gemaakt door de analyseprogramma's. De tekst wordt gecontroleerd en tokens worden gemaakt die met de index kunnen worden gebruikt. Tokens kunnen op verschillende manieren worden gemaakt op basis van de tekstreeks. Een gewoon analyseprogramma kan tekenreeksen splitsen op basis van witruimten, terwijl andere programma's tokens kunnen filteren afhankelijk van de vereisten van de toepassing. Documentatie omvat voornamelijk normale tekst en daarom is het wenselijk dat de tokenisatie en normalisatie van geïndexeerde tekst aan een spelling- en grammaticacontrole wordt onderworpen door de analyseprogramma's van het Help-systeem. Voor bepaalde talen wordt de kwaliteit van zoekopdrachten aanzienlijk verbeterd als stopwoorden worden verwijderd uit de geïndexeerde tekst.
Het analyseprogramma dat door dit extensiepunt wordt geleverd, overschrijft het programma dat door het Help-systeem van Eclipse wordt verstrekt voor een bepaalde locale.
<!ELEMENT extension (analyzer*)>
<!ATTLIST extension
point CDATA #REQUIRED
id CDATA #IMPLIED
name CDATA #IMPLIED>
<!ELEMENT analyzer EMPTY>
<!ATTLIST analyzer
locale CDATA #REQUIRED
class CDATA #REQUIRED>
<extension id=
"com.xyx.XYZ"
point=
"org.eclipse.help.base.luceneAnalyzer"
>
<analyzer locale=
"ll_CC"
class=
"com.xyz.ll_CCAnalyzer"
/>
</extension>
De waarde van het kenmerk class is de klasse waarmee org.apache.lucene.analysis.Analyzer wordt uitgebreid. Het wordt aanbevolen talen in de onderkast te filteren. Het aantal treffers kan worden vergroot door de zoekopdracht hoofdlettergevoelig te maken.
Copyright (c) 2000, 2005 IBM Corporation en anderen.
Alle rechten voorbehouden. Dit programma en het begeleidende materiaal zijn beschikbaar gesteld onder de voorwaarden van de Eclipse Public License v1.0 die bij deze distributie is geleverd en beschikbaar is op http://www.eclipse.org/legal/epl-v10.html.