Lucene-analyserare

org.eclipse.help.base.luceneAnalyzer

3.0 (ursprungligen tillagt i version 2.0 som org.eclipse.help.luceneAnalyzer)

Den här utökningspunkten används för att registrera textanalyserare för användning i hjälp vid indexering av och sökning i dokumentation.

I Hjälpen beskrivs funktionerna i Lucene-sökmotorn som möjliggör indexering av tokenströmmar (strömmar av ord). Med analyserare skapas tokenar från teckenströmmen. Med dem undersöks textinnehållet och tillhandahålls tokenar för användning med indexet. Textströmmen kan tokeniseras på många unika sätt. Med en trivial analyserare kan strömmar tokeniseras vid blanktecken, med en annan kan filtrering av tokenar utföras, baserat på programmets behov. Eftersom dokumentationen till största delen består av läsbar text är det önskvärt att analyserare som används i hjälpsystemet utför språk- och grammatikmedveten tokenisering och normalisering av indexerad text. För vissa språk ökar sökningen kvalitet avsevärt om stoppordsborttagning och stavelseindelning utförs för den indexerade texten.

Analyseraren för den här utökningspunkten ersätter den som tillhandahålls i Eclipse hjälpsystem för en viss språkmiljö.

<!ELEMENT extension (analyzer*)>

<!ATTLIST extension

point CDATA #REQUIRED

id    CDATA #IMPLIED

name  CDATA #IMPLIED>


<!ELEMENT analyzer EMPTY>

<!ATTLIST analyzer

locale CDATA #REQUIRED

class  CDATA #REQUIRED>


Här följer ett exempel på Lucene-analyserarens konfiguration:

 

<extension id=

"com.xyx.XYZ"

point=

"org.eclipse.help.base.luceneAnalyzer"

>

<analyzer locale=

"ll_CC"

class=

"com.xyz.ll_CCAnalyzer"

/>

</extension>

Värdet för attributet locale måste beteckna en språkmiljösträng om fem eller två tecken. Om analyseraren konfigureras för ett språk med en språkangivelse om två tecken, används analyseraren för alla språkmiljöer för det språket. Om analyseraren konfigureras så att den stämmer med en språkmiljö om fem tecken används den i stället.

Värdet för attributet class måste beteckna en klass som utökar org.apache.lucene.analysis.Analyzer. Det rekommenderas att den här analyseraren används för att utföra gemenfiltrering för språk där det är möjligt att öka antalet sökträffar genom att göra sökningen skiftlägeskänslig.

Eclipse hjälpsystem innehåller analyserare för alla språk. För engelska och tyska utförs stoppordsfiltrering, gemenfiltrering och stavelseindelning med analyserare. För alla övriga språk utförs endast gemenfiltrering med analyserare.