Εργαλείο ανάλυσης Lucene

org.eclipse.help.base.luceneAnalyzer

3.0 (προστέθηκε αρχικά στην έκδοση 2.0 ως org.eclipse.help.luceneAnalyzer)

Αυτό το σημείο επέκτασης χρησιμοποιείται για την καταχώρηση εργαλείων ανάλυσης κειμένου, ώστε να χρησιμοποιείται από τη βοήθεια, κατά τη δημιουργία ευρετηρίου και την αναζήτηση εγγράφων.

Η βοήθεια χρησιμοποιεί τις δυνατότητες της μηχανής αναζήτησης Lucene, η οποία επιτρέπει τη δημιουργία ευρετηρίου ροών διακριτικών στοιχείων (ροές λέξεων). Τα εργαλεία αναζήτησης δημιουργούν διακριτικά στοιχεία από τη ροή χαρακτήρων. Εξετάζουν το περιεχόμενο του κειμένου και παρέχουν διακριτικά στοιχεία που χρησιμοποιούνται με το ευρετήριο. Η δημιουργία διακριτικών στοιχείων από τη ροή κειμένου μπορεί να πραγματοποιηθεί με πολλούς τρόπους. Ένα συνηθισμένο εργαλείο αναζήτησης μπορεί να δημιουργήσει διακριτικά στοιχεία από ροές σε κενό διάστημα, ένα άλλο εργαλείο μπορεί να φιλτράρει διακριτικά στοιχεία, ανάλογα με τις ανάγκες της εφαρμογής. Καθώς η τεκμηρίωση είναι κατά κύριο λόγο ένα αναγνώσιμο από τον άνθρωπο κείμενο, τα εργαλεία ανάλυσης που χρησιμοποιούνται από το σύστημα βοήθειας θα πρέπει να εκτελούν ταξινόμηση των διακριτικών στοιχείων και κανονικοποίηση του ευρετηριοποιημένου κειμένου με γλωσσικό και γραμματικό έλεγχο. Για ορισμένες γλώσσες, η ποιότητα της αναζήτησης αυξάνεται σημαντικά, αν στο ευρετηριοποιημένο κείμενο πραγματοποιηθεί αφαίρεση των εξαιρούμενων λέξεων και αναζήτηση λέξεων με το ίδιο θέμα.

Το εργαλείο αναζήτησης που συνεισφέρεται σε αυτό το σημείο επέκτασης αντικαθιστά αυτό που παρέχεται από το σύστημα βοήθειας του Eclipse για τις δεδομένες τοπικές ρυθμίσεις.

<!ELEMENT extension (analyzer*)>

<!ATTLIST extension

point CDATA #REQUIRED

id    CDATA #IMPLIED

name  CDATA #IMPLIED>


<!ELEMENT analyzer EMPTY>

<!ATTLIST analyzer

locale CDATA #REQUIRED

class  CDATA #REQUIRED>


Παρακάτω δίνεται ένα παράδειγμα ρυθμίσεων εργαλείου ανάλυσης Lucene:

 

<extension id=

"com.xyx.XYZ"

point=

"org.eclipse.help.base.luceneAnalyzer"

>

<analyzer locale=

"ll_CC"

class=

"com.xyz.ll_CCAnalyzer"

/>

</extension>

Η τιμή του γνωρίσματος locale πρέπει να είναι μια σειρά χαρακτήρων τοπικών ρυθμίσεων με πέντε ή δύο χαρακτήρες. Εάν το εργαλείο ανάλυσης έχει ρυθμιστεί για μια γλώσσα μέσω προσδιορισμού γλώσσας δύο γραμμάτων, τότε αυτό το εργαλείο ανάλυσης θα χρησιμοποιείται για όλες τις τοπικές ρυθμίσεις της γλώσσας αυτής. Εάν το εργαλείο ανάλυσης ρυθμιστεί έτσι ώστε να συμφωνεί με τοπικές ρυθμίσεις πέντε χαρακτήρων, τότε θα χρησιμοποιείται αυτό.

Η τιμή του γνωρίσματος class πρέπει να εκφράζει μια κλάση η οποία επεκτείνει την org.apache.lucene.analysis.Analyzer. Συστήνεται η πραγματοποίηση φιλτραρίσματος πεζών χαρακτήρων από αυτό το εργαλείο ανάλυσης, για γλώσσες όπου είναι πιθανή η αύξηση του πλήθους των αποτελεσμάτων αναζήτησης μέσω αναζήτησης με διάκριση πεζών-κεφαλαίων.

Το σύστημα βοήθειας Eclipse παρέχει εργαλεία ανάλυσης για όλες τις γλώσσες. Για αγγλικά και γερμανικά, το εργαλείο ανάλυσης εφαρμόζει το φιλτράρισμα εξαιρούμενων λέξεων, το φιλτράρισμα πεζών χαρακτήρων και την αναζήτηση λέξεων με το ίδιο θέμα. Για όλες τις άλλες γλώσσες, το εργαλείο ανάλυσης που παρέχεται εκτελεί μόνο φιλτράρισμα πεζών χαρακτήρων.