Analisador Lucene

org.eclipse.help.base.luceneAnalyzer

3.0 (inicialmente adicionado à edição 2.0 como org.eclipse.help.luceneAnalyzer)

Este ponto de extensão é utilizado para registar analisadores de texto para serem utilizados pelo sistema de ajuda ao indexar e pesquisar documentação.

A ajuda explora capacidades do motor de pesquisa Lucene, que permite indexar sequências de sinais (sequências de palavras). Os analisadores criam sinais a partir da sequência de caracteres.Examinam o conteúdo do texto e facultam sinais para utilizar com o índice. A sequência de texto pode ser convertida em sinais de várias formas. Um analisador trivial pode converter em sinais as sequências em espaços em branco e outro pode executar a filtragem de sinais, com base nas necessidades da aplicação. Dado que a documentação é maioritariamente texto legível pelos utilizadores, é desejável que os analisadores utilizados pelo sistema de ajuda executem uma conversão para sinais que detecte o idioma e a gramática e a normalização do texto indexado. Para alguns idiomas, a qualidade da pesquisa aumenta significativamente se forem removidas palavras de paragem e indicações a temas relacionados do texto indexado.

O analisador contribuído para este ponto de extensão irá sobrepor o analisador facultado pelo sistema de ajuda Eclipse de um local estabelecido.

<!ELEMENT extension (analyzer*)>

<!ATTLIST extension

point CDATA #REQUIRED

id    CDATA #IMPLIED

name  CDATA #IMPLIED>


<!ELEMENT analyzer EMPTY>

<!ATTLIST analyzer

locale CDATA #REQUIRED

class  CDATA #REQUIRED>


De seguida é apresentado um exemplo de configuração do Analisador Lucene:

 

<extension id=

"com.xyx.XYZ"

point=

"org.eclipse.help.base.luceneAnalyzer"

>

<analyzer locale=

"ll_CC"

class=

"com.xyz.ll_CCAnalyzer"

/>

</extension>

O valor do atributo locale tem de representar uma cadeia de locales de cinco ou dois caracteres. Caso o analisador seja configurado para um idioma especificando a designação de idioma de duas letras, o analisador será utilizado para todos os locales deste idioma. Caso o analisador seja configurado para corresponder a um locale de cinco caracteres, será este o utilizado.

O valor do atributo class tem de representar uma classe que expanda org.apache.lucene.analysis.Analyzer. Recomenda-se que este analisador execute a filtragem de letras minúsculas para idiomas nos quais é possível aumentar o número de acertos de pesquisa, tornando a pesquisa sensível a letras maiúsculas e minúsculas.

O sistema de ajuda Eclipse faculta analisadores para todos os idiomas. Para Inglês e Alemão, os analisadores executam filtragem de palavras de paragem, filtragem de letras maiúsculas e minúsculas e a indicação de temas relacionados. Em relação a todos os outros idiomas, o analisador faculta apenas executa a filtragem de letras minúsculas.