#1 Step
Attivare il plugin di ricerca JiFile
#2 Step
Configurare il percorso dei file (PDF, ad esempio) per l'indicizzazione Percorso Filesystem: Il percorso della cartella dove sono presenti i documenti. Questo non può essere al di fuori della root di Joomla! Deve essere creata manualmente prima di procedere.
(E' possibile modificare più volte questo campo in funzione del numero di cartelle presenti a sistema dove sono presenti documenti da indicizzare.)
Percorso Indice: Il percorso della cartella dove il sistema andrà a costruire la struttura dell’indice.
IMPORTANTE:
La cartella non deve essere assolutamente già presente a sistema e pertanto non deve essere creata. Di fatto il sistema creerà automaticamente la cartella e alcuni file utili al processo di indicizzazione.
Ignore file: Elenco di estensioni dei file separato da una virgola (,). Permette di non presentare nella sezione Filesystem i file con le estensioni indicate.
Encoding SO: Questo campo definisce il tipo di encoding del proprio sistema operativo. Questo va configurato solo se nella sezione Filesystem alcuni nomi di file, che presentano caratteri speciali, vengono visualizzati in modo non corretto.
#3 Step
Configurazione di JiFile Una configurazione errata potrebbe darvi problemi nel processo di indicizzazione è pertanto consigliato leggere con molta attenzione questa parte della guida.
Verranno descritti solo i campi fondamentali per un utilizzo rapido.
Encoding: Definisce il tipo di "charset encoding" in cui è stato scritto il documento. Se non valorizzato il sistema cerca di recuperare autonomamente il tipo di encoding di ogni campo. Un'incorretta configurazione, potrebbe provocare una indicizzazione incompleta o restituire il messaggio di errore "Contenuto del file vuoto".
Messaggio di errore "Contenuto del file vuoto": Per capire come configurare correttamente questo campo, è importante ricordare che ogni documento potrebbe essere stato scritto con una codifica diversa.
Facciamo un esempio:
Un documento "PDF", scritto in italiano, è stato scritto e salvato in codifica ISO-8859-1 (Windows 1252 – Latin1). Ora il sistema, per indicizzare il PDF, deve leggere il contenuto, ovvero la XPDF apre il documento e recupera tutto il testo presente nel PDF.Come impostazione predefinita, la XPDF utilizza l'encoding di lettura ISO-8859-1 (Windows 1252 o Latin-1), e pertanto bufferizza il testo contenuto nel PDF in ISO-8859-1.Dato che l'analizzatore (campo Analyzer) è impostato in "UTF8_CaseInsensitive" (ricorda che questo campo non deve essere mai modificato dopo averlo definito e salvato), il sistema di indicizzazione deve convertire il contenuto bufferizzato dalla XPDF (nella codifica ISO-8859-1) in UTF8 (risultato finale dell’indice).Per avere una corretta indicizzazione del contenuto, senza ricevere il fastidioso messaggio “Corpo Vuoto” , è necessario definire la codifica del documento nel campo "Encoding" nella configurazione di JiFile in ISO-8859-1.Server Bit: Definisce il tipo di server su cui è installato il vostro Joomla!. Questa configurazione serve per l’indicizzazione dei documenti PDF dato che il sistema deve poter utilizzare la XPDF compilata per il sistema operativo a 32 o 64 bit.
XPDF: È possibile definire il percorso dei file eseguibili della XPDF se quelli in JiFile non sono compatibili con il vostro server (è possibile chiedere il vostro hosting qual è il percorso della pdftotext e pdfinfo).
Analyzer: Il tipo di analyzer serve per la gestione dei documenti sia in fase di indicizzazione che in fase di ricerca. Se si configura un tipo di analyzer per indicizzare un documento e si cambia successivamente, durante la ricerca, i risultati potrebbero essere diversi da quelli attesi. Di fatto un analyzer dovrebbe essere sempre lo stesso per tutta la vita dell’indice.
#4 Step
Indicizza i tuoi file PDF, DOC, XLS, ecc.
#Cancella i file dall'indice