Datei Indexierung
Um Meta Dateien und Inhalte von Dateien zu extrahieren bindet Apache Solr Apache Tika mit ein. Alternativ kann Apache Tika aber auch als eigentständige Applikation eingesetzt werden, wobei beide Varianten mit der Extension Solr (EXT:Solr) genutzt werden können.
Diese Tika Integration wird durch EXT:tika angeboten und ist im TYPO3 Forge zu finden. EXT:Tika kann dabei so konfiguriert werden, dass eine der beiden Varianten eingesetzt wird. Welche Variante nun genutzt wird ist für EXT:solr stets erkennbar.
Einbindung von Tika in Apache Solr
Als ein in Solr eingesetztes Abfrage Steuerungsprogram weist Tika vor allem einen großen Vorteil auf: Bei der Installation von Solr auf einem seperaten Host oder einem Multi-Webserver muss Java nicht auf dem Webserver präsent sein.
Tika als eigenständige Applikation
Kommt Tika hingegen als eine eigenständige Applikation zum Einsatz ist sie schneller als ein Abfrage Steuerungsprogramm. Zustäzlich müssen Dateien nicht mehr über das gesamte Netzwerk gesendet werden. Eine eigenständige Tika Applikation kann auch früher mit neueren Versionen verwenden werden als es bei der Integration in Solr der Fall ist.
Bei der Ausgabe der Ergebnisliste im Frontend werden die Datei-Ergebnisse anders als die normalen Seiten-Ergebnisse ausgegeben. Sie verlinken direkt zu den Dateien und zeigen zusätzlich Meta Dateien wie Mime Type und Links zu Bezugsseiten und Anzeigen an.
Man sieht, dass die Datei Indexierung mit EXT:solr über viele verschieden Wege möglich ist.
Entwicklungsstatus
Wenn Sie an Datei Indexierung interessiert sind, rufen Sie uns an!



