Externe Suchengines – FACT-Finder und Solr im Vergleich (2011)

Suchtechnologien werden heutzutage in allen Bereichen des Internets eingesetzt. Das bekannteste und erfolgreichste Beispiel ist Google. Das Hauptaugenmerk wird oft auf die Genauigkeit und Strukturierung der umfangreichen Informationen gesetzt.
Für Onlineshops ist eine Suchfunktion elementar. Viele Shopbesucher wissen schon vorher welches Produkt sie kaufen bzw. anschauen möchten und nutzen so die Suchfunktion. Hier muss also eine effiziente und genaue Suche erfolgen, um eine hohe Konversion zu gewährleisten. Eine eigene Entwicklung der Suchfunktion ist für viele Betreiber und Entwickler ein ressourcenaufwändiger Prozess. Deswegen greifen Onlineshopbetreiber oft auf externe Lösungen zurück.
Zwei sehr erfolgreiche Vertreter dieser Branche sind FACT-Finder und Solr, welche auf dem Gebiet der Suche in Online-Shops bzw. im E-Commerce sehr breite Anwendung finden, sodass an einem Vergleich dieser Produkte ein öffentliches Interesse besteht.
Der FACT-Finder basiert auf dem patentierten Algorithmus FACT und ist in der Programmiersprache C geschrieben. Die Suchergebnisse werden mit Hilfe eines mathematisch-linguistischen Verfahrens, welches auf dem Fuzzy-Set-Modell beruht, und einem phonetischen Vergleich, basierend auf der Omikron Phonetik, ermittelt. Für den Import stellt FACT-Finder vier Schnittstellen bereit, sodass die Ergebnisse entweder als HTML, XML, Webservice oder JavaScript Object Notation (JSON) empfangen werden. Im Vergleich zu Solr stellt der FACT-Finder eine kommerzielle Standardlösung dar.
Solr ist somit in seiner Standardversion eine von Apache kostenfrei zur Verfügung gestellte Suchfunktion. Es basiert auf dem Suchkern Lucene und erweitert diesen mit zusätzlichen Funktionen und Webkomponenten zu einem Suchserver. Lucene basiert auf Java und arbeitet basierend auf dem Booleschen und dem Vektorraummodell. Für den Import von Suchergebnissen bietet Solr unterschiedliche Methoden (XML, JSON, PHP, Java) an, die intern durch den entsprechenden ResponseWriter realisiert sind.

Die Arbeit im Gesamten stellt zunächst allgemeine Suchalgorithmen vor, danach folgt eine Festlegung der verschiedenen Bewertungskriterien aus Sicht der Shopbetreiber sowie aus Sicht der Shopnutzer. Aufbauend auf diesen Kriterien wird nach einer Erklärung der beiden Suchfunktionen Solr und FACT-Finder ein Vergleich gezogen. Um die Kriterien der Performance und des Integrationsaufwandes einzuschätzen, wurden beide Programme in die von dotSource entwickelte Social Commerce Komplettlösung SCOOBOX integriert.
Kostenloser Download der gesamten Diplomarbeit 

Eine Reaktion zu “Externe Suchengines – FACT-Finder und Solr im Vergleich (2011)”

  1. Eine Konfiguration (schema.xml, solrconfig.xml etc.) wäre sinnvoll, um die Ergebnisse bewerten zu können.
    Bei größerem Indexvolumen muss Solr Segmente mergen, daher wird die Indizierung langsamer.
    Anders als dargestellt muss Solr bei einer Indexoperation natürlich nicht den Term zu mehreren Segmenten hinzufügen (jedes Lucene-Segment ist ein kleiner Index für sich), dies geschieht erst bei den Merges.
    Es wäre interessant zu sehen, wie sich Produkte in den letzten beiden Jahren weiterentwickelt haben.

Schreibe einen Kommentar