Produktsuche im E-Commerce: Warum „Site Search“ heute über Umsatz entscheidet – und was semantische KI wirklich besser macht

Illustration: Wie KI-gestützte Produktsuche die passende Auswahl liefert
Illustration: Wie KI-gestützte Produktsuche die passende Auswahl liefert
Quelle: Bild generiert mit Hilfe von KI (Open AI)

Stell dir vor, jemand betritt deinen Onlineshop mit einem ziemlich klaren Ziel – und verlässt ihn nach 10 Sekunden, weil die Suche nur „naja“ ist. Genau dieses Muster ist im E-Commerce ein stiller Umsatzkiller: In einer Google-Cloud-Studie (Harris Poll) wird beziffert, dass Händler weltweit über 2 Billionen US-Dollar pro Jahr verlieren – allein durch schlechte Online-Sucherlebnisse.

Und das ist nicht mal das Schlimmste: 80% der Befragten sagen, sie verlassen eine Website nach einer erfolglosen Suche. Noch härter fürs Markenbild: Ein großer Teil meidet Websites nach Suchproblemen künftig – im Google-Cloud-Blog wird das global mit 77% genannt.

Kurz: Die Suchfunktion ist längst kein „Feature“ mehr. Sie ist Customer Experience, Conversion-Hebel und Vertrauensbeweis in einem.

Von Keywords zu „Ich meine eigentlich …“: Suchanfragen werden menschlicher

Früher waren viele Shop-Suchen eher wie: nike pegasus 40 42.
Heute sind sie oft: „laufige schuhe für knieprobleme, nicht zu schwer“ oder „kleid fürs standesamt, nicht zu schick“.

Das passt zu einem Grundprinzip aus dem Information-Retrieval: Eine Query ist nur der Versuch, ein Informationsbedürfnis auszudrücken – und das ist häufig mehrdeutig. Das Standardwerk von Manning/Raghavan/Schütze formuliert das sehr klar: IR soll Material finden, das ein information need erfüllt – nicht nur Wörter matchen.

Und genau da entsteht das Spannungsfeld, das du in deiner Forschungsfrage aufmachst:

Liefert semantische, KI-gestützte Suche eine höhere Ergebnisqualität als klassische, wortbasierte Suche – in der Produktsuche?

Die ehrliche (und nützliche) Antwort: Kommt drauf an. Aber auf eine Weise, die man ziemlich gut operationalisieren kann.

Zwei Welten: Wortbasierte Suche (BM25 + Synonyme) vs. Semantische Suche (Sentence-BERT)

1) Klassisch/lexikalisch: BM25 (plus Synonym-Expansion)

BM25 ist im Kern extrem gut darin, präzise Keyword-Treffer nach oben zu sortieren. Wenn Nutzer:innen „so suchen wie der Index denkt“, bekommst du:

  • hohe Präzision
  • gute Erklärbarkeit („Treffer, weil Begriff X im Titel + Beschreibung vorkommt“)
  • robuste Performance bei Produktnummern, Spezifikationen, klaren Attributen

Synonym-Expansion kann helfen (z. B. „Sneaker“ ↔ „Turnschuhe“), aber sie hat Grenzen:

  • Sie ist oft manuell und domänenspezifisch
  • Sie skaliert schlecht bei kombinierten, mehrgliedrigen Queries
  • Sie trifft bei Umgangssprache („für kaputtes Knie“) schnell daneben

2) Semantisch: Sentence-BERT (SBERT)

SBERT übersetzt Query und Produkte (Texte/Attribute) in Vektoren und findet Nähe im Bedeutungsraum. Stark bei:

  • natürlicher Sprache
  • mehrdeutigen Formulierungen
  • intent-getriebener Suche („gemütlich“, „Business-Look“, „für Allergiker“)

Schwächen gibt’s auch:

  • Erklärbarkeit ist schwieriger („Warum genau dieser Treffer?“)
  • Bei harten Constraints (Artikelnummer, exakte Normen) kann semantische Ähnlichkeit „zu kreativ“ wirken
  • Ohne domänenspezifisches Tuning kann’s bei Spezialsortiment holpern

Was eure Studie im Kern zeigt: Keine „One-Size-Fits-All“-Überlegenheit – sondern komplementäre Stärken

Eure kontrollierte Rechenstudie mit BM25 + Synonym-Expansion vs. SBERT (bewertet u. a. mit etablierten IR-Metriken wie NDCG@5) kommt zu einem Ergebnis, das für die Praxis Gold wert ist:

  • BM25 überzeugt bei strukturierten Keyword-Anfragen (klare Schlüsselbegriffe) durch präzise, nachvollziehbare Treffer.
  • SBERT glänzt besonders bei natürlichsprachlichen, semantisch komplexen Queries, bei denen reine Wortübereinstimmung nicht reicht.
  • Unterschiede in der Sortierqualität werden besonders sichtbar bei mehrgliedrigen Begriffskombinationen, wo Synonymlisten an Grenzen stoßen.

Das ist keine akademische „Jein“-Antwort. Das ist ein Bauplan: Suchqualität hängt vom Query-Typ und Kontext ab.

B2C vs. B2B: Warum der Kontext die „richtige“ Suche bestimmt

Hier wird’s richtig praktisch:

B2C (Endkund:innen)

  • Suchanfragen sind häufiger explorativ, emotional, umgangssprachlich
  • Nutzer:innen erwarten, dass Systeme „mitdenken“
  • Semantische Suche bringt spürbaren Mehrwert, weil sie Intent besser abfangen kann

B2B (Ersatzteile, Industrie, Tech)

  • Suchanfragen sind häufiger exakt (Artikelnummern, Normen, Specs)
  • Nachvollziehbarkeit und Verlässlichkeit sind zentral
  • BM25 bleibt ein robustes, transparentes Werkzeug

Übrigens passt das auch zur Marktbeobachtung: Google Cloud beschreibt, dass Menschen nicht mehr bereit sind, mehrfach zu iterieren – sie erwarten, dass Suchsysteme Intent „tief“ verstehen und direkt relevante Ergebnisse liefern.

Die eigentliche Empfehlung: Hybrid ist das neue „Best Practice“

Wenn du nur eine Botschaft aus dem Thema in einen Marketing-Blogbeitrag meißeln willst, dann diese:

Semantische Suche ersetzt BM25 nicht – sie ergänzt BM25.
Die beste Produktsuche ist oft keine Entweder-oder-Entscheidung, sondern eine intelligente Kombination.

Wie so eine hybride Architektur in der Praxis aussehen kann

  1. Lexikalisches Retrieval als „Safety Net“
    BM25 (plus Tippfehler-Toleranz, Stemming, Synonyme) sorgt dafür, dass harte Begriffe sitzen.
  2. Semantisches Retrieval als „Intent-Layer“
    SBERT holt Kandidaten, wenn Sprache weich, mehrdeutig oder natürlich ist.
  3. Re-Ranking (optional, aber stark)
    Ein Re-Ranker (z. B. Learning-to-Rank oder ein leichtgewichtiges Modell) mischt die Kandidaten neu – mit Signalen wie:
    • Verfügbarkeit/Lager
    • Marge (vorsichtig dosieren)
    • Klick-/Kaufhistorie
    • Produktattribute (Material, Anlass, Kompatibilität)
  4. Query-Routing / Query-Klassifikation
    Entscheide dynamisch:
    • „Artikelnummer/Norm erkannt“ → stärker lexikalisch
    • „Natürlichsprachlich/Intent“ → stärker semantisch

Quick-Win-Checkliste: Woran du erkennst, dass deine Suche gerade Geld verbrennt

  • Hohe Search Exit Rate (Nutzer:innen verlassen nach Suche)
  • Viele „0 Results“ oder irrelevante Treffer
  • Hoher Anteil an Refinement-Loops (Query wird mehrfach umformuliert)
  • Hohe Nutzung von Filtern als „Rettungsboot“
  • Support-Tickets à la „Ich finde X nicht“

Und ja: Bei den Größenordnungen aus der Harris-Poll/Google-Cloud-Erhebung lohnt es sich fast immer, hier zuerst anzusetzen (über 2 Billionen US-Dollar Verlust weltweit pro Jahr sind eine Ansage).

Fazit: Die Frage ist nicht „ob“, sondern „wie“ semantische Suche integriert wird

Die Schlussfolgerung trifft den Punkt: Semantische Verfahren sind kein Ersatz, sondern ein Upgrade-Modul – besonders dort, wo Sprache wichtiger ist als exakte Begriffe.

Für E-Commerce-Teams bedeutet das ganz konkret:

  • B2C: Semantik bringt oft sofort spürbare Relevanz-Wins.
  • B2B: BM25 bleibt Basis – Semantik kann gezielt dazukommen (z. B. bei Beschreibungs-Queries).
  • Hybrid ist meist der Sweet Spot, weil er sowohl Präzision als auch Flexibilität abdeckt.