Automatické triedenie produktov pre Google Shopping a Heureku
Nástroj, ktorý automaticky priraďuje produktom správne kategórie pre Google Shopping a Heureku. Pomáha zlepšiť kvalitu feedu bez toho, aby tím musel ručne triediť tisíce produktov.
- Klient
- Interný nástroj pre veľký e-commerce brand
- Rola
- Samostatne
Použité technológie
- Google Apps Script
- Vertex AI (text-embedding-004)
- Gemini 2.5 Flash Lite
- Vertex AI fine-tuning
- Google Sheets
- OAuth 2.0 service account
Dopad
- Čo umožňuje
- Produkty dostávajú správnu kategóriu automaticky. Tím nemusí ručne riešiť každý riadok vo feede a kampane v Google Shoppingu alebo Heureke dostávajú kvalitnejšie vstupné dáta.
- Metrika
- Kapacita 8000 produktov denne; v praxi spracuje najmä novo pribudnuté produkty a už hotové preskočí
- Cena prevádzky
- Centy za 1000 riadkov v ustálenom stave — väčšina produktov sa vyrieši lacnejšou automatickou kontrolou, AI model sa volá iba pri ťažších prípadoch
- Používatelia
- PPC tím a ľudia zodpovední za produktové feedy
Čo to umožňuje
Produktový feed odchádza do Google Shoppingu a Heureky so správnou kategóriou pri každom produkte, odvodenou z názvu a popisu produktu. Nie z ručne udržiavanej tabuľky, ktorá časom zastará.
- Cena ostáva pod kontrolou aj pri veľkom katalógu. Väčšina produktov sa vyrieši lacnou automatickou kontrolou a drahší AI model sa použije iba pri ťažších prípadoch.
- Kvalita feedu sa zlepšuje tam, kde ovplyvňuje výkon reklamy. Zle zaradený produkt sa môže zobrazovať v nesprávnych vyhľadávaniach alebo sa nezobrazovať vôbec.
Cena prevádzky: v ráde centov za 1000 produktov v ustálenom stave.
Problém
Produktový katalóg tejto veľkosti sa nedá ručne kategorizovať pri každej aktualizácii feedu. V hre boli dva slabé prístupy:
- Ručné mapovacie tabuľky, ktoré časom zastarávajú, keď pribúdajú nové typy produktov.
- AI volanie na každý produkt, ktoré je pri veľkom katalógu drahé a nie vždy konzistentné.
V oboch prípadoch sa problém prejavil až neskôr: produkty zlyhávali vo feede, zobrazovali sa v nesprávnych vyhľadávaniach alebo podávali slabší výkon, pretože boli zaradené zle.
Riešenie — tri vrstvy podľa istoty
Produkt (názov + popis)
│
▼
┌────────────────────────────────────────────────────────────────┐
│ 1. Významová podobnosť voči uloženým kategóriám │
│ similarity >= 0.90 → priradiť kategóriu, hotovo │
└────────────────────────────────────────────────────────────────┘
│ (nízka istota)
▼
┌────────────────────────────────────────────────────────────────┐
│ 2. Vlastný natrénovaný Gemini model │
│ vráti kategóriu zo zoznamu → priradiť, hotovo │
└────────────────────────────────────────────────────────────────┘
│ (mimo zoznamu / prázdne)
▼
┌────────────────────────────────────────────────────────────────┐
│ 3. Gemini 2.5 Flash Lite pre najťažšie prípady │
│ detailný prompt + top-N kandidáti → priradiť kategóriu │
└────────────────────────────────────────────────────────────────┘
Detaily, ktoré rozhodujú o cene a spoľahlivosti:
- Uložené výpočty kategórií. Kategórie sa nespracúvajú znova pri každom behu, čím sa šetrí čas aj peniaze.
- Bezpečné opakované spustenie. Už spracované produkty sa preskočia a manuálne uzamknuté riadky sa nemenia.
- Poznámka pri každom riadku. Tím vidí, ktorá vrstva kategóriu priradila, takže vie ľahko skontrolovať rizikové prípady.
Kľúčové poučenia
- Lacná predkontrola pred drahšou AI výrazne znižuje náklady.
- Vlastný model je dobrá stredná vrstva, ale najlepšie funguje v kombinácii s ďalšími kontrolami.
- Ak sa nástroj dá bezpečne spustiť opakovane, môže bežať pravidelne a bez dozoru.
- Poznámka priamo v tabuľke je praktickejšia než technické logy, pretože ju vie použiť aj marketér.