Quando as pessoas discutem a escalabilidade do comércio eletrónico, costumam focar em desafios tecnológicos aparentemente grandiosos como pesquisa distribuída, inventário e motores de recomendação. Mas o que realmente preocupa cada plataforma de comércio eletrónico são os problemas mais básicos: a inconsistência nos atributos dos produtos.
Os atributos impulsionam todo o sistema de descoberta de produtos. Eles sustentam filtros, comparações, rankings de pesquisa e lógica de recomendações. No entanto, no catálogo real de produtos, os valores dos atributos raramente são limpos. Repetições, formatos confusos e ambiguidades semânticas são a norma.
Vamos olhar para atributos aparentemente simples como "tamanho": ["XL", "Small", "12cm", "Large", "M", "S"]
E "cor": ["RAL 3020", "Crimson", "Red", "Dark Red"]
Ver esses exemplos dispersos parece inofensivo, mas quando você tem mais de 300万+