ITELLIGENT

¿Qué es Product Matching?

Post sobre:

Escrito por:

Pacheco, Mariona
12/02/2016

El proceso de  Product Matching consiste en relacionar para distintas fuentes aquellos productos que son el mismo. Esto, que puede parecer una tarea trivial, no es así debido a que para un mismo producto, en cada web, lo pueden nombrar de diferente forma.  Por ejemplo, tomando datos de tres webs de viajes distintas, podemos ver como en cada una de ellas, al hotel Gran Bahía Duque y al Hotel Gran Meliá Palacio Isora en Tenerife, son nombradas por cada web de forma distinta.

WEB 1 WEB 2 WEB 3
Gran Hotel Bah\u00eda Del Duque Resort Gran Bahia Del Duque Resort HOTEL GRAN  BAHIA DEL DUQUE RESORT 5* LUJO(Costa Adeje)
Gran Melia Palacio De Isora Gran Meliá Palacio de Isora Resort & SPA HOTEL GRAN MELIA PALACIO DE ISORA 5* LUJO(Guia De Isora)

¿Cómo solucionar esta problemática?

Existen dos enfoques para solventar el problema que conlleva el Product Matching:

  1. Técnica de similitud de textos: medir la similitud entre los textos de título y descripción de los productos para detectar aquellas ofertas que representan al mismo producto.
  2. Técnicas de aprendizaje automático para generar modelos que realicen el matching entre productos.

¿Cómo funciona un sistema de Product Matching?

Se basa en un proceso con las siguientes etapas:

  • Preprocesado, se establece la normalización de los datos.
  • Filtrado, se generan los bloques de Matching.
  • Clasificación, se determina el producto con el que enlaza.

Matching_Product_ITELLIGENT

 ¿Quieres conocer más sobre Product Matching? 

Te recomendamos las siguientes publicaciones:

Köpcke, H., Thor, A., Thomas, S., Rahm, E. Tailoring entity resolution for matching product offers.(2012) ACM International Conference Proceeding Series.

Köpcke, H., Thor, A., Rahm, E. Evaluation of entity resolution approaches on real-world match problems. (2010) Proceedings of the VLDB Endowment, 3 (1).

Thor, A. Toward an adaptive string similarity measure for matching product offers. (2010) INFORMATIK 2010 – Service Science – Neue Perspektiven fur die Informatik, Beitrage der 40. Jahrestagung der Gesellschaft fur Informatik e.V. (GI)

Kannan, A., Givoni, I.E., Agrawal, R., Fuxman, A. Matching unstructured product offers to structured product specifications. (2011) Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.

Kannan, A., Talukdar, P.P., Rasiwasia, N., Ke, Q. Improving product classification using images. (2011) Proceedings – IEEE International Conference on Data Mining, ICDM, art. no. 6137235.

Otras entradas de esta categoría

¿Quieres aportar nueva información o hacernos un comentario?

0 comentarios

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *