Google Maps es un producto increíble y aporta mucho valor a la vida de las personas. Hoy, pensé en compartir mis puntos de vista sobre cómo alguien puede construir un producto como este desde cero.
Si bien es cierto que la búsqueda involucra tanto la ingeniería como la ciencia de datos, muchas empresas pueden subestimar la importancia de la ciencia de datos en la búsqueda. La búsqueda no se trata solo de construir una infraestructura técnica para procesar y devolver resultados para una consulta determinada, sino también de comprender y anticipar las necesidades y preferencias de los usuarios, y usar datos para adaptar la experiencia de búsqueda a usuarios individuales.
Como científico de datos, considero que la personalización y la clasificación de las búsquedas son un desafío complejo e interesante. Captamos el interés de los usuarios al examinar: consultas de búsqueda de usuarios, historial de búsqueda anterior y datos de clics.
Este boletín responderá a todas sus preguntas sobre:
Descargo de responsabilidad: envíe un mensaje privado antes de volver a publicar esta estrategia en otras plataformas, ya que es completamente original para mí y no fue copiada. No apoyo ninguna marca; los ejemplos compartidos son solo para aprender. Cualquiera puede crear sus propios mapas desde cero usando este concepto.
Si alguien quiere una consulta mía, comuníquese AQUÍ
Lo que buscamos: Vivo en Gurugram y busco la “Torre Eiffel, París”
Comencemos a escribir "EI" en Maps y analicemos. Obtuvimos los 5 mejores resultados de la consulta que se enumeran a continuación.
Fig.1 Análisis de búsqueda
¿Por qué hay sólo cinco resultados? La búsqueda tiene que ver con la clasificación y la relevancia. El objetivo del algoritmo es hacer que el usuario obtenga el resultado deseado con una longitud de consulta mínima. Por otro lado, es preferible tener más contexto para el algoritmo que el esfuerzo de desplazarse por una larga lista de resultados devueltos por la consulta "ei".
Motivo de este resultado: la popularidad y las señales contextuales se disparan aquí. Google Maps reconoce mi ubicación y muestra las cinco ubicaciones más populares visitadas o en las que hicieron clic las personas que escribieron previamente "ei". Todos los resultados están cerca de mi ubicación (ver Fig. 1). La consulta "eif" coloca a la Torre Eiffel en la tercera posición debido a su mayor puntaje de popularidad. (ver Fig. 2)
¿Que tenemos?
Usando la fórmula de Haversine, calcule la distancia entre User Lat/Long y otras ubicaciones dentro de una ciudad o código postal. (ver Fig.3)
A nivel de GMaps, donde hay miles de millones de entidades y millones de usuarios, este enfoque no es escalable.
PD. Algunos de ustedes pueden preguntar si esto se puede hacer dentro de Elastic Search. Echa un vistazo a la clasificación geográfica
Para que la búsqueda sea más contextual o personalizada, puede considerar el uso de enfoques basados en datos que tengan en cuenta las necesidades o preferencias específicas del usuario. Por ejemplo, si el Sr. Wolf está buscando restaurantes y ha realizado varias consultas relacionadas con restaurantes en un período corto de tiempo o en la misma sesión, puede priorizar mostrarle resultados personalizados para su ubicación y también considerar su historial de búsqueda anterior. Esto puede implicar clasificar los restaurantes cercanos a él más arriba en los resultados de búsqueda y presentarle opciones que se adapten a sus gustos o preferencias o a sus visitas anteriores a diferentes lugares.
Mediante el uso de enfoques basados en datos, puede proporcionar al Sr. Wolf resultados de búsqueda más relevantes y específicos en lugar de confiar simplemente en criterios populares o basados en la distancia.
Ningún modelo de ciencia de datos puede superar la simplicidad de los datos históricos bien presentados (consulte la Fig. 6) con algoritmos de almacenamiento en caché: LFU (Usado con menor frecuencia) o LFU con envejecimiento dinámico (consulte el siguiente enlace para obtener una explicación detallada de LFU con envejecimiento dinámico).
Consulte mi blog aquí: https://shauryauppal.medium.com/thinking-data-strategies-in-fintech-universe-building-payments-recommendation-system-for-google-95c746e3dd0e
1. Discutimos por qué se muestran 5 resultados en la lista de resultados de búsqueda
2. Ranking de resultados en función de la puntuación de Popularidad + Distancia
3. Clasificación geográfica en búsqueda elástica
4. Personalización en la búsqueda basada en la categoría histórica de consultas
5. ¿Cómo identifica una entidad como un lugar popular?
6. Recomendaciones basadas en el almacenamiento en caché de consultas de búsqueda anteriores y lugares visitados
Gracias a todos por regalarme este premio
Conéctate, sígueme o apóyame en LinkedIn si encuentras útil esta lectura. Para saber más de mí visita: Aquí
Estoy buscando un rol interesante de líder/científico de datos sénior: si tiene algo para mí, conéctese con [email protected]