Google मानचित्र एक अद्भुत उत्पाद है, और यह लोगों के जीवन में बहुत अधिक मूल्य लाता है। आज, मैंने अपने विचार साझा करने के बारे में सोचा कि कैसे कोई इस तरह का उत्पाद स्क्रैच से बना सकता है।
हालांकि यह सच है कि खोज में इंजीनियरिंग और डेटा विज्ञान दोनों शामिल हैं, कई कंपनियां खोज में डेटा विज्ञान के महत्व को कम आंक सकती हैं। खोज केवल एक दी गई क्वेरी के लिए परिणामों को संसाधित करने और वापस करने के लिए एक तकनीकी बुनियादी ढांचे के निर्माण के बारे में नहीं है, बल्कि उपयोगकर्ताओं की जरूरतों और प्राथमिकताओं को समझने और अनुमान लगाने और व्यक्तिगत उपयोगकर्ताओं के लिए खोज अनुभव को अनुकूलित करने के लिए डेटा का उपयोग करने के बारे में भी है।
एक डेटा वैज्ञानिक के रूप में, मुझे खोज वैयक्तिकरण और रैंकिंग एक जटिल और दिलचस्प चुनौती लगती है। उपयोगकर्ता की खोज क्वेरी, पिछला खोज इतिहास और क्लिक डेटा की जांच करके हम उपयोगकर्ताओं की रुचि को कैप्चर करते हैं।
यह न्यूज़लेटर आपके सभी सवालों के जवाब देगा:
- कौन सा डेटा आवश्यक है?
- मानचित्रों में रैंकिंग और प्रासंगिकता की आवश्यकता?
- कोई विशेष परिणाम क्यों दिखाई देता है?
अस्वीकरण: कृपया इस रणनीति को अन्य प्लेटफार्मों पर दोबारा पोस्ट करने से पहले डीएम करें, क्योंकि यह मेरे लिए पूरी तरह से मूल है और इसकी नकल नहीं की गई थी। मैं किसी ब्रांड का समर्थन नहीं करता; साझा किए गए उदाहरण केवल सीखने के लिए हैं। इस अवधारणा का उपयोग करके कोई भी व्यक्ति स्क्रैच से अपना मानचित्र बना सकता है।
अगर कोई मुझसे परामर्श चाहता है तो यहां पहुंचें
यह रिजल्ट क्यों और कैसे?
हम क्या ढूंढ रहे हैं: मैं गुरुग्राम में रहता हूं और "एफिल टॉवर, पेरिस" की खोज कर रहा हूं
आइए मैप्स पर "ईआई" टाइप करना शुरू करें और विश्लेषण करें। हमें क्वेरी से नीचे सूचीबद्ध शीर्ष-5 परिणाम मिले।
Fig.1 खोज विश्लेषण
केवल पांच परिणाम ही क्यों हैं? खोज रैंकिंग और प्रासंगिकता के बारे में है। एल्गोरिथ्म का उद्देश्य उपयोगकर्ता को न्यूनतम क्वेरी लंबाई के साथ उसका वांछित परिणाम प्राप्त करना है। दूसरी ओर, एल्गोरिथ्म के लिए अधिक संदर्भ "ईआई" क्वेरी द्वारा लौटाए गए परिणामों की लंबी सूची के माध्यम से स्क्रॉल करने के प्रयास के लिए बेहतर है।
इस परिणाम का कारण: लोकप्रियता और प्रासंगिक संकेत यहां दिए गए हैं। Google मानचित्र मेरे स्थान की पहचान करता है और उन शीर्ष पांच सबसे लोकप्रिय स्थानों को प्रदर्शित करता है, जिन लोगों ने पहले "ईआई" टाइप किया है या उन लोगों ने उन पर क्लिक किया है। सभी परिणाम मेरे स्थान के पास हैं (चित्र 1 देखें)। क्वेरी "eif" अपने उच्च लोकप्रियता स्कोर के कारण एफिल टॉवर को तीसरे स्थान पर रखती है। (चित्र 2 देखें)
उपयोगकर्ता की स्थान-आधारित खोज कैसे तैयार करें?
हमारे पास क्या है?
- हम उपयोगकर्ता के स्थान को जानते हैं
- पंजीकृत सभी संस्थाओं के स्थान - दुकानें, कैफे, रेस्तरां, होटल, आदि।
भोला दृष्टिकोण
Haversine सूत्र का उपयोग करके, किसी शहर या ज़िप कोड के भीतर उपयोगकर्ता अक्षांश/देशांतर और अन्य स्थानों के बीच की दूरी की गणना करें। (चित्र 3 देखें)
GMaps स्तर पर, जहाँ अरबों संस्थाएँ और लाखों उपयोगकर्ता हैं, यह दृष्टिकोण मापनीय नहीं है।
डीएस इंटेलिजेंस के साथ बेहतर दृष्टिकोण
- बता दें कि हम यह सर्च बिल्ड-अप केवल बैंगलोर क्षेत्र के लिए कर रहे हैं।
- हम पंजीकृत प्रत्येक इकाई को क्लस्टर करते हैं - पूरे क्षेत्र को छोटे उप-इकाई समूहों में तोड़ते हैं, आइए हम 50 कहते हैं। (चित्र 4 देखें)।
- जब कोई उपयोगकर्ता ऑनलाइन आता है तो बस क्लस्टर के भीतर लोकप्रियता के आधार पर अपनी लेट-लांग और रैंक इकाइयों की जांच करें। यह दृष्टिकोण हमारे खोज परिणामों में दूरी और लोकप्रियता दोनों आधारित तत्वों को जोड़ता है।
पुनश्च। आप में से कुछ पूछ सकते हैं कि क्या यह लोचदार खोज के भीतर किया जा सकता है। जियो-सॉर्टिंग देखें
खोज को अधिक प्रासंगिक या वैयक्तिकृत कैसे करें?
खोज को अधिक प्रासंगिक या वैयक्तिकृत बनाने के लिए, आप डेटा-आधारित दृष्टिकोणों का उपयोग करने पर विचार कर सकते हैं जो उपयोगकर्ता की विशिष्ट आवश्यकताओं या प्राथमिकताओं को ध्यान में रखते हैं। उदाहरण के लिए, यदि श्री वुल्फ रेस्तरां खोज रहे हैं और उन्होंने बहुत कम समय या एक ही सत्र में रेस्तरां से संबंधित कई प्रश्न किए हैं, तो आप उन्हें ऐसे परिणाम दिखाने को प्राथमिकता दे सकते हैं जो उनके स्थान के लिए वैयक्तिकृत हैं और उनके पिछले खोज इतिहास पर भी विचार करें। इसमें खोज परिणामों में उसके निकट के रेस्तराँ को उच्च स्थान देना और उसे ऐसे विकल्प प्रस्तुत करना शामिल हो सकता है जो उसके स्वाद या वरीयताओं या विभिन्न स्थानों पर उसकी पिछली यात्राओं के अनुरूप हों।
डेटा-आधारित दृष्टिकोणों का उपयोग करके, आप केवल लोकप्रिय या दूरी-आधारित मानदंडों पर भरोसा करने के बजाय श्री वुल्फ को अधिक प्रासंगिक और लक्षित खोज परिणाम प्रदान कर सकते हैं।
कोई पूछ सकता है, शौर्य आपने खोज में लोकप्रियता पहलू के बारे में बात की है लेकिन लोकप्रिय के रूप में किसी स्थान की पहचान करने के कुछ अलग तरीके क्या हैं?
- पिछले 1 महीने में देखे जाने/क्लिक की संख्या
- पिछले 1 महीने में किसी स्थान पर जाने वाले लोगों की संख्या
- प्रॉक्सी क्रॉस-प्लेटफ़ॉर्म: Google पे लेनदेन विश्लेषण, लेन-देन की मात्रा अधिक होने पर एक व्यापारी की दुकान को लोकप्रिय माना जाता है
पिछली संचित खोजों से अनुशंसाएँ
कोई डेटा साइंस मॉडल कैशिंग एल्गोरिदम के साथ अच्छी तरह से प्रस्तुत ऐतिहासिक डेटा (चित्र 6 देखें) की सादगी को हरा नहीं सकता है: एलएफयू (कम बार-बार उपयोग किया जाता है) या डायनेमिक एजिंग के साथ एलएफयू (डायनेमिक एजिंग स्पष्टीकरण के साथ विस्तृत एलएफयू के लिए नीचे दिए गए लिंक की जांच करें)।
मेरा ब्लॉग यहां देखें: https://shauryauppal.medium.com/thinking-data-strategies-in-fintech-universe-build-payments-recommendation-system-for-google-95c746e3dd0e
हमारे विश्लेषण का सारांश
1. हमने चर्चा की कि खोज परिणाम सूची में 5 परिणाम क्यों दिखाए जाते हैं
2. लोकप्रियता + दूरी स्कोरिंग के आधार पर परिणामों की रैंकिंग
3. इलास्टिक सर्च में जियो-सॉर्टिंग
4. प्रश्नों की ऐतिहासिक श्रेणी के आधार पर खोज में वैयक्तिकरण
5. आप किसी इकाई को एक लोकप्रिय स्थान के रूप में कैसे पहचानते हैं?
6. पिछले खोज प्रश्नों और विज़िट किए गए स्थानों के कैशिंग पर आधारित अनुशंसाएँ
मुझे यह पुरस्कार देने के लिए आप सभी का धन्यवाद
लिंक्डइन पर मुझे कनेक्ट करें, फॉलो करें या एंडोर्स करें अगर आपको यह पढ़ने में उपयोगी लगे। मेरे बारे में अधिक जानने के लिए यहाँ जाएँ: यहाँ
मुझे एक दिलचस्प लीड/सीनियर डेटा साइंटिस्ट की भूमिका की तलाश है: यदि आपके पास मेरे लिए कुछ है, तो [email protected] पर कनेक्ट करें