How Do Search Engines Work – Web Crawlers in Hindi

Search Engines कैसे काम करते हैं – Web Crawler क्या है ?

 

यह खोज इंजन ही हैं जो अंततः आपकी वेबसाइट को संभावित ग्राहकों के ध्यान में लाते हैं। इसलिए यह जानना बेहतर है कि ये खोज इंजन वास्तव में कैसे काम करते हैं और वे खोज शुरू करने वाले ग्राहक को जानकारी कैसे प्रस्तुत करते हैं।

 

5 Important Rules in Website Design

सर्च इंजन मूलतः दो प्रकार के होते हैं. पहला रोबोट द्वारा है जिन्हें क्रॉलर या स्पाइडर कहा जाता है.

 

खोज इंजन वेबसाइटों को अनुक्रमित करने के लिए स्पाइडर का उपयोग करते हैं। जब आप किसी खोज इंजन के आवश्यक सबमिशन पेज को पूरा करके अपनी वेबसाइट के पेज सबमिट करते हैं, तो सर्च इंजन स्पाइडर आपकी पूरी साइट को अनुक्रमित कर देगा। ‘स्पाइडर’ एक स्वचालित प्रोग्राम है जो सर्च इंजन सिस्टम द्वारा चलाया जाता है। स्पाइडर एक वेब साइट पर जाता है, वास्तविक साइट पर मौजूद सामग्री, साइट के मेटा टैग को पढ़ता है और साइट से जुड़े लिंक का भी अनुसरण करता है।

स्पाइडर फिर उस सारी जानकारी को एक केंद्रीय डिपॉजिटरी में वापस लौटा देता है, जहां डेटा को अनुक्रमित किया जाता है। यह आपकी वेबसाइट पर मौजूद प्रत्येक लिंक पर जाएगा और उन साइटों को भी अनुक्रमित करेगा। कुछ स्पाइडर आपकी साइट पर केवल एक निश्चित संख्या में पृष्ठों को अनुक्रमित करेंगे, इसलिए 500 पृष्ठों वाली साइट न बनाएं!

 

स्पाइडर समय-समय पर साइटों पर लौटकर किसी भी बदली हुई जानकारी की जाँच करेगा। ऐसा होने की आवृत्ति खोज इंजन के मॉडरेटर द्वारा निर्धारित की जाती है।

 

एक मकड़ी लगभग एक किताब की तरह होती है जिसमें सामग्री की तालिका, वास्तविक सामग्री और खोज के दौरान मिलने वाली सभी वेबसाइटों के लिंक और संदर्भ शामिल होते हैं, और यह एक दिन में दस लाख पृष्ठों तक अनुक्रमित कर सकती है।

Example:  Excite, Lycos, AltaVista and Google.

10 Essential Factors for a Successful Compost Pile

जब आप किसी खोज इंजन से जानकारी ढूंढने के लिए कहते हैं, तो वह वास्तव में उस सूचकांक के माध्यम से खोज कर रहा होता है जिसे उसने बनाया है, न कि वास्तव में वेब पर खोज रहा है। विभिन्न खोज इंजन अलग-अलग रैंकिंग उत्पन्न करते हैं क्योंकि प्रत्येक खोज इंजन सूचकांकों के माध्यम से खोज करने के लिए समान एल्गोरिदम का उपयोग नहीं करता है।

 

खोज इंजन एल्गोरिदम जिन चीजों को स्कैन करता है उनमें से एक वेब पेज पर कीवर्ड की आवृत्ति और स्थान है, लेकिन यह कृत्रिम कीवर्ड स्टफिंग या स्पैमडेक्सिंग का भी पता लगा सकता है। फिर एल्गोरिदम उस तरीके का विश्लेषण करते हैं जिससे पेज वेब में अन्य पेजों से लिंक होते हैं। यह जांच कर कि पेज एक-दूसरे से कैसे लिंक होते हैं, एक इंजन यह निर्धारित कर सकता है कि पेज किस बारे में है, यदि लिंक किए गए पेजों के कीवर्ड मूल पेज के कीवर्ड के समान हैं।

Leave a Comment