हालाँकि वर्डप्रेस के साथ आने वाली खोज कुछ चीजों की खोज कर सकती है, कभी-कभी खोज परिणाम आवश्यक रूप से संतोषजनक नहीं होते हैं, और कोई संयुक्त खोज या अस्पष्ट खोज नहीं होती है, इसलिए कभी-कभी आपको खोज परिणाम प्राप्त करने के लिए सटीक कीवर्ड निर्दिष्ट करने पड़ते हैं। इसके अलावा, वर्डप्रेस के साथ आने वाली खोज काफी हद तक Mysql डेटाबेस क्वेरीज़ पर निर्भर करती है, जो डेटाबेस बड़ा होने पर समय लेने वाली हो सकती है।
वर्डप्रेस की डिफ़ॉल्ट खोज को बदलना मुश्किल नहीं है। जो लोग कला को जानते हैं वे मूल रूप से जानते हैं कि साइट:wzfou.com xxx निर्दिष्ट वेबसाइट की सामग्री की खोज कर सकता है और Google ने कस्टम खोज शुरू की है, जिसका अर्थ है साइट:wzfou। com. com xxx सीधे साइट में एम्बेड किया गया है। उपयोगकर्ता खोज पर क्लिक करने के बाद Baidu और Google पर गए बिना परिणाम देख सकते हैं।
हालाँकि, Baidu और Google कस्टम खोज खोज इंजन के सूचकांक पर निर्भर करते हैं, कुछ अनुक्रमणिका वाली नई साइटों के लिए, कभी-कभी नए लेख नहीं खोजे जा सकते हैं, जो उपयोगकर्ता अनुभव को प्रभावित करता है। परिणामस्वरूप, एक खुला स्रोत और मुफ़्त स्व-निर्मित खोज इंजन इलास्टिक्स खोज का जन्म हुआ। यह एक वितरित, स्केलेबल, वास्तविक समय खोज और डेटा विश्लेषण इंजन है जो संरचित डेटा के पूर्ण-पाठ खोज और वास्तविक समय आंकड़ों को संभाल सकता है। .
यह लेख साझा करेगा कि कैसे Baidu, Google कस्टम खोज और Elasticsearch स्व-निर्मित खोज वर्डप्रेस को एकीकृत करते हैं। वर्डप्रेस वेबसाइट निर्माण और WP अनुकूलन के बारे में अधिक लेखों में शामिल हैं:
- लिनक्स php-fpm अनुकूलन अनुभव-php-fpm प्रक्रिया बड़ी मेमोरी लेती है और मेमोरी समस्याएं जारी नहीं करती है
- वर्डप्रेस Alipay, WeChat इनाम बटन उत्पादन उदाहरण और Paypal.me इनाम लिंक जोड़ता है
- पांच उत्कृष्ट आरएसएस पाठकों की सिफारिश की गई - प्रमुख घरेलू और विदेशी आरएसएस पाठकों के संग्रह के साथ
PS: 1 सितंबर, 2019 को अपडेट किया गया, जो मित्र Baidu और Google कस्टम खोजों से परेशान नहीं होना चाहते हैं, वे इस उत्कृष्ट तृतीय-पक्ष ऑन-साइट खोज इंजन को आज़मा सकते हैं: वास्तविक समय जोड़ने के लिए अल्गोलिया का उपयोग करें -वर्डप्रेस के लिए साइट खोज फ़ंक्शन-उच्च गुणवत्ता और अधिक सटीक सामग्री खोजें।
PS: 2 दिसंबर, 2019 को अपडेट किया गया, यदि आप अधिक शक्तिशाली और तेज़ मुफ्त ऑन-साइट खोज बनाना चाहते हैं, तो आप
1. Baidu ऑन-साइट सर्च इंजन
वेबसाइट:
- HTTPS://resource.baidu.com/color/wiki/introduce
1.1 Baidu ऑन-साइट खोज इंजन का उपयोग
पहला कदम उस वेबसाइट डोमेन नाम को जोड़ना है जिसे आप Baidu खोज इंजन में उपयोग करना चाहते हैं।
2.1 Google कस्टम खोज का उपयोग
सबसे पहले आधिकारिक Google कस्टम खोज पृष्ठ पर लॉग इन करें, और फिर एक नई कस्टम खोज बनाने के लिए क्लिक करें।
अगला कदम वह यूआरएल सेट करना है जिसे आप अनुक्रमित करना चाहते हैं, उसे नाम दें, आदि। (बड़ा करने के लिए क्लिक करें)
एक बार बन जाने के बाद, आप कोड प्राप्त करने के लिए क्लिक कर सकते हैं।
Google ऑन-साइट खोज उपस्थिति सेटिंग्स, खोज परिणाम अनुकूलन और अन्य फ़ंक्शन भी प्रदान करती है, जिन्हें आप अपनी आवश्यकताओं के अनुसार समायोजित कर सकते हैं। (बड़ा करने के लिए क्लिक करें)
Google कस्टम खोज आपको विशिष्ट खोज परिणाम, स्वत: पूर्ण, समानार्थक शब्द और बहुत कुछ पिन करने की अनुमति देता है।
यह Google की कस्टम खोज का खोज प्रभाव है। इसे किसी वेब पेज में एम्बेड करना मूल CSS से भी प्रभावित हो सकता है, इसलिए आपको इसे स्वयं और बेहतर बनाने की आवश्यकता है। (बड़ा करने के लिए क्लिक करें)
Google कस्टम खोज छवियों को भी खोज सकता है, जो वास्तव में शक्तिशाली है।
2.2 Google कस्टम खोज समस्या प्रदर्शित नहीं करती है
जाने-माने कारणों से चीन में Google कस्टम खोज ठीक से प्रदर्शित नहीं हो पाती है, तो इस समस्या का समाधान कैसे करें? एक व्यवहार्य तरीका रिवर्स जेनरेशन (देखें: Nginx रिवर्स बाइंडिंग) का उपयोग करना या Google कस्टम खोज से संबंधित फ़ाइलों को स्थानीयकृत करना है। इसे लागू करना कठिन है...
Google कस्टम खोज को वास्तव में निम्नलिखित प्रभावों के साथ होस्ट किया जा सकता है:
- HTTPS://color.Google.com/color/public URL?appear=011545314673148308753:3 और 6-KFC को नष्ट नहीं कर सकता
3. इलास्टिक्स खोज स्व-निर्मित खोज
वेबसाइट:
- HTTPS://wuwuwu.elastic.co
3.1 इलास्टिक्स खोज स्थापित करें
इलास्टिक्स खोज इंस्टालेशन के लिए, आप मूल रूप से आधिकारिक ट्यूटोरियल का संदर्भ ले सकते हैं।
वर्चुअल मशीन और ऑनलाइन वातावरण दोनों Ubuntu 14.04.4 LTS हैं, और Elasticsearch नवीनतम संस्करण का उपयोग करता है। सब कुछ शुरू होने से पहले, पहले जांच लें कि मशीन पर जावा वातावरण स्थापित है या नहीं, तो आप इसे निम्नलिखित कमांड के माध्यम से स्थापित कर सकते हैं:
sudo apt-get install openjdk-7-jre-headless
Elasticsearch 2.3.0 संपीड़ित पैकेज डाउनलोड करें और इसे अनज़िप करें:
wget -c https://download.elasticsearch.org/elasticsearch/release/org/elasticsearch/distribution/zip/elasticsearch/2.3.0/elasticsearch-2.3.0.zip unzip elasticsearch-2.3.0.zip
अनज़िप की गई elasticsearch-2.3.0
निर्देशिका का नाम बदलकर ~/es_root
कर दें (नाम और स्थान पर कोई प्रतिबंध नहीं है, आप इसे किसी भी स्थान पर ले जा सकते हैं जो आपको उचित लगे)। इलास्टिक्स खोज को इंस्टॉलेशन की आवश्यकता नहीं है और इसे सीधे चलाया जा सकता है (ध्यान दें: इसे रूट खाते के साथ नहीं चलाया जा सकता है):
BASHcd ~/es_root/bin/ chmod a+x elasticsearch ./elasticsearch
यदि स्क्रीन पर कोई त्रुटि संदेश मुद्रित नहीं होता है, तो इलास्टिक्स खोज सेवा सफलतापूर्वक प्रारंभ हो गई है। एक नया टर्मिनल बनाएं और सत्यापित करने के लिए कर्ल का उपयोग करें:
BASHcurl -XGET http://127.0.0.1:9200/?pretty { "name" : "Melissa Gold", "cluster_name" : "elasticsearch", "version" : { "number" : "2.3.0", "build_hash" : "8371be8d5fe5df7fb9c0516c474d77b9feddd888", "build_timestamp" : "2016-03-29T07:54:48Z", "build_snapshot" : false, "lucene_version" : "5.5.0" }, "tagline" : "You Know, for Search" }
यदि आप उपरोक्त जानकारी देखते हैं, तो सब कुछ सामान्य है। अन्यथा, कृपया स्क्रीन पर त्रुटि संदेश के अनुसार कारण ढूंढें। हालाँकि Elasticsearch स्वयं जावा में लिखा गया है, यह RESTful इंटरफ़ेस के माध्यम से बाहरी दुनिया के साथ बातचीत कर सकता है, जो बहुत सुविधाजनक है।
डिफ़ॉल्ट रूप से, Elasticsearch की RESTful सेवा को केवल स्थानीय मशीन द्वारा ही एक्सेस किया जा सकता है, जिसका अर्थ है कि वर्चुअल मशीन में सेवा को होस्ट से एक्सेस नहीं किया जा सकता है। डिबगिंग की सुविधा के लिए, आप ~/es_root/config/elasticsearch.yml
फ़ाइल को संशोधित कर सकते हैं और निम्नलिखित दो पंक्तियाँ जोड़ सकते हैं:
network.bind_host: "0.0.0.0" network.publish_host: _non_loopback:ipv4_
लेकिन ऑनलाइन वातावरण में को इस तरह कॉन्फ़िगर न करें, अन्यथा कोई भी इस इंटरफ़ेस के माध्यम से आपके डेटा को संशोधित कर सकता है।
3.2 आईके विश्लेषण स्थापित करें
इलास्टिक्स खोज खोज के साथ आने वाला शब्द खंडकर्ता, शब्दावली के अनुसार शब्दों को विभाजित किए बिना, प्रत्येक चीनी वर्ण को सीधे अलग कर देगा। चीनी खोजों को संसाधित करने के लिए, आपको चीनी शब्द विभाजन प्लग-इन भी इंस्टॉल करना होगा। मैं elasticsearch-analysis-ik का उपयोग कर रहा हूं, जो कस्टम लेक्सिकॉन का समर्थन करता है।
सबसे पहले, इलास्टिक्स खोज से मेल खाने वाला इलास्टिक्स खोज-विश्लेषण-ik प्लगइन डाउनलोड करें:
wget -c https://github.com/medcl/elasticsearch-analysis-ik/archive/v1.9.0.zip unzip v1.9.0.zip
डीकंप्रेसन के बाद, प्लग-इन स्रोत कोड निर्देशिका पर जाएं और संकलित करें:
BASHsudo apt-get install maven cd elasticsearch-analysis-ik-1.9.0 mvn package
यदि सब कुछ ठीक रहा, तो संकलित फ़ाइलें target/releases/
निर्देशिका में पाई जा सकती हैं। इसे अनज़िप करें और इसे ~/es_root
की संबंधित निर्देशिका में कॉपी करें:
mkdir -p ~/es_root/plugins/ik/ unzip target/releases/elasticsearch-analysis-ik-1.9.0.zip -d ~/es_root/plugins/ik/
इलास्टिक्सर्च-एनालिसिस-इक की कॉन्फ़िगरेशन फ़ाइल ~/es_root/plugins/ik/config/ik/
निर्देशिका में है। उनमें से कई शब्द सूचियाँ हैं जिन्हें आप सीधे टेक्स्ट के साथ खोलकर संशोधित कर सकते हैं संपादक। उन्हें यूटीएफ-8 प्रारूप के रूप में सहेजना याद रखें।
अब Elasticsearch सेवा प्रारंभ करें यदि आपको निम्न के समान एक संदेश दिखाई देता है, तो इसका मतलब है कि IK विश्लेषण प्लग-इन स्थापित किया गया है:
plugins [analysis-ik]
3.3 समानार्थक शब्द कॉन्फ़िगर करें
इलास्टिक्स खोज एक पर्यायवाची फ़िल्टर के साथ आता है जिसे पर्यायवाची कहा जाता है। IK और पर्यायवाची को एक ही समय में काम करने के लिए, हमें एक नए विश्लेषक को परिभाषित करने, टोकननाइज़र के रूप में IK और फ़िल्टर के रूप में पर्यायवाची का उपयोग करने की आवश्यकता है। यह जटिल लगता है, लेकिन वास्तव में आपको केवल कॉन्फ़िगरेशन का एक अनुभाग जोड़ने की आवश्यकता है।
~/es_root/config/elasticsearch.yml
फ़ाइल खोलें और निम्नलिखित कॉन्फ़िगरेशन जोड़ें:
YAMLindex: analysis: analyzer: ik_syno: type: custom tokenizer: ik_max_word filter: [my_synonym_filter] ik_syno_smart: type: custom tokenizer: ik_smart filter: [my_synonym_filter] filter: my_synonym_filter: type: synonym synonyms_path: analysis/synonym.txt
उपरोक्त कॉन्फ़िगरेशन दो नए विश्लेषक, ik_syno और ik_syno_smart को परिभाषित करता है, जो क्रमशः IK की ik_max_word और ik_smart शब्द विभाजन रणनीतियों के अनुरूप हैं। आईके दस्तावेज़ के अनुसार, दोनों के बीच अंतर इस प्रकार हैं:
- ik_max_word: पाठ को बेहतरीन ग्रैन्युलैरिटी में विभाजित करेगा और सभी संभावित संयोजनों को समाप्त कर देगा;
- ik_smart: पाठ को सबसे मोटे ग्रैन्युलैरिटी में विभाजित करेगा;
ik_syno और ik_syno_smart दोनों पर्यायवाची रूपांतरण को लागू करने के लिए पर्यायवाची फ़िल्टर का उपयोग करेंगे। बाद के परीक्षण को सुविधाजनक बनाने के लिए, ~/es_root/config/analysis/synonym.txt
फ़ाइल बनाने, कुछ समानार्थक शब्द दर्ज करने और इसे utf-8 प्रारूप में सहेजने की अनुशंसा की जाती है। उदाहरण के लिए:
ua,user-agent,userAgent js,javascript 谷歌=>google
3.4 इलास्टिक्स खोज वर्डप्रेस को एकीकृत करता है
वर्डप्रेस प्लगइन:
1. इलास्टिकप्रेस: https://wordpress.org/plugins/elasticpress/
2. इलास्टिक्स खोज के साथ WP खोज: https://wordpress.org/plugins/db-search-with-elasticsearch/
ये दो Elasticsearch वर्डप्रेस प्लग-इन हमें Elasticsearch खोज को वर्डप्रेस में एकीकृत करने में मदद कर सकते हैं, सबसे पहले, प्लग-इन को सक्रिय करें, और फिर Elasticsearch सर्वर से संबंधित जानकारी भरने के लिए प्लग-इन सेटिंग पृष्ठ पर जाएं। (बड़ा करने के लिए क्लिक करें)
फिर आप वर्डप्रेस लेखों और पेजों को इलास्टिक्स खोज सर्वर पर सिंक्रनाइज़ कर सकते हैं और अनुक्रमण शुरू कर सकते हैं।
4. सारांश
Baidu ऑन-साइट सर्च इंजन उन वेबसाइटों के लिए उपयुक्त है जो HTTPS का उपयोग नहीं करते हैं और बड़ी Baidu इंडेक्स रखते हैं, यह उन नई साइटों और वेबसाइटों के लिए बहुत हानिकारक है जो Baidu ऑन-साइट सर्च इंजन का उपयोग करने के लिए Google कस्टम सर्च का उपयोग करते हैं मित्र और घरेलू मित्र उपद्रव करना बंद करें।
Elasticsearch की स्व-निर्मित खोज शक्तिशाली कार्यों के साथ एक बहुत अच्छा उपकरण है। वर्डप्रेस के लिए पूर्ण-पाठ खोज वास्तव में एक "छोटा परीक्षण" है, जो दस्तावेज़ों को अनुक्रमित, खोज, सॉर्ट और फ़िल्टर कर सकता है, और यह जटिल पूर्ण-पाठ खोज कर सकता है .