全國(guó)服務(wù)熱線:400-080-4418

您現(xiàn)在的位置是:首頁(yè) > 新聞資訊 > 網(wǎng)站建設(shè)常識(shí)

淺談網(wǎng)絡(luò)環(huán)境下搜索引擎的使用2010/2/9 16:55:59 瀏覽:48

  摘要隨著網(wǎng)絡(luò)信息時(shí)代的到來,信息檢索處于一個(gè)互聯(lián)的網(wǎng)絡(luò)系統(tǒng)之中,用戶、信息檢索技術(shù)、信息資源構(gòu)成信息檢索三個(gè)基本要素。主要通過Intemet搜索引擎來介紹信息檢索技術(shù)。關(guān)鍵詞網(wǎng)絡(luò)信息檢索搜索引擎

  一、前言

  隨著Internet的迅速發(fā)展,網(wǎng)上信息正以爆炸性的速度增長(zhǎng),其資源內(nèi)容幾乎涉及所有領(lǐng)域,已經(jīng)成為知識(shí)、信息的集合體,是人們獲取信息的基本工具。在Internet網(wǎng)上進(jìn)行瀏覽和檢索,就好比進(jìn)入了世界上大的圖書館,而這個(gè)圖書館里的書刊、雜志、廣告、新聞及各種形式的文獻(xiàn)信息全都沒有規(guī)律地排放著,沒有一個(gè)中心目錄將這些信息組織起來。正是因?yàn)镮nternet資源既豐富又分散且處于無序狀態(tài),使得人們?cè)诰W(wǎng)上查找自己所需的信息并非易事。這時(shí)為滿足人眾信息檢索的需求,搜索引擎便應(yīng)運(yùn)而生。搜索引擎是指使用某些自動(dòng)索引軟件來發(fā)現(xiàn)、收集網(wǎng)絡(luò)上的信息,然后對(duì)收集的網(wǎng)頁(yè)進(jìn)行標(biāo)引,建立一個(gè)可供查詢的大型數(shù)據(jù)庫(kù)。Intemet提供了多種不同的檢索工具,它們各自有各自的數(shù)據(jù)庫(kù)、語(yǔ)言、檢索功能和顯示方式,對(duì)用戶來說,重要的就是熟悉這些工具的性能,掌握檢索技巧,提高檢索的命中率。

  二、搜索引擎的工作原理

  搜索引擎的工作原理可以簡(jiǎn)單概括為:從互聯(lián)網(wǎng)上抓取網(wǎng)頁(yè)→建立索引數(shù)據(jù)庫(kù)→在索引數(shù)據(jù)庫(kù)中搜索排序。從互聯(lián)網(wǎng)上抓取網(wǎng)頁(yè)利用能夠從互聯(lián)網(wǎng)上自動(dòng)收集網(wǎng)頁(yè)的Spider系統(tǒng)程序,自動(dòng)訪問互聯(lián)網(wǎng),并沿著任何網(wǎng)頁(yè)中的所有URL爬到其它網(wǎng)頁(yè),重復(fù)這過程,并把爬過的所有網(wǎng)頁(yè)收集回來。建立索引數(shù)據(jù)庫(kù)由分析索引系統(tǒng)程序?qū)κ占貋淼木W(wǎng)頁(yè)進(jìn)行分析,提取相關(guān)網(wǎng)頁(yè)信息,根據(jù)一定的相關(guān)度算法進(jìn)行大量復(fù)雜計(jì)算,得到每一個(gè)網(wǎng)頁(yè)針對(duì)頁(yè)面內(nèi)容中及超鏈中每一個(gè)關(guān)鍵詞的相關(guān)度,然后用這些相關(guān)信息建立網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)。在索引數(shù)據(jù)庫(kù)中搜索排序當(dāng)用戶輸入關(guān)鍵詞搜索后,由搜索系統(tǒng)程序從網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁(yè)。因?yàn)樗邢嚓P(guān)網(wǎng)頁(yè)針對(duì)該關(guān)鍵詞的相關(guān)度早已算好,所以只需按照現(xiàn)成的相關(guān)度數(shù)值排序,相關(guān)度越高,排名越靠前。后由頁(yè)面生成系統(tǒng)將搜索結(jié)果的鏈接地址和頁(yè)面內(nèi)容摘要等內(nèi)容組織起來返回給用戶。說到這里,網(wǎng)絡(luò)搜索引擎的基本工作原理基本上讓大家了解了。

  三、檢索技巧

  (一)科學(xué)選擇關(guān)鍵詞。由于搜索引擎智能化程度的影響,它只能在現(xiàn)存的數(shù)據(jù)庫(kù)中查找匹配的關(guān)鍵詞,因此,這種匹配相對(duì)比較盲目,我們?cè)谶x擇關(guān)鍵詞時(shí),要注意兩方面的問題,才有可能得到較好的搜索效果。

  (二)使用雙引號(hào)進(jìn)行精確查詢。如果查找的是一個(gè)詞組或多個(gè)漢字,的辦法就是將它們用雙引號(hào)括起來,這樣得到的結(jié)果少、精確。

  (三)使用加號(hào)(+)、減號(hào)(一)限定查找。很多搜索引擎都支持在搜索詞前冠以加號(hào)(+)限定搜索結(jié)果中必須包含的詞匯,用減號(hào)(一)限定搜索結(jié)果不能包含的詞匯。

  (四)靈活運(yùn)用使用通配符。很多搜索引擎支持通配符號(hào),如“*”代表一連串字符,“?”代表單個(gè)字符。

  (五)使用邏輯詞輔助查找。比較大的搜索引擎都支持使用邏輯詞進(jìn)行更復(fù)雜的搜索界定,常用的有:AND (和)、OR (或)、NOT(否)及NEAR(兩個(gè)單詞的靠近程度),恰當(dāng)應(yīng)用它們可以使搜索結(jié)果非常精確。另外,也可以使用括號(hào)將搜索詞分別組合,如[(新聞OR足球)AND米盧)NoT新聞”O(jiān)R足球)

  (六)有針對(duì)性地選擇搜索引擎。用不同的搜索引擎進(jìn)行查詢得到的結(jié)果常常有很大的差異,這是因?yàn)樗鼈兊脑O(shè)計(jì)目的和發(fā)展走向存在著許多的不同,比如:Download.com是針對(duì)軟件類的搜索引擎,可搜尋大量的自由軟件和共享軟件。驅(qū)動(dòng)之家主要是提供查找驅(qū)動(dòng)程序及硬件廠商信息。

  (七)使用元詞檢索。大多數(shù)搜索引擎都支持“元詞”功能,用戶把元詞放在關(guān)鍵詞的前面,就可以告訴搜索引擎你想要檢索的內(nèi)容具有哪些明確的特征。例如,你在搜索引擎中輸入“title:清華大學(xué)”,就可以查到網(wǎng)頁(yè)標(biāo)題中帶有清華大學(xué)的網(wǎng)頁(yè)。其他元詞還包括:image,用于檢索圖片;link,用于檢索鏈接到某個(gè)選定網(wǎng)站的頁(yè)面;URL,用于檢索地址中帶有某個(gè)關(guān)鍵詞的網(wǎng)頁(yè)。[Page]

  (八)細(xì)化查詢。許多搜索引擎都提供了對(duì)搜索結(jié)果進(jìn)行細(xì)化與再查詢的功能,如有的搜索引擎在結(jié)果中有”查詢類似網(wǎng)頁(yè)”的按鈕,還有一些則可以對(duì)得到的結(jié)果進(jìn)行新一輪的查詢。

  (九)盡可能將搜索范圍限制在特定的領(lǐng)域里。比如在yahoo中文網(wǎng)站中,你要查找的是與電腦相關(guān)的知識(shí),那么你沒有必要讓搜索引擎在休閑與運(yùn)動(dòng)、健康與醫(yī)藥、藝術(shù)與人文等其他分類中查找。你可以進(jìn)入“電腦與因特網(wǎng)”這一類,選中“檢索此目錄下的網(wǎng)站”。然后再開始搜索。四、結(jié)束語(yǔ)要完成一個(gè)有效的搜索,首先要確定要檢索的主題,選擇合適的檢索工具、抽取適當(dāng)?shù)年P(guān)鍵詞。為避免可能出現(xiàn)搜索結(jié)果的冗余性,要盡可能限制查詢范圍,正確構(gòu)造檢索式。同時(shí)要使用邏輯條件限制及模糊或精確查詢的功能保證能真正檢索到我們所需的網(wǎng)絡(luò)信息資源?傊,只要掌握一定的方法與技巧并經(jīng)常實(shí)踐.利用搜索引擎一定能從網(wǎng)上獲取許多有價(jià)值的信息。由于網(wǎng)上信息具有動(dòng)態(tài)性、多變性,今天能看到的信息也許明天便不復(fù)存在,要注意對(duì)檢索到的有價(jià)值信息的進(jìn)行保存。

 

服務(wù)網(wǎng)絡(luò)

關(guān)于我們

網(wǎng)至普專注于網(wǎng)站建設(shè)/網(wǎng)站優(yōu)化,始終追求 “您的滿意,我的追求!”。懂您所需、做您所想!我們一直在思考如何為客戶創(chuàng)造更大的價(jià)值,讓客戶更省心!立足上海,服務(wù)全國(guó)。服務(wù):上海,北京,廣州,深圳,成都,杭州,南京,蘇州,無錫等地

查看更多 >>

聯(lián)系我們

Copyright 2008 © 上海網(wǎng)至普信息科技有限公司 All rights reserved. 滬ICP備11006570號(hào)-13 滬公網(wǎng)安備 31011402007386號(hào)


關(guān)于我們 | 聯(lián)系我們 | 網(wǎng)站建設(shè)

返回頂部