Thursday, June 21, 2012

善用GOOGLE -- 從入門到精通


(DOC 簡體字版由網站下載,原作者不詳)
修正版:方煒 台大生機系

        GOOGLE簡介
        GOOGLE特色
        基本搜尋:+,  -,  OR
        輔助搜尋:萬用符號、大小寫、句子、忽略字符以及強制搜尋
        關鍵詞搜尋技巧
        進階搜尋:sitelinkinurlallinurlintitleallintitle
        少用進階搜尋語法:relatedcacheinforelated
        其他重要功能
().     目錄服務
().     新聞組(USENET)搜尋
().     搜尋結果翻譯
().     搜尋結果過濾
().     PDF檔案搜尋
().     圖像文檔搜尋
().     找人
().     找軟體
().     找圖片
().     MP3
(十一).     找書
        GOOGLE搜尋FAQ




  GOOGLE簡介


Google (www.google.com)是一個搜尋引擎,由某大學博士生Larry PageSergey Brin19989月發明,Google Inc. 1999年創立。20007月份,Google替代Inktomi成為Yahoo公司的搜尋引擎,同年9月份,Google成為中國網易公司的搜尋引擎。98年至今,GOOGLE已經獲得30多項業界大獎。

  GOOGLE特色


GOOGLE支持多達132種語言,包括簡體中文和繁體中文;GOOGLE網站只提供搜尋引擎功能,沒有太多花俏的裝飾;GOOGLE速度極快,據說有8000多台服務器,200多條T3級頻寬;GOOGLE的專利網頁級別技術PageRank能夠提供高命中率的搜尋結果;GOOGLE的搜尋結果摘錄查詢網頁的部分具體內容,而不僅僅是網站簡介;GOOGLE智慧型的手氣不錯功能,提供可能最符合要求的網站;GOOGLE網頁快取功能,能從GOOGLE服務器裡直接取出緩衝存放的網頁。

  基本搜尋:+,  -,  OR


1.          無需用“+”來表示邏輯,只要空格就可以了。

範例:搜尋所有包含關鍵詞易筋經吸星大法的中文網頁
搜尋:易筋經 吸星大法
結果:已搜尋有關易筋經 吸星大法的中文(簡體)網頁。共約有726項查詢結果,這是第1-10項。搜尋用時0.13秒。
注意:文章中搜尋語法外面的引號僅起引用作用,不能帶入搜尋欄內。

2.          用減號“-”表示邏輯

範例:搜尋所有包含易筋經而不含吸星大法的中文網頁
搜尋:易筋經 -吸星大法
結果:已搜尋有關易筋經 -吸星大法的中文(簡體)網頁。共約有5,440項查詢結果,這是第1-10項。搜尋用時0.13秒。
注意:這裡的“+”“-”號,是英文字符,而不是中文字符的。此外,”+””-“兩側的關鍵字之間不能有空格。比如易筋經 - 吸星大法,搜尋引擎將視為邏輯,中間的“-”被忽略。

3.          用大寫的“OR”表示邏輯。但是,關鍵字為中文的查詢似乎還有BUG,無法得到正確的查詢結果。

範例:搜尋包含布蘭妮“Britney”或者披頭士“Beatles”、或者兩者均有的中文網頁。
搜尋:britney OR beatles
結果:已搜尋有關britney OR beatles的中文(簡體)網頁。共約有14,600項查詢結果,這是第1-10項。搜尋用時0.08秒。
搜尋:布蘭妮 OR 披頭士
結果:找不到和您的查詢-布蘭妮 OR 披頭士-相符的網頁。
注意:小寫的“or”,在查詢的時候將被忽略;這樣上述的****作實際上變成了一次查詢。

4.           “+”“-”的作用有的時候是相同的,都是為了縮小搜尋結果的範圍,提高查詢結果命中率。

例:查閱天龍八部具體是哪八部。
分析:如果光用天龍八部做關鍵字,搜尋結果有26,500項,而且排前列的主要與金庸的小說《天龍八部》相關,很難找到所需要的資訊。可以用兩個方法減少無關結果。

如果你知道八部中的某一部,比如阿修羅,增加阿修羅關鍵字,搜尋結果就只有995項,可以直接找到全部八部,天龍八部 阿修羅。如果你不知道八部中的任何一部,但知道這與佛教相關,可以排除與金庸小說相關的記錄,查詢結果為1,010項,可以迅速找到需要的資料,天龍八部 佛教 -金庸

  輔助搜尋:萬用符號、大小寫、句子、忽略字符以及強制搜尋


1.          不支援萬用符號,如“*”“?”等,只能做精確查詢,關鍵字後面的“*”或者“?”會被忽略掉。

2.          忽略英文字符大小寫,“GOD”“god”搜尋的結果是一樣的。

3.          關鍵字可以是詞組(中間沒有空格),也可以是句子(中間有空格),但是,用句子做關鍵字,必須加英文引號。

範例:搜尋包含“long, long ago”字串的網頁。
搜尋:“"long, long ago"”
結果:搜尋"long, long ago". 共約有28,300項查詢結果,這是第1-10項。搜尋用時0.28秒。
注意:和搜尋英文關鍵字串不同的是,GOOGLE對中文字串的處理並不十分完善。比如,搜尋“"啊,我的太陽"”,我們希望結果中含有這個句子,事實並非如此。查詢的很多結果,我的太陽等詞語是完全分開的,但又不是 我的 太陽這樣的與查詢。顯然,GOOGLE對中文的支援尚有欠缺之處。

4.          對一些網路上出現頻率極高的詞(主要是英文單詞),如i“com”,以及一些符號如“*”“.”等,作忽略處理,如果用戶必須要求關鍵字中包含這些常用詞,就要用強制語法“+”

範例:搜尋包含“Who am I ?”的網頁。如果用“"who am i ?"”“Who”“I”“?”會被省略掉,搜尋將只用“am”作關鍵字,所以應該用強制搜尋。
搜尋:“"+who +am +i"”
結果:搜尋"+who +am +i". 共約有362,000項查詢結果,這是第1-10項。搜尋用時0.30秒。
注意:英文符號(如問號,句號,逗號等)無法成為搜尋關鍵字,加強制也不行。


  關鍵詞搜尋技巧


關鍵詞的選擇在搜尋中起到決定性的作用,所有搜尋技巧中,關鍵詞選擇是最基本也是最有效的。

特定詞法的關鍵字選擇技巧

範例:查找《鏡花緣》一書中淑士國酒保的酸話原文。

分析:如果按照一般的思路,找某部小說中的具體段落,就需要用搜尋引擎先找到這本書,然後再翻到該段落。這樣做當然可以,但是效率很低。如果了解目標資訊的構成,用一些目標資訊所特有的字詞,可以非常迅速的查到所需要的資料。也就是說,高效率的搜尋關鍵字不一定就是目標資訊的主題。在上面的例子中,酒保談到酒的濃淡與貴賤的關係時,之乎者也橫飛。因此,可以用特定的詞語一下子找到目標資料。

搜尋:   OK,找到的第一條資訊就是鏡花緣的這一段落:先生聽著:今以酒醋論之,酒價賤之,醋價貴之。因何賤之?為甚貴之?真所分之,在其味之。酒昧淡之,故而賤之;醋味厚之,所以貴之。..”

近義詞法的關鍵字選擇技巧

範例:黃花閨女一詞中黃花是什麼意思。

分析:黃花閨女是一個約定的俗語,如果只用黃花閨女 黃花做關鍵詞,搜尋結果將浩如煙海,沒什麼價值,因此必須要加更多的關鍵詞,約束搜尋結果。選擇什麼關鍵詞好呢?備選的有意思含義來曆由來典故出典淵源等,可以猜到的是,類似的資料,應該包含在一些民俗介紹性的文字里,所以用諸如來曆由來出典等詞匯的概率更高一些。

搜尋:黃花閨女 黃花 由來,查到黃花原來出典於《太平御覽》,與南朝的壽陽公主相關。如果想獲得第一手資料,那就可以用太平御覽 壽陽公主做搜尋了。

相關詞法的關鍵字選擇技巧

範例:劉德華的胸圍是多少。

分析:首先聲明,這是某個MM要我做的搜尋,我把它作為搜尋案例而已,沒其他的意思。非常直接的搜尋是,劉德華 胸圍,但事實上,這麼搜尋出來的結果,盡是一些諸如劉德華取笑莫文蔚胸圍太小之類的八卦新聞,無法快速得到所需要的資料。可以想到的是,需要的資料應該包含在劉德華的全面介紹性文字中,除了胸圍,應該還包括他的身高,體重,生日等一系列相關資訊。這樣就可以進一步的增加其他約束性關鍵詞以縮小搜尋范圍。

搜尋:劉德華 胸圍 身高,沒有料到的情況發生了,網上炙手可熱的痞子蔡《第一次親密接触》裡居然含有這樣關鍵字,阿泰改編自劉德華《忘情水》的變態歪歌用身高體重三圍和生日來加以編號。好辦,把這部小說去掉,劉德華 胸圍 身高 -阿泰OK,結果出來了,華仔胸圍84cm。說明一下,為什麼用阿泰而不用第一次親密接触呢?這是因為小說的名字被轉載的時候可能有變動,但裏面角色的名字是不會變的。

  進階搜尋:sitelinkinurlallinurlintitleallintitle


1.          “site”表示搜尋結果侷限在某個具體網站或者網站頻道,如sina.com.cnedu.sina.com.cn,或者是某個域名,如com.cn“com”等等。如果是要排除某網站或者域名範圍內的頁面,只需用“-網站/域名

範例:搜尋中文教育科研網站(edu.cn)上所有包含金庸的頁面。
搜尋:金庸 site:edu.cn
結果:已搜尋有關金庸 site:edu.cn的中文(簡體)網頁。共約有2,680項查詢結果,這是第1-10 。搜尋用時0.31秒。

範例:搜尋包含金庸古龍的中文新浪網站網頁,
搜尋:金庸 古龍 site:sina.com.cn
結果:已在sina.com.cn搜尋有關金庸 古龍的中文(簡體)網頁。共約有869項查詢結果,這是第1-10項。搜尋用時0.34秒。
注意:site後的冒號為英文字符,而且,冒號後不能有空格,否則,“site:”將被作為一個搜尋的關鍵字。此外,網站域名不能有“http”以及“www”等,也不能有任何“/”的目錄後顯示;網站頻道則只局限在頻道名.域名方式,而不能是域名/頻道名方式。諸如金庸site:edu.sina.com.cn/1/”的語法是錯誤的。

2.          “link”語法返回所有鏈接到某個URL地址的網頁。

範例:搜尋所有含指向華軍軟體園www.newhua.com鏈接的網頁。
搜尋:“link:www.newhua.com”
結果:搜尋有鏈接http://www.newhua.com的網頁。共約有...j尋時用0.23秒。
注意:“link”不能與其他語法相混合****作,所以“link:”後面即使有空格,也將被GOOGLE忽略。

3.          inurl語法返回的網頁鏈接中包含第一個關鍵字,後面的關鍵字則出現在鏈接中或者網頁文檔中。

有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如“MP3”“GALLARY”等,於是,就可以用INURL語法找到這些相關資源連結,然後,用第二個關鍵詞确定是否有某項具體資料。INURL語法和基本搜尋語法的最大區別在於,前者通常能提供非常精確的專題資料。

範例:查找MIDI滄海一聲笑
搜尋:inurl:midi 滄海一聲笑
結果:已搜尋有關inurl:midi 滄海一聲笑的中文(簡體)網頁。共約有14項查詢結果,這是第1-10項。搜尋用時0.01秒。

範例:查找微軟網站上關於windows2000的安全專題資料。
搜尋:inurl:security windows2000 site:microsoft.com”
結果:已在microsoft.com內搜尋有關 inurlecurity windows2000的網頁。共約有198項查詢結果,這是第1-10項。搜尋用時0.37秒。
注意:inurl:”後面不能有空格,GOOGLE也不對URL符號如“/”進行搜尋。GOOGLEcgi-bin/phf中的“/”當成空格處理。

4.          allinurl語法返回的網頁的連結中包含所有查詢關鍵字。這個查詢的對象只集中於網頁的鏈接字符串。

範例:查找可能具有PHF安全漏洞的公司網站。通常這些網站的CGI-BIN目錄中含有PHF腳本程序(這個腳本是不安全的),表現在鏈接中就是域名/cgi-bin/phf
語法:allinurl:"cgi-bin" phf +com”
搜尋:搜尋allinurl:"cgi-bin" phf +com. 共約有40項查詢結果,這是第1-10項。搜尋用時0.06秒。

5.          allintitleintitle的用法類似於上面的allinurlinurl,只是後者對URL進行查詢,而前者對網頁的標題欄進行查詢。

網頁標題,就是HTML標記語言title中之間的部分。網頁設計的一個原則就是要把主頁的關鍵內容用簡潔的語言表示在網頁標題中。因此,只查詢標題欄,通常也可以找到高相關率的專題頁面。示例:查找日本明星藤原紀香的照片集。

搜尋:intitle:藤原紀香 寫真
結果:已搜尋有關intitle:藤原紀香 寫真的中文(簡體)網頁。共約有284項查詢結果,這是第1-10項。搜尋用時0.03秒。

  少用進階搜尋語法:relatedcacheinforelated


用來搜尋結構內容方面相似的網頁。

範例:搜尋所有與中文新浪網主頁相似的頁面(如網易首頁,搜狐首頁,中華網首頁等),related:www.sina.com.cn/index.shtml

cache用來搜尋GOOGLE服務器上某頁面的緩衝暫存,這個功能同網頁快取,通常用於查找某些已經被刪除的死鏈接網頁,相當於使用普通搜尋結果頁面中的網頁快取功能。
info用來顯示與某鏈接相關的一系列搜尋,提供cachelinkrelated和完全包含該鏈接的網頁的功能。

範例:查找和新浪首頁相關的一些資訊。
搜尋:info:www.sina.com.cn
結果:有www.sina.com.cn的網頁資訊。

新浪首頁北京站 上海站 廣東站. ... 游戲世界, |, 影音娛樂, |, Club, |, 男人女人, |, 論壇聊天, |,時尚潮流, |, 文教育兒, |, 車行天下, |, 軟體下載. ...

Google 提供這個網址的資訊:
查看Google網頁快照www.sina.com.cn的存檔
尋找www.sina.com.cn類似的網頁
尋找網頁有鏈接www.sina.com.cn
尋找網頁包含有www.sina.com.cn'

  其他重要功能

(一).              目錄服務


如果不想搜尋網頁,而是想尋找某些專題網站,可以瀏覽GOOGLE的分類目錄http://directory.google.com/

GOOGLE為了方便搜尋者,提供了工具Bar,集成於瀏覽器中,用戶無需打開GOOGLE主頁就可以在工具Bar內輸入關鍵字進行搜尋。此外,工具Bar還提供了其他許多功能,如顯示頁面PageRank等。最方便的一點在於用戶可以快捷的在GOOGLE主頁、目錄服務、新聞組搜尋、高級搜尋和搜尋設定之間切換。欲安裝GOOGLE的工具Bar,可以瀏覽http://toolbar.google.com/

(二).              新聞組(USENET)搜尋


新聞組中有大量的有價值資訊,DEJA一直是新聞組搜尋引擎中的佼佼者。20012月份,GOOGLEDEJA收購並提供了所有DEJA的功能。現在,除了搜尋之外,GOOGLE還支持新聞組的WEB方式瀏覽和張貼功能。

輸入“http://groups.google.com/”後,點按“Advanced Groups Search”進入進階搜尋界面http://groups.google.com/advanced_g...lt.chinese.textauthor:tuya@ccmail.uoregon.edu

一般而言,我更推薦使用圖形搜尋界面,方便而且直接觀看。

(三).              搜尋結果翻譯


曾經為那些你不懂的法文、西班牙文頁面煩惱麼? GOOGLE支援一項搜尋結果翻譯功能,可以把非英文的搜尋結果翻譯成英文!!目前只支持有限的拉丁語、法語、西班牙語、德語和葡萄牙文。不過,只能在英文狀態GOOGLE下實現這個功能。進入GOOGLE的設置頁面,http://www.google.com/preferences,有一個“BETA: Enable translation of search results you’re your interface language. ”的選項,把它選中,就OK了。

(四).              搜尋結果過濾


網絡上的成人內容浩如煙海,而且很多站點具有欺騙或者其他不良企圖,瀏覽者很容易掉入其中的陷阱。為此,GOOGLE新設立了成人內容過濾功能,見GOOGLE的設置網頁,http://www.google.com/preferences。不過,中文狀態下的GOOGLE尚沒有這個功能。

(五).              PDF檔案搜尋


GOOGLE提供對PDF檔案內文的檢索。目前GOOGLE檢索的PDF文檔大約有2500萬左右。PDFADOBE公司開發的電子文檔格式,現在已經成為網際網路上的電子化出版標準。PDF文檔通常是一些圖文並茂的綜合性檔案,提供的資訊一般比較集中全面。

範例:搜尋關於電子商務(ECOMMERCE)的PDF文檔。
搜尋:inurldf ecommerce”
結果:搜尋inurldf ecommerce. 共約有19,200項查詢結果,這是第1-10項。搜尋用時0.11秒。

下面是某項搜尋結果:

[PDF]www.usi.net/pdf/outsoucing-ecommerce.pdf  Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product Marketing Professonial (PMP) Implementation Manager, Web Engineering ...一般文字檔 - 類似網頁可以看到,GOOGLEPDF檔前加上了[PDF]的標記,而且,GOOGLEPDF文件轉換成了文字檔,點擊一般文字檔,可以粗略的查看該PDF文檔的大致內容。當然,PDF原有的圖片以及格式是沒有了。

(六).              圖像文檔搜尋


GOOGLE提供了Internet上圖像文件的搜尋功能!訪問地址是“images.google.com”。你可以在關鍵字欄位內輸入描述圖像內容的關鍵字,如britney spears”,也可以輸入描述圖像質量或者其他屬性的關鍵字,如“high quality”

GOOGLE給出的搜尋結果具有一個直觀的縮略圖(Thumbnail),以及對該縮略圖的簡單描述,如圖像文件名稱,以及大小等。點擊縮略圖,頁面分成兩禎,上禎是圖像之縮略圖,以及頁面鏈接,而下禎,則是該圖像所處的頁面。屏幕右上角有一個“Remove Frame”的按鈕,可以把框架頁面迅速切換到單禎的結果頁面,非常方便。GOOGLE還提供了對成人內容圖像的限制功能,可以讓搜尋者免受不必要的騷擾。不過,非常遺憾的是,圖像搜尋功能還不支援中文。

(七).              找人


分析:一個人在網上揭示的資料通常有:姓名,網名,性別,年齡,畢業學校,工作單位,外號,住址,電話,電子信箱,BP,手機號碼,ICQ號,OICQ號等等。所以,如果你要了解一下你多年沒見過的同學,那不妨用上述資訊做關鍵字進行查詢,也許會有大的收獲。

(八).              找軟體


分析一:最簡單的搜尋當然就是直接以軟體名稱以及版本號為關鍵字查詢。但是,僅僅有軟體名稱和目標網站,顯然還不行,因為搜尋到的可能是軟體的相關新聞。應該再增加一個關鍵字。考慮到下載頁面上常有點擊此處下載或者“download”的提示語,因此,可以增加下載或者“download”為關鍵字。

搜尋:winzip 8.0 下載
結果:已搜尋有關winzip 8.0 下載的中文(簡體)網頁。共約有6,670項查詢結果,這是第1-10項。搜尋用時0.22秒。

分析二:很多網站設有專門的下載目錄,而且就命名為“download”,因此,可以用INURL語法直接搜尋這些下載目錄。

搜尋:winzip 8.0 inurlownload
結果:已搜尋有關winzip 8.0 inurlownload的中文(簡體)網頁。共約有358項查詢結
果,這是第1-10項。搜尋用時0.44秒。

在網際網路上隨意的下載軟體是不安全的,因為供下載的軟體有可能帶有病毒或者捆綁了木馬,所以,對下載網站作一個限定,是一個穩妥的思路。可以用SITE語法達到這個目的。

共享軟體下載完之後,使用的時候,軟體總跳出警示框,或者軟體的功能受到一定限制。由於中國的網民多是窮棒子,所以應該再找一個注冊碼。找注冊碼,除了軟體的名稱和版本號外,還需要有諸如“serial number”sn序列號等關鍵字。現在,來搜尋一下winzip8.0的注冊碼。

搜尋:winzip 8.0 sn
結果:搜尋winzip 8.0 sn共約有777項查詢結果,這是第1-10項。搜尋用時0.30秒。

(九).              找圖片


除了GOOGLE提供的專門圖片搜尋功能,還可以組合使用一些搜尋語法,達到圖片搜尋之目的。

分析一:專門的圖片集合,提供圖片的網站通常會把圖片放在某個專門目錄下,如gallary“album”photo”“image等。這樣就可以使用INURL語法迅速找到這類目錄。現在,試著找找小甜甜布蘭妮的照片集。

搜尋:“"britney spears" inurlhoto
結果:搜尋"britney spears" inurlhoto共約有2,720項查詢結果,這是第1-10項。搜尋用時0.23秒。

分析二:提供圖片集合的網頁,在標題欄內通常會註明,這是誰誰的圖片集合。於是就可以用INTITLE語法找到這類網頁。

搜尋:intitle:"britney spears" picture”
結果:搜尋intitle:"britney spears" picture. 共約有317項查詢結果,這是第1-10項。搜尋用時0.40秒。

分析三:明星的FANS通常會申請免費個人主頁來存放他們偶像的靚照。於是用SITE語法指定某免費主頁提供站點,是個迅速找到圖片的好辦法。

搜尋:“"britney spears" site:geocities.com”
結果:已在geocities.com內搜尋有關"britney spears"的網頁。共約有5,020項查詢結果,這是第1-10項。搜尋用時0.47秒。

(十).              MP3


分析一:提供MP3的網站,通常會建立一個叫做MP3的目錄,目錄底下分門別類的存放各種MP3樂曲。所以,可以用INURL語法迅速找到這類目錄。現在用這個辦法找找老歌“say you say me”

搜尋:“"say you say me" inurl:mp3”
結果:搜尋inurl:mp3 "say you say me". 共約有155項查詢結果,這是第1-10項。搜尋用時0.17秒。

分析二:也可以通過網頁標題,找到這類提供MP3的網頁。

搜尋:“"say you say me" intitle:mp3”
結果:搜尋"say you say me" intitle:mp3. 共約有178項查詢結果,這是第1-10項。搜尋用時0.73秒。

當然,如果你知道某個網站的下載速度快,而且樂曲全,就可以用SITE語法先到該網站上看看有沒有目標樂曲。

(十一).    找書


分析一:找書的關鍵,是你了解一大批著名的圖書館網站。對我而言,常訪問的電子圖書館類網站就那麼幾個,比如文藝類的www.shuku.net。用SITE語法 site:shuku.net”,就可以馬上找到該書。

分析二:我上面介紹的第一項關鍵字選擇技巧特定詞法,對於迅速找到某書或者文章也是極其有用的,當然,這得建立在你已經讀過該書,對書的內容有印象的基礎上。比如如果了解唐吉訶德一書的大致內容,就可以用吉訶德 風車 桑喬迅速找到該書。

  GOOGLE搜尋FAQ


Q:如何全面的了解google.com
A:查看網站相關頁面“http://www.google.com/about.html”

Q:如何切換google.com的初始語言界面?
A:點擊搜尋欄右邊的使用偏好Preferences),選擇界面語言Interface Language)中你期望的語言,點擊最下面的設定使用偏好Save Preferences)按鈕。需要提醒的是,GOOGLEcookie記錄這個偏好,所以如果你把瀏覽器的cookie功能關掉,就無法進行設定。

Q:如何設定每頁搜尋結果顯示數量?
A:同上,進入使用偏好,在該頁的查看結果Number of Results)選擇顯示結果數,數目越大,顯示結果需要的時間越長,預設是10項。

Q:搜尋到的鏈接無法打開怎麼辦?
A:鏈接無法打開的原因很多,比如網站當機,或者ISP過濾等,可以點擊GOOGLE網頁快取查看在GOOGLE服務器上的網頁緩存。

Q:打開搜尋結果的鏈接,可是該頁面太大,很難找到一下子找到目的資料怎麼辦?
A:直接打開網頁快取GOOGLE會把關鍵詞用不同顏色標記出來,很容易找到。


<其他參考資料>