Google是怎麼替你找到資料的?揭秘搜尋引擎的運作 3 階段

|本文由邱韜誠 Frank Chiu授權行銷人轉載、編輯,非經原作者同意請勿轉載,原文出處。/首圖:Pixababy


文/邱韜誠

Google 搜尋引擎到底怎麼運作的?當我們使用者「按下」搜尋按鈕那個 moment,Google 是如何提供給我們對應的資料的呢?

這篇文章我會用簡單的比喻,讓你輕鬆了解搜尋引擎的基本運作邏輯,以及 Google 是如何提供給我們眾多搜尋結果——這將能讓你規劃 SEO 策略時,會更有方向跟階段性,成為一個更進階的 SEO 人!

用「圖書館」來理解Google搜尋

搜尋引擎(Search Engine)就是個圖書館,提供讀者需要的書籍。

我們可以把搜尋引擎想像成一個「圖書館」:我們使用者就是想去圖書館找書的讀者,而 Google 則是圖書館管理員,網路上的內容、搜尋結果就是圖書館內的書籍跟館藏。

  1. 假設讀者今天想找「Kindle Oasis」的相關書籍。
  2. 圖書館管理員(Google)找了整個圖書館後,發現圖書館裡面有 50 本關於「Kindle Oasis」的書籍。
  3. 但有這麼多本書,該排序順序給讀者呢?畢竟沒辦法讓讀者一次看到 50 本書,所以會需要排定「優先順序 (搜尋排名)」。
  4. 至於要怎麼決定誰先誰後呢?這就要靠「演算法(algorithm)」來決定了,如:哪一本書跟使用者想找的關鍵字最相關、哪本內容對使用者最有幫助、哪個作者最有權威…等等,藉此判斷哪本書應該優先提供給使用者。
  5. 使用者拿到一串推薦書單。

想要有好排名?你得先進到圖書館館藏才行

許多人做 SEO,追求就是網站排名更好,藉此被更多使用者看到,也就是在上面故事中的第 5 點。

然而,從圖書館的故事我們也會發現,如果自己的書「不在圖書館裡面」的話,那麼又要如何被讀者找到呢?一本不存在圖書館的書,就算你把整個圖書館都翻遍,也不可能找到。

所以說,想要拿到好排名,我們的第一步驟就是讓自己的書,進入 Google 這間圖書館!而這就是索引要做的事情。

我們都是在 Google 的資料庫裡面找資料

有句話是這樣說的:「世界上根本沒有『雲端』,而只有另一台電腦。」

我們在 Google 搜尋時也是一個道理,使用者並非在「整個 internet」上找資料(這樣既慢又沒有效率),而是在 Google 自己的資料庫裡面找資料。

回到我們圖書館上的故事,當我們讀者想開始找書的時候,圖書館管理員 Google 此時可不是現在才去市面上的各種書局、商城找書,而是早就備妥了各式各樣的書籍,儲存在 Google 的資料庫了。

像是前面舉例的「kindle oasis」,在 Google 的資料庫中,就有 53,400,000 項跟「kindle oasis」相關的搜尋結果,如果你的網站內容根本不在 Google 的資料庫裡,使用者當然就找不到囉。

※備註:我能在這五千萬筆資料中拿到第一名,還不錯吧哈哈哈。(但這樣說法會有點 tricky,並不精準,搏君一笑而已。)

搜尋引擎的運作3階段:爬取→索引→排名

接下來就是統整前面的知識了,看完這段你就能理解搜尋引擎的基礎運作邏輯了,而且不只 Google 是這樣,這幾乎適用於各家的搜尋引擎,像是:Yahoo、Bing、YouTube。

1. 爬取資料:

Google 的爬蟲(spider),會去整個 internet 爬取(crawl)、觀看各式各樣的網站與內容。

→ 這就像是圖書館管理員去市面上看看(crawl)現在有哪些好書本。

2. 索引資料:

當 Google 覺得你家的網站內容不錯,值得加到自己的資料庫、提供給適合的使用者,那麼他就會進行「索引(index)」這個動作。

→ 圖書館管理員決定把哪些好書放到圖書館內(index)。

3. 呈現資料:

當使用者輸入關鍵字,按下搜尋按鈕,Google 就會從資料庫中,根據各種考量及演算法,提供適合的搜尋結果(Search Engine Results)給使用者,幫助使用者獲得資訊。

→ 讀者想找書本,圖書館管理員針對使用者想找的書名(關鍵字),給他一個書單的清單(搜尋結果)。

這麼想過後,其實搜尋引擎也是挺簡單可愛的,是吧。

驗收時間:你能看懂這個新聞嗎?

在之前有個很有意思的新聞《逮到你了!歌詞網站 Genius 在歌詞中藏摩斯密碼,指控 Google 抄襲》。

故事中,歌詞網站Genius在歌詞藏了一組神秘代碼,來證明 Google 有抄襲自己的網站內容,各位可以從搜尋三階段來思考看看 Genius 是根據什麼原理來判斷的呢?

答案我會放在最下面,歡迎去對答案哦。

從搜尋三階段,反思 SEO 策略

這個搜尋三階段(爬取、索引、排名),對於我們規劃 SEO 策略其實相當有幫助。從下面的例子中,我們都能套入搜尋三階段的框架中。

  • 如果一個網站的載入速度很慢(page speed),效率很差:在第一階段,Google 爬起來就不開心,就不喜歡常來你的網站;而在第三階段,使用者用你網站的體驗也不好。
  • 如果一個網站上面的文字內容很少,都是圖片:但因為 Google 對於圖片辨識能力不好,因此這本書對於 Google 來說就是無字天書,因此怎麼知道要端給什麼使用者呢?
  • 如果說你的網站內容很優秀,篇數長又圖文並茂,可是關鍵字(keyword)卻非常稀少:那這個時候就像是一本討論咖哩食譜的書籍,但裡面居然都沒出現「咖哩食譜」一詞,那麼 Google 怎麼知道要把這本書提供給想看咖哩食譜的使用者呢?
  • 如果說你的網站重複內容很多(duplicate content):那麼對於 Google 來說,爬你的網站很沒成就感,反正內容都一樣,何必常常來?

了解搜尋三階段後,你在規劃網站的技術與內容時,就會更加了解要怎麼跟搜尋引擎溝通,這就是理解搜尋三階段的價值。

關於如何確認自己的文章有沒有被索引,請見《如何確認網頁被 Google 索引(index)了?三個確認方法及強化作法,搞定索引問題!

了解更多Google資訊:
揭密 Google Trends 正確使用方式:為何 90% 人都用錯 Google Trends?|Google Trends 教學
深度解讀「Google 搜尋量」:了解人們真實意圖與量化需求的強大武器
特定關鍵字的搜尋量居然查不到?有什麼方法能推估關鍵字的搜尋量呢?

附件:抄襲事件答案揭曉

若用圖書館的舉例來說,就是有個人先在書本上劃記一些重點,然後把這本書放在路邊,看 Google 會不會來看。

後來他發現在圖書館看到這本書時,有自己的獨特畫記,藉此判斷說 Google 就是偷了自己書的內容。

作者介紹-邱韜誠 Frank Chiu:

行銷人,喜歡分享好東西跟好觀點,最近在做 SEO。歡迎來我的部落格 https://frankchiu.io/ 逛逛。

更多行銷人報導
不是行銷人也該懂,SEO是什麼?網站優化入門解說
【SEO技巧】找關鍵字的四大步驟與工具分享

作者資訊

《行銷人》合作夥伴
《行銷人》合作夥伴
歡迎成為《行銷人》合作夥伴,若有任何文章授權、尋求報導及投稿的需求,歡迎來信:[email protected]