Google 網頁收錄查詢教學:3 種方法快速確認網站是否被索引,不被收錄的解決方案
確認網站是否被 Google 收錄,最快的方法是在 Google 搜尋框輸入「site:你的網址」,有結果代表已被索引、完全空白代表還沒進到索引;要查得更準,就到 Google S…
確認網站是否被 Google 收錄,最快的方法是在 Google 搜尋框輸入「site:你的網址」,有結果代表已被索引、完全空白代表還沒進到索引;要查得更準,就到 Google Search Console 的「網頁索引」報表看已編入索引與未編入索引的頁面清單,再逐頁用網址審查工具驗證。整套流程靠的是 site: 速查、Search Console 報表、網址審查工具三層檢查互相印證;根據 Google Search Central 對 site: operator 的說明,site: 回傳的結果數只是採樣估計值,會明顯波動,不能當作精確的收錄頁數。
重點先看:被收錄的最低門檻是「索引」,這關過了才有資格談「排名」,先確認 Google 有沒有把你建檔,再考慮排不排得上去;新網站若沒主動提交 Sitemap,只靠自然檢索,收錄往往要等上數天到數週。
先搞懂 Google 收錄的三階段:檢索、索引、排名不是同一件事
Google 收錄一個網站會依序走過「檢索、索引、排名」三個獨立階段,這三個詞常常被混在一起講,但對應的是完全不同的關卡。檢索(Crawl)是 Googlebot 讀取頁面的內容、標題、內外部連結、結構化資料與圖片等資訊的動作;索引(Index)是通過品質判斷後正式建檔、存進 Google 的資料庫;排名(Rank)才是索引之後,決定你在搜尋結果出現位置的競爭。把這三層分清楚,診斷問題才不會開錯藥方。
很多站長卡在「搜尋自家網站找不到」就直接認定要再提交一次 Sitemap,這是常見的誤判。真相是:搜不到可能代表沒被檢索、沒被索引、或被索引了但排名太低,三種情況的解法完全不同。沒被檢索要看 robots.txt 和站內連結;沒被索引要看 noindex 和品質訊號;被索引但排不上來,則要回到內容與 站內 SEO 優化,必要時用 Google Trends 輔助判斷話題熱度。三種情況解法不同,搞混了只會白忙一場。
| 階段 | 發生什麼事 | 對應的卡關訊號 | 排查工具 |
|---|---|---|---|
| 檢索 Crawl | Googlebot 讀取頁面內容、連結、程式碼 | robots.txt 封鎖、無站內連結指向 | GSC 網址審查工具、伺服器 log |
| 索引 Index | 通過品質判斷後正式建檔 | noindex、軟 404、已檢索尚未索引 | GSC 網頁索引報表 |
| 排名 Rank | 決定搜尋結果位置 | 內容薄弱、點擊率低、缺外部訊號 | GSC 點擊曝光報表、SEO 工具 |
把三個階段拆開來看,是為了避免把時間浪費在錯的動作上。實務上常見的情境是:首頁怎麼搜都搜不到,直覺認定 Sitemap 沒提交、重提了幾次沒效,最後才發現是開發期間在 WordPress「設定 → 閱讀」勾到了搜尋引擎可見度選項,整站被 noindex 封鎖。如果一開始就分清楚「沒被索引」和「沒被檢索」,這類問題往往十分鐘就能定位。相關的基礎觀念,可以搭配 技術性 SEO 完整指南 一起建立。
行動裝置優先索引:行動版決定你的索引主體
Google 桌面版跟行動裝置各有不同的爬蟲,而從 2019 年起 Google 全面採用行動裝置優先索引(Mobile-First Indexing),也就是以行動版內容作為索引與排名的主要依據。Google 已於 2023 年 10 月宣布行動優先索引的轉換全面完成,所有能在行動裝置上運作的網站,現在都以行動爬蟲作為主要檢索對象 [來源:Google Search Central Blog〈Mobile-first indexing is here〉https://developers.google.com/search/blog/2023/10/mobile-first-is-here 2023-10-31]。所以確保網站有一個好用、效能好的行動版,不只影響排名,更會直接影響到底有沒有被正確索引。
若行動版內容跟桌面版不一致,或行動版缺少桌面版才有的文字、結構化資料標記、內部連結,Google 索引到的就會是那個殘缺的版本。想讓機器更正確讀懂內容,結構化資料 Schema 標記是值得花時間補的功課。這也是為什麼行動版的網站使用體驗核心指標(CWV)與網頁速度會直接拖累索引與排名,而不是只在桌面端發酵。
| 檢查面向 | 做法 | 常見失誤 |
|---|---|---|
| 回應速度 | 用 PageSpeed Insights 對行動版跑一次,看 LCP、INP、CLS 是否落綠區 | 只看桌面分數,忽略行動版紅燈 |
| 內容一致性 | 逐欄比對行動版與桌面版的標題、正文、內部連結、結構化資料 | 響應式外觀一致但 DOM 被裁切 |
| 互動與觸控 | 確認按鈕間距、字級、點擊區域符合觸控習慣 | 折疊區塊藏關鍵字,被視為次要 |
方法一:用 site: 指令 30 秒速查收錄狀態
site: 指令是最快的收錄速查工具,做法是在 Google 搜尋框輸入「site:你的網址」,例如 site:example.com,按下搜尋後列出的就是目前被 Google 索引的頁面。site: 只是眾多 Google 搜尋技巧 的一種,熟練後能用來快速定位特定網站、檔案類型或關鍵字。如果結果完全空白,代表網站很可能還沒被收錄或遭到封鎖,這時訪客用任何關鍵字都找不到你。這個方法不需登入任何帳號、任何人都能測試,是判斷收錄是否成立的最快訊號。
要特別提醒的是,site: 回傳的那個結果數字只是近似值。根據 Google Search Central 對 site: search operator 的官方說明,這個計數是基於採樣的估計值,會有明顯波動,不能當作精確的收錄頁面總數。要拿精確數字,還是得回到 Search Console。不過作為「有沒有被收錄」的二值判斷,site: 完全夠用,而且 zero result 這個訊號非常明確。
site: 查不到任何結果,真正代表的狀況通常是 Google 從來沒把這個網站編入索引。這和被懲罰是兩回事:被懲罰是原本在索引裡、因為違規被移出;從未索引則是 Google 根本不認識你,問題出在前置的檢索或封鎖條件。遇到零結果別急著重提 Sitemap,先回頭看 網站 Sitemap 入門觀念 與封鎖設定有沒有問題,往往比反覆提交更有效。想檢查某主題頁面有沒有被收,可在網址後加空格與關鍵字,例如 site:example.com 聯絡我們,這是 site: 少數能延伸的用法。
方法二:Google Search Console 網頁索引報表,看清「為什麼沒被收錄」
Google Search Console 的「網頁索引」報表比 site: 指令更權威,它不只告訴你哪幾頁沒被收錄,還會直接列出 Google 給出的具體原因,例如已檢索尚未建立索引、重複網址、遭 noindex 封鎖、軟 404 等。對還不熟悉這套工具的人,可以先看 Google Search Console 介紹 或 這篇 GSC 入門 建立基本概念,再回來讀 網頁索引報表的詳細解讀。登入 GSC 後進入報表,會看到已編入索引與未編入索引兩大區塊,點進未編入索引的原因就能看到受影響的頁面清單,依原因修正後,再用網址審查工具重新驗證,確認問題是否排除。
使用這個報表的前提是先完成網站驗證,根據 Google Search Console 的官方說明,驗證方式包含 DNS 記錄、HTML 檔上傳、HTML 標記等多種。如果你還沒把網站加進 GSC,先參考 GSC 安裝設定步驟 或 Google Search Console 完整設定教學 把基礎打好,也可以順手把 WordPress 串接 Google Analytics 一起設定,流量與索引數據才看得完整。GSC 的索引數字是官方第一手資料,權威性遠高於 site:,所以診斷收錄問題最終都要回到這裡確認。
| 常見未編入索引原因 | 代表的問題 | 修正方向 |
|---|---|---|
| 已檢索,目前尚未建立索引 | Google 讀過了但暫不建檔,多與品質或爬取預算有關 | 強化內容獨特性、累積內部連結,參考 反向連結建立指南 |
| 重複網址,Google 已選擇標準網址 | 存在重複頁面,被併入另一個版本 | 設定 canonical,見 Canonical URL 重複內容處理 |
| 遭 noindex 標記封鎖 | 頁面或外掛設了 noindex | 移除 noindex,檢查 SEO 外掛設定 |
| 軟 404 | 頁面回傳 200 但內容空白或像不存在 | 補實內容或回傳正確 404,搭配 301 與 302 轉址教學 |
| 遭 robots.txt 封鎖 | robots.txt 的 Disallow 擋住檢索 | 調整 robots.txt 規則 |
判讀這張報表時,最容易被「已檢索,目前尚未建立索引」這個原因嚇到。它聽起來像被拒絕,其實更接近「Google 先擱置」的狀態:機器人讀過了,但基於品質判斷或爬取預算,暫時沒有建檔。如果你的網站大量依賴前端腳本渲染內容,也要留意 JavaScript SEO 常是這類擱置的幕後原因,機器人讀得到程式碼卻讀不到實際內容。這種情況下重複要求建立索引通常沒用,真正能推進的是把內容做厚、把站內連結串起來,讓 Google 覺得這頁值得收。這也說明很多時候,收錄問題的根不在 GSC,而在你怎麼經營 SEO 網址結構優化 與內容深度。
一個實用的判讀原則是看「未編入索引」佔整體提交頁面的比例,比例比絕對數字更能反映體質。粗略的門檻是這樣:未索引比例在個位數百分比,屬於正常的長尾頁擱置,可持續優化但不必焦急;落在兩到三成,代表網站結構或內容獨特性有系統性問題,值得回頭檢視 thin content、重複頁面與內部連結;一旦超過一半,問題多半出在封鎖指令、品質全面低落或爬取預算被低價值頁面吃光,這時該把心力放在結構性修復,逐頁請求索引只是杯水車薪。這組門檻屬於依報表結構推得的判讀參考,並非 Google 官方定義,但能幫你把心力優先放在報酬最高的地方。
以這類中型內容站為例,常見的狀況可以這樣推演。假設一個月自然流量約落在 1 萬到 5 萬工作階段、提交頁面數約在 800 到 3,000 之間的網站,第一次打開網頁索引報表時,未編入索引的頁面通常會集中在「已檢索,目前尚未建立索引」與「重複網址,Google 已選擇標準網址」兩個原因,合計大約落在提交量的 15% 到 25% 之間。依典型表現幅度,這個區間的多數頁面其實是分頁、標籤頁、篩選參數產生的近似版本,真正因為內容品質被判低而擱置的,往往只佔其中一小部分。把這類站當成判讀範本,你會發現報表真正在交付的,其實是一份要你逐項分類的清單,分類清楚之後,動作自然就會跟著浮現。
依這個典型情境往下走,決策角度就會浮現:把受影響頁面依原因分桶,比盯著總未索引數字更能導出動作。分頁與標籤頁那桶,用 noindex 或 robots.txt 主動退出,把額度讓給正文頁;重複網址那桶,補上明確的 canonical 與內部連結指向主版本,讓 Google 容易判斷主版本;真正被判品質擱置的那一小桶,才是值得投人力做深、補獨特性的對象。這裡也要誠實說明一項限制:報表的數字本身有資料延遲,剛修正後的幾天內比例有時不降反升,因為重新檢索與狀態更新需要時間走完。這個分桶動作的價值,在於讓「值得被收錄的頁面」這一桶在後續幾週被 Google 重新評估時,有更高的被留下機率,至於帳面數字何時下降,反倒要看 Google 的檢索節奏。把心力放在分類與結構修復,會比反覆對單一頁面點要求建立索引更有效率。
GSC 雖然好用,也有它誠實的限制要說清楚。網頁索引報表的數字有資料延遲,通常不是即時的,剛上線的頁面可能要等個幾天才會在報表裡反映出狀態變化。所以若你剛修完一個 noindex 問題,別期望隔天報表就更新,給它一點時間,同時用網址審查工具做更即時的單頁確認,也可以善用 GSC 日期範圍快速切換 的技巧來比對修正前後的差異。善用 Site Kit by Google 整合教學 串接的工具,能讓你在判讀這些數字時少走冤枉路。
方法三:網址審查工具逐頁驗證並要求建立索引
網址審查工具(URL Inspection)專門處理單一頁面的收錄驗證,在 GSC 頂端搜尋框輸入特定頁面網址,工具會顯示該頁是否已索引、是否被允許檢索。想完整掌握這個工具的每個欄位含義,可以參考 如何利用網址審查工具排查收錄 的逐步說明。若結果顯示「網址不在 Google 服務中」,可以點「要求建立索引」主動請求收錄,系統會先做即時測試確認頁面沒有索引錯誤,通過後才排入索引佇列。這個功能適合處理剛上線的首頁、活動頁等少數重要頁面的緊急收錄需求。
要求建立索引要等多久?根據 Google Search Console 對 Index Inspection 與 Request Indexing 流程的官方說明,單一頁面的處理時間從一天到兩週不等,沒有保證時程。而且每日索引要求次數有上限,Google 對單日索引請求採配額限制機制,確切數字未公開,把它理解成「每日次數有限」即可。當你需要讓大量頁面被收錄時,提交一份完整的 Sitemap 產生與提交實作 遠比逐頁請求來得實際。還有一個前提常被忽略:只有具備網站擁有者權限的帳號才看得到要求建立索引這個按鈕,而且頁面本身若有 noindex 或被 robots 封鎖,點了也不會通過。
有一個常見誤解值得澄清:並非每個點下「要求建立索引」的頁面都會被收錄。如果頁面本身有 noindex、被 robots.txt 封鎖,或內容被判斷為低品質,即便你主動請求,Google 也不會強制建檔。要求建立索引只是把頁面推到 Google 面前請它再看一次,最後收不收還是取決於它的品質判斷。所以把心力優先放在基本功而非反覆點按鈕:先把 提升 Google 排名的關鍵技巧 顧好,讓頁面本身值得被收;若想系統性地補強整體 SEO 體質,也能考慮 搭配 Ahrefs 工具的 SEO 陪跑學習,把收錄與排名一次顧好。
換個角度想,網址審查工具的價值其實不只是「要求建立索引」這個動作。它即時顯示的檢索狀態、索引狀態、允許檢索與否、最後檢索時間,每一項都是診斷的線索。當你懷疑某頁被封鎖,先來這裡查「是否允許檢索」就能秒確認是不是 robots 或 noindex 在作怪,比翻設定快得多。把它當成 Google 排名下滑的急救方法 工具箱裡的第一個手電筒,很多問題一眼就能照出來。
網頁沒被收錄的四大元凶與解法
排除各種檢查後網頁還是沒被收錄,絕大多數不出四個原因:從未提交 Sitemap、誤設 noindex 或勾到搜尋引擎可見度選項、網站存在安全性問題遭降權、以及 Google 尚未主動檢索。對應的解法分別是提交 Sitemap、移除封鎖指令、修復資安問題並用網址審查工具主動請求。多數教學會把沒收錄直接歸咎於要再提交一次 Sitemap,但真正常見的卡關點其實是前三項的封鎖條件,盲目重提 Sitemap 只會浪費每日有限的索引要求額度。
元凶一:從未提交 Sitemap,Google 不知道有哪些頁面
新網站最常見的情況是,站長以為「架完站 Google 自己會來」,但 Google 其實是靠連結和 Sitemap 來發現新頁面,沒人告訴它、又沒有外部連結指向你,它可能很久都不會主動上門。這也難怪剛走完 WordPress 架站新手教學 的站長,常會卡在「網站做好了卻沒人來」的空窗期。提交 Sitemap 等於把站內所有該收錄的頁面清單交給 Google,是最直接縮短等待的動作,相關觀念可參考 30 分鐘快速架好 WordPress 裡的收錄前置步驟;日後要批次檢查 sitemap 或爬取狀態,懂一點 命令列入門 會讓技術排查更順手。
元凶二:搜尋引擎可見度被打勾,整站被封鎖
WordPress 站長特別要檢查這一項。後台「設定 → 閱讀」裡有一個「阻擋搜尋引擎索引這個網站」的選項,開發期間常被打勾避免給 Google 看到半成品,但網站上線後如果忘記取消,就等於整站 noindex,Google 連建檔都不會建。這個設定極度容易被忽略,卻是新手網站搜不到的頭號兇手之一;如果你才剛走完 WordPress 安裝完整教學,務必把這一項列為上線前的必檢清單。確認網站基礎建設時,也順手檢查 WordPress 站台 SEO 全攻略 裡提到的可見度設定。
元凶三:noindex meta 或 robots.txt 明確禁止索引
頁面層級的 noindex meta 標記、robots.txt 的 Disallow 規則,或密碼保護機制,都會明確告訴爬蟲不要索引或不要檢索,想從根本理解這個指令的作用,可以先讀 noindex 介紹。常見來源是 SEO 外掛的進階設定被誤開、或是某個外掛更新後預設值改變。排查時用網址審查工具查「是否允許檢索」就能快速定位,若某些頁面你確實不想讓它進索引,也能反過來參考 主動設定不被索引的方法,再對照 常見 SEO 優化地雷 逐項排除。
元凶四:安全性問題導致網頁被移出索引
網站若被偵測出惡意軟體、釣魚或社交工程等安全性問題,Google 會把相關網頁移出索引,並在瀏覽器與搜尋結果顯示警告,嚴重影響收錄與流量,這也是 GSC「安全性問題」報表會主動警示的項目。修復方式是依照 GSC「安全性問題」報表的指引清除惡意程式碼、申請重新審查。WordPress 站長可搭配資安外掛定期掃描,及早發現漏洞,相關基礎建設如 SSL 憑證與網站安全、HTTP 換 HTTPS 的影響 也一併顧好,避免連帶拖累收錄。
| 元凶 | 典型症狀 | 第一動修正 |
|---|---|---|
| 從未提交 Sitemap | 新站 site: 查無結果、GSC 無檢索紀錄 | 提交 sitemap.xml,參考 如何從零架設網站 |
| 搜尋引擎可見度被打勾 | 整站 site: 空白、原始碼出現 noindex | 取消勾選 WordPress 閱讀設定 |
| noindex 或 robots 封鎖 | 單頁未索引、網址審查顯示不允許檢索 | 移除封鎖指令、重新驗證 |
| 安全性問題 | GSC 安全性問題報表有警示 | 清除惡意程式碼、申請審查 |
四大元凶裡最容易被忽略、也最冤枉的,就是搜尋引擎可見度被打勾這一項。不少站長花幾週研究 SEO、寫了一堆內容,結果問題出在一個開發時勾的 checkbox。所以診斷沒被收錄時,請把這一項放在第一順位檢查,先排除封鎖條件再看 Sitemap 與品質。想批量掃出全站的 noindex 與封鎖設定,用 Screaming Frog 爬蟲工具 跑一次就能一目了然;想建立整體觀念,可以讀 SEO 搜尋引擎優化入門。
robots.txt 與 noindex 的進階判讀:封鎖指令誰說了算
前面屢屢提到封鎖指令,這裡把它拆開講清楚。robots.txt 與 noindex 雖然常被放在一起講,但作用層級完全不同,搞混會導致修正方向錯誤。robots.txt 是「檢索層」的封鎖,它告訴 Googlebot 哪些路徑連讀都不准讀;noindex 則是「索引層」的指令,它允許 Googlebot 讀取頁面,但要求不要把這頁建檔進索引庫。兩者的差別在於:被 robots.txt 封鎖的頁面,Google 根本看不到內容,連裡面的 noindex 標記都讀不到;而被 noindex 標記的頁面,Google 已經讀過內容,只是選擇不收錄。
這個差別會帶來一個反直覺的陷阱。如果你用 robots.txt 封鎖一個已經被索引的頁面,期待它從搜尋結果消失,結果常常不如預期:因為 Google 已經無法檢索這頁,它讀不到你新加的任何指令,只能繼續憑印象保留舊的索引紀錄。正確讓頁面退出索引的做法,是改用 noindex 標記並允許檢索,讓 Google 親自讀到這個指令後再把頁面移出索引,必要時再搭配 301 與 302 轉址教學 處理永久搬移的狀況。
| 指令層級 | 作用位置 | Googlebot 行為 | 典型用途 |
|---|---|---|---|
| robots.txt Disallow | 檢索層 | 連讀都不讀,內容完全看不到 | 封鎖後台、搜尋結果頁、篩選參數頁 |
| noindex meta / header | 索引層 | 會讀取內容,但不建檔 | 低價值分頁、站內搜尋、暫存頁 |
| canonical | 正規化層 | 會讀取並建檔,但併入指定主版本 | 重複內容、列印版、排序參數頁 |
| X-Robots-Tag header | 索引層 | 等同 noindex,但作用在伺服器回應標頭 | PDF、圖片等非 HTML 檔案 |
判讀 robots.txt 時,最常見的三種誤寫要特別留意。第一種是路徑寫得太寬,例如用 Disallow: / 封鎖整站,這在開發環境很常見,上線後沒改回來就等於把 Google 擋在門外。第二種是大小寫與斜線位置錯誤,robots.txt 對路徑大小寫敏感,/Tag 與 /tag 在比對時是不同的路徑。第三種是把應該用 noindex 處理的頁面,誤用 robots.txt 封鎖,結果 Google 讀不到 noindex,頁面反而繼續留在索引裡。排查時務必把 GSC 網址審查工具的「是否允許檢索」與「索引狀態」兩個欄位一起看,前者反映 robots.txt 的結果,後者反映 noindex 與品質判斷的結果,兩個欄位對照才能定位真正的封鎖來源。
一個實用的排查順序是這樣的:先用 site: 確認問題範圍是整站還是單頁,再進 GSC 看網頁索引報表列出哪些原因,接著針對單一頁面用網址審查工具看「是否允許檢索」與「索引狀態」,最後回到伺服器檢查 robots.txt 與頁面的 noindex 設定。把這四步走完,幾乎所有封鎖類的收錄問題都能定位到具體指令。WordPress 站長還要額外檢查 SEO 外掛的「全域 meta robots」與「單一文章覆寫」兩層設定,因為外掛更新後預設值改變,是 noindex 誤開的高發原因之一。
爬取預算:大型網站才需要認真顧的觀念
爬取預算(Crawl Budget)是指 Googlebot 願意在你的網站上花費的檢索次數與時間上限。根據 Google Search Central 對爬取預算的官方說明,它主要由「檢索率上限」(抓取速度的限制)與「檢索需求」(Google 認為這頁值不值得抓)兩個因素決定。對頁面數量在幾千以下的中小型網站,爬取預算幾乎不構成瓶頸,Google 有足夠的額度把整站檢索完;但當網站規模來到數萬、數十萬頁,例如大型電商、內容聚合站、分類廣告平台,爬取預算就會成為決定哪些頁面能被及時發現與收錄的關鍵變數。
爬取預算吃緊時,最直接的症狀是 GSC 網頁索引報表出現大量「已檢索,目前尚未建立索引」或「已發現,目前尚未建立索引」。這代表 Google 知道這些頁面存在,但因為額度有限或判斷價值不足,暫時沒有完整檢索與建檔。要緩解這個狀況,可以從三個方向著手:第一,用 robots.txt 主動封鎖低價值頁面,例如站內搜尋結果頁、無限捲動產生的參數頁、已下架商品的庫存頁,把額度留給值得收錄的內容;第二,強化內部連結結構,讓重要頁面距離首頁的點擊層級夠淺,SEO 友善網站架構規劃 與 爬取預算優化策略 是這一塊的主戰場;第三,把 Sitemap 依內容類型拆分提交,並控制單一 Sitemap 的網址數量,方便 Google 分批處理。
| 網站規模 | 爬取預算敏感度 | 建議動作 |
|---|---|---|
| 小於 1,000 頁 | 低 | 基本顧好 Sitemap 與封鎖即可,無需過度優化 |
| 1,000 到 10,000 頁 | 中 | 留意參數頁與重複內容,適度用 canonical 整合 |
| 10,000 到 100,000 頁 | 高 | 主動封鎖低價值頁、分拆 Sitemap、監控檢索統計 |
| 大於 100,000 頁 | 極高 | 建立完整的分面導航與 robots 策略,定期分析伺服器 log |
判讀爬取預算健康度,GSC 的「檢索統計資料」報表是第一手資料,它會顯示每日檢索頁數、下載位元組、回應時間等趨勢。如果檢索頁數長期偏低、或集中在少數路徑,就代表 Google 把額度花在重複或低價值頁面上,值得回頭檢視封鎖與內部連結策略。不過對多數剛起步的內容站來說,把內容品質與發現機制顧好,優先順序還高於鑽研爬取預算,畢竟被檢索的先決條件,永遠是 Google 認為這些頁面值得花時間。
診斷評分卡:把收錄問題拆成可量化的檢查點
前面把工具與原因講了一遍,實際動手時很容易漏掉某一步。這張評分卡把收錄診斷拆成八個獨立檢查點,每個檢查點過關得一分,總分愈高代表收錄體質愈健全。對新站或剛改版的網站,建議在每個重要里程碑(上線、改版後、遷移網址後)都跑一次這張評分卡,確保沒有哪一環悄悄失分。
| 檢查點 | 通過標準 | 驗證工具 |
|---|---|---|
| 1. site: 有結果 | site:你的網址 至少回傳首頁 | Google 搜尋框 |
| 2. Sitemap 已提交且狀態成功 | GSC 顯示已發現的網址數大於零 | GSC Sitemap 報表 |
| 3. 搜尋引擎可見度未被打勾 | WordPress 閱讀設定未勾選阻擋選項 | WordPress 後台 |
| 4. 無全站 noindex | 首頁原始碼找不到 noindex meta | 瀏覽器檢視原始碼 |
| 5. robots.txt 未封鎖重要路徑 | 網址審查顯示允許檢索 | GSC 網址審查工具 |
| 6. 無安全性問題 | GSC 安全性問題報表無警示 | GSC 安全性報表 |
| 7. 行動版可正常檢索 | 行動裝置可用性測試通過 | GSC 行動裝置可用性 |
| 8. 結構化資料無錯誤 | 複合式搜尋結果報表無嚴重錯誤 | GSC 複合式搜尋結果 |
這張評分卡的價值在於把模糊的「網站有沒有問題」變成可逐項打勾的清單。舉個常見情境:某個網站 site: 有結果、Sitemap 也提交了,但新增的商品頁遲遲不進索引,跑一次評分卡才發現,原來是商品分類頁被 SEO 外掛的某個選項預設套上了 noindex,導致連帶影響子頁面的發現。八個檢查點走完,通常能在十分鐘內把這類隱性問題揪出來,比反覆猜測有效得多。
提交 Sitemap 是加速收錄的第一個動作
Sitemap(網站地圖,XML 格式)像一份交給搜尋引擎的目錄,完整列出站內允許收錄的頁面,能讓 Google 用最短路徑發現並檢索新內容。Sitemap 不只能交給 Google,也能提交到 Bing Webmaster Tools,一次擴大兩大搜尋引擎的收錄範圍。新手架站完成後應該立刻提交一次,這是縮短收錄等待最具體的動作;但網站一旦被穩定收錄,就不必反覆重提,Google 會自動定期檢索,這時該把心力轉到內容與排名追蹤,而不是天天重提 Sitemap。
提交位置在 GSC 的「Sitemap」區塊,輸入 sitemap.xml 路徑送出即可。WordPress 站長可以搭配 Rank Math SEO 外掛教學 或 Rank Math Pro 進階功能解析,這類 SEO 外掛會自動產生 Sitemap,再把路徑提交給 Google 就好。其他熱門外掛的比較可以看 WordPress SEO 外掛評測,再依需求挑選適合的方案。
一個常被問到的問題:提交 Sitemap 真的能加快收錄嗎?答案是能,但有條件。Sitemap 解決的是「發現」這一關,讓 Google 更快知道有這些頁面存在;但如果頁面本身被封鎖、品質低落,Sitemap 提交了也不會被收錄。換句話說,Sitemap 是幫 Google 開路的工具,不是保證收錄的通行證;穩定收錄之後 Google 會自動定期檢索,也不必天天重提。把它和 SEO 友善網站架構規劃、爬取預算優化策略 一起做,才能讓提交的每一頁都真正有機會被撿進去;站點規模變大時,把 Sitemap 依內容類型分拆提交,是大型網站常見的做法。
進階:Indexing API 是什麼,又為什麼大多數人用不上
Indexing API 能用程式一次提交大量網址、直接通知 Google 安排檢索,但官方明文限制只支援結構化資料為 JobPosting(職缺)或 BroadcastEvent(直播)的網頁。絕大多數部落格與內容站根本不在適用範圍,別把它當成通用的索引加速器。
根據 Indexing API 官方文件,這個 API 能做到的事包括:通知 Google 有新網址需要檢索、移除已刪除網頁的索引、查詢特定網址最近一次收到通知的時間,以及把最多 100 個呼叫合併成一個 HTTP 要求做批次提交。聽起來很強大,但關鍵限制在下面。
- 批次提交:單次 HTTP 要求最多合併 100 個呼叫,減少連線數。
- 使用範圍很窄,官方僅支援 VideoObject 內嵌 BroadcastEvent 或 JobPosting 的網頁,一般文章頁不適用。
- 沒有職缺或直播內容的網站,Indexing API 形同無用,老老實實顧 sitemap 與連結才是正道
- 坊間流傳「裝了 Indexing API 索引就會變快」,這句話對不符合資格的網頁其實沒有任何保證效果
這裡要講一個最多人踩的坑。很多教學會告訴你「裝了 Indexing API,索引就會變快」,把這東西當成萬能加速器。但只要你點開官方文件,就會看到白紙黑字寫著:這個 API 只能用於檢索在 VideoObject 中嵌入 BroadcastEvent 或 JobPosting 的網頁。換句話說,你寫的是一般文章、產品頁、部落格,就算硬把網址塞進去送,Google 也不保證會有任何效果。
那有 sitemap 了還需要 Indexing API 嗎?官方的說法是:建議用 Indexing API 觸發檢索,因為它比「先更新 sitemap 再通知」更快讓 Googlebot 開始動工;但同時也建議持續提交 sitemap,好讓 Google 能全面檢索整站。所以對符合資格的網站來說,兩者並用最好;對不符合資格的網站來說,這段話等於沒講,把心力放回 sitemap 就好。
被收錄只是起點:從索引到實際拿到 SEO 流量
被 Google 索引只是拿到「進入搜尋結果」的門票,能不能被點擊還取決於排名位置與點閱率。想真正拿到自然流量,接下來要做的是持續產出有價值內容、優化站內 SEO 與使用者體驗,讓 Google 的排名訊號往有利方向累積。內容方向若想用資料輔助決策,可借助 DataForSEO API 拉搜尋量資料,或用 Bing 關鍵字搜尋量的免費查詢方法 交叉驗證熱度。索引和排名是兩件事,混為一談會讓你以為被收錄就等於有流量,結果等了半天還是沒人來。
這組「索引不等於流量」的落差,有第三方數據可以佐證。Ahrefs 分析其索引中約 140 億個頁面後發現,96.55% 的頁面從 Google 拿不到任何自然流量,只有 1.94% 的頁面每月能拿到 1 到 10 次造訪 [來源:Ahrefs〈96.55% of Content Gets No Traffic From Google. Here's How to Be in the Other 3.45% [New Research for 2023]〉 https://ahrefs.com/blog/search-traffic-study/ 2023-12-01]。即使頁面順利進了 Google 索引,絕大多數仍分不到流量,收錄只是入場,排名才是決戰點。
Google 決定排名時會綜合參考眾多訊號,官方已公開說明它淡化單一訊號的權重,諸如停留時間、跳出率、點擊率都只是其中之一,沒有任何一個能單獨決定生死。反向連結在排名訊號裡的地位也有數據佐證:Ahrefs 分析約 2,000 萬個完全沒有反向連結的頁面,只有約 2,997 個能每月拿到超過 1,000 次搜尋造訪,大約每 6,671 個無反向連結的頁面才有一個能靠純內容衝出流量 [來源:Ahrefs〈96.55% of Content Gets No Traffic From Google. Here's How to Be in the Other 3.45% [New Research for 2023]〉 https://ahrefs.com/blog/search-traffic-study/ 2023-12-01]。缺乏外部訊號支撐的頁面,要拿到像樣的流量相當困難,外部連結的累積仍是排名競爭裡無法迴避的一環。要讓排名訊號往有利方向累積,可以從幾個方向著手:用 SEO 關鍵字工具 做好關鍵字佈局,用 內容行銷策略 持續產出深度內容,用 網站速度優化技巧 搭配 Core Web Vitals 指標顧好使用者體驗。
排名位置的差距,會直接反映在點擊上。Backlinko 分析約 400 萬筆 Google 搜尋結果後發現,只有 0.63% 的搜尋者會點擊第二頁(第 11 名以後)的結果 [來源:Backlinko (Brian Dean)〈Google CTR Stats: We Analyzed 4 Million Google Search Results〉 https://backlinko.com/google-ctr-stats 2025-04-16]。這也說明為什麼只追求「有被索引」還遠遠不夠,頁面得持續往第一頁推進,才有實際拿到點擊的機會。
被收錄之後,從「進得了搜尋結果」到「排得上第一頁」之間,往往還有一段不算短的距離。新網站就算頁面都順利索引,初期排名通常也不高,這是正常的累積期。經營越久、累積價值越高的網站,越容易獲得穩定排名與回訪流量。短期的排名波動不值得過度焦慮,把心力放在能長期累積的事反而更實在:內容深度、EEAT 經驗權威信任原則 的建立、結構化資料 Schema 標記 讓 Google 更懂你的頁面,以及 站外 SEO 與反向連結 的穩健擴展。
| 階段 | 目標 | 關鍵動作 | 追蹤指標 |
|---|---|---|---|
| 被收錄 | 進入索引 | 提交 Sitemap、排除封鎖 | GSC 網頁索引報表 |
| 爭排名 | 往第一頁推進 | 關鍵字佈局、內容深度 | GSC 平均排名、關鍵字排名 |
| 拿流量 | 提升點擊與曝光 | 標題優化、點閱率 | GSC 點擊、曝光,見 SEO 標題優化 |
| 穩經營 | 長期累積權重 | 內容更新、外部訊號 | 回訪率、跳出率 |
說實在的,收錄之後的這段路,比收錄本身更考驗耐心。你可以用 GSC 的點擊、曝光、平均排名數據追蹤收錄後的實際成效,想看得更細還能串接 GA4 工作階段數據解讀,這些數字會誠實告訴你哪些頁面有潛力、哪些還在躺平。把它們和 Google 搜尋演算法解析 的觀念對照著看,會更清楚 Google 究竟在獎勵什麼樣的內容;而一旦流量開始下滑,也能循 網站流量下滑的修復對策 及早應對。被收錄只是起點,後面的每一步才是真正決定網站能不能長出流量的關鍵。
常見問題:收錄查詢與排查的 FAQ
site: 指令查不到任何結果代表什麼?
零結果通常代表 Google 根本還沒把你建檔,這和被懲罰是兩回事。原因多半是從未被檢索,或被 noindex、robots.txt 擋下,下一步該到 Search Console 釐清是卡在檢索還是索引。
要求建立索引要等多久才會生效?
根據 Google Search Console 的說明,單一頁面處理時間從一天到兩週不等,沒有保證時程。每日提交次數有限,大量頁面請改用 Sitemap 批次提交。
新網站通常多久會被 Google 收錄?
被動等待自然收錄往往要數天到數週,主動提交 Sitemap 能明顯縮短等待。沒有外部連結指向的新站,等待時間通常更長。
每日能提交幾次索引要求?
Google 對單日索引請求採配額限制,確切數字未公開,建議理解為每日次數有限。需要收錄大量頁面時,提交 Sitemap 比逐頁請求更有效率。
頁面一直顯示「已檢索,目前尚未建立索引」怎麼辦?
這個狀態代表 Google 已經讀過頁面,但基於品質判斷或爬取預算暫時擱置建檔。重複點要求建立索引通常沒用,真正能推進的做法是把內容做厚、補強獨特性、累積內部連結與外部連結,讓 Google 認為這頁值得收。若頁面大量依賴 JavaScript 渲染,也要檢查機器人是否讀得到實際內容,而非只讀到空殼程式碼。
robots.txt 封鎖的頁面會自動從索引移除嗎?
不一定。robots.txt 封鎖的是檢索,一旦封鎖,Google 反而讀不到頁面裡的 noindex 標記,可能繼續保留舊的索引紀錄。要讓頁面乾淨退出索引,正確做法是允許檢索並改用 noindex 標記,讓 Google 親自讀到指令後再移除,必要時搭配 301 轉址處理永久搬移。
回到開頭那句:確認網站有沒有被 Google 收錄,靠的是一套可以重複執行的三層檢查流程,被動等待收效有限。site: 指令做速查、Search Console 網頁索引報表看原因、網址審查工具做逐頁驗證,三層互相印證,再加上把封鎖條件優先排除,多數收錄問題都能在短時間內定位。被收錄之後,再把心力轉到內容深度與排名訊號的累積:用 E-E-A-T 原則 累積內容可信度,用 Ahrefs Brand Radar 追蹤品牌能見度變化,並排程 SEO 年度內容更新 讓舊文持續有效。門票拿到了,接下來能不能換成流量,靠的是後面這些功夫。