noindex 介紹:什麼是 noindex?對於 SEO 有何效果? | 白話文商學院
noindex 是告訴搜尋引擎「這個頁面可以爬、但不要放進搜尋結果」的指令,最常透過 meta robots 標籤或 HTTP 標頭 x-robots-tag 傳達。它控制的是「要…
noindex 是什麼?一篇看懂「要不要出現在搜尋結果」的開關
noindex 是告訴搜尋引擎「這個頁面可以爬、但不要放進搜尋結果」的指令,最常透過 meta robots 標籤或 HTTP 標頭 x-robots-tag 傳達。它控制的是「要不要被收錄顯示」,不是「要不要被讀取」。根據 Google 官方說明,當 Google 看到頁面回傳 noindex,就不會把這個網址放進索引庫、也不會出現在搜尋結果裡 [來源:Google Search Central〈封鎖索引〉文件]。真正危險的從來不是沒加 noindex,而是賺錢的轉換頁被誤加 noindex,讓整站流量一夜消失。
這個 SEO 標籤常被講成「不想被搜到就用」,但這個講法低估了它的破壞力。它其實是一個靜音鍵:把不該被收錄的頁面靜音,也讓該被收錄的頁面有機會被看見。搞懂這層差別,你才不會把它當成擋箭牌,也不至於因為一個 noindex 設錯就慌了手腳。想先搞懂整個 SEO 的運作脈絡,可以先看SEO 入門與底層邏輯,再回來看 noindex 怎麼放進這套架構裡。
重點先看:noindex 不等於上鎖,它只是把頁面從搜尋結果「靜音」;真正致命的是把賺錢頁誤加 noindex,這類誤設常讓自然流量在數天內斷崖式下滑,營收空窗期可能拖長到數週。
noindex 的定義:控制顯示、不控制讀取的指令
noindex 是一個指令(directive),告訴搜尋引擎「這個頁面你可以爬,但不要放進搜尋結果」。它跟單純的「提示」不同,Google 對 noindex 的尊重等級是 strong directive,也就是官方會盡量遵守、把它當成硬性指令看待 [來源:Google Search Central〈封鎖索引〉文件]。最常出現的位置是 HTML head 裡的 meta 標籤,或伺服器回應的 HTTP 標頭 x-robots-tag。對剛接觸 SEO 的網站經營者來說,最容易把它跟 robots.txt 控制爬蟲抓取權限搞混,但兩者作用層級完全不一樣。
白話一點比喻:noindex 像在門口貼一張「可以看,但不能把這裡的東西拿出去展覽」的告示。搜尋引擎爬蟲照樣進得來、讀得到內容、看得到連結結構,但被禁止把這個頁面排進搜尋結果列表。這跟「上鎖」是兩件事。要徹底不讓人讀取,得靠密碼、權限驗證或伺服器層級的封鎖,noindex 本身做不到這件事,後面會專門談這個常被誤解的邊界。
既然爬蟲進得來,那「不索引」到底有什麼意義?意義在於它管的是「收錄與顯示」這一段,「讀取」這件事留給爬蟲照常進行。整個搜尋流程從檢索(crawl)、索引(index)一路走到排名(rank),noindex 插手的是中間那一段。要弄懂它在鏈上的位置,可以搭配 檢索在索引與排名間的角色與 Google 搜尋引擎運作原理一起看,會更清楚 noindex 卡在哪一個環節。
noindex 適用的頁面類型
noindex 適合用在「爬蟲需要看到、但使用者搜尋時不該出現」的頁面,服務的是那種「讀得到、但顯示出來沒價值甚至有害」的內容。經典例子是站內搜尋結果頁、重複或薄內容頁、測試與開發頁、活動結束的過期行銷頁,以及用來間接調節爬取預算的低價值頁。如果你連「這個頁面要不要被收錄」都還沒想清楚,可以先看 Google 網頁收錄查詢把索引的底層邏輯釐清;noindex 本身也屬於站內 SEO 的一環,站內 SEO 攻略把它放進更大的設定框架裡看會更清楚。
站內搜尋結果頁是 noindex 最經典的應用。假設你的站有 ?q=關鍵字 這類網址,使用者每輸入一個詞就會生出一個新頁面,這些頁面內容彼此高度重複、品質低落,放任它們被收錄等於讓搜尋引擎塞滿垃圾。幫這類頁面加上 noindex,是控制這類結構性低價值內容的第一步。這跟 網址查詢參數造成重複內容是同一個問題的兩面,值得一起處理;多語系網站若用 hreflang 多語言網站架構,也要留意各語言版本的索引狀態不要互相打架。
重複內容、分頁、篩選頁、tag 彙整頁也常被點名要加 noindex,但這裡有個分歧。重複內容用 noindex 是直覺做法,可是如果你希望權重被合併到標準頁,改用 canonical 反而更對症。這牽涉到 重複內容對 SEO 的負面影響到底有多嚴重,以及你到底要「不收錄」還是「權重合併」。後面會專門比較 noindex 跟 canonical 為什麼不能同時用;若想把 canonical 的用法一次看懂,Canonical URL 完整指南是很好的對照。
這幾類情境的共同特徵是「頁面本身有功能、但沒有排名價值」。站內搜尋頁要留著給使用者用、測試頁要留著給工程師看、活動頁要留著做成效追蹤,所以你不能刪掉它們,卻也不希望它們占去搜尋結果的位置。noindex 正好填補這個「保留頁面、但不顯示」的中間地帶。如果你連頁面的搜尋意圖都還沒摸清楚,建議先讀 搜尋意圖決定排名核心,再決定一個頁面到底值不值得被收錄。
用四維決策矩陣判斷要不要 noindex
上述情境只是起點,真正上線時你會遇到大量灰色地帶的頁面,靠直覺決定容易誤判。比較可靠的做法是固定用一組問題把每個頁面過一遍,再依分數決定動作。一張四維度的決策矩陣就能勝任:每個維度給 0 到 2 分,總分 0 到 8 分。把同樣的問題套到每一個頁面上,結論會比「我覺得這頁不重要」穩定得多。
| 維度 | 0 分(明確該收錄) | 1 分(中性) | 2 分(明確該 noindex) |
|---|---|---|---|
| 獨立資訊價值 | 頁面有原創內容、能單獨回答使用者問題 | 內容是組合頁,靠彙整才有意義 | 內容與其他頁面高度重複、或本身幾乎空白 |
| 搜尋需求存在 | 有對應的搜尋量、有人會這樣查 | 需求微弱、季節性強 | 幾乎沒人這樣搜,純粹是站內功能產生的網址 |
| 權重去向 | 希望頁面自己累積權重 | 只當中繼頁,把權重導向其他頁 | 不希望權重停在此頁,也無合併目標 |
| 使用者體驗 | 從搜尋結果點進來會得到完整答案 | 點進來後還要再點一層才有用 | 點進來會困惑、是流程中途的過場頁 |
計分規則很單純:總分 0 到 2 分的頁面應該收錄,不要動它;3 到 5 分的頁面屬於灰色地帶,優先考慮 canonical 或改善內容,noindex 是最後選項;6 到 8 分的頁面明確該加 noindex。把這張表存進你的團隊文件,每個新頁面上線前先打分,能避開大多數「憑感覺誤加或漏加」的錯誤。打分時最容易出錯的是第二個維度「搜尋需求」,因為站長常把「站內有人點」誤判成「搜尋引擎前有人搜」,這兩件事差很多;想知道怎麼分辨,量化真實搜尋需求與 關鍵字研究工具指南能幫你把這個維度打對。
不該用 noindex 的反模式
noindex 被濫用的場景比你想得多。知道何時該用之後,更要記住幾種明明該收錄、卻被誤加 noindex 的反模式,因為這些錯誤造成的損失遠大於「該擋沒擋」。把還在養的新內容頁誤擋是第一種:新文章剛上線、排名還沒起來,站長看流量低就以為沒價值、加上 noindex,問題在於搜尋引擎還沒累積夠的權重與信任,本來就需要時間,提早 noindex 等於把還沒機會成長的頁面直接判死刑,正解是給它檢索與排名的機會,並透過內部連結導入權重。
第二種是把分頁或篩選頁全部一刀切。分頁與篩選頁確實常有重複問題,但有些篩選組合本身有搜尋需求,例如「紅色」「冬季」「台北」這類帶明確屬性的篩選頁,一律 noindex 等於把長尾流量來源整批砍掉。正解是挑出有搜尋需求的組合放行,其餘再考慮 noindex 或 canonical。第三種是把商品或內容分類頁當彙整頁擋掉,分類頁往往對應著高搜尋量的核心關鍵字,例如「男鞋」「筆電推薦」,這類頁面是電商與內容站的金礦,加 noindex 等於把金礦封起來。
判斷一個頁面到底屬於上述反模式還是真的該 noindex,可以回頭用前一節的決策矩陣打分。分數落在灰色地帶時,保守的做法是先收錄、用 GSC 觀察一段時間,確認真的沒帶來流量再考慮 noindex,因為誤擋的修復成本遠高於暫時多收錄幾個低價值頁。對於分類頁與篩選頁到底該不該收錄,重複內容對 SEO 的負面影響與 網址查詢參數造成重複內容提供了更具體的判斷依據,值得一起對照;而網站整體的網址結構若規劃得好,能從源頭減少這類灰色頁面的產生,SEO 友善網頁結構設計是順手的延伸。
noindex 的兩種寫法:meta 標籤與 HTTP 標頭
noindex 最常見的寫法是在 HTML head 放 <meta name="robots" content="noindex">,可搭配 follow 或 nofollow 控制連結要不要繼續被追蹤。非 HTML 檔案,例如 PDF、圖片、影片,則改用伺服器回應的 HTTP 標頭 x-robots-tag: noindex。寫法看似簡單,但「noindex,follow」跟「noindex,nofollow」的差別很多人沒認真分清楚,而這個差別會直接影響頁面的連結權重要不要被傳遞下去。
基本寫法是 <meta name="robots" content="noindex, follow">,意思是這個頁面不索引,但搜尋引擎仍會繼續追蹤頁面上的連結,把權重往下傳。這對站內搜尋頁特別有用,因為頁面本身不該出現在搜尋結果,但它連到的產品頁、分類頁卻很重要,follow 能確保這些目標頁繼續被抓到。相對地,noindex, nofollow 是連連結都不追蹤,等於把頁面跟它指向的資源整個隔離掉。選哪一種,取決於你對 內部連結架構與連結權重的整體規劃。
| 寫法 | 是否索引 | 是否追蹤連結 | 典型用途 |
|---|---|---|---|
| index, follow | 是 | 是 | 一般內容頁(預設值) |
| noindex, follow | 否 | 是 | 站內搜尋頁、分頁、篩選頁 |
| noindex, nofollow | 否 | 否 | 測試頁、完全隔離的開發頁 |
| x-robots-tag: noindex | 否 | 視情況 | PDF、圖片、影片等非 HTML 資源 |
HTTP 標頭 x-robots-tag 適用 PDF、圖片、影片等非 HTML 資源,因為這些檔案沒有 head 區可以塞 meta 標籤 [來源:Google Search Central〈封鎖索引〉文件]。很多站長不知道 PDF 也會被收錄,結果一份報告、一份型錄被當成獨立頁面排進搜尋結果,反而瓜分了主頁面的能見度,PDF noindex 排除搜尋結果就是靠 x-robots-tag 來做。這類資源的管理,可以搭配 XML Sitemap 協助索引一起規劃,把該收錄的列進去、不該收錄的擋掉;若是 JavaScript 網站收錄問題導致 noindex 讀不到,又是另一條排查路線。
如果你是 WordPress 站長,其實不用手寫程式碼。Yoast SEO、Rank Math 這類外掛在後台就有「是否允許搜尋引擎顯示這篇內容」的勾選項,勾掉就等於加上 noindex(介面名稱隨外掛版本變動,以各外掛當時版本為準)。這也是 noindex 最容易出問題的地方之一,因為勾選太方便,一不注意就勾到整批頁面。WordPress 之所以是 noindex 誤設的高風險地帶,與它的市占規模直接相關:截至 2026 年 6 月,WordPress 在所有網站的占比達 41.5%,在已知使用內容管理系統的網站中更高達 59.2% [來源:W3Techs〈Usage Statistics and Market Share of WordPress〉 https://w3techs.com/technologies/details/cm-wordpress 2026-06-29]。這意味著只要一個外掛介面調整、或一次全站隱私設定誤勾,影響的就是數以千萬計的網站,這也是為什麼 WordPress 站長更該把 noindex 設定列為必檢項目。下一節會講為什麼 noindex 跟 robots.txt 搭在一起會出更大的問題。
noindex 與 robots.txt 為什麼不能同時用
這是新手最容易踩的大坑:很多人以為「用 robots.txt 擋掉再加 noindex」是雙保險,其實剛好相反。如果你用 robots.txt 把頁面封鎖,爬蟲根本進不來,就看不到你寫的 noindex,於是 noindex 形同失效,頁面仍可能因為其他網站連結而出現在搜尋結果裡。Google 官方明確建議:為了讓 noindex 生效,不要用 robots.txt 封鎖該頁 [來源:Google Search Central〈封鎖索引〉文件]。
關鍵在於作用層級不同。robots.txt 控制「能不能爬」,noindex 控制「要不要顯示」,兩者作用在搜尋流程的不同階段。robots.txt 封鎖後,爬蟲連頁面都進不去,自然讀不到裡面的 meta 標籤,noindex 這張告示對它來說根本不存在。更麻煩的是,即使被 robots.txt 擋住,若有其他網站連結到該頁,Google 仍可能以「僅網址」的形式把頁面收錄進索引庫,你以為擋住了,其實沒有。這兩個工具本來就是設計來做不同事的:你想擋的是「顯示」就交給 noindex,想擋的是「爬取」就交給 robots.txt,不要把它們疊在一起當成萬用組合技。要弄懂兩者為什麼打架,看 robots.txt 與 noindex 為何不能併用會更清楚;而他站連結對收錄的影響,可以對照 反向連結與網域權重來理解,為什麼單靠 robots.txt 擋不住。
如果你完全不希望某頁面出現在搜尋結果,正確做法是放行爬蟲、加上 noindex,必要時再搭配 Google Search Console 功能介紹裡的主動移除工具加速處理。沒有任何一個指令是絕對保險的,理解機制比背規則重要。要把這類技術性設定放進整體藍圖,技術性 SEO 完全指南能幫你把脈絡串起來。
noindex 與 rel canonical 不建議並存
不建議把 noindex 和指向他頁的 rel canonical 同時用在同一個頁面上。原因很直接:兩者發出互相矛盾的訊號。noindex 說「這頁沒價值、別收錄」,canonical 卻說「這頁的權重請轉給標準頁」,你一方面要搜尋引擎忽略這個頁面,一方面又要它處理這個頁面的權重轉移,訊號打架的結果就是搜尋引擎的處理行為並不穩定,不應依賴。
拆開來看,noindex 的目的是不收錄、不出現在搜尋結果;rel canonical 的目的是聲明自己是某標準頁的副本,把權重合併過去。處理重複內容時,你要先想清楚目標:如果希望權重合併,用 canonical;如果希望徹底不收錄,用 noindex。兩者並存時,等於同時要搜尋引擎「忘掉這頁」又要它「幫這頁轉帳」,邏輯上根本衝突。實務上會看到站長這麼做,多半是因為重複內容處理到一半,兩個工具都掛上去「求心安」,但求心安不等於有效。
| 指令 | 目的 | 權重處理 | 適用情境 |
|---|---|---|---|
| noindex | 不收錄、不顯示 | 頁面權重不傳遞 | 站內搜尋頁、測試頁、低價值頁 |
| rel canonical | 聲明為標準頁副本 | 權重合併到標準頁 | 重複內容、分頁、印刷版 |
| 兩者並存 | 訊號矛盾 | 行為不穩定 | 不建議,擇一使用 |
判斷標準其實很單純:問自己「這個頁面到底要不要把權重傳出去」。要傳,就用 canonical;不要傳、也不希望出現,就用 noindex。兩者並存的灰色地帶,搜尋引擎可能選擇忽略 noindex、也可能選擇忽略 canonical,你不該把排名結果賭在這種不穩定的行為上。如果你對 canonical 的機制還不熟,建議先讀 canonical 標籤的運作方式,回頭看這段會更有感;而文章轉載與重複內容的界線,文章轉載對 SEO 的影響也值得一看。
檢查頁面有沒有 noindex 的方法
最快確認一個網頁是否被設了 noindex的方法,是用 Google Search Console 的網址檢查工具直接看索引狀態。輸入網址後,工具會告訴你這個頁面「是否允許索引」,若被封鎖也會顯示原因。這是最直接、也最權威的方式,因為資料直接來自 Google 本身。要善用這個工具,可以先看 GSC 網址檢查工具主動提交的操作細節;還沒把網站接上 GSC 的 WordPress 站長,可以照 WordPress 提交 Google Search Console走完串接流程。
第二個方法是裝瀏覽器外掛,例如 SEO META in 1 CLICK 或 Detailed SEO Extension,一鍵就能看到 meta robots 的設定值。第三個方法是直接檢視網頁原始碼,用 Ctrl+U(Windows)或 Cmd+U(Mac)叫出原始碼,或按 F12 開發者工具,搜尋 noindex 這個字串。不會看原始碼的人,可以先從 用開發者工具看網頁原始碼入門,這是 SEO 人必備的基本功。
大站常用的批次排查則是用 Screaming Frog 這類爬蟲工具一次掃出全站 noindex 頁面清單。當你的站有上千個頁面,手動逐一檢查不現實,工具一次跑完就能給你完整的 noindex 頁面清單,這在 Screaming Frog 批次掃描 noindex有詳細流程;拿到清單後,再對照下一節要講的「絕對不能 noindex」白名單,逐一比對有沒有誤擋。GSC 網頁索引報表本身也值得花時間看懂:它會把頁面分成「已建立索引」「已檢索但目前未建立索引」「已排除」等狀態,其中「已排除:noindex」就是被你或外掛加上 noindex 的頁面,是發現誤擋最即時的訊號,判讀方式可以參考 GSC 網頁索引報表判讀。
最危險的 noindex 錯誤:重要頁面被誤擋
noindex 最嚴重的災難,就是把賺錢的轉換頁、首頁、分類頁被誤加 noindex,導致整站或關鍵頁面一夜從搜尋結果消失;相比之下,該擋的沒擋只是次要問題。這是 WordPress 站長每隔一陣子就會踩到的真實地雷:全站隱私設定勾到、Yoast 文章層級勾到 noindex、改版時整批套用錯範本,任何一個都能讓流量突然斷崖式下滑。症狀很明確:流量突然下滑、GSC 出現大量「已排除」、品牌關鍵字搜不到自己的網站。
更棘手的是復原不即時。移除 noindex 後,你得等下次檢索與索引更新才會陸續恢復,這段時間可能是數天到數週,對靠自然流量吃飯的電商來說,這段空窗期就是實實在在的營收損失。這也是為什麼與其記「什麼時候加 noindex」,不如反過來建立一份「絕對不能 noindex 的頁面清單」,這才是實務上保命的那份清單。流量突然下滑有時也會被誤判成演算法波動,跳出率與 SEO 的關係能幫你區分到底是誤擋還是內容問題;要更精確追蹤流量來源,UTM 追蹤碼教學能把自然流與行銷流分清楚。
之所以說 noindex 誤設的代價特別慖烈,是因為自然流量本身就是極稀缺的資源。Ahrefs 分析其索引中約 140 億個頁面發現,96.55% 的頁面從 Google 拿不到任何自然流量,只有 1.94% 的頁面每月能拿到 1 到 10 次造訪 [來源:Ahrefs〈96.55% of Content Gets No Traffic From Google〉 https://ahrefs.com/blog/search-traffic-study/ 2023-12-01]。換句話說,絕大多數頁面本來就進不了搜尋結果的視野,所以一個能穩定帶流量的轉換頁一旦被誤加 noindex,等於親手抹掉那少數能見光的版面,這正是「絕對不能 noindex」清單非建不可的根本原因。
以這類誤觸情境的典型表現幅度來說,當一個穩定帶自然流量、每日約 800 到 2,500 次造訪的轉換頁(例如分類頁或結帳前落地的商品頁)被誤加 noindex,常見的狀況是 GSC 在數天內陸續出現「已排除:noindex」的累積計數,品牌核心關鍵字的排名則在接下來約 1 到 2 週內從首頁滑落到找不到或消失。依這類站的典型反應,移除 noindex 後要等下次檢索與索引更新,流量回升通常落在數天到數週之間,並不會立即回到原水位。這裡要誠實提醒一個常被忽略的限制:這些幅度只是依公開檢索與索引行為推估的典型區間,實際恢復速度高度取決於該頁的檢索頻率、外站連結強度與改版規模,無法套用單一數字保證。所以決策重點不在「誤觸後能多快救回」,而在事前就用「絕對不能 noindex」白名單把轉換頁列為禁區,並在重大改版、外掛更新後第一時間用 GSC 網址檢查工具覆核,這比事後搶救划算太多。若想把這類檢查排進常態流程,Google Search Console 功能介紹與 SEO 內容年度更新建議提供了可照著走的檢核節奏。
「絕對不能 noindex」清單至少該涵蓋這幾類:首頁、金流與結帳頁、主要分類頁、產品頁、高流量內容頁,以及任何承載品牌關鍵字的頁面。這些頁面一旦被誤加 noindex,等於把你最賺錢的門面從搜尋結果裡搬走。要驗證這些頁面沒被誤擋,最快的方式還是用網址檢查工具逐一確認。若你的站剛做完改版,務必參考 網站改版流量暴跌災難裡的檢查清單,把 noindex 設定列為必檢項目之一;而賺錢頁的 URL 結構本身就該避開 SEO 地雷,可對照 SEO 網址優化指南與 SEO 友善網站架構設計。
這一節講的不是技巧,而是紀律。技巧人人學得會,紀律卻是每次改版、每次套範本、每次開新頁面前都要重複執行的那一步。把「noindex 檢查」寫進上線流程,重大改版前先備份好 robots 與 meta 設定,這兩個動作看似不起眼,卻是把你從流量消失的恐慌裡拉回來的保命繩。對內容型網站來說,SEO 內容年度更新建議這類定期維護流程,也值得把 noindex 排查排進去。若恢復後排名依舊卡關,Google 排名上不去的破解關鍵可以接著排查。
noindex 容易被忽略的邊界
noindex 還有幾個容易被忽略的邊界:它不等於安全防護、加了不會立刻生效、也不是唯一不被收錄的方法。它只是控制「要不要出現在搜尋結果」的指令,理解這個邊界,你才不會把它當成隱私護盾或刪除工具。只加 noindex 能保護內容安全嗎?不能。noindex 不會擋住爬蟲抓取頁面內容,它只控制「要不要顯示在搜尋結果」。想保護會員資料、報價單、內部文件這類敏感資訊,必須再上密碼或權限驗證。把 noindex 當成安全機制,等於門口貼了「不要展覽」的告示,卻沒上鎖,任何人推門還是進得來。這是 Google 官方文件反覆強調的限制 [來源:Google Search Central〈封鎖索引〉文件]。如果你要的是不被收錄的完整選項,可以看 不被索引的四種方法總整理,裡面把密碼保護、GSC 移除工具、robots.txt 都列在一起比較。
已收錄的頁面加上 noindex,會馬上從搜尋結果消失嗎?不會。要等搜尋引擎再次檢索這個頁面、並更新索引後,頁面才會陸續被移除。這個時間差從幾天到數週都有可能,取決於檢索頻率。如果你急需立刻移除,可以用 GSC 的移除工具暫時遮蔽,但它只是權宜之計,不是永久解。要了解網址結構怎麼影響檢索效率,網址組成要素解析與 網址路徑設計原則能補上這塊背景。
| 情境 | noindex 做得到嗎 | 正解 |
|---|---|---|
| 不讓頁面出現在搜尋結果 | 可以 | meta robots 或 x-robots-tag |
| 保護敏感內容不被讀取 | 不行 | 密碼、權限驗證 |
| 立刻從搜尋結果移除 | 不行(有時間差) | GSC 移除工具搭配 noindex |
| 合併重複內容權重 | 不適合 | rel canonical |
被 noindex 的頁面同樣不會成為 AI 搜尋引用的來源,因為 AI 摘要、AEO、GEO 這類機制同樣建立在索引之上。這意味著,如果你把一份高價值的來源頁面誤加了 noindex,它不只從傳統搜尋結果消失,也會從 AI 推薦場景裡缺席,這個影響比你想得大,AI 摘要如何引用內容有更細的說明。想增加被引用的機會,結構化資料 Schema 標記教學是值得補強的一環。
tag 頁、作者彙整頁要不要 noindex,沒有標準答案。小站、內容品質高的站,tag 頁反而可能帶來長尾流量,貿然 noindex 等於砍掉這條路;大站、tag 浮濫的站,noindex 反而能清出空間讓主內容頁被凸顯。判斷標準是「這個彙整頁本身對使用者有沒有價值」,而不是「別人說要不要 noindex」。這跟 長尾關鍵字優先策略的思考邏輯一致:先看這個頁面服務的搜尋需求到底存不存在。
noindex 設了卻沒生效的排查方向
noindex 設了卻發現頁面還在搜尋結果裡,是最常見的技術疑難。問題通常不出在 noindex 本身,而在它賴以生效的前置條件沒滿足,背後對應的是三個前置條件:爬蟲進得來、讀得到標籤、索引有更新。先檢查頁面是否被 robots.txt 擋住,前面提過,robots.txt 封鎖會讓爬蟲讀不到 noindex,到 GSC 網址檢查工具看「檢索」是否被允許,若被擋就先放行再等重新檢索。接著確認 noindex 是否真的被讀到:用網址檢查工具看「檢索後的網頁」,確認渲染後的 HTML 裡確實有 meta robots,若是 JavaScript 動態注入的標籤,可能渲染延遲導致爬蟲讀不到,這時要把 noindex 改成伺服器端輸出或用 x-robots-tag。
另外兩個方向比較偏向時間差。一是即使 noindex 生效,若其他網站連到該頁,Google 仍可能以「僅網址」形式短暫顯示,這種情況頁面通常只有網址、沒有標題摘要,屬於正常過渡,不需要特別處理。二是移除或加上 noindex 都需要等下次檢索與索引更新,低流量頁面檢索頻率低,可能要數週才反映,急著處理可主動提交檢索請求加速。最後要留意:若之前用過 GSC 的暫時移除工具(效期約半年),過期後頁面會重新出現,需確認 noindex 是否仍生效。把這三個前置條件記住,未來遇到任何「設了沒用」的變形問題,都能從這裡反推。若是 JavaScript 網站遇到 noindex 讀不到的狀況,JavaScript 網站收錄問題有更深入的排查路線;而想確認頁面到底有沒有被檢索、檢索頻率多高,爬取預算的優化策略能幫你理解背後的調度邏輯。
noindex 與其他收錄控制工具的完整比較
noindex 只是控制收錄的眾多工具之一。把它放回整個工具箱裡比較,你才會知道每一種該用在哪個環節,也不會把所有需求都硬塞給 noindex。把常見的收錄控制工具並列來看,每一種各自控制的是「檢索、索引、顯示、權重」這四個環節裡的哪一段,會清楚很多。
| 工具 | 控制環節 | 頁面還能被讀取 | 典型用途 |
|---|---|---|---|
| robots.txt Disallow | 檢索 | 否(爬蟲不進來) | 擋爬蟲抓取整個目錄 |
| meta robots noindex | 索引/顯示 | 是 | 不收錄但仍追蹤連結 |
| x-robots-tag noindex | 索引/顯示 | 是 | PDF、圖片、影片等非 HTML |
| rel canonical | 權重合併 | 是 | 重複內容導向標準頁 |
| 密碼/權限驗證 | 讀取 | 否(未登入看不到) | 保護會員資料與敏感內容 |
| GSC 移除工具 | 暫時顯示 | 是 | 急著下架、效期約半年 |
這張表最關鍵的一欄是「頁面還能被讀取」。很多人以為加了 noindex 或 robots.txt 就等於保護了內容,其實只有密碼與權限驗證能做到真正的讀取封鎖,其他工具控制的只是檢索、索引或顯示的某一段。把這個差別記住,遇到需要保護會員資料、報價單、內部文件的情境,才會直接想到權限驗證,而不會誤以為 noindex 能勝任。把這些工具搭配運用時,技術性 SEO 完全指南能幫你把每個環節的設定串成一套完整流程。
結語:先建立不能 noindex 的白名單
回顧一下整篇的核心立場:noindex 控制的是「要不要出現在搜尋結果」,不是把頁面鎖起來,也不擋爬蟲。實務上最該背的不是「何時加 noindex」,而是「絕對不能 noindex 哪些頁面」這份清單,因為真正會讓流量消失的,永遠是把賺錢頁誤加 noindex 這一種災難。除了 Google,Yahoo 搜尋排名提升也適用同一套收錄邏輯,值得一起顧。
做法很直接:先建立白名單,再談黑名單。把首頁、轉換頁、主要分類與產品頁、高流量內容頁放進「絕對不能 noindex」的保護區,定期用 GSC 排查,上線流程固定加一個 noindex 檢查步驟。這幾個動作比起死背 noindex 設定方法,更能真正保住你的排名與流量。想更系統化理解 SEO 的全貌,可以從 關鍵字的基礎概念、搜尋結果頁元素總覽這幾篇開始,把 noindex 放回整體策略裡看。若是 WordPress 站長,Title Tag 撰寫要點也值得一起顧好;而想避免黑帽操作反噬排名,黑帽 SEO 的風險與後果是很好的反面教材。
FAQ:noindex 常見問題
noindex 跟 rel canonical 可以同時用嗎?
不建議。兩者訊號互相矛盾:noindex 要搜尋引擎忽略這頁,canonical 卻要它把權重轉給標準頁。擇一使用即可,處理重複內容時若想合併權重用 canonical,若想徹底不收錄用 noindex。
如何檢查網頁有沒有被 noindex?
用 Google Search Console 網址檢查工具看索引狀態最快;也可以裝 SEO META in 1 CLICK 外掛看 meta robots,或直接檢視網頁原始碼搜尋 noindex 字串。大站可用 Screaming Frog 一次掃完全站。
重要頁面被 noindex 怎麼辦?
移除 noindex 並用 GSC 網址檢查工具主動請求重新檢索,加快索引更新。恢復需要時間,可能要數天到數週,期間流量會受影響,建議平時就建立「絕對不能 noindex」的頁面白名單來預防。
分類頁或篩選頁該不該 noindex?
沒有統一答案。判斷標準是這個頁面對應的篩選組合有沒有真實搜尋需求。帶有明確屬性、有人會這樣搜的篩選頁(例如「紅色洋裝」「冬季外套」)通常該收錄,貿然 noindex 會砍掉長尾流量;純粹由站內功能產生、彼此高度重複且無人搜尋的篩選頁,才適合 noindex 或改用 canonical 合併。保守做法是先收錄觀察,確認沒帶來流量再處理。
noindex 設了卻沒生效怎麼辦?
照三個前置條件反推:頁面是否被 robots.txt 擋住、noindex 是否真的被爬蟲讀到(尤其 JavaScript 動態注入的標籤)、索引更新是否有時間差。另外留意是否還有他站連結導致僅網址收錄、或 GSC 暫時移除工具已過期。多數「設了沒用」的狀況都能從這幾點涵蓋。
WordPress 怎麼設定 noindex?
用 Yoast SEO、Rank Math 等外掛,在文章編輯頁的進階設定裡有「是否允許搜尋引擎顯示這篇內容」的選項,勾掉即等於加上 noindex。介面名稱會隨外掛版本變動,以各外掛當時版本為準。想比較常見外掛的差異,WordPress SEO 外掛推薦整理得清楚。