網址查詢參數是什麼?|認識網址 | 白話文商學院
網址查詢參數(Query Parameters)是附加在網址路徑後面、以問號「?」開頭、用鍵值對(key=value)傳遞資料的一段字串。它讓同一個路徑可以依據不同條件回傳不同內容…
網址查詢參數(Query Parameters)是附加在網址路徑後面、以問號「?」開頭、用鍵值對(key=value)傳遞資料的一段字串。它讓同一個路徑可以依據不同條件回傳不同內容或狀態,是搜尋、分頁、篩選、追蹤這四種功能共同的骨幹。Google 把網址差一個字就視為不同頁面,這也是同一篇文章加上 ?page=2、?utm_source=... 後會被當成多個網址的根本原因。
重點先看:查詢參數是網址裡唯一會主動傳遞狀態與資料的段落,結構固定為
?key=value&key2=value2。一組帶參數的網址可能讓 Google 把同一頁拆成數千個網址收錄,爬取預算與權重因此被分散。
查詢參數在網址尾巴的位置與結構
查詢參數看似一串亂碼,其實是網址裡唯一會主動傳遞狀態與資料的段落。位置固定在路徑後面,以問號「?」開頭,後面接鍵值對(key-value pair),等號左邊是參數名稱、右邊是值,第二組以後用「&」串接。這段字串讓網站讀到值以後,才知道要回傳什麼內容。
在動手判斷任何一個參數之前,先把它的固定結構記清楚會省下很多往後爭吵的時間。要完整理解查詢參數在網址裡的位置,建議先把網址(URL)是什麼與網址組成與各段落結構看過一遍,知道協議、網域、路徑各自代表什麼,再進到參數這一層才不會搞混。
- 問號「?」是分界:路徑到此結束,查詢參數從這裡開始。
/search?keyword=apple的/search是路徑,keyword=apple才是參數。 - 鍵值對(key=value):等號左邊是參數名稱(keyword、page、sort),右邊是值,網站讀值決定回什麼內容。
- 「&」串接多組參數:
?category=electronics&sort=price同時傳兩組條件,組合成「電子產品、依價格排序」。 - 與路徑分工:路徑描述「這是什麼資源」,參數描述「要這個資源的什麼狀態或版本」,兩者用「?」分界。路徑的設計觀念可以參考網址路徑(path)是什麼。
- 與錨點(fragment)不同:井號「#」後面是頁內定位,完全不會送到伺服器,也不會出現在查詢參數裡,對收錄的影響接近零。
把上面的結構拆解一次,用一個範例看清楚:在 https://example.com/search?keyword=apple 裡,https:// 是協議、example.com 是網域、/search 是路徑,而 ?keyword=apple 就是要查詢 apple 這個關鍵字的參數。協議與網域的觀念延伸閱讀可以看HTTPS 協議與網站安全與網域與子網域的差別,區分網域與網址的不同也值得對照著看。
協議這一層也有相關的工程前置作業:網站要上線就得先有一張憑證把協議鎖成 https,SSL 憑證的選擇與安裝是繞不開的前置作業,而 HTTP 與 HTTPS 的差別本身又是另一個獨立議題。
查詢參數的四種核心用途:搜尋、分頁、篩選、追蹤
查詢參數最常見的四種用途是搜尋、分頁、分類篩選與動態資料顯示。幾乎所有電商、部落格、內容網站的互動功能都靠它運作,你每天點的每一個「下一頁」「依價格排序」按鈕,背後幾乎都是一組參數在傳值。共同特徵是「同一個路徑、不同狀態」,這正是參數的核心價值,卻也是重複內容問題的源頭。
沒有查詢參數,這四種功能幾乎做不出來。一個沒有參數的搜尋頁,使用者輸入什麼都回到同一頁;分頁沒有 ?page=2 就無法記錄看到第幾頁。便利是有代價的,後面會談到同一個機制怎麼回頭咬 SEO 一口。整體網站該怎麼安排這些功能,可以對照SEO 友善的網站架構設計與SEO 友善的網址命名與結構。
| 用途 | 典型參數 | 範例網址 | 是否改變內容 | SEO 處理傾向 |
|---|---|---|---|---|
| 搜尋功能 | keyword、q | /search?keyword=apple | 是 | 謹慎索引,建議收斂 |
| 分頁功能 | page、p | /article?page=2 | 部分 | 看內容是否實質重複 |
| 分類篩選 | category、sort、color | /products?category=electronics&sort=price | 是 | 重要分類建議轉路徑 |
| 動態資料顯示 | articleId、id | /news?articleId=123 | 是 | 建議改為路徑式網址 |
| 追蹤用途 | utm_source、fbclid、gclid | /?utm_source=newsletter | 否 | 用 canonical 收斂 |
搜尋與分頁:同一個路徑回不同內容
搜尋功能把使用者輸入的關鍵字放進查詢參數,例如 ?keyword=apple,讓網址本身就能記錄、分享、回到同一組搜尋結果。分頁則用 ?page=2 指定第幾頁,每換一頁就是一組新的參數網址。這兩種用途都會「實質改變內容」,所以在 SEO 上要判斷的是:這些參數版要不要被索引,還是該收斂到主要網址。
分類篩選與動態資料顯示
電商常見的 ?category=electronics&sort=price,可以同時多個參數組合,表達「電子產品、依價格排序」這種複合條件。動態資料顯示則是 ?articleId=123 直接指定要顯示哪一篇內容,網站根據參數即時組裝頁面。篩選條件越多,排列組合越爆炸,這正是參數拖垮收錄品質的主要來源之一。
為什麼這四種功能非靠參數不可
HTTP 協定本身沒有狀態,每一次請求對伺服器來說都是獨立事件,前一秒看了哪一頁、勾了哪個篩選,伺服器預設記不住。要讓「下一頁」「依價格排序」「電子報流量」這些條件在重新整理、分享連結、跨裝置開啟時都還成立,最輕量的做法就是把狀態寫進網址。查詢參數承擔的就是這個角色:把使用者的當下狀態變成網址的一部分,任何人在任何裝置打開同一組網址,都能拿到同一組結果。
用一組搜尋結果最能看出這個價值。假設你在找「藍色 M 号的襯衫」,條件一旦寫成 ?color=blue&size=M&category=shirt,這組網址就能被複製貼上、放進書籤、傳給同事,對方打開看到的是一模一樣的結果頁。如果把同樣的狀態改存在 cookie 或 session 裡,連結一分享出去就失效,因為接收方的 cookie 跟你不同。狀態進網址才有可分享性,這是搜尋、篩選功能幾乎都依賴參數的根本原因。
便利的代價緊接在後。一個分類頁若有顏色、尺寸、價格區間、排序、頁數五種可調條件,每種條件就算只有五個選項,排列組合也會逼近上萬種網址。Googlebot 不會知道哪些組合有真人看過、哪些只是參數換順序產生的近似頁,它會盡責地把這些網址都爬一遍。便利與失控之間的界線就在這裡:把狀態寫進網址是對的,讓所有排列組合都被當成獨立可索引頁面則是失控。
UTM 參數:用查詢參數追蹤流量來源
UTM 參數是一組專門用來追蹤流量來源的查詢參數,核心三個欄位是 utm_source、utm_medium、utm_campaign。它依附在一般網址後面,讓 GA4 等分析工具能分辨「這筆流量從哪個管道、哪個活動來」。它的本質就是查詢參數,所以同樣會產生「同一頁多個網址」的問題,必須搭配 canonical 或 GA4 的管道設定來避免重複計算。
根據 Google Analytics 官方文件,utm_source 標示流量來源(如 newsletter、facebook),utm_medium 標示媒介(如 email、cpc),utm_campaign 標示活動名稱,三者組合就能精準歸因 [來源:〈Google Analytics 說明:收集及分析資料〉〈https://support.google.com/analytics/answer/1033863〉〈2025〉]。一組完整的追蹤連結長這樣:?utm_source=newsletter&utm_medium=email&utm_campaign=summer_sale,代表來自電子報、夏季促銷活動的流量。想用範本把五大欄位一次填齊,UTM 追蹤碼完整教學與產生器給你現成格式。當流量來源多了 ChatGPT、Perplexity 這類 AI 服務,GA4 追蹤 AI 流量的做法能幫你把這條新管道也歸因進來。
命名要一致是 UTM 最常被忽略的環節。utm_source 一律小寫、不加空格、全站統一格式,否則同一個來源會被拆成好幾條,報表數字失真。追蹤連結建議用 Google 官方的 Campaign URL Builder 產生,避免手動拼錯參數名。想深入了解命名規則與常見錯誤,可以看UTM 參數的命名規則與常見錯誤;追蹤參數產生的資料最終要讀懂,GA4 怎麼讀懂流量來源與GA4 重要的專有名詞清單是配套閱讀。
UTM 的真正價值在於事後能不能讀出有意義的歸因,貼標籤本身只是手段。一支活動跑了五十條 utm_campaign,命名卻亂七八糟,最後報表只會給你五十條看不出關聯的線,那這組參數貼了等於沒貼。
社群平台的點擊識別參數:fbclid 與 gclid
從 Facebook、Google 廣告點進來的網址,尾巴常會多出 fbclid、gclid 這類參數。它們是 Meta 與 Google 廣告系統自動加入的點擊識別參數,目的是讓平台在自己的生態內追蹤點擊與轉換歸因。這些參數會在你分享或點擊連結時被自動附加到網址尾巴。
它們的值是隨機字串,每次點擊都不同。這代表同一篇文章可能累積成千上萬個「長得不一樣但其實是同一頁」的網址,是重複內容與權重分散最常見的來源之一。一篇被瘋傳的文章,光 fbclid 就可能讓 Google 看到數千個版本,爬取預算被這些近似網址吃掉,真正該被收錄的內容反而排不上隊。爬取預算到底怎麼分配、哪些做法能把浪費搶回來,爬取預算的優化策略有完整討論。
這類參數要不要清掉,網路上爭論很多,兩種極端做法都見得到:一種是完全不管,讓它隨平台附著;另一種是伺服器端直接剝光所有追蹤參數。比較務實的做法是在 canonical 上統一指向乾淨網址,把網址層交給平台自然附著即可,這樣既能保留平台的追蹤能力,又不讓 Google 把同一頁拆成幾千個。要驗證自己的網站有沒有被這類參數拖累,Google Search Console 常用功能與Search Console 網頁索引報表解讀會給最直接的證據。
查詢參數最常拖垮 SEO 的地方
對搜尋引擎來說,網址差一個字就是不同頁面。同一篇文章只要加上 ?page=2、?utm_source=...、?fbclid=... 等不同參數,就會被當成不同的網址,導致重複內容、權重分散與爬取預算浪費。這並非 Google 偶發的誤判,根據 Google Search Central 的重複內容指南,把網址差一個字視為不同頁面是它處理網址的長期既定原則。
舉前面那組分頁網址為例:/article/seo-intro、/article/seo-intro?page=2、/article/seo-intro?page=3,這是三個不同的網址。內容彼此關聯、本質上應該被當成同一份資料,但對 Google 來說就是三個網址。當外部連結與內部連結都指向帶不同參數的版本,原本該集中給一頁的權重就被分散到多個網址。
問題會隨排列組合放大。參數的排列組合可以產生海量網址:一個分類加上排序、顏色、尺寸、頁數,組合動輒上千組。Googlebot 花時間爬這些近似頁面,就會擠掉真正該被收錄的內容,這就是爬取預算被浪費的由來。爬取預算怎麼運作、怎麼優化,可以對照爬取預算與爬取優化;收錄狀態的確認看網頁被 Google 索引的確認方法。
| 參數類型 | 會不會改變內容 | 重複網址風險 | 建議處理 |
|---|---|---|---|
| 搜尋、篩選 | 會 | 高 | 重要結果轉路徑或謹慎索引 |
| 分頁 | 部分 | 中 | 實質重複者用 canonical 收斂 |
| 排序(sort) | 低 | 中 | 用 canonical 指向預設排序 |
| UTM 追蹤 | 否 | 高 | canonical 指向乾淨網址 |
| fbclid、gclid | 否 | 極高 | canonical 或伺服器剝離 |
| session id | 否 | 極高 | 改用 cookie,不要進網址 |
判斷原則可以濃縮成一條:參數會改變內容的(搜尋、篩選、分類)要謹慎決定是否索引;參數不改變內容的(追蹤、session id、排序)就該收斂。後面選工具時就有依據,不會東試一個、西試一個。重複內容的完整判斷邏輯,延伸閱讀SEO 重複內容的判斷與處理。
重複網址的影響不只停留在收錄層。當搜尋結果越來越常在頁面上直接給出答案,零點擊搜尋時代的 SEO 對策會影響你對「哪些頁面值得保留參數版」的判斷;而使用者搜尋時背後的意圖,也會決定某組篩選參數該不該被獨立收錄,關鍵字搜尋意圖的四大類型是配套觀念。
路徑還是參數:一張決策矩陣的分類原則
很多站長面對參數時卡在第一個問題:到底該把某個條件做成路徑,還是留在參數?把這個選擇拆成兩個維度來看會清晰很多。第一個維度是「這個條件會不會實質改變內容」,第二個維度是「這個條件本身有沒有被搜尋的價值」。把兩個維度交叉,就能得到四個象限,每個象限對應一種處理手法。
| 內容會實質改變 | 內容不會實質改變 | |
|---|---|---|
| 有被搜尋的價值 | 轉成路徑式網址,獨立索引 例:商品主分類、品牌頁 | 轉成路徑或保留並收斂 canonical 例:季節性活動落地頁 |
| 沒有被搜尋的價值 | 保留參數,謹慎索引或 noindex 例:深層篩選組合、站內搜尋結果 | 用 canonical 收斂到乾淨網址 例:排序、追蹤、session |
四個象限各自對應不同的工程成本與 SEO 風險,逐格說明會更好套用。左上格的條件既會改變內容、又有人搜尋,是最該投資轉成路徑式網址的一群,例如把 ?category=shoes 改成 /category/shoes,因為這類頁面值得擁有自己的網址、自己的權重、自己的標題。左下格會改變內容但沒人搜尋,典型是站內搜尋結果頁,建議保留參數並謹慎控制索引範圍,避免無意義的搜尋字串被大量收錄。右下格不改變內容也沒搜尋價值,涵蓋排序、追蹤、session,是 canonical 的主戰場,全部收斂到乾淨網址。右上格是少見但棘手的情境:條件不改變內容卻有人搜尋,例如季節活動搭配同一批商品,這時要判斷的是該為活動另開路徑,還是保留參數並用標題與文案差異化。
用這張矩陣走一遍的好處是,你不再需要憑直覺決定每個參數的去留,而是用同一套標準套用全站。實際操作時,先把網站上所有帶參數的網址類型列出來,逐一填進對應象限,再依象限決定手法。這個分類動作本身就能擋掉一半以上的重複網址問題,因為多數站點的失控來自從來沒做過這一步。重要分類轉路徑的具體做法,延伸閱讀網址路徑的設計原則與SEO 友善的網址結構。
用 canonical 標準網址把參數收斂回乾淨網址
最直接的做法是透過 canonical 標準網址(rel canonical),在帶參數的頁面上指定一個乾淨、無參數的標準網址,告訴搜尋引擎「這些網址都是同一頁,請把權重集中到標準網址」。做法是在頁面的 <head> 裡加上 link rel="canonical",指向你想保留的那個乾淨網址。根據 Google Search Central 對 canonical 的官方說明,搜尋引擎會以此訊號判斷多個網址中哪一個是代表版本。
canonical 的角色等於把多個近似網址合併成一個。它最適合處理追蹤參數(UTM、fbclid、gclid)、session id、排序參數這類不改變核心內容的參數。但要注意一個界線:會實質改變內容的參數(不同商品分類、不同搜尋結果)就不該全部指向同一個 canonical,否則等於告訴 Google 它們是同一頁,反而把該被索引的內容抹掉。canonical 的完整用法看canonical 標準網址解決重複內容。
- canonical 為主:在帶參數頁面指向乾淨網址,是處理追蹤參數的第一選擇。
- 內部連結統一為輔:站內連結一律指向乾淨網址,不要把 utm 帶進內部連結。內部連結在網站架構中的角色是配套閱讀。
- 伺服器端剝離:必要時在伺服器把 fbclid、gclid 這類追蹤參數從公開網址直接拿掉。
- noindex 慎用:對近似參數頁下 noindex 要小心,別誤殺該收錄的頁面,觀念看noindex 標籤對 SEO 的效果。
canonical 用錯反而比不用更傷。最常見的兩種失誤,一種是自引用 canonical 設錯指向,把帶參數的頁面 canonical 指向另一個帶參數的版本,等於告訴 Google 這兩個近似網址誰也不收斂誰;另一種是多個訊號互相打架,頁面的 canonical 指向 A、sitemap 卻列 B、內部連結又連到 C,Google 收到三個互相矛盾的訊號,最後可能自行決定,結果與你的預期不同。檢查的方法是回到 Search Console 的網址檢查工具,看 Google 實際採用的 canonical 是哪一個,跟你頁面上寫的是否一致。
權重分散的後果可以用一組研究體會。Ahrefs 分析約 140 億個頁面發現,96.55% 的頁面從 Google 拿不到任何自然流量 [來源:Ahrefs〈96.55% of Content Gets No Traffic From Google. Here's How to Be in the Other 3.45%〉 https://ahrefs.com/blog/search-traffic-study/ 2023-12-01]。多數頁面本來就難拿到流量,再把一頁的權重分散到數百個近似參數網址,等於讓本就稀缺的排名訊號更難集中。這也是為什麼收斂參數網址屬於必要的權重管理,而非可有可無的錦上添花:它把有限的排名訊號集中到該集中的頁面。
一個常被問到的問題是,Search Console 那個可以逐一設定參數行為的網址參數報表還能不能用。近年 Google 已逐步停用舊版參數報表,現在更應依賴 canonical 與內部連結策略,別再把希望寄託在單一報表上。相關工具的替代方案,可以看robots.txt 控制爬蟲抓取範圍、robots.txt 與 noindex 的差異、XML Sitemap 幫助搜尋引擎收錄,以及Search Console 網址檢查工具。
行動建議是:先盤點網站上有哪些參數家族,再決定每一家是收斂到一個 canonical、保留各自索引,還是從網址剝離。不要等問題爆發才動手,重複網址一旦累積到一定數量,收斂回來會非常費力。多語言站點的參數處理另有一套邏輯,延伸閱讀hreflang 多語言網站架構。
查詢參數、路徑、錨點與編碼的差別
在網址結構中,路徑(path)定位資源、查詢參數(query)傳遞狀態、錨點(fragment)做頁內定位,三者各自獨立。遇到中文或特殊字元時,查詢參數的值還需要做 URL 編碼才能正確傳遞。把這幾個名詞的分界記清楚,才不會在實務上把不同的東西混為一談。
| 名稱 | 符號 | 作用 | 會不會送到伺服器 | 對 SEO 收錄的影響 |
|---|---|---|---|---|
| 路徑(path) | / | 定位資源 | 會 | 直接影響 |
| 查詢參數(query) | ? | 傳遞狀態與資料 | 會 | 可能產生重複網址 |
| 錨點(fragment) | # | 頁內定位 | 不會 | 幾乎不影響 |
| URL 編碼 | % 系列 | 轉譯特殊字元 | 會 | 編碼不一致會造成重複 |
網址的組成方式會直接影響點閱率,這也是為什麼路徑與參數該如何分工同時是技術問題與 SEO 判斷,做得好就能直接左右搜尋成效。Backlinko 分析近 400 萬筆 Google 搜尋結果發現,網址中包含與關鍵字相近詞彙的頁面,點閱率比不含關鍵字的網址高出 45% [來源:Backlinko〈Google CTR Stats: We Analyzed 4 Million Google Search Results〉 https://backlinko.com/google-ctr-stats 2025-04-16]。這組數據說明,把重要的關鍵字放在路徑裡,往往比塞進一長串查詢參數更能爭取點擊,也印證了前面「重要分類建議轉路徑」的處理傾向。
- 路徑回答「這是什麼」,查詢參數回答「要它的什麼狀態」。改路徑通常代表換頁面,改參數通常代表同頁不同條件,這是兩者最實用的分界。中英文路徑的取捨看中文網址與英文網址的選擇。
- 錨點(fragment)以 # 開頭,只作用於瀏覽器端、不會送到伺服器,跟查詢參數是完全不同的東西,也不影響 SEO 收錄。
- 參數值含空格、中文或特殊符號時要做 URL 編碼,轉成
%20、%E4%B9之類,否則網址會斷掉或被誤讀,這是 RFC 3986 標準的規範 [來源:〈RFC 3986: Uniform Resource Identifier (URI): Generic Syntax〉〈https://www.rfc-editor.org/rfc/rfc3986〉〈2005〉]。 - 串接多組參數時,第一個接在 ? 後面,第二個以後用 & 串接。順序不影響功能,但會影響網址一致性,建議全站固定順序。
- 編碼要一致:同一個值在不同頁面用不同編碼,會造成「看似不同其實相同」的網址,這也是重複內容的隱形來源。
URL 編碼的實際樣貌與三個常踩的坑
把 URL 編碼實際拆開看會更具體。空格在網址裡不能直接出現,要寫成 %20 或在參數值裡替換成加號 +;中文字「鞋」會被編成 %E9%9E%8B 這種百分號開頭的位元組序列;保留字元像是 &、=、#、+ 本身有結構意義,若出現在值裡就必須分別編成 %26、%3D、%23、%2B,否則伺服器會把 & 誤判成下一組參數的分隔,整段值就被截斷。
實務上有三個坑特別常見。第一個是同一個值前後端用不同編碼函式處理,例如前端用 JavaScript 的 encodeURI、後端用另一套規則,於是空格一下是 %20、一下是 +,Google 看到兩種就當成兩個網址。第二個是大小寫不一致,參數名 Category 與 category 對伺服器可能等價,對 Google 卻是不同的網址。第三個是參數順序漂移,?a=1&b=2 與 ?b=2&a=1 功能相同,網址卻不同,當內部連結、sitemap、canonical 三者順序不一致,等於自己製造了一批近似網址。
這三個坑的共通解法是「全站統一」。固定一套編碼函式、參數名一律小寫、參數順序在程式層強制排序,三條規矩落實下來,就能擋掉絕大多數隱形重複網址。要回頭檢查自己的網站有沒有這類問題,Screaming Frog 爬蟲檢測工具可以把全站網址拉出來比對編碼與順序差異,用開發者工具看網頁原始碼則適合單頁查證送出的網址長什麼樣。
這裡藏一個很多人沒注意到的小坑:動態網址(網址靠參數組裝內容)與靜態網址(網址對應一個實體檔案)在維護成本與收錄穩定度上表現不同。動態網址彈性高,但參數一失控就會爆炸;靜態網址收錄穩定,但每新增一個狀態就要改網址。實務上沒有絕對優劣,要看網站規模與內容更新頻率決定。不少站長用 WordPress 架站時就得先決定permalink要用路徑還是參數,而WordPress 架站與 SEO 優化全攻略會把這個選擇放進更大的優化脈絡裡。
參數網址的盤點與清理流程
處理參數問題的順序很有講究。常見錯誤是一發現重複網址就直接下 noindex 或大量 canonical,結果該收錄的頁面被一起清掉,事後補救比一開始就做對更費力。穩當的做法是先盤點、再分類、最後才動手收斂,每一步都有對應工具與判斷標準。
- 第一步:盤點全站參數家族。用爬蟲工具把全站帶參數的網址全部抓出來,彙整成一份參數清單,列出每個參數名稱、出現的頁面類型、出現頻率。這份清單是後續所有判斷的基礎,沒有它就只能憑印象處理。
盤點這一步最值得用一個典型情境來具體化。以一個月自然流量約 5,000-20,000、商品或文章數量在數百到數千之間的中型電商或內容站為例,這類網站常見的狀況是:第一次跑全站爬蟲,整理出來的帶參數網址家族大約落在 8-20 組,其中真正會實質改變內容的(搜尋、分類篩選、商品詳情 id)通常只有 3-6 組,其餘多半是排序、追蹤、session 這類不該被索引的。把這些家族排列組合算進去,爬蟲撈到的近似網址總數常常是主要頁面數量的約 5-15 倍,也就是說一個約 800 頁的站,帶參數網址可能膨脹到約 4,000-12,000 個。這個倍數本身沒有絕對標準,但它傳達的重點很明確:參數造成的近似網址很少只是「多幾個」,而是整批放大。
依這類站的典型表現幅度,盤點清單做完之後,真正需要動手收斂的往往不是數量最多的那一組,而是「被索引量」最高、且內容其實重複的那幾組。常見的狀況是,約 70-85% 的近似網址集中在排序與追蹤參數上,這些在 Search Console 網頁索引報表裡會大量出現,但它們對內容毫無貢獻,是第一批該收斂的對象;真正會改變內容的搜尋與分類參數,數量雖少,卻往往藏著值得轉成路徑式網址的高價值頁面。把資源優先花在前者,能用最低成本壓掉最大量的重複網址。
這裡有一個務實的限制要誠實說明:盤點清單再完整,也壓不掉所有近似網址。實務上即使把 canonical、內部連結統一、伺服器剝離三層都做齊,大型電商站仍會殘留一批無法完全消除的近似網址,原因是部分參數由第三方廣告或聯盟行銷系統動態附加,站方不一定能從伺服器端攔截。判斷的重點不在於追求近似網址歸零,而在於分清哪些是「可控、該收斂」、哪些是「外部附加、只能靠 canonical 軟收斂」,把可控的那批做到位,剩下的交給 canonical 持續指向乾淨網址即可。換句話說,這套流程的成敗標準不是清零,而是「主要內容頁的權重有沒有重新集中、被排除的近似網址比例有沒有下降」,這兩個指標在 Search Console 收錄報表裡都能觀察到。
- 第二步:核對收錄現況。把清單上的參數網址拿到 Search Console 的網頁索引報表比對,看哪些帶參數版本真的被收進索引、哪些沒被收。被收進去的才是優先處理對象,沒被收的不必浪費力氣收斂。
- 第三步:依決策矩陣分類。把每個參數家族填進前面的四象限矩陣,決定是轉路徑、保留並謹慎索引、還是收斂 canonical。分類時要連「這個參數值有沒有被搜尋的價值」一起判斷,工具上可以對照關鍵字工具的搜尋量資料。
- 第四步:分層收斂。先做成本最低的 canonical 與內部連結統一,驗證沒有誤殺該收錄的頁面,再考慮動伺服器端剝離追蹤參數。每一層做完都回到 Search Console 觀察收錄變化,確認方向正確才進下一層。
- 第五步:持續監控。參數問題會隨新功能上線再次累積,建議每季跑一次全站參數盤點,把新增的參數家族納入同一套分類流程。
這套流程的核心觀念是「先看證據再動手」。Search Console 的網頁索引報表會明確告訴你哪些網址被收錄、哪些被排除、排除原因是什麼,這些是判斷的硬證據,比任何經驗法則都可靠。把報表讀懂是基本功,Search Console 網頁索引報表解讀與Search Console 常用功能是配套閱讀;收錄狀態的單頁驗證則用網址檢查工具。
實戰判斷:面對一個帶參數網址的三個檢查點
判斷一個參數該怎麼處理,只看三件事:它會不會改變頁面內容、它是不是追蹤用途、它有沒有造成重複網址。依這三個答案,就能決定保留索引、用 canonical 收斂,還是從網址剝離。這套做法的目的在於給你一套可以重複套用的判斷流程,讓每個參數的去留都有依據可循。
- 判斷一:會不會改變內容。搜尋、篩選、分類通常會,排序、追蹤、session 通常不會。會改變內容的參數要謹慎決定是否索引,重要的結果甚至該考慮轉成路徑式網址。
- 判斷二:是不是追蹤用途。UTM、fbclid、gclid 屬於追蹤,應該用 canonical 收斂到乾淨網址,不要讓它們各自成為被索引的頁面。
- 判斷三:有沒有造成重複網址。用
site:搜尋或 Search Console 觀察同一頁是否被收錄成多個帶參數版本,若有就啟動收斂。Google 搜尋運算子的用法看Google 搜尋技巧與搜尋運算子。
收斂手法的優先順序很明確:canonical 為主,內部連結統一指向乾淨網址為輔,必要時再從伺服器端剝離追蹤參數。這個順序的好處是成本由低到高、風險由小到大,先用最輕的 canonical 解掉大部分問題,真的壓不住再動伺服器。重複網址拖累權重久了,Google 排名上不去的常見原因會把這類技術債也算進去;而帶參數的落地頁若內容薄弱,網站跳出率與 SEO 的關係會進一步放大問題。
要點觀念是:參數本身並無好壞,關鍵在於分類管理,逐項判斷去留,避免一刀切地清掉所有參數。把該保留的搜尋、篩選功能留下,把追蹤、session 收斂掉,網站的功能性與收錄品質才能同時顧到。想確認某個帶參數的網址到底有沒有被收進索引,Search Console 的網址檢查功能是最直接的單頁驗證方式;想大規模掃描參數網址,可以搭配Screaming Frog 爬蟲檢測工具。手邊若缺工具,站長與行銷人必備的 SEO 工具能幫你把基本盤補齊;想順帶找關鍵字,從免費到付費的關鍵字工具推薦是另一條路。
把這套判斷流程放進更大的 SEO 框架來看,它其實是「網址層的重複內容控制」的一環。往上要接SEO 是什麼的自學懶人包與搜尋意圖與高排名的關係,往下要接關鍵字研究的終極指南與長尾關鍵字為什麼該優先做。連結層面則要理解四大類型連結的全面解析與反向連結與網域權重,才能看出參數問題對整體權重流動的影響。內容品質端,E-E-A-T 高品質內容原則與資訊增益幫你贏過競爭對手是配套,Entity SEO 與實體概念則給你另一個看參數分類的角度。
如果你的網站用了大量 JavaScript 動態組裝參數網址,收錄的變數會更多,JavaScript 網站的收錄與渲染值得對照閱讀。效能與體驗層面,網頁速度與網站效能優化、網站使用體驗核心指標 CWV會影響帶參數頁面的排名訊號。想自己檢查參數實際送出什麼,用開發者工具看網頁原始碼是最直接的方式。結構化資料的配套看結構化資料對 SEO 的意義,社群分享時的網址呈現看Open Graph 讓網址在社群被漂亮分享。搜尋結果的整體樣貌可以對照搜尋結果頁 SERP 的各種元素與網站連結 Sitelinks 的取得方式。
長期維護上,網站搬家與改版時參數最容易出事,網站搬家與改版的 SEO 風險與SEO 年度內容更新的建議能幫你預防。轉載與內容授權涉及的參數追蹤問題,看文章轉載對 SEO 的影響。歷史上 Google 曾調整 num 參數的處理方式,Google num 參數事件的 SEO 影響是個值得參考的案例。關鍵字分類與季節性內容,可以對照關鍵字的季節型與長青型分類與SEO 關鍵字的基本概念。AI 搜尋與 RAG 時代下參數如何被檢索,RAG 檢索增強生成與 SEO 應用與AI 搜尋引擎與新世代搜尋工具是值得追蹤的方向;AI 幻覺可能影響資訊查證,AI 幻覺的成因與應對是配套觀念。
常見問題
同一個網頁加上不同參數,會變成不同網址嗎?
會。對搜尋引擎來說,網址只要差一個字就是不同頁面,加 ?page=2 或 ?utm_source=... 都會產生獨立網址,即使背後是同一份內容。
為什麼 fbclid、gclid 不能用手動刪除來解決?
因為它們是 Meta 與 Google 廣告系統在連結被點擊時自動附加的,你刪掉再分享,平台下一次點擊又會補上。治本做法是在 canonical 上指向乾淨網址,或從伺服器端把這類追蹤參數從公開網址剝離,而不是逐一刪值。
canonical 指向乾淨網址後,參數版就完全不會被收錄嗎?
不一定。canonical 是強烈建議而非硬性指令,Google 仍可能因內部連結、sitemap 或外部連結的訊號不一致而自行決定。所以 canonical 要搭配內部連結統一指向乾淨網址一起做,訊號一致才收得乾淨。
Search Console 的網址參數報表還能用嗎?
近年 Google 已逐步停用舊版參數報表,與其寄望單一報表,更應依賴 canonical、內部連結與網頁索引報表的排除原因來判斷。
參數網址清到什麼程度算完成?
判斷標準看兩個指標在 Search Console 收錄報表裡的變化:主要內容頁的權重有沒有重新集中、被排除的近似網址比例有沒有下降。第三方廣告動態附加的參數本就無法從伺服器端完全攔截,能軟收斂即可,不必追求近似網址歸零。