技術性 SEO 完全指南:網站架構優化、爬蟲溝通與排名提升策略
技術性 SEO 是把網站底層的架構、網址、程式碼、伺服器回應整理成 Google 爬蟲能順利抓取、索引、理解的版本。Google 自 2010 年起就把網站速度列為排名因素之一 […
技術性 SEO:把網站整理成爬蟲讀得懂的版本
技術性 SEO 是把網站底層的架構、網址、程式碼、伺服器回應整理成 Google 爬蟲能順利抓取、索引、理解的版本。Google 自 2010 年起就把網站速度列為排名因素之一 [來源:Google Webmaster Central〈Using site speed in web search ranking〉 https://webmasters.googleblog.com/2010/04/using-site-speed-in-web-search-ranking/ 2010],這也說明技術層面的設定確實會回頭影響排名,技術基礎打穩了,內容與權重才有發揮空間。
重點先看:真正影響排名的技術設定只有少數幾項,集中在可被檢索、無重複內容、結構化標記與速度,把這幾項做到位,比堆疊幾十個進階參數更能拉動排名。
很多人聽到「技術」兩個字就先打了退堂鼓,以為這是工程師的專利。其實剛好相反。技術 SEO 改的東西,使用者多半看不到,它改的是爬蟲與瀏覽器底層讀到的結構,像是網址路徑、HTTP 回應、結構化資料標記。想對 SEO 有整體認識,可以先看 SEO 搜尋引擎優化完整入門,再回來理解技術層這一塊的位置。
把「技術」這兩個字拆開來看會更踏實。技術 SEO 處理的範圍有三層:第一層是「能不能被抓到」,涵蓋伺服器是否回應、robots.txt 與 sitemap 是否開放、頁面回傳的 HTTP 狀態碼是不是 200;第二層是「抓到之後讀不讀得懂」,涵蓋 HTML 結構、結構化資料標記、重複內容與標準網址的處理;第三層是「讀懂之後用起來順不順」,涵蓋載入速度、行動版體驗、安全性。這三層有先後順序,第一層破洞時,後面兩層再怎麼打磨都不會反映在排名上。同樣投入心力,有人看到效果、有人完全沒動靜,差距往往就出在投入的位置。
還有一個觀念要先講清楚:技術 SEO 與內容 SEO 是分工合作,並不存在「哪一個比較重要」這種二選一的問題。技術層負責讓頁面被正確抓取與索引、把訊號傳清楚,內容層負責讓搜尋引擎覺得這個頁面值得推薦。技術層修到不拖累排名之後,內容與權重才有發揮空間;爬蟲抓不到的頁面,內容再好也等於不存在,而一個技術沒問題、內容卻空洞的網站,同樣找不到被排上去的理由。把技術層當成基礎建設修穩,再回頭把內容與權重做到極致,是比較站得住腳的先後順序。
技術 SEO 和站內 SEO 的界線,業界各有看法。有人把技術 SEO 歸在站內 SEO 底下,也有人主張應該獨立出來。目前多數 SEO 機構採用第二種說法:站內 SEO 改看得到、摸得到的內容與版面;技術 SEO 改爬蟲與瀏覽器底層讀到的結構。如果你對站內那塊有興趣,可以參考 站內 SEO 優化攻略。
| SEO 分支 | 作用範圍 | 代表工作 |
|---|---|---|
| 站外 SEO | 網站以外的訊號 | 反向連結、品牌提及、社群 |
| 站內 SEO | 網站表層的內容與版面 | 標題、內文關鍵字、圖片、排版 |
| 技術 SEO | 網站底層的結構與程式碼 | 網址、爬蟲檢索、結構化資料、速度 |
把這三條線分清楚之後,會得到一個關鍵認知:內容再好,爬蟲抓不到、讀不懂,排名就不會動,這正是站長值得花一個下午把技術層面檢查一遍的理由。技術到位之後,能不能贏過對手就回到內容本身的資訊增量,這一點資訊增益為何是 SEO 內容的關鍵有清楚說明。
排名的前提是先被索引
排名卡住時,最常被忽略的前提是「被索引」。爬蟲抓不到、或抓到多個重複版本,Google 根本沒機會評估你的內容品質,你在起跑點就被淘汰了。技術問題遮住了你的真實成績,內容本身未必有問題。
數字也支持這個判斷。依 Ahrefs 2023 年針對其 Content Explorer 約 140 億頁資料庫的分析,全部索引頁面中高達 96.55% 從 Google 拿不到任何自然搜尋流量,另有 1.94% 的頁面每月只有 1 到 10 次造訪,也就是絕大多數頁面根本進不了能被搜尋到的位置 [來源:Ahrefs〈96.55% of Content Gets No Traffic From Google. Here's How to Be in the Other 3.45%〉 https://ahrefs.com/blog/search-traffic-study/ 2023]。技術層面「進得了索引」只是起點,後面還得靠內容與權重把頁面推進能曝光的名次。
排名發生在「檢索、索引、排名」三個階段的最後一步。技術 SEO 作用在前兩階段,內容 SEO 作用在第三階段。順序不能顛倒。網站連 Google 都進不了索引時,再多的結構化資料都沒用;技術 SEO 的正確順序是「先確認可被檢索,再談優化」。想知道自己的站有沒有被收進去,最快的方法是 Google 網頁收錄查詢方法。
這三個階段各自有對應的診斷工具與失敗訊號,把它們對照著看會更清楚問題出在哪一環。檢索階段看的是 Googlebot 有沒有真的來、來的時候伺服器有沒有正常回應,對應的依據是 Search Console 的檢索統計資料與伺服器 log 檔;索引階段看的是抓回去的頁面有沒有被收進資料庫,對應的是涵蓋範圍報表;排名階段看的是收進去的頁面在哪些關鍵字上拿到曝光與點擊,對應的是成效報表。一個常見的誤判是看到成效差就以為內容不夠好,實際上問題可能出在前兩個階段,頁面根本沒被收進索引。先確認頁面進得了索引,再回頭檢討內容,這個順序能避免把心力花錯地方。
| 常見症狀 | 可能的技術病因 | 建議檢查 |
|---|---|---|
| 收錄頁數異常低 | robots.txt 封鎖、noindex 設錯 | Search Console 涵蓋範圍報表 |
| 排名莫名波動 | 重複內容、權重分散 | canonical 與 301 重定向 |
| 曝光高但點擊率低 | 標題中繼標記、結構化資料缺漏 | 標題長度與 Schema 標記 |
| 新頁面遲遲不收錄 | sitemap 未提交、孤立頁面 | 提交 sitemap 與內部連結 |
很多技術 SEO 問題真正傷害的是使用者體驗與轉換,排名下降只是症狀,不是病因。一個滿是 404 的網站,或一個要等五秒才開啟的頁面,使用者早就走了,Google 只是忠實反映「這個站不值得推薦」。遇到這類問題可以看 404 頁面優化技巧 和 網站跳出率與 SEO 關係。技術 SEO 不是萬靈丹,做完並不保證排名會自動往上衝;但若沒做,再好的內容也上不來。
技術 SEO 的效果通常不會立刻反映在排名上,Google 重新檢索與索引一個網站需要時間,從幾天到幾週都有可能。判斷技術調整有沒有用,至少要給它一個月的觀察期,用 Search Console 對照前後資料,而不是改完隔天就下結論。
技術 SEO 檢查清單:先確認「被檢索」再談優化
技術 SEO 的起點是先用 Google Search Console 完整教學 確認網站能被檢索與索引。這一步沒過,後面所有技巧都是白做;對這套工具的基本功能還陌生的話,先讀一遍Google Search Console 介紹會更踏實。確認「門是開的」之後,再按「檢索、索引、呈現、體驗」四段順序逐項修,效率最高。
檢查的優先級依照「不修會讓整站失效」的程度來排,背後有明確的輕重邏輯:第一級沒過,後面三級做得再漂亮都沒有意義。可被檢索這一關擺最前面,涵蓋 robots.txt、Sitemap 產生與提交教學 與 Search Console 涵蓋範圍報表,網站 Sitemap 入門指南 是檢查起點;接著是索引正確,處理網址結構、301 重定向與 canonical 標準網址,讓爬蟲讀到對的版本;第三段是讓爬蟲讀懂內容,靠結構化資料與標題中繼標記標示頁面類型;最後才是體驗順暢的速度、行動版與 SSL。想用進階技巧挖更深,可以參考 Search Console 進階檢查技巧。
| 檢查項目 | 工具 | 通過標準 | 影響層級 |
|---|---|---|---|
| robots.txt 開放 | Search Console | 無 Disallow 封鎖重要頁面 | 檢索 |
| Sitemap 已提交 | Search Console | 狀態為成功 | 檢索 |
| 無重複內容 | Screaming Frog | canonical 指向單一網址 | 索引 |
| 網址可讀 | 手動檢視 | 簡短、含關鍵字、用連字號 | 索引 |
| 結構化資料 | Rich Results Test | 無錯誤、類型正確 | 呈現 |
| 頁面速度 | PageSpeed Insights | 行動版分數及格 | 體驗 |
| SSL 啟用 | 瀏覽器網址列 | 顯示鎖頭圖示 | 體驗 |
多數教學把技術 SEO 包成「七大技巧清單」,讓人誤以為每項都要做、且都同等重要。實際上網站連索引都進不去時,去調結構化資料只是白忙一場,優先級的差距遠比項目數量關鍵。
網址結構與網站架構:讓爬蟲找得到每一頁
一致、有層級、可讀的網址,搭配扁平但有邏輯的網站架構,能讓每一個重要頁面在少量點擊內被到達,也不會出現找不到的孤立頁面。Google 搜尋中心在官方文件中也建議,邏輯合理且一致的網址結構,較友善於爬蟲與使用者理解網站內容 [來源:Google 搜尋中心〈URL structure〉 https://developers.google.com/search/docs/crawling-indexing/url-structure 2026]。
網址設計有幾個原則:簡短、包含關鍵字、用連字號分隔單字、避免一長串看不出意義的參數亂碼。比方說 example.com/dress/lace 比 example.com/p?id=8837&cat=2 好得多,前者一眼看得出是洋裝分類底下的蕾絲款。想更深入研究命名邏輯,可以看 SEO 網址優化與命名規則。連網址每個組成代表什麼都搞懂,才不會在設定時亂改一通,這部分可以從理解網址的組成結構入門。
網站架構指的是網頁之間的上下階層關係。一個好的架構,首頁到任一頁面建議在三到四次點擊內可達,分類層級保持一致。這樣爬蟲從首頁出發,能沿著連結爬完整站,也方便使用者快速找到資料。想系統性規劃,參考 SEO 友善的網站架構設計;想把架構本身當成一門課題來檢視,也能看什麼是 SEO 友善的網站架構。
特別要注意孤立頁面,也就是站內沒有任何連結指向的頁面。它們像孤島一樣,爬蟲和使用者都找不到,等於白白寫了內容卻不會被收錄。可以用 Visual Site Mapper 或爬蟲工具比對,把孤立頁面重新接回分類或選單。架構與 sitemap 不太一樣:架構是網頁的連結路線流程,sitemap 則是完整列出所有頁面的清單。要弄懂連結怎麼分配權重,先從站內站外與導入導出連結的全面解析建立觀念。
WordPress 的網址與架構實作
用 WordPress 架站,設定一致網址非常簡單。網域申請完畢後,到後台的「設定、永久連結」,選擇文章名稱或自訂結構即可,WordPress 永久連結 SEO 設定 有完整步驟。分類與選單則建議在寫內容前就先規劃好,事後再大改網址結構會牽動 301 重定向,工程量不小。
網址最常出問題的幾個地方,本質都是「同一份內容長出多個版本」。手機版用獨立網址(例如 m. 開頭),會讓電腦版與手機版被當成兩個站,用 RWD 響應式網頁設計 一套版面走天下更安全;www 與非 www 同時存在、http 與 https 兩條路徑同時開啟,也是同一類毛病,www 與 non-www 網址 SEO 差異 把前者講清楚,後者則一律透過 301 收攏成單一版本。
301 重定向與重複內容:別讓權重分散
同一個頁面有多個網址,或網站搬家時,正解是用 301 永久重定向把舊網址的權重轉到新網址,並用 canonical 標準網址告訴 Google 哪個版本才是主要版本。重複內容不會直接被懲罰,但會讓權重分散到多個版本、降低單一頁面被收錄的機會。
需要設 301 的情境大致四種:網站搬家、換網域、換網址結構、整併 www 與非 www。只要使用者或爬蟲可能從舊網址進站,就該設一條 301 把他們導到新網址。301 代表「永久搬家」,Google 會慢慢停止索引舊網址,只索引你指向的新網址,權重也會跟著轉移。要點明的是,Google 官方說法是大部份權重會移轉、但並非全部,而且移轉需要時間,急不得,所以與其事後補救,不如在改版前就把網址結構一次規劃好。完整差異看 301 與 302 轉址完整教學。
| 方法 | 用途 | 適用情境 |
|---|---|---|
| 301 重定向 | 永久把舊網址轉到新網址 | 換網域、換網址結構、www 整併 |
| canonical | 宣告標準網址 | 同內容多網址、分頁、排序參數 |
| noindex | 禁止頁面被索引 | 篩選頁、搜尋結果頁、低價值頁面 |
一個常見錯誤是把 noindex 當成指定標準網址的工具。noindex 的作用是「禁止索引」,等於告訴搜尋引擎不要收錄這個頁面,拿它來合併重複版本反而會讓頁面從搜尋結果消失。標準網址的對的做法是用 canonical,Canonical 標準網址解決重複內容 有詳細說明。robots.txt 與 noindex 雖然都跟檢索有關,作用卻完全不同:前者控制「要不要來抓」,後者控制「抓了之後要不要收錄」,兩者不能混用。
設定方式有兩條路。一條是直接編輯伺服器的.htaccess 檔,用 FTP 軟體連線下載、加入規則、再上傳覆蓋,WordPress FTP 檔案傳輸教學 有操作流程。另一條是走 WordPress 外掛,Rank Math、Yoast、Redirection 都有圖形化的 301 設定介面,不用碰任何程式碼,對怕把網站改壞的人友善得多。
檢查重複內容的工具不少。Search Console 的涵蓋範圍排除報表能列出被判定為重複的網址;Screaming Frog 能爬完整站把重複頁面一次抓出來;SEMrush 則適合較大型網站的定期健檢。電商站要特別小心一個地雷:同一個商品的顏色或尺寸變體,如果各自產生一個獨立網址,很容易被當成多個重複頁面,這時就得靠 canonical 把變體收攏回主商品頁。
重複內容檢查若發現是站外有人抄襲,可以向 Google 提出申訴,要求把抄襲頁面從搜尋結果移除。不過多數情況下,站內自己的重複問題才是大頭,先把自己家裡整理好比較實際。懷疑內容互相搶排名時,可以看看 關鍵字蠶食修復策略。
結構化資料 Schema:讓 Google 用更少時間讀懂你
結構化資料 Schema 是給搜尋引擎看的標準化標記,能讓 Google 更精準理解頁面類型,有機會拿到 SERP 豐富結果版面、提升點擊率。但它本身不是直接的排名加分因素,亂標還可能被判定為操縱而降權。Schema.org 的標準是由 Google、Bing、Yahoo 等搜尋引擎共同維護 [來源:schema.org〈About Schema.org〉 https://schema.org/ 2026]。這套標記的底層思維其實是 Entity SEO,也就是讓搜尋引擎明確辨識頁面談論的人事物,想理解這層概念可以看Entity SEO 在 AI 時代為何重要。
Schema 的本質是幫搜尋引擎省下理解成本。Google 每天要消化數以萬計的網頁,如果它一讀到你的頁面就知道「這是一篇 FAQ」、「這是一個商品」、「這是一段影片」,就能用更少時間決定要不要給你豐富版面。回饋就是 FAQ、評論星等、麵包屑、影片預覽這類 SERP 特殊版面,點擊率往往比純文字結果高。結構化資料 Schema 標記教學 有完整清單。常見的類型與對應的豐富版面如下:
| Schema 類型 | 適用頁面 | 可能觸發的豐富版面 |
|---|---|---|
| FAQ | 教學、客服問答頁 | FAQ 展開式問答 |
| Article | 文章、部落格 | 標題、作者、發布時間 |
| Product | 商品頁 | 價格、庫存、評論星等 |
| Review | 評論內容 | 星等摘要 |
| BreadcrumbList | 全站通用 | 麵包屑路徑 |
| VideoObject | 影片頁 | 縮圖預覽 |
WordPress 加 Schema 幾乎不用寫程式。Rank Math 與 Yoast 都內建結構化資料設定,編輯文章時勾選類型即可,Rank Math SEO 外掛教學 與 Yoast 與 Rank Math 比較 能幫你選工具。進階需求也可以用結構化資料產生器手動產出 JSON-LD 程式碼,再貼到頁面。想要更進階功能,Rank Math Pro 進階功能 值得一看。
有一條硬規則千萬別踩:標記內容必須與頁面實際內容相符。如果頁面明明沒有問答,卻硬塞 FAQ Schema 來搶版面,Google 會視為欺騙,輕則拿掉豐富結果,重則降權。驗證方式是用 Google Rich Results Test 檢測標記有沒有錯誤,再從 Search Console 的增強項目報表追蹤是否成功觸發豐富版面,搭配 SERP 搜尋結果頁運作機制 會更清楚版面怎麼生成。近來搜尋結果頁還多了一塊由 AI 直接生成的摘要版面,運作邏輯可以看Google AI Overviews 摘要版面解析。把傳統 SERP 與 AI 搜尋整體體驗串起來看,AXO 全搜尋體驗優化提供了另一個視角。
速度、行動版與 SSL
速度、行動版與 SSL 是技術 SEO 裡會直接反映在排名訊號上的三項。網站速度自 2010 年起就是 Google 排名因素之一 [來源:Google Webmaster Central〈Using site speed in web search ranking〉 https://webmasters.googleblog.com/2010/04/using-site-speed-in-web-search-ranking/ 2010];行動版體驗在行動優先索引全面完成後,已是決定哪個版本會被索引的基本門檻;SSL 則是 Google 自 2014 年起公開的安全排名訊號 [來源:Google Webmaster Central〈HTTPS as a ranking signal〉 https://webmasters.googleblog.com/2014/08/https-as-ranking-signal.html 2014]。這三項共同決定你的網站值不值得被推薦。
速度的影響很直接。載入時間越長,跳出率越高,這是普遍觀察到的現象。Google 與 SOASTA 合作、發表於 Think with Google 的研究即指出,行動版頁面載入時間從 1 秒拉長到 3 秒,跳出機率就增加 32%;拉長到 5 秒更高達 90% [來源:Think with Google〈Find Out How You Stack Up to New Industry Benchmarks for Mobile Page Speed〉 https://www.thinkwithgoogle.com/future-of-marketing/management/infographics/mobile-page-speed-load-time/ 2017]。這也解釋為什麼載入拖過 2 秒門檻,使用者離開的比例就會明顯攀升,超過幾秒還打不開的頁面,多數訪客會直接走人。Google 目前衡量體驗的官方依據是 Core Web Vitals 三指標:LCP(最大內容繪製)、INP(互動到下一次繪製)、CLS(累計版面位移),Core Web Vitals 核心指標優化 有詳細解讀。三個指標各自的計算與及格門檻,網站使用體驗核心指標 CWV 入門 講得更細。速度為什麼會回頭咬住排名,網頁速度與網站速度的本質 也值得一併讀。
Core Web Vitals 自 2021 年起正式列入排名因素 [來源:Google 搜尋中心〈Evaluating page experience for a better web〉 https://developers.google.com/search/blog/2020/05/evaluating-page-experience 2020],三個指標各有明確的及格門檻:LCP 應在 2.5 秒以內、INP 應在 200 毫秒以內、CLS 應低於 0.1。三者各看一件事,LCP 看載入、INP 看互動流暢度、CLS 看視覺穩定度,三者皆綠才算及格。下表把門檻與常見瓶頸列在一起,方便對照排查。
| 指標 | 衡量什麼 | 及格門檻 | 常見瓶頸 |
|---|---|---|---|
| LCP | 最大內容繪製(載入) | ≤ 2.5 秒 | 圖片未壓縮、主機回應慢 |
| INP | 互動回應流暢度 | ≤ 200 毫秒 | 過多 JavaScript、外掛衝突 |
| CLS | 視覺穩定度(版面位移) | < 0.1 | 圖片無尺寸、動態廣告 |
Core Web Vitals 不只是排名訊號,它對營收的影響也有公開案例佐證。Google 在 web.dev 整理的個案中,日本的電商 Rakuten 24 投入 Core Web Vitals 優化後,每位訪客的營收提升 53.37%,轉換率提升 33.13%;英國電信 Vodafone 把 LCP 改善 31%,帶動銷售成長 8%;印度訂票平台 redBus 優化 INP 後,銷售提升 7%;媒體 The Economic Times 通過 Core Web Vitals 門檻後,整體跳出率改善 43% [來源:web.dev〈Why does speed matter?〉 https://web.dev/articles/why-speed-matters 2026]。這些數字把「速度」這件看似抽象的事,翻譯成能進財報的結果,也說明為什麼大型品牌會把 Core Web Vitals 列為技術投資項目。
行動版體驗的權重,與行動流量本身的占比連動。依 Statista 統計,2026 年第一季行動裝置(不含平板)佔全球網站流量的 52.27% [來源:Statista〈Share of mobile web traffic worldwide quarterly 2015-2026〉 https://www.statista.com/statistics/277125/share-of-website-traffic-coming-from-mobile-devices/ 2026-04-28]。過半流量來自手機的事實,也讓 Google 的行動優先索引成為基本前提,既然多數訪客用手機進站,索引與排名自然以行動版內容為準。Google 自 2020 年起逐步把全站切換到行動優先索引,當年公告時已有 70% 的網站完成切換,並於 2023 年 10 月宣布行動優先索引全面完成,所有能在手機上正常瀏覽的網站,改以行動版爬蟲為主要檢索對象 [來源:Google 搜尋中心〈Mobile-first indexing is here〉 https://developers.google.com/search/blog/2023/10/mobile-first-is-here 2023-10-31]。這段演進代表一件事:行動版內容與電腦版不一致,或行動版缺漏重要資訊,會直接吃掉排名機會。
行動優先索引代表 Google 會以行動版內容做為索引的主要版本。這就是為什麼 RWD 響應式設計比獨立手機網址更安全,一套版面同時顧兩邊,不用擔心爬蟲讀到的行動版內容跟電腦版對不起來。SSL 的影響更直觀:沒有 SSL 的網站,瀏覽器會直接顯示「不安全」提示,多數使用者看到這個訊號就轉身離開,SSL 憑證安裝與比較教學 與 HTTP 換 HTTPS 完整攻略 能帶你走完設定。
| 項目 | 為何影響排名 | 常見作法 |
|---|---|---|
| 網站速度 | Google 排名因素,且直接影響跳出率 | 圖片壓縮、快取、CDN、優質主機 |
| 行動版體驗 | 行動優先索引的門檻 | RWD 響應式設計 |
| SSL/HTTPS | 安全排名訊號,瀏覽器提示影響信任 | Let's Encrypt 免費憑證 |
速度優化的手段很多,CP 值最高的是圖片壓縮,再來是用快取外掛與延遲載入。整體診斷流程可以看 網站速度優化全攻略;想用 CDN 從全球節點縮短載入距離,參考 CDN 網站加速原理與服務。
主機選擇也會回頭影響速度與穩定度。挑一台回應快、支援 Let's Encrypt 免費 SSL 的主機,能省下後續大半功夫,虛擬主機挑選指南 與 WordPress 主機深度評測 可以參考。速度、行動版、SSL 本來就是使用者會直接感受到的東西,把它們顧好,使用者和爬蟲都會更願意留下來。
爬取預算與檢索效率:大網站才需要認真管
爬取預算(crawl budget)指的是 Google 願意花在同一個網站上的檢索次數與頻率。它由兩件事決定:一是「檢索速率上限」,也就是 Googlebot 在不拖垮伺服器的前提下,每秒能發出多少請求;二是「需求」,也就是 Google 覺得這個站的頁面值不值得被抓。兩者相乘,就是 Google 實際會來抓的頁面數量。理解這個機制,才知道什麼時候該管、什麼時候可以放著不管。
中小型網站幾乎不必為爬取預算焦慮。幾百頁、幾千頁的站,Google 通常一個晚上就能把全站抓完,再怎麼浪費預算也不會有成長瓶頸。真正需要認真看待的是頁面量級達到數萬、數十萬以上的大型站,例如電商、新聞、論壇、分類廣告這類會不斷增生頁面的站。這類站的常見症狀是:新頁面遲遲不被收錄、舊頁面很久才被更新、重要分類頁的更新頻率比不上低價值頁。問題的核心往往出在「預算被低價值頁吃掉了」,Google 並非不願意抓,而是有限的檢索次數被數量龐大的低價值頁佔滿。
| 網站規模 | 頁面數量 | 需要管爬取預算嗎 | 主要工作 |
|---|---|---|---|
| 小型 | 數百頁以內 | 不必 | 顧好 sitemap 與內部連結即可 |
| 中型 | 數千頁 | 通常不必 | 留意孤立頁面與重複內容 |
| 大型 | 數萬頁以上 | 需要 | 控制低價值頁、優化檢索路徑 |
| 超大型 | 數十萬頁以上 | 必須 | 分區管理 sitemap、監控檢索統計 |
大型站要做的第一件事,是辨識並處理低價值頁面。常見的低價值頁包括:篩選與排序產生的參數頁、站內搜尋結果頁、分頁的深層頁、過期的活動頁、被標記為薄內容的自動生成頁。這些頁面數量往往遠超主力頁,會把 Google 的注意力分散到沒有排名價值的地方。處理方式有三種:用 robots.txt 直接封鎖檢索、用 noindex 阻止索引、用 canonical 收攏到主力版本。三種各有適用場景,選錯會造成反效果,爬取預算優化策略 有完整的判斷流程。
robots.txt 與 noindex 的選擇最容易搞混。robots.txt 控制的是「要不要來抓」,爬蟲連內容都讀不到,自然也無從判斷頁面價值;noindex 控制的是「抓了之後要不要收進索引」,爬蟲會讀完整頁面再做決定。如果一個頁面已經被外部連結指向、或被其他站引用,用 robots.txt 封鎖會讓 Google 連頁面內容都看不到,反而可能把權重資訊漏掉。穩當的做法是先讓爬蟲抓得到、再用 noindex 或 canonical 控制索引結果。判斷的順序很單純:先問這個頁面值不值得被收錄,再決定用哪一種方法控制它。
觀察爬取預算的實際狀況,可從兩個地方著手。一是 Search Console 的檢索統計資料報表,它會顯示 Googlebot 每天抓了多少頁、平均下載時間、主機回應狀態;二是伺服器本身的 log 檔,能精確看到哪些網址被最常抓、哪些從沒被碰過。兩者搭配,就能找出「明明存在卻從沒被檢索」的頁面,這通常是孤立頁面或深埋在分類結構底層的頁面。把它們重新接回主連結路徑,往往能直接看到收錄數字往上升。
再補一個容易被忽略的細節:伺服器回應速度直接影響 Google 願意發出的請求數量。當主機回應變慢,Googlebot 會自動降低檢索速率,以免壓垮伺服器,於是同一段時間內能抓的頁面就變少。這也是為什麼大型站對主機效能的要求會比小型站嚴苛得多,速度在這裡不只是使用者體驗問題,更是檢索效率的根基。
技術 SEO 決策矩陣:哪些項目該先做、哪些可以等
把前面幾個章節的檢查項目全攤開來,數量會讓人眼花。真正要排優先順序時,有兩個維度最值得參考:第一個是「不修會讓整站失效的程度」,第二個是「修了之後對排名的邊際效益」。把這兩個維度交叉,就能得到一張四象限的決策矩陣,幫你判斷該把有限的時間花在哪裡。
| 整站失效風險高 | 整站失效風險低 | |
|---|---|---|
| 邊際效益高 | 第一象限:立即修(可被檢索、重複內容) | 第二象限:排入計畫(結構化資料、速度優化) |
| 邊際效益低 | 第三象限:盡快修(robots.txt 封鎖、404 滿站) | 第四象限:有空再做(進階快取、CDN 細調) |
這張矩陣真正有用的地方,是把「急」與「重要」拆開來看。第三象限的滿站 404、大量斷鏈看似火燒屁股,但單次修完後就得靠持續監控防止再發生,邊際效益有限;第一象限的 robots.txt 誤封重要分類、全站重複內容、伺服器回 5xx 才是「不做就會出事」的一級,不修則後面所有努力都打折扣。把精力優先壓在第一象限、緊接著清第三象限的緊急項,第二象限(結構化資料、Core Web Vitals、孤立頁面)排進中長期計畫,第四象限的進階調校留到時間充裕再做,時間投入與排名回報才會對得起來。
實務上接手過一個匿名教育品牌的內容站,就是 WordPress 架了幾年、累積不少舊文章、技術債長期沒整理的典型狀況。這個站當時有 392 個網址、月 sessions 約 19,775,量級落在中型,理論上爬取預算不必擔心,真正的阻力是長期沒清的技術債擋住了本該被收錄的頁面。一次健檢的做法是系統性地掃過 sitemap、robots、canonical、404、重複 title、Schema 標記、noindex 與內部連結,把問題逐一標出來再依前面的象限排序。具體的處理落在幾個方向:分類頁索引設定、canonical 指到錯誤版本的修正、把舊文章沒有內部連結接回來的孤立頁重新接上、以及清理過期沒再更新的 sitemap。這幾項正好對應決策矩陣的第一象限與第三象限,先解掉會讓整站失效的,再處理邊際效益高的。
用 Screaming Frog SEO Spider 20.1 爬完整站,掃描出來的網址量是 418 個(來源:Screaming Frog 掃描 2025-Q1),問題分布是這樣:404 頁 96 個、重複 title 63 個、canonical 指錯或失效 21 個。逐項處理完之後的成果對應回這幾個指標:404 頁降到 12(來源:Screaming Frog 加 Google Search Console 覆核),重複 title 剩 4(來源:Screaming Frog),canonical 問題收斂到 1(來源:Screaming Frog)。在 Google Search Console 涵蓋範圍報表追蹤 6 週,標記為索引問題的頁面從 187 降到 58(來源:Google Search Console Pages 匯出 2025-02-27);成效報表 28 天的自然 clicks 從 5,482 升到 6,771(來源:Google Search Console 成效報表 28 天)。這幾個數字是這個站自己的前後對比,不是任何通用基準,工具版本與匯出日期都附在每個數字後面,方便回頭核對。
這裡必須誠實指出一個沒效的地方:有 17 篇內容本身就薄的文章,技術問題修完之後排名還是不動。後來判斷問題不在技術層,而是這些頁面沒有足夠的資訊增量撐得起排名,於是把它們做 noindex 或合併進主題相近的紮實文章,避免硬留在索引裡佔位置。這個結果對應回決策矩陣,正好說明 Technical SEO 的真正價值:讓該被索引的頁面被理解、不該被索引的頁面不要浪費 crawl 與權重,而不是把排名憑空生出來。前面那組成長的前提,是站上確實有內容夠紮實、只是被技術問題擋住的頁面,把阻力移除後才有機會反映在數字上。可驗證的依據是這套流程跑在 Screaming Frog SEO Spider 20.1 與 Yoast SEO 23.0 之上,搭配 GSC Pages 匯出 2025-02-27 對照前後。
不會寫程式也能上手:WordPress 技術 SEO 實戰路線
不懂程式碼的人也能用 WordPress 做好技術 SEO。WordPress 是成熟的開源架站軟體,程式碼長期由專業開發者維護,加上 SEO 外掛幾乎把技術工作都圖形化了,只要選對主機、主題與外掛,按檢查清單逐項設定,就能完成八成以上的技術 SEO 工作。
WordPress 的技術 SEO 基本盤其實很完整。固定網址結構可以自訂,內建就能產生 sitemap,佈景主題的程式碼品質也經過社群長年檢驗。搜尋引擎對 WordPress 的底層結構非常熟悉,這本身就是一種無形的 SEO 紅利。完整設定流程可以看 WordPress SEO 終極優化指南 與 WordPress 架站與 SEO 整合教學。
WordPress 在內容管理系統的普及程度,也讓它成為技術 SEO 預設要熟悉的平台。依 W3Techs 截至 2026 年 6 月的調查,WordPress 用於 59.2% 已知使用內容管理系統的網站,佔全體網站的 41.5% [來源:W3Techs〈Usage Statistics and Market Share of WordPress〉 https://w3techs.com/technologies/details/cm-wordpress 2026-06-29]。這個市佔意味著多數 SEO 工具、主機、外掛都會優先把 WordPress 納入支援,遇到問題時也容易找到解答,降低了獨自摸索的成本。同份調查也顯示,同樣建立在 WordPress 之上的 WooCommerce,覆蓋全體電商系統的 48.6%,是電商網站最常見的技術底層 [來源:W3Techs〈Usage Statistics and Market Share of WooCommerce〉 https://w3techs.com/technologies/details/cm-woocommerce 2026-06-29]。
必裝的工具組合不複雜。一套 SEO 外掛負責標題、中繼標記、結構化資料與 301 轉址,WordPress SEO 外掛完整評測 有完整比較;一套快取外掛負責速度;一套圖片壓縮外掛負責把首圖與內文圖檔縮小。把這三套裝起來、設好,技術 SEO 的地基就穩了。
委外或自學的判斷標準在於風險。改固定網址、裝外掛、提交 sitemap 這些自己來沒問題;但若要動到.htaccess、改伺服器設定、處理大規模換網址,建議找懂 SEO 的網頁設計公司處理,免得一個失誤整站掛掉。想自己把站先架起來,可以從 WordPress 提交 Search Console 教學 開始串接收錄流程。決定走自學路線時,GEO 與 SEO 課程推薦清單能幫你挑出適合的學習資源。
建議的工作順序是:先驗證收錄,再修網址與重複內容,最後才碰速度與結構化資料。這個順序呼應前面提過的「檢索、索引、呈現、體驗」邏輯,把會讓整站失效的問題先解掉,再去追求加分項。爬取預算要不要管,小網站通常不必太在意,爬取預算優化策略 會說明什麼時候才需要認真看待。檢測工具的完整清單看 站長必備 SEO 檢測工具推薦。
技術 SEO 的價值,取決於你能不能先排除讓爬蟲抓不到頁面的障礙,而不是比誰設定多。很多人花一整個週末調幾十個進階參數,卻連 robots.txt 有沒有封鎖、sitemap 有沒有提交都沒檢查,方向就偏了。可檢索這一關先過了,再回頭談加分項也不遲。想把檢索這條線再往前推一步,還能為 AI 爬蟲準備一份說明文件,llms.txt 這份實驗性文件的用途值得認識。
技術基礎打好之後,下一個戰場是 AI 搜尋。SEO、GEO、AEO、LLMO 這些常被混用的名詞,AI SEO 各種別稱一次看懂把它們拆得很清楚;當瀏覽器代理人開始自己上網找答案,網站還得過 Agentic Browsing 對 AI 友善這一關。
技術 SEO 疑難排解:排名卡住時的診斷流程
排名卡住、收錄變少、流量突然下滑,背後的技術病因通常落在幾個固定範圍。憑直覺亂猜往往越猜越遠,按一個固定的診斷流程走一次、把可能性一一排除會更有效率。這套流程從最常見、最好排除的問題開始,一步步往罕見原因收斂,避免一開始就鑽進複雜但低機率的死角。第一站是 Search Console 的涵蓋範圍報表,先確認出狀況的頁面是否仍被索引;若顯示「已排除」或「發生錯誤」,病因就落在索引層,再對照是 noindex 誤設、canonical 指錯還是重複內容。索引層沒問題,接著用 URL 檢查工具模擬 Googlebot 抓取,看回傳的狀態碼與內容,若遭到 robots.txt 封鎖或回傳 5xx,爬蟲根本進不來,排名自然動不了。
技術層都排除後,才把視角拉到站外與結構性因素。把流量下滑的時間點對照 Google 搜尋演算法更新的時間表,演算法波動會讓整批頁面同時受影響,特徵與單一頁面的技術問題不同;再用排名追蹤工具看同一批關鍵字的 SERP 結構有沒有改變,例如多出大量新競爭者、或版面被豐富結果與 AI 摘要佔走,這類變化屬於競爭層,技術層能做的有限。最後回頭檢查內部連結與權重流動:出狀況的頁面若從主選單或分類頁已經點不到,權重進不來,內容再好也會被當成孤立頁。
這套流程跑完,多半能定位到病因落在哪一層。比較容易誤判的有兩種狀況。第一種是「頁面明明被索引、排名卻不動」,這時問題通常落在內容與權重,技術層已經到位,繼續調技術設定也幫助有限,要回頭檢視內容的資訊增量與外部連結。第二種是「剛改完技術設定就看到排名下滑」,容易讓人誤以為改錯,實際上 Google 重新檢索與評估需要時間,短期波動常常與改動無關,至少觀察兩到四週再下判斷。
另外有幾個常見的陷阱值得列出來,省得重複踩雷。重定向鏈過長(A 跳到 B 再跳到 C)會耗損權重,理想是讓每條 301 一次到位;noindex 與 canonical 同時設在不同方向會讓 Google 收到矛盾訊號,結果常常兩邊都不採用;結構化資料標記的屬性與頁面實際內容對不上,會被判定為誤導。這些問題單獨看都不複雜,疊在一起就會讓排名像在原地打轉,定期跑一次完整診斷流程,能在症狀擴大前先抓出來。
常見問題 FAQ
技術 SEO 一定要會寫程式嗎?
大多數情況不用。網址、sitemap、結構化資料、301 轉址這幾項,靠 Rank Math、Yoast 等外掛的圖形介面就能設完。唯一會碰到程式碼的是.htaccess 與伺服器設定,這類建議交給工程師。
結構化資料亂標會被懲罰嗎?
有風險。頁面沒有問答卻硬掛 FAQ Schema,Google 會視為誤導,可能移除豐富版面,嚴重時連帶降權。上線前先用 Rich Results Test 跑一次驗證。
WordPress 站長最該先做哪幾項技術 SEO?
依序是:接上 Google Search Console、設定永久連結讓網址語意化、裝 Rank Math 處理 canonical 與 Schema、啟用快取外掛提速、安裝 SSL 並提交 Sitemap。這五項做完,地基就穩了。
用什麼工具檢查網站的技術 SEO 問題?
免費首選 Google Search Console 看收錄與重複頁面、PageSpeed Insights 測速度;進階可用 Screaming Frog 爬全站找斷鏈與孤立頁面,或用 SEMrush、Ahrefs 做大規模掃描。
技術 SEO 做完之後,還需要定期回頭檢查嗎?
需要。網站會持續新增頁面、外掛會更新、主機環境會變動,任何一項都可能重新引入重複內容、斷鏈或檢索障礙。建議每季跑一次完整的診斷流程,重點看涵蓋範圍報表有沒有新增排除項、Core Web Vitals 是否仍維持及格、sitemap 是否涵蓋新增頁面。
真正會牽動排名的技術設定,集中在可被檢索的網址結構、沒有重複內容、頁面夠快、有 SSL、結構化資料標記正確這幾個點,把這幾項顧好,比堆疊幾十個進階參數更有效率。排名掉了想找原因,可以對照 Google 排名掉了急救技巧;對演算法有疑問,參考 Google 搜尋演算法全解析。站外與權重部分則延伸到 站外 SEO 與反向連結。
想把技術 SEO 連同內容、連結一起學紮實,系統化的資源會比零散文章更有效率。偏好從產業分析一路練到落地的人,SEO 排名攻略學課程把流程拆得很清楚;想在實戰中有人帶著跑、同時熟悉 Ahrefs 等工具,SEO 陪跑班搭配 Ahrefs 學習是另一條路。