內容再好,如果搜尋引擎爬唔到、索引唔到,一切都係徒勞。技術SEO(Technical SEO)係確保搜尋引擎可以正確發現、爬取、理解同索引你網站嘅基礎工作。冇穩固嘅技術基礎,其他SEO努力都會事倍功半。
好多網站擁有優質內容,但因為技術問題——錯誤嘅Robots.txt、缺少Sitemap、重複內容、緩慢載入——而喺搜尋結果中表現差強人意。呢篇文章將由零開始教你掌握網站架構同索引優化嘅核心技術,建立搜尋引擎友好嘅網站基礎。EC Shop City自2006年起提供網頁設計服務,對技術SEO有豐富經驗。
一、技術SEO基礎概念
1.1 什麼是技術SEO?
技術SEO係指優化網站嘅技術層面,確保搜尋引擎可以有效地爬取(Crawl)、渲染(Render)同索引(Index)你嘅內容。呢個係SEO三大支柱之一,同內容SEO、站外SEO並重。
1.2 搜尋引擎運作原理
| 階段 | 說明 | 技術SEO關注點 |
|---|---|---|
| 爬取(Crawling) | 搜尋引擎機器人發現同訪問網頁 | Robots.txt、Sitemap、內部連結 |
| 渲染(Rendering) | 處理JavaScript、CSS生成完整頁面 | JS優化、資源可訪問性 |
| 索引(Indexing) | 分析內容並存入搜尋引擎數據庫 | Canonical、Meta robots、重複內容 |
| 排名(Ranking) | 根據相關性同質量排列結果 | 頁面速度、結構化數據、手機優化 |
1.3 技術SEO核心要素
- 可爬取性(Crawlability):機器人可以訪問你嘅頁面
- 可索引性(Indexability):頁面可以被加入索引
- 可渲染性(Renderability):頁面內容可以被正確處理
- 可排名性(Rankability):頁面有競爭排名嘅技術基礎
1.4 技術SEO的重要性
- 確保搜尋引擎可以發現所有重要頁面
- 避免爬蟲預算浪費喺低價值頁面
- 防止重複內容稀釋排名能力
- 提升用戶體驗(速度、手機友好)
- 幫助搜尋引擎更好理解內容(結構化數據)
二、Robots.txt配置
2.1 Robots.txt是什麼?
Robots.txt係放喺網站根目錄嘅文字檔案,告訴搜尋引擎爬蟲邊啲頁面可以爬取、邊啲應該避開。呢個係Technical SEO嘅基礎配置之一。
位置:https://yourdomain.com/robots.txt
2.2 基本語法
| 指令 | 說明 | 範例 |
|---|---|---|
| User-agent | 指定適用嘅爬蟲 | User-agent: * (所有爬蟲) |
| Disallow | 禁止爬取嘅路徑 | Disallow: /admin/ |
| Allow | 允許爬取(覆蓋Disallow) | Allow: /admin/public/ |
| Sitemap | 指向XML Sitemap位置 | Sitemap: https://domain.com/sitemap.xml |
| Crawl-delay | 爬取間隔(部分爬蟲支援) | Crawl-delay: 10 |
2.3 應該禁止的路徑
- 管理後台:/admin/、/wp-admin/
- 登入頁面:/login/、/member/
- 搜尋結果:/search/、/?s=
- 購物車/結帳:/cart/、/checkout/
- 篩選頁面:帶有大量參數嘅篩選URL
- 無限日曆:可無限生成嘅日期頁面
- 內部API:/api/(如果唔係公開內容)
2.4 常見錯誤
| 錯誤 | 問題 | 解決方法 |
|---|---|---|
| Disallow: / | 封鎖整個網站 | 只禁止特定路徑 |
| 封鎖CSS/JS | Google無法正確渲染頁面 | Allow關鍵資源文件 |
| 冇Sitemap指向 | 錯失告知爬蟲機會 | 加入Sitemap指令 |
| 語法錯誤 | 指令無效 | 用Google測試工具驗證 |
2.5 Robots.txt範例
User-agent: *
Disallow: /admin/
Disallow: /cart/
Disallow: /checkout/
Disallow: /search/
Disallow: /*?s=
Disallow: /*?filter=
Allow: /admin/public/
Sitemap: https://yourdomain.com/sitemap.xml
2.6 測試工具
- Google Search Console Robots.txt測試工具
- Bing Webmaster Tools
- 第三方工具如Screaming Frog
三、XML Sitemap建立
3.1 XML Sitemap是什麼?
XML Sitemap係列出網站所有重要頁面嘅文件,幫助搜尋引擎發現同理解你嘅網站架構。呢個對索引優化至關重要,特別係大型網站或新網站。
3.2 Sitemap最佳實踐
| 原則 | 說明 |
|---|---|
| 只包含可索引URL | 排除noindex、redirect、404頁面 |
| 使用Canonical URL | 只列出標準版本URL |
| 保持更新 | 新增/刪除內容時同步更新 |
| 按類型分割 | 分開blog、product、category等 |
| 控制大小 | 每個Sitemap最多50,000 URL或50MB |
3.3 Sitemap類型
- XML Sitemap:標準網頁sitemap
- Image Sitemap:圖片索引
- Video Sitemap:影片索引
- News Sitemap:新聞內容(需符合Google News要求)
- Sitemap Index:索引多個sitemap嘅主檔案
3.4 Sitemap Index範例
大型網站應使用Sitemap Index組織多個sitemap:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://domain.com/sitemap-posts.xml</loc>
<lastmod>2026-02-01</lastmod>
</sitemap>
<sitemap>
<loc>https://domain.com/sitemap-products.xml</loc>
<lastmod>2026-02-01</lastmod>
</sitemap>
<sitemap>
<loc>https://domain.com/sitemap-pages.xml</loc>
<lastmod>2026-01-15</lastmod>
</sitemap>
</sitemapindex>
3.5 提交Sitemap
- 喺Robots.txt中指向Sitemap
- 提交到Google Search Console
- 提交到Bing Webmaster Tools
- 定期檢查索引狀態
3.6 Sitemap生成工具
- WordPress:Yoast SEO、Rank Math
- 爬蟲工具:Screaming Frog
- 線上工具:XML-Sitemaps.com
- 自訂開發:動態生成
四、結構化數據標記
4.1 什麼是結構化數據?
結構化數據(Schema Markup)係用標準化格式向搜尋引擎描述頁面內容嘅方法。正確使用可以獲得Rich Results(豐富搜尋結果),提升點擊率同可見度。
4.2 常用Schema類型
| Schema類型 | 適用內容 | Rich Result效果 |
|---|---|---|
| Article | 新聞、部落格文章 | 標題、圖片、日期 |
| Product | 產品頁面 | 價格、評分、庫存 |
| LocalBusiness | 本地商戶 | 地址、營業時間、評價 |
| FAQPage | 常見問題 | 問答展開式結果 |
| HowTo | 教學步驟 | 步驟列表 |
| Review | 評價內容 | 星級評分 |
| BreadcrumbList | 麵包屑導航 | 層級導航顯示 |
| Organization | 公司資訊 | 知識面板 |
4.3 實施格式
Google推薦使用JSON-LD格式:
- JSON-LD(推薦):獨立腳本,唔影響HTML結構
- Microdata:嵌入HTML標籤
- RDFa:較少使用
4.4 JSON-LD範例
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "LocalBusiness",
"name": "EC Shop City",
"image": "https://ecshopcity.com/logo.png",
"telephone": "+852-XXXX-XXXX",
"address": {
"@type": "PostalAddress",
"streetAddress": "地址",
"addressLocality": "香港",
"addressCountry": "HK"
},
"openingHours": "Mo-Fr 09:00-18:00"
}
</script>
4.5 驗證工具
- Google Rich Results Test
- Schema.org Validator
- Google Search Console增強功能報告
4.6 2026年結構化數據趨勢
- 結構化數據對AI搜尋(GEO)越來越重要
- Speakable Schema支援語音搜尋
- 更多Rich Result類型推出
五、內部連結策略
5.1 內部連結的作用
內部連結係網站架構嘅關鍵組成部分:
- 分配PageRank:將權重傳遞到重要頁面
- 幫助爬取:確保所有頁面可被發現
- 建立層次:表明頁面之間嘅關係
- 提升用戶體驗:引導用戶瀏覽相關內容
5.2 內部連結最佳實踐
| 實踐 | 說明 |
|---|---|
| 描述性Anchor Text | 使用清晰、相關嘅連結文字 |
| 連結到深層頁面 | 唔好只連結首頁同分類頁 |
| 相關性原則 | 連結到主題相關嘅頁面 |
| 合理數量 | 每頁保持合理嘅連結數量 |
| 避免孤兒頁面 | 確保每個頁面都有內部連結指向 |
5.3 內部連結架構
- 導航連結:主選單、頁尾選單
- 麵包屑:顯示頁面層級
- 內容連結:文章內嘅相關連結
- 相關文章:文章底部嘅推薦
- Hub頁面:主題集合頁連結到所有相關文章
5.4 Anchor Text優化
| 類型 | 範例 | 建議 |
|---|---|---|
| 精確匹配 | 「網頁設計服務」 | 適量使用 |
| 部分匹配 | 「專業網頁設計」 | 推薦 |
| 品牌名 | 「EC Shop City」 | 適合首頁 |
| 通用詞 | 「點擊這裡」 | 避免 |
5.5 防止孤兒頁面
- 定期用爬蟲工具檢查孤兒頁面
- 建立自動化內部連結機制
- 確保新頁面有連結指向
六、網址結構設計
6.1 URL設計原則
| 原則 | 好例子 | 壞例子 |
|---|---|---|
| 簡潔易讀 | /web-design/ | /p?id=12345&cat=3 |
| 包含關鍵字 | /seo-services/ | /service-1/ |
| 用連字號分隔 | /web-design/ | /web_design/ |
| 小寫字母 | /contact/ | /Contact/ |
| 反映層次 | /blog/seo/technical-seo/ | /technical-seo-blog-post/ |
6.2 URL層次結構
理想嘅網站架構應該係扁平但有邏輯嘅層次:
- 首頁到任何頁面唔超過3次點擊
- URL層級反映內容層次
- 避免過深嘅URL結構
6.3 參數處理
- 追蹤參數:用Google Search Console設定
- 篩選參數:考慮Canonical或Robots禁止
- 分頁參數:正確使用rel="next/prev"(雖然Google不再依賴)
6.4 URL更改注意事項
- 避免無必要更改URL
- 如需更改,必須設定301重定向
- 更新內部連結指向新URL
- 更新Sitemap
七、重複內容處理
7.1 重複內容問題
重複內容會導致:
- 爬蟲預算浪費
- PageRank稀釋
- 排名混亂(搜尋引擎唔知揀邊個版本)
7.2 常見重複內容來源
| 來源 | 範例 |
|---|---|
| HTTP vs HTTPS | http://domain.com vs https://domain.com |
| www vs non-www | www.domain.com vs domain.com |
| 尾部斜線 | /page vs /page/ |
| URL參數 | /page vs /page?ref=123 |
| 分頁 | /category/ vs /category/page/2/ |
| 打印版本 | /page vs /page/print |
7.3 Canonical標籤
Canonical標籤告訴搜尋引擎邊個係「標準」版本:
<link rel="canonical" href="https://domain.com/page/" />
- 每個頁面都應該有Canonical標籤
- 自我指向Canonical係最佳實踐
- 重複頁面指向標準版本
7.4 301重定向
- HTTP重定向到HTTPS
- 統一www或non-www
- 舊URL重定向到新URL
- 避免重定向鏈(A > B > C)
7.5 Hreflang標籤
多語言網站使用Hreflang避免被視為重複內容:
<link rel="alternate" hreflang="zh-HK" href="https://domain.com/zh-hk/page/" />
<link rel="alternate" hreflang="zh-TW" href="https://domain.com/zh-tw/page/" />
<link rel="alternate" hreflang="en" href="https://domain.com/en/page/" />
八、爬蟲與索引監測
8.1 Google Search Console
Search Console係監測索引優化嘅主要工具:
- 覆蓋範圍報告:索引狀態同錯誤
- Sitemap報告:Sitemap提交同索引狀態
- URL檢查:個別頁面索引狀態
- 爬取統計:Googlebot爬取頻率同回應
8.2 常見索引問題
| 問題 | 原因 | 解決方法 |
|---|---|---|
| 已爬取但未索引 | 內容質量或重複 | 提升內容質量、檢查重複 |
| 已發現但未爬取 | 爬蟲預算不足 | 改善內部連結、減少低質頁面 |
| 被Robots.txt封鎖 | 配置錯誤 | 修正Robots.txt |
| 已排除 | Canonical指向他處或noindex | 檢查Canonical同Meta robots |
8.3 爬蟲日誌分析
進階技術SEO需要分析伺服器日誌:
- 了解Googlebot實際爬取行為
- 識別爬蟲預算浪費
- 發現爬取錯誤同異常
九、技術SEO檢查清單
9.1 基礎檢查
| 項目 | 檢查內容 |
|---|---|
| HTTPS | 全站使用HTTPS |
| 手機友好 | 響應式設計、通過Mobile-Friendly Test |
| 頁面速度 | Core Web Vitals達標 |
| Robots.txt | 正確配置、唔封鎖重要內容 |
| XML Sitemap | 存在、已提交、保持更新 |
9.2 進階檢查
| 項目 | 檢查內容 |
|---|---|
| Canonical | 每頁有正確Canonical標籤 |
| 結構化數據 | 正確實施、通過驗證 |
| 內部連結 | 冇孤兒頁面、冇斷連結 |
| 重定向 | 冇重定向鏈、冇重定向迴圈 |
| Hreflang | 多語言網站正確設定 |
9.3 EC Shop City的技術SEO服務
Technical SEO需要專業知識同持續維護。EC Shop City嘅網頁設計服務包含全面嘅技術SEO優化:
查看我哋嘅網頁設計計劃了解更多方案。
需要專業協助優化網站技術基礎?
EC Shop City可以幫你建立搜尋引擎友好嘅網站架構,確保你嘅網站可以被正確爬取同索引,為SEO成功打好技術基礎。
立即聯絡我哋,獲取免費技術SEO審計!