Cách Xử Lý SEO Cho Trang Filter & Faceted Navigation – Giữ Cấu Trúc Crawl Sạch, Không Trùng Lặp, Chuẩn Google Search
1. Giới thiệu
Nếu website bạn có chức năng lọc sản phẩm (filter) hoặc điều hướng đa chiều (faceted navigation) — ví dụ:
Lọc theo màu sắc, giá, thương hiệu,
Hoặc kết hợp nhiều điều kiện như
/ao-nu?color=den&size=M&brand=abc,
thì bạn đang nắm trong tay một con dao hai lưỡi với SEO.
💡 Làm đúng → Google hiểu rõ cấu trúc sản phẩm, index hợp lý, tăng CTR.
💣 Làm sai → Google crawl hàng nghìn URL trùng lặp, lãng phí crawl budget và loạn index.
2. Filter & Faceted Navigation là gì?
Thuật ngữ | Giải thích | Ví dụ |
|---|---|---|
Filter (bộ lọc) | Lọc dữ liệu theo một tiêu chí cụ thể |
|
Faceted Navigation | Kết hợp nhiều tiêu chí lọc cùng lúc |
|
Sort (sắp xếp) | Thay đổi thứ tự hiển thị, không thay nội dung |
|
💡 Google có thể coi các URL filter là trang trùng lặp nội dung (duplicate content) nếu không được kiểm soát.
3. Rủi ro SEO khi không xử lý đúng filter
Vấn đề | Hậu quả |
|---|---|
Trùng lặp nội dung (duplicate content) | Hàng trăm URL khác nhau nhưng nội dung gần giống nhau → giảm chất lượng SEO |
Phân tán link juice | Sức mạnh bị chia nhỏ cho các URL filter không cần thiết |
Lãng phí crawl budget | Googlebot phải crawl hàng nghìn biến thể URL |
Index rác | Các trang như |
Không kiểm soát canonical / noindex | Google xếp hạng sai trang, không hiển thị đúng landing page chính |
💡 95% site thương mại điện tử gặp vấn đề index “rác” từ filter nếu không xử lý SEO kỹ thuật.
4. Chiến lược xử lý SEO cho trang filter & faceted navigation
✅ 1. Phân loại URL quan trọng vs không quan trọng
Loại URL | Giữ lại (index) | Chặn / noindex |
|---|---|---|
Trang danh mục chính | ✅ Có giá trị SEO | ❌ |
Trang filter phổ biến có volume tìm kiếm (VD: “áo sơ mi trắng nữ”) | ✅ Có thể index, canonical riêng | ❌ |
Filter theo thuộc tính phụ (màu, size, sắp xếp...) | ❌ | ✅ noindex / Disallow |
Kết hợp nhiều filter (multi-facet) | ❌ | ✅ Disallow / canonical về danh mục chính |
💡 Chỉ nên để Google index những filter có giá trị tìm kiếm thực sự (search intent rõ ràng).
✅ 2. Dùng canonical tag đúng cách
Với trang filter không cần index:
<link rel="canonical" href="https://naviwebsite.vn/ao-nu/" />Với trang filter có giá trị riêng (VD: /ao-nu-trang/): canonical chính nó.
💡 Canonical giúp Google hiểu “phiên bản chuẩn” của nội dung, tránh trùng lặp.
✅ 3. Chặn crawl filter không cần thiết bằng robots.txt
User-agent: *
Disallow: /*?color=
Disallow: /*?size=
Disallow: /*?sort=
Disallow: /*?filter=
💡 Dùng pattern hợp lý để ngăn bot crawl nhưng vẫn cho phép người dùng truy cập.
✅ 4. Loại bỏ URL filter khỏi sitemap
Sitemap XML chỉ nên chứa URL tĩnh, có giá trị SEO (danh mục, sản phẩm, bài viết).
Không thêm query như ?brand=, ?price=, ?color=.
✅ 5. Kiểm soát tham số URL trong Google Search Console
Vào Settings → Crawl parameters → Add parameter
Ví dụ:
Parameter
Behavior
color
No URLs
sort
No URLs
brand
Crawl every URL
💡 GSC giúp bạn nói trực tiếp với Google “đừng index các biến thể này”.
5. Khi nào nên cho phép index filter?
Trường hợp | Ví dụ | Ghi chú |
|---|---|---|
Có từ khóa tìm kiếm riêng |
| Từ khóa có volume > 200/tháng |
Có landing page riêng biệt (custom content) | “Laptop gaming giá rẻ” | Tạo tiêu đề + mô tả riêng |
Có backlink hoặc traffic thật | Được chia sẻ nhiều trên MXH | Giữ index để tận dụng sức mạnh external link |
💡 Nếu bạn định index trang filter, hãy xây content riêng cho nó (title, meta, intro, schema…).
6. Tối ưu UX & crawl flow cho faceted navigation
Dùng AJAX / History API để cập nhật bộ lọc mà không tạo URL mới.
Thêm breadcrumbs để Google hiểu cấu trúc hierarchy.
Gắn internal link từ danh mục → filter quan trọng.
Tạo HTML fallback cho trường hợp JavaScript bị tắt.
💡 UX tốt giúp Googlebot và người dùng cùng hiểu mối quan hệ danh mục – filter chính xác.
7. Theo dõi hiệu quả sau khi xử lý filter
Chỉ số | Công cụ | Mục tiêu |
|---|---|---|
Crawl stats | GSC → Crawl Stats Report | Giảm số request “rác” 60–80% |
Index coverage | GSC | Không còn URL query bị index |
Organic traffic danh mục chính | GA4 | +20–30% sau khi dọn index |
Core Web Vitals | PSI / Lighthouse | Cải thiện tốc độ vì giảm crawl load |
💡 Nếu Google vẫn index URL filter sau 2–4 tuần, hãy kiểm tra lại canonical và robots.txt.
8. Case Study – NaviWebsite tối ưu SEO cho eCommerce có 20.000 URL filter
Tình huống:
Một website thời trang có 5 danh mục chính nhưng hơn 20.000 URL filter như ?color=red&size=M&brand=nike.
Google index 6.000 URL “rác”, làm giảm crawl hiệu quả và tụt traffic 35%.
Giải pháp:
Thêm canonical về trang danh mục chính.
Chặn crawl bằng robots.txt & khai báo GSC parameter.
Giữ index cho 10 filter có volume cao (áo trắng nữ, váy công sở...).
Dọn sitemap & update internal link theo topic cluster.
Kết quả:
95% URL rác biến mất khỏi index trong 1 tháng.
Crawl budget tập trung lại danh mục chính.
Traffic organic +42%, tốc độ tải trung bình nhanh hơn 18%.
9. Kết luận
Filter & faceted navigation là phần tất yếu của website thương mại — nhưng nếu không quản lý, nó sẽ “nuốt” sạch crawl budget và làm loạn index.
Khi được tối ưu đúng cách:
Google chỉ index những URL có giá trị,
Cấu trúc site rõ ràng hơn,
Và hiệu suất SEO tổng thể được cải thiện bền vững.
👉 NaviWebsite hỗ trợ xử lý SEO kỹ thuật cho trang filter & faceted navigation – đảm bảo cấu trúc crawl sạch, tốc độ nhanh & tối ưu index chuẩn Google cho mọi loại website thương mại.
