Cách Xử Lý Canonical & URL Parameters – Giữ Trang Chính, Loại Trùng Lặp Chuẩn Google
1. Giới thiệu
Trong SEO kỹ thuật, canonical và URL parameters là hai yếu tố quyết định tính nhất quán nội dung và hiệu quả crawl của Googlebot.
Nếu không xử lý đúng:
Google sẽ index trùng lặp (duplicate content),
Link juice bị chia nhỏ,
Và hiệu suất SEO tổng thể bị giảm đáng kể.
Bài viết này, NaviWebsite hướng dẫn chi tiết cách sử dụng canonical & parameters chuẩn Google, giúp bạn giữ trang chính – tối ưu crawl budget – tăng authority toàn site.
2. Canonical là gì?
Canonical tag (rel=“canonical”) là đoạn thẻ HTML giúp Google hiểu phiên bản URL nào là bản chính của một nội dung.
Ví dụ:
https://naviwebsite.vn/san-pham/ao-thun
https://naviwebsite.vn/san-pham/ao-thun?color=red
https://naviwebsite.vn/san-pham/ao-thun?ref=facebook
→ Tất cả trỏ về URL chính:
<link rel="canonical" href="https://naviwebsite.vn/san-pham/ao-thun" />
💡 Hiểu đơn giản: Canonical là “tín hiệu” nói với Google:
“Đây là URL gốc, các bản còn lại chỉ là bản phụ.”
3. Khi nào cần dùng Canonical?
Tình huống | Có nên dùng canonical không? | Gợi ý xử lý |
|---|---|---|
Trang có nhiều tham số filter / sort | ✅ Có | Canonical về trang gốc |
Phiên bản in / bản rút gọn | ✅ Có | Canonical về bản đầy đủ |
Trang có UTM tracking (Facebook, Ads, Email) | ✅ Có | Canonical về bản không có UTM |
Trang có nội dung trùng nhau (copy 90%) | ✅ Có | Chọn 1 URL chính |
Trang khác nội dung hoàn toàn | ❌ Không | Để index riêng |
4. Cách chèn canonical chính xác
🔹 Trong thẻ <head>
<link rel="canonical" href="https://naviwebsite.vn/bai-viet/huong-dan-seo" />
🔹 Trong HTTP Header (khi không truy cập HTML)
Dành cho file PDF, CSV, API:
Link: <https://naviwebsite.vn/file.pdf>; rel="canonical"
🔹 Trong sitemap XML
Đảm bảo URL canonical trùng với URL trong sitemap:
<loc>https://naviwebsite.vn/san-pham/ao-thun</loc>
5. Các lỗi canonical phổ biến
Lỗi | Hậu quả | Cách khắc phục |
|---|---|---|
Canonical trỏ về chính nó sai (self-canonical không đồng nhất) | Google không hiểu đâu là bản gốc | Kiểm tra URL tuyệt đối, không dùng relative |
Canonical trỏ sang domain khác | Google bỏ qua, mất tín hiệu | Chỉ canonical nội bộ cùng domain |
Nhiều canonical trong cùng trang | Google chọn ngẫu nhiên | Giữ duy nhất 1 canonical |
Canonical + noindex cùng lúc | Mâu thuẫn tín hiệu | Không nên dùng cùng nhau |
Canonical dynamic (biến động theo tham số) | Google không hiểu rõ phiên bản | Gắn cố định canonical cho từng trang |
6. URL Parameters là gì?
URL Parameters (tham số URL) là phần phía sau dấu ?, dùng để lọc, theo dõi hoặc thay đổi hiển thị trang.
Ví dụ:
?sort=price_asc
?color=red
?utm_source=facebook
?ref=ads
Google coi mỗi URL có tham số là một trang riêng biệt → nếu nội dung không khác nhau, sẽ bị duplicate content.
7. Cách xử lý URL Parameters chuẩn SEO
✅ 1. Canonical về trang chính
Nếu các tham số không tạo ra nội dung khác biệt:
<link rel="canonical" href="https://naviwebsite.vn/san-pham/ao-thun" />
→ Giữ link juice về bản chính.
✅ 2. Chặn crawl bằng robots.txt (với filter, sort)
User-agent: *
Disallow: /*?sort=
Disallow: /*?color=
→ Giúp Google không crawl các URL phụ vô ích.
⚠️ Nhưng vẫn nên để index URL chính – không block toàn thư mục.
✅ 3. Thêm noindex, follow nếu vẫn cần truy cập
Khi filter cần giữ để người dùng dùng được:
<meta name="robots" content="noindex,follow">
→ Google không index nhưng vẫn theo link nội bộ.
✅ 4. Dùng Google Search Console (Legacy Parameter Tool)
Mặc dù Google đã giảm hỗ trợ công cụ này, bạn vẫn có thể:
Xác định tham số nào thay đổi nội dung,
Và nói với Google “bỏ qua” tham số không quan trọng (vd: tracking, session).
✅ 5. Cấu trúc URL filter thân thiện (rewrite parameters)
Thay vì:
/san-pham?color=red&size=m
→ Dùng dạng tĩnh:
/san-pham/mau-do/size-m/
→ Giúp URL đẹp, dễ đọc, thân thiện SEO, và có thể index được nếu có nội dung riêng.
8. Chiến lược kết hợp Canonical + URL Parameters
Mục tiêu | Hành động SEO |
|---|---|
Tránh duplicate do sort / filter | Canonical về trang gốc + chặn crawl bằng robots.txt |
Giữ traffic từ URL có tracking | Giữ canonical về bản sạch |
Filter có giá trị SEO (ví dụ “áo thun màu đỏ”) | Cho phép index + viết nội dung riêng |
Giảm load server khi crawl | Loại bỏ parameters thừa bằng regex trong robots.txt |
9. Kiểm tra canonical & parameter trong thực tế
🔍 Dùng công cụ:
Google Search Console → Inspect URL: xem canonical mà Google chọn.
Screaming Frog / Sitebulb: kiểm tra canonical tags & duplicate.
Ahrefs / Semrush: xem URL parameters nào được index.
Log File / Crawl Stats: phát hiện bot crawl quá nhiều URL phụ.
🧠 Tip:
Nếu Google chọn canonical khác bạn khai báo → có thể nội dung quá giống → cần khác biệt hóa title, H1 hoặc internal link.
10. Case Study – NaviWebsite xử lý canonical & parameters
Tình huống:
Trang sản phẩm có 20 biến thể màu + filter sort.
→ Google index 120 URL trùng nội dung → giảm 30% crawl efficiency.
Giải pháp:
Canonical về trang gốc,
Disallow
?sort=&?ref=trong robots.txt,Viết 3 trang filter riêng cho nhóm từ khóa có volume cao (“áo thun đỏ”, “áo thun form rộng”).
Kết quả sau 45 ngày:
Số URL index giảm 65%,
Crawl budget tập trung,
Organic traffic danh mục tăng +38%.
11. Kết luận
Canonical và URL parameters không chỉ là chi tiết kỹ thuật – mà là chiến lược làm sạch cấu trúc website giúp:
Giữ tín hiệu SEO tập trung,
Giảm duplicate content,
Và cải thiện hiệu suất index dài hạn.
👉 NaviWebsite chuyên tối ưu kỹ thuật SEO (canonical, parameters, crawl budget) giúp website vận hành mượt và giữ vững thứ hạng trên Google.
