Xử Lý Nội Dung Trùng Lặp: Dùng Thẻ Canonical, Noindex Hay Là Không Làm Gì?

LƯỢT XEM: 1718
Xử Lý Nội Dung Trùng Lặp

Có thể bạn đang cố gắng làm nhiều cách để nuông chiều cô gái đỏng đảnh Google để cuối cùng, bạn là người được chọn. Có phải khi làm SEO, bạn luôn bị ám ảnh bởi câu hỏi: “Google Có thích trang web của tôi không?”

Rất nhiều SEOer muốn làm hài lòng Google mà cách điển hình nhất thường làm cung cấp thật nhiều content.

Cách này Khang phải nói là khá tuyệt vời đấy! Nhưng nếu không kiểm soát nội dung sản xuất ra mỗi ngày thế nào team content của bạn cũng đẻ ra những nội dung na ná nhau, thậm chí là trùng lặp. Bạn cứ cho cô gái đó ăn gà mãi sao cô ấy chịu được?

Cẩn thận, nội dung trùng lặp sẽ tác động cực xấu đến xếp hàng Google. Nhưng nếu là lý do vô ý dẫn đến trùng lặp nội dung thì bài viết này, Khang sẽ giúp bạn xử lý từng nội dung sao cho hợp lý nhất có thể.

Tóm lược trước khi đi vào chi tiết nhé:

1 Xử Lý Nội Dung Trùng Lặp: Dùng Thẻ Canonical

<b>Xử Lý Nội Dung Trùng Lặp: Dùng Thẻ Canonical</b>
Sử dụng thẻ canonical để giải quyết trùng lặp nội dung

Nếu chưa biết thẻ Canonical là gì bạn có thể đọc bài này trước khi đi vào cách xử lý nội dung trùng bằng thẻ Canonical Thẻ Canonical Là Gì? Cách Kiểm Tra Canonical Trong SEO

Sử dụng thẻ Canonical có thể là một cách tuyệt vời để hướng dẫn Google thu thập thông tin như phiên bản đại diện của nội dung trùng lặp hoặc nội dung tương tự. Tất cả những gì bạn phải làm là đặt thẻ này trong phần đầu của mã nguồn.

Nhưng làm thế nào để bạn tìm được bạn có nội dung tương tự hoặc trùng lặp trên trang web hay không?

Thử nghiệm đơn giản nhất là xem xét thủ công bằng cách tìm với URL riêng biệt hoặc các thành phần của nội dung như hình ảnh, tiêu đề, từ khóa, mô tả,..

Lấy một vài trong số các URL này và sử dụng một công cụ như Similar Page Checker để kiểm tra. Bạn cũng có thể sử dụng Siteliner, trang này sẽ xem xét trang web của bạn cho nội dung trùng lặp hoặc tương tự hay không.

Bây giờ đi vào phân loại và cách xử lý nhé!

Các case study về trường hợp sử dụng thẻ Canonical 

Trường hợp 1. Trang web của bạn tồn tại ở cả phiên bản HTTP và HTTPS

Giải pháp: Hãy dùng thẻ Canonical cho phiên bản trang có số lượng liên kết, liên kết nội bộ lớn nhất.., cho đến khi bạn có thể thực hiện chuyển hướng tất cả các trang trùng lặp.

Trường hợp 2. Bạn bán các loại áo thun khác nhau với một số kiểu áo nằm trong mục áo sơ mi. Không có bản sao duy nhất trên các trang này, chỉ có tên, hình ảnh, giá cả, v.v. Bạn có nên chỉ định các trang sản phẩm áo thun vào trang mục áo sơ mi không?

Giải pháp: Không nên làm gì cả. Các trang này là đủ duy nhất để được lập chỉ mục. Chúng có các tên duy nhất để phân biệt rồi và điều này có thể giúp bạn cho các trường hợp từ khóa dài.

Trường hợp 3. Bạn bán áo thun nhưng có một trang cho mọi màu và cho mọi áo

Giải pháp: dùng thẻ Canonical gắn thẻ các trang màu để tham chiếu trang áo sơ mi. Mỗi trang không phải là một sản phẩm riêng biệt, chỉ là một biến thể đơn giản.

Case nên sử dụng Canonical:  Nội dung đủ độc đáo và hấp dẫn

Tương tự như ví dụ được trình bày ở trên. Khang muốn giải thích rằng đôi khi nội dung hơi giống nhau vẫn có thể phù hợp để lập chỉ mục. Chúng là những sản phẩm khác nhau, không chỉ là một biến thể.

Ví dụ như một trang thương mại điện tử bán xe ô tô, có riêng một danh mục cho xe ô tô, trong đó có hàng trăm tin về xe Toyota Vios với cả đống phiên bản, đủ màu, đủ các đời xe…

Tất cả các biến thể xe chỉ đơn giản là gần trùng lặp của các trang mô hình. Vậy tại sao chúng ta lại muốn “làm phiền” Google với nội dung gần trùng lặp này khi chúng ta có thể hợp thức hóa các trang này để trỏ đến trang chính làm trang đại diện?

Chúng tôi thấy rằng lưu lượng truy cập tự nhiên tăng lên không chỉ ở các trang con này mà cả các trang mẹ. Nghĩa là, các trang mẹ sẽ “hưởng lợi ké” từ các trang con nếu các trang con có nguồn truy cập trả tiền (quảng cáo).

Những sai lầm cần tránh khi sử dụng thẻ Canonical 

Đừng mắc phải những sai lầm này khi dùng thẻ Canonical:

  • Đặt các thẻ canonical chuyển hướng trước khi giải quyết đến trang cuối cùng. Đừng làm chậm các công cụ tìm kiếm bằng cách buộc chúng chuyển hướng và hướng tầm quan trọng đến một trang không tồn tại.
  • Thẻ Canonical được đặt thành các trang lỗi 404.
  • Gắn thẻ Canonical vào phiên bản trang sai, ví dụ: www./non-www., HTTP / HTTPS.

2 Xử Lý Nội Dung Trùng Lặp: Dùng Noindex

<b>Xử Lý Nội Dung Trùng Lặp: Dùng Noindex</b>
Một cách xử lý nội dung trùng lặp hiệu quả

Bạn cũng có thể sử dụng thẻ meta robot noindex để loại trừ hoàn toàn nội dung bị trùng lặp. Đặt thẻ noindex trong phần đầu của mã nguồn của bạn sẽ ngăn các công cụ tìm kiếm lập chỉ mục các trang này.

Mặc dù thẻ meta robot noindex là một cách nhanh chóng để loại bỏ nội dung trùng lặp khỏi việc xem xét xếp hạng, nhưng nó có thể gây nguy hiểm cho lưu lượng truy cập tự nhiên của bạn nếu bạn không sử dụng nó một cách thích hợp.

Thẻ này đã được sử dụng trong quá khứ để loại bỏ các trang web lớn để chỉ hiển thị các trang web quan trọng tìm kiếm để chi tiêu thu thập dữ liệu trang web  hiệu quả nhất có thể. Tuy nhiên, chúng ta đều muốn Google xem tất cả nội dung trang có liên quan để hiểu phân loại trang và phân cấp trang.

Case study nên sử dụng thuộc tính Noindex

Dưới đây là một vài trường hợp nên sử dụng thuộc tính Noindex:

Trường hợp 1: Để hỗ trợ khách hàng, bạn cung cấp thông tin sản phẩm có từ nhà sản xuất mặc dù họ nội dung này đã có trên trang web của họ.

Giải pháp: Tiếp tục cung cấp tài liệu để hỗ trợ khách hàng tại chỗ của bạn nhưng không cần index các trang nội dung này. Các nội dung này đã được lập chỉ mục, về cơ bản, bạn sẽ không vượt qua họ về nội dung này được đâu.

Trường hợp 2:  Bạn cung cấp một số sản phẩm khác nhau nhưng tương tự nhau. Sự khác biệt duy nhất là màu sắc, kích thước, số lượng…

Giải pháp: Giải quyết thông qua việc sử dụng các thẻ canonical. Một tìm kiếm đuôi dài có thể thúc đẩy lưu lượng đủ điều kiện vì một trang nhất định vẫn sẽ được lập chỉ mục và có thể xếp hạng.

Trường hợp 3: Bạn có rất nhiều sản phẩm cũ mà bạn thực sự không bán nhiều nữa và không còn là trọng tâm chính

Giải pháp: Sử dụng thẻ canonical cho các trang này đến các danh mục chứa nó hoặc chuyển hướng đến các trang phân loại có liên quan. Các trang này có độ tuổi/niềm tin khá cao, có thể có liên kết và có thể sở hữu thứ hạng, cho nên noindex là mất hết, đừng dại :)).

Trường hợp sử dụng: Không hy sinh xếp hạng/lưu lượng truy cập để xem xét chi tiêu thu thập dữ liệu

Chúng ta luôn muốn đưa những thứ tốt nhất lên trước cho Google. Chúng ta cũng không muốn lãng phí thời gian của họ khi thu thập thông tin, nhưng chúng ta lại không biết rằng: nội dung của chúng tôi thiếu tính độc đáo.

Hãy sử dụng thẻ meta robot noindex đặt trên các trang biến thể sản phẩm con trong thời gian chuyển đổi hoặc khởi chạy lại tên miền.

Những lỗi khi sử dụng Meta Robot Noindex cần tránh

  • Không đặt thẻ meta robot noindex trên một trang có giá trị liên kết trong. Nếu vậy, trang được đề cập sẽ được chuyển hướng vĩnh viễn đến một trang web có liên quan khác.
  • Nếu bạn đang tìm kiếm một trang được bao gồm trong điều hướng chính, chân trang hoặc điều hướng hỗ trợ, hãy đảm bảo rằng lệnh đó không phải là “noindex, nofollow” mà là noindex, follow” để Google thu thập thông tin trang web các liên kết trên trang noindex.

Kết luận

Các thẻ canonical và noindex có thể là công cụ hữu ích để hướng dẫn Google tìm và xử lý nội dung trùng lặp hoặc loại bỏ nội dung không cần thiết khỏi các chỉ mục của công cụ tìm kiếm.

Chỉ cần cẩn thận khi áp dụng thì sẽ không ảnh hướng đến khả năng lập chỉ mục. Chúc bạn thành công!

20 Phản hồi

Bình Luận

R - SEO ToolsSEO & Marketing ToolThemes WordPressPlugins WordPress