Tại sao trang web của bạn có vấn đề về lập chỉ mục?

2023-03-06T01:03:13+00:00

Các trang web tương đối thường gặp vấn đề với việc lập chỉ mục – và có thể có nhiều lý do cho việc này. Chúng tôi đã biên soạn một danh sách kiểm tra để giúp chẩn đoán và giải quyết vấn đề của bạn.

Tuy nhiên, đối với những người mới bắt đầu, cần đảm bảo rằng trang web của bạn thực sự không được lập chỉ mục. Thật dễ dàng – chỉ cần gõ lệnh site:example.com vào Google, thay thế example.com bằng địa chỉ của trang web bạn muốn kiểm tra. 
 

Tại sao trang web của bạn có vấn đề về lập chỉ mục?

Bạn cũng nên nhớ tắt bộ lọc Tìm kiếm an toàn vì bộ lọc này có thể chặn các kết quả tìm kiếm được liên kết với một số trang web nhất định. Để thực hiện việc này, hãy nhấp vào Cài đặt rồi nhấp vào Cài đặt tìm kiếm: 
 
Nếu bạn vẫn không thấy trang web của mình trong kết quả tìm kiếm rất ảnh hưởng đến việc SEO của bạn, hãy thử sử dụng lệnh site:, theo sau là địa chỉ trang web đầy đủ, ví dụ: “https://www.example.com”.

Vẫn không có kết quả? Điều này có thể có nghĩa là các rô-bốt của Google chưa bắt gặp nó. Điều này có thể xảy ra với các trang web hoàn toàn mới (mà Google chưa tìm thấy nên chưa có cơ hội lập chỉ mục chúng), cũng như các trang con mới được thêm vào các trang web hiện có và đã được lập chỉ mục trước đó.

Để tăng tốc độ lập chỉ mục, hãy cân nhắc tạo tài khoản Google Search Console, xác minh miền và thêm sơ đồ trang web ở định dạng .xml hoặc / và thử lập chỉ mục một địa chỉ cụ thể bằng cách thêm địa chỉ đó vào hàng đợi trong trường bên dưới:
 

Và sau đó nhấp vào nút được đánh dấu bên dưới:
 
Cũng có thể xảy ra trường hợp trang chủ được lập chỉ mục chính xác, nhưng vì lý do nào đó, các trang con khác hoặc một số trang con chưa được lập chỉ mục. Có một số lý do có thể khiến điều này xảy ra:

Trang web có sẵn cả có và không có www, không cần chuyển hướng

Nếu một trang khả dụng bằng cả hai phiên bản của địa chỉ và cả hai đều trả về mã phản hồi của máy chủ 200 cho biết trang chính xác mà không cần chuyển hướng – Google có thể hạn chế lập chỉ mục ít nhất một trong các phiên bản. Đây là một lỗi phổ biến có thể được giải quyết bằng cách triển khai chuyển hướng vĩnh viễn từ phiên bản này sang phiên bản khác (nghĩa là chuyển hướng trả về mã phản hồi của máy chủ là 301). Nếu cả hai trang web đều mới – việc chúng tôi thực hiện chuyển hướng từ trang nào không quan trọng, nếu trên một trong số chúng, một số kết quả đã được lập chỉ mục, thì đáng để thực hiện chuyển hướng đến trang đó.

Trang web bị chặn lập chỉ mục

Các vấn đề về lập chỉ mục cũng có thể xảy ra nếu một trang web có các chỉ thị ngăn cản việc lập chỉ mục. Điều này có thể được thực hiện thông qua tệp robots.txt (chỉ thị không cho phép), .htaccess (noindex, nofollow) hoặc thậm chí trực tiếp trong meta robot (noindex, nofollow).

Mẹo : đối với một hệ thống quản lý nội dung phổ biến như WordPress, người dùng thường đánh dấu vào hộp kiểm chống lập chỉ mục trong khi cài đặt và sau đó quên lập chỉ mục trang web theo cách thủ công – bạn nên ghi nhớ điều này khi tìm kiếm các nguồn có thể gây ra sự cố lập chỉ mục!

Có lỗi trong cấu trúc trang web

Nếu một số trang con trong cấu trúc trang web không được liên kết nội bộ và không xuất hiện trong sơ đồ trang web .xml, Google sẽ gặp khó khăn trong việc lập chỉ mục chúng. Cần đảm bảo rằng luồng PageRank nội bộ là chính xác và mỗi URL có liên quan được bao gồm trong cấu trúc liên kết nội bộ của trang, nghĩa là có một liên kết nội bộ dẫn đến nó từ một trang con khác đã được lập chỉ mục.

Các trang con và nội dung bị trùng lặp

Nếu một trang web chứa quá nhiều trang trùng lặp, Google có thể cho rằng trang đó có quá ít nội dung độc đáo và sẽ không lập chỉ mục trang đó.

Trang web mất quá nhiều thời gian để tải

Các rô-bốt kết xuất và diễn giải các trang web không đợi vô thời hạn để tải một trang con. Nếu trang không tải trong khung thời gian đã chỉ định (một số báo cáo đề xuất 4-5 giây), rất có thể trang đó sẽ không được lập chỉ mục. Bạn nên sử dụng báo cáo PageSpeed ​​Insights và đảm bảo rằng chỉ số tốc độ nằm trong khoảng 80-90 điểm (có nghĩa là thời gian tải dưới 2 giây).

Trang web không có nội dung

Việc không có nội dung, cũng như sự trùng lặp của nó, khiến giá trị của các trang con cụ thể trong “con mắt” của thuật toán Google giảm xuống đáng kể. Đây có thể là một lý do khác khiến các trang con không được lập chỉ mục.

Trang web không tuân thủ nguyên tắc của Google

Hình phạt từ Google (thường được gọi là “bộ lọc”)

Hình phạt từ Google (thường được gọi là “bộ lọc”) có thể được áp dụng khi một trang web không tuân thủ các nguyên tắc của Google, chẳng hạn như khi trang web:

ẩn nội dung trên trang web,
áp dụng kỹ thuật che giấu (nghĩa là nội dung hiển thị cho rô-bốt khác với nội dung hiển thị cho người dùng),
có được các liên kết spam trên các trang web bên ngoài,
không có giá trị đối với người dùng và được tạo riêng để có được lưu lượng truy cập từ công cụ tìm kiếm,
là bản sao của một trang web khác không có giá trị gia tăng hoặc nội dung độc đáo, hoặc
tên miền mà chúng tôi đã đặt trang web của mình trong quá khứ đã bị Google phạt, chứa nội dung spam hoặc bất hợp pháp

Trang web đang gặp sự cố kỹ thuật

Nếu trang được thiết kế trên Flash, nội dung quan trọng được trình bày bằng Ajax, chứa tiêu đề http không chính xác của trang chính (không phải 200), hoặc, chẳng hạn, được Google đánh dấu là “Soft 404”, tức là trang trả về mã phản hồi của máy chủ là 200, nhưng công cụ tìm kiếm đã quyết định rằng trang con sẽ trả về trạng thái 404. Ví dụ, điều này xảy ra khi trang con không có nội dung hoặc khi Googlebot “nghĩ” rằng trang con có lỗi, trong trường hợp đó, Googlebot cũng có thể quyết định không lập chỉ mục trang đó.

Chuyển hướng tạm thời đã được thiết lập

Ví dụ: nếu một trang web đang chuyển đổi URL và chuyển hướng từ địa chỉ cũ sang địa chỉ mới đã được thiết lập thông qua chuyển hướng tạm thời, tức là 302, thì có khả năng địa chỉ mới có thể gặp sự cố lập chỉ mục, ít nhất là ban đầu. Nếu chúng tôi đang thay đổi địa chỉ, chúng tôi nên sử dụng chuyển hướng vĩnh viễn (trả về mã phản hồi của máy chủ là 301). Việc sử dụng chuyển hướng tạm thời (302) nên được cân nhắc và không thực hiện mà không có lý do.

Trang web đang phát tán virus

Nó có thể xảy ra rằng trang web của chúng tôi đã bị nhiễm và trở nên nguy hiểm. Một lần nữa, Googlebot có thể sẽ quyết định không lập chỉ mục hoặc thậm chí hủy lập chỉ mục nếu vấn đề không có từ đầu.

Việc hủy lập chỉ mục như vậy sẽ xuất hiện trong “Thao tác thủ công” trong Google Search Console. Nó hiển thị tất cả các hành động được thực hiện bởi “người xác minh”, tức là nhân viên của Google kiểm tra xem trang web có tuân thủ các nguyên tắc của Google hay không.

Những lý do đằng sau các vấn đề về chỉ mục là vô tận. Chúng tôi hy vọng rằng danh sách của chúng tôi sẽ giúp bạn chẩn đoán những cái quan trọng và phổ biến nhất, làm cho trang web của bạn hiển thị nhiều hơn cho tìm kiếm của Google.