Broken link là liên kết không còn hoạt động, trỏ đến một trang không tồn tại hoặc trả về mã lỗi. Mỗi broken link trên website gây ra ba hệ quả đồng thời: Googlebot bị gián đoạn crawl, link juice bị mất vào “hố đen” và người dùng rời trang ngay lập tức. Đây là lỗi Technical SEO thầm lặng nhất, dễ tích lũy theo thời gian và ít được kiểm tra thường xuyên nhất.
1. Broken Link là gì?
Broken link (liên kết gãy, link chết) là đường liên kết khi click vào không dẫn đến nội dung nào, thay vào đó trả về một trong các mã lỗi sau:
- 404 Not Found: Trang từng tồn tại nhưng đã bị xóa hoặc đổi URL. Đây là loại phổ biến nhất.
- 400 Bad Request: URL bị sai định dạng, thường do ký tự đặc biệt hoặc lỗi kỹ thuật khi tạo link.
- 410 Gone: Trang bị xóa vĩnh viễn và chủ website xác nhận điều đó với Google. Khác với 404, mã 410 nói với Googlebot “đừng quay lại trang này nữa”.
- 500 Server Error: Máy chủ gặp sự cố, không phục vụ được trang. Thường là lỗi tạm thời nhưng nếu kéo dài sẽ bị Google ghi nhận.
Broken link có thể xuất hiện ở hai vị trí hoàn toàn khác nhau: trong nội bộ website (internal broken link) và trỏ ra trang bên ngoài (external broken link). Hai loại này có mức độ ảnh hưởng và cách xử lý khác nhau.
2. Phân biệt Internal Broken Link và External Broken Link
Đây là điểm hầu hết bài viết tiếng Việt bỏ qua nhưng quan trọng để biết xử lý cái gì trước.
Internal broken link là link trong nội bộ website của bạn trỏ đến một trang cũng trong website nhưng không còn tồn tại. Ví dụ: bài viết A link đến bài viết B, nhưng bài B đã bị xóa.
Đây là loại nguy hiểm hơn vì: Googlebot đang crawl website của bạn sẽ bị chặn lại đúng chỗ đó, không đến được các trang khác được link từ trang B. Link juice từ các trang trỏ vào B cũng bị mất hoàn toàn.
External broken link là link trong bài viết của bạn trỏ ra một trang bên ngoài đã chết. Ví dụ: bạn dẫn nguồn một nghiên cứu nhưng trang đó đã xóa bài.
Loại này ảnh hưởng đến UX và E-E-A-T (nội dung không còn dẫn nguồn được nữa) nhưng không làm gián đoạn crawl nội bộ. Tuy nhiên nếu bài dẫn nguồn bằng số liệu mà link chết, độ tin cậy của bài giảm đáng kể trong mắt Google.
3. Nguyên nhân phổ biến gây ra Broken Link
Thay đổi cấu trúc URL: Đây là nguyên nhân số một. Khi bạn đổi permalink, đổi slug bài viết, hoặc tái cơ cấu danh mục mà không thiết lập redirect 301, tất cả link cũ trỏ vào URL đó đều thành broken link ngay lập tức.
Xóa trang hoặc bài viết: Xóa một bài viết mà không redirect URL cũ sang trang thay thế là cách nhanh nhất tạo ra hàng loạt broken link, đặc biệt nếu bài đó đang được nhiều trang khác dẫn link.
Trang đích bên ngoài thay đổi: Website bạn dẫn nguồn xóa bài, đổi domain hoặc tắt hẳn. Bạn không kiểm soát được điều này, chỉ phát hiện khi kiểm tra định kỳ.
Lỗi khi nhập URL thủ công: Sai một ký tự, thiếu dấu gạch ngang, nhầm http/https là đủ tạo ra broken link ngay từ đầu.
Domain hết hạn không gia hạn: Nếu bạn link đến một subdomain hoặc microsite của chính mình mà quên gia hạn hosting/domain, toàn bộ link trỏ vào đó sẽ chết.
4. Broken Link ảnh hưởng đến SEO như thế nào?
4.1. Gián đoạn crawl và index
Googlebot di chuyển theo các đường link. Khi gặp broken link, bot dừng lại tại đó và không thể khám phá các trang được link tiếp theo từ trang đã chết. Với website lớn có ít crawl budget, mỗi lần bot “lãng phí” vào 404 là mất đi cơ hội index một trang hữu ích.
4.2. Link juice chảy vào “hố đen”
Như đã phân tích trong bài [Link Juice là gì], mọi link trỏ đến trang 404 đều truyền link juice vào khoảng trống, không có trang nào hưởng lợi. Nếu trang đó từng có nhiều backlink chất lượng trỏ vào, toàn bộ giá trị đó bị mất cho đến khi bạn thiết lập redirect hoặc khôi phục trang.
4.3. Tín hiệu chất lượng trang giảm
Google đánh giá website có nhiều broken link là website không được bảo trì tốt. Đây là tín hiệu gián tiếp về chất lượng tổng thể, ảnh hưởng đến cách Google đánh giá E-E-A-T của toàn domain, không chỉ riêng trang có lỗi.
4.4. Tăng bounce rate, giảm thời gian trên trang
Người dùng gặp trang 404 thường thoát ngay. Bounce rate tăng là tín hiệu tiêu cực cho Google về chất lượng trải nghiệm.
5. Cách phát hiện Broken Link
5.1. Google Search Console (miễn phí, ưu tiên dùng trước)
Vào Lập chỉ mục (Indexing) > Trang (Pages), chọn mục “Không tìm thấy (404)”. Google Search Console liệt kê tất cả URL trong website đang trả về 404 mà Googlebot đã crawl đến. Đây là danh sách broken internal link cần xử lý ngay.
5.2. Screaming Frog SEO Spider
Crawl toàn bộ website, vào tab Response Codes > Client Error (4xx) để xem danh sách đầy đủ. Xuất ra Excel để xử lý hàng loạt. Free cho site dưới 500 URL.
5.3. Ahrefs Site Audit
Báo cáo Broken Links trong Site Audit cho thấy cả internal lẫn external broken link, kèm thông tin trang nào đang chứa link đó để biết cần vào sửa ở đâu.
5.4. Ahrefs > Site Explorer > Broken Backlinks
Tính năng này cho thấy các trang bên ngoài đang link vào URL 404 của website bạn, tức là bạn đang “bỏ phí” backlink chất lượng. Đây là dữ liệu quan trọng để ưu tiên khôi phục.
6. Quy trình xử lý Broken Link đúng thứ tự ưu tiên
Không phải broken link nào cũng cần xử lý ngay. Hãy xử lý theo thứ tự sau:
Ưu tiên 1: Internal broken link được nhiều trang trỏ vào. Đây là lỗi nghiêm trọng nhất. Thiết lập redirect 301 sang trang thay thế gần nhất về nội dung, hoặc khôi phục lại trang nếu nội dung vẫn còn giá trị.
Ưu tiên 2: URL 404 đang có backlink từ bên ngoài. Kiểm tra trong Ahrefs > Broken Backlinks. Mỗi URL trong danh sách này là link juice đang bị lãng phí. Redirect 301 về trang liên quan để thu hồi toàn bộ giá trị backlink đó.
Ưu tiên 3: External broken link trong bài viết quan trọng. Các bài pillar page hoặc bài có thứ hạng tốt mà link dẫn nguồn bị chết cần được cập nhật nguồn mới hoặc xóa link, tránh ảnh hưởng E-E-A-T.
Ưu tiên 4: Toàn bộ broken link còn lại. Xử lý dần trong quá trình audit định kỳ hàng tháng hoặc hàng quý.
7. Góc nhìn thực chiến: Broken Link Building
Hầu hết người làm SEO nhìn broken link như một vấn đề cần dọn dẹp. Mình thì nhìn nó theo hướng khác.
Sau nhiều năm làm SEO, mình nhận ra broken link của người khác chính là cơ hội link building có tỷ lệ thành công cao nhất mà ít ai khai thác. Lý do đơn giản: khi bạn liên hệ xin backlink thông thường, bạn đang đề nghị họ làm thêm việc mà không có lý do rõ ràng. Nhưng khi bạn báo cho họ biết trang đang có broken link và đề xuất nội dung thay thế, bạn đang giúp họ sửa một lỗi thực sự trên website.
FAQ: Câu hỏi thường gặp về Broken Link
Broken link có bị Google phạt không? Google không phạt trực tiếp vì broken link. Nhưng nhiều broken link là tín hiệu gián tiếp về chất lượng website kém, ảnh hưởng đến cách Google đánh giá tổng thể. Quan trọng hơn, mỗi broken link là lãng phí crawl budget và link juice.
Có bao nhiêu broken link thì cần lo? Không có ngưỡng cụ thể. Nguyên tắc thực chiến: kiểm tra định kỳ mỗi tháng và xử lý ngay bất kỳ broken link nào có backlink từ bên ngoài hoặc nằm trên trang quan trọng.
Xóa link chết trong bài có tốt hơn để nguyên không? Tốt hơn. Xóa link chết loại bỏ tín hiệu tiêu cực về chất lượng nội dung. Nếu có thể tìm được nguồn thay thế tương đương, thay link mới vào là phương án tốt nhất.
Redirect 301 có khôi phục được link juice từ backlink không? Có, nhưng mất khoảng 10 đến 15% link juice qua mỗi bước redirect. Vì vậy nên redirect thẳng đến trang đích cuối cùng, tránh tạo chuỗi redirect A sang B sang C.
Trang 404 tùy chỉnh (custom 404) có giúp SEO không? Trang 404 tùy chỉnh giúp giữ người dùng lại và cải thiện UX, nhưng không giải quyết vấn đề crawl budget hay link juice. Redirect 301 về trang thích hợp luôn là giải pháp ưu tiên hơn là chỉ thiết kế trang 404 đẹp.
