Có nhiều tuyên bố về sự tồn tại của các cụm lỗi hoặc khiếm khuyết. Một tìm kiếm đơn giản cho thấy nhiều kết quả, ví dụ: 1 , 2 , 3 , 4 , 5 .
Tuy nhiên, tất cả các bằng chứng được trích dẫn là giai thoại và tôi không thể tìm thấy bất kỳ dữ liệu cụ thể nào để sao lưu điều này. Mặc dù kinh nghiệm của riêng tôi không mâu thuẫn với những tuyên bố này, mọi người thích xem các mẫu ngay cả khi không có (thậm chí phân phối lỗi đồng đều sẽ tạo ra các cụm và có thể dễ nhớ hơn khi bạn phải sửa 10 lỗi ở một nơi thay vì 10 những thứ không liên quan trên tất cả các cơ sở mã).
Tôi thực sự tò mò nếu hiện tượng này thực sự tồn tại, nhưng tôi không thể tìm thấy bất kỳ nguồn khách quan hay thậm chí bán khách quan nào (như trong thử nghiệm, thử nghiệm, nghiên cứu, v.v.) sẽ cho thấy sự phân cụm khiếm khuyết thực sự xảy ra.
Tất nhiên, tôi ổn với giả định giả thuyết phân cụm lỗi là cách thực hành tốt (ngay cả khi đó là sai, nó sẽ không bị tổn thương quá nhiều). Mặt khác, dữ liệu cụ thể có thể làm sáng tỏ lý do tại sao nó xảy ra. Có phải vì những ngày đó người ta đau đầu khủng khiếp (vì bất cứ lý do gì)? Hoặc có thể vì một số phần của mã chỉ khó và những phần khác thì dễ? Hoặc có lẽ đó là nơi chịu trách nhiệm của hai kỹ sư không thích nhau?
Câu hỏi của tôi: Liệu hiệu ứng cụm khiếm khuyết thực sự tồn tại? Có dữ liệu phi giai thoại cụ thể nào được giải thích tốt nhất bằng giả thuyết này không?