Hai tệp có cùng nội dung nhưng tên tệp khác nhau: ( tệp1 và tệp2 ):
cat file1
this is a simple file
cat file2
this is a simple file
md5sum file1
7de45bf879db49de7e2eacea23e6c165 file1
md5sum file2
7de45bf879db49de7e2eacea23e6c165 file2
Hai tệp có nội dung khác nhau nhưng tên tệp giống nhau: ( tệp1 và tệp1 )
cat file1
this is a simple file
cat file1
this is a simple file with extra contents
md5sum file1 #first file1
7de45bf879db49de7e2eacea23e6c165 file1
md5sum file1 #second file1
c7c8f3fd9ddd7a926c31416a69063e4e file1
Từ mục wiki ,
Tuy nhiên, rất khó có khả năng hai tệp không giống nhau trong thế giới thực sẽ có cùng hàm băm MD5, trừ khi chúng được tạo riêng để có cùng hàm băm.
Nhưng, thuật toán MD5 có những sai sót của riêng nó.
Tuy nhiên, bây giờ rất dễ tạo ra xung đột MD5, người tạo tệp có thể tạo tệp thứ hai có cùng tổng kiểm tra, vì vậy kỹ thuật này không thể bảo vệ chống lại một số hình thức giả mạo độc hại. Ngoài ra, trong một số trường hợp, tổng kiểm tra không thể tin cậy được (ví dụ: nếu nó được lấy trên cùng một kênh với tệp đã tải xuống), trong trường hợp đó MD5 chỉ có thể cung cấp chức năng kiểm tra lỗi: nó sẽ nhận ra tải xuống bị hỏng hoặc không đầy đủ, mà trở nên có khả năng hơn khi tải xuống các tập tin lớn hơn.
Tôi khuyên bạn nên sử dụng sha1 để tính toán tổng kiểm tra vì việc tạo va chạm không dễ dàng khi sử dụng thuật toán sha1 . Sản xuất tổng kiểm tra sha1 khá dễ dàng như bạn có thể thấy ở đây .