Làm thế nào tôi có thể xác định các tập tin hình ảnh trùng lặp?


16

Trong những năm qua, tôi đã tích lũy được rất nhiều hình ảnh, trên một loạt các máy khác nhau.

Tôi nghĩ rằng tôi chủ yếu giữ chúng trong cấu trúc thư mục yyyy / mm /, nhưng đặc biệt với một số hình ảnh cũ hơn, dường như có rất nhiều bản sao.

Cách tốt nhất để xác định các bản sao là gì? Có những công cụ tốt để làm điều này, hoặc tôi sẽ phải tự viết một cái gì đó?


3
Bạn đang tìm kiếm các kết quả gần đúng (giả sử, cùng một hình ảnh, siêu dữ liệu khác nhau) hoặc tìm kiếm các kết quả khớp chính xác đủ tốt?
mattdm

Các trận đấu chính xác sẽ đủ tốt.
chris

có thể nhìn vào kích thước tập tin?
aaaaa nói phục hồi Monica

Câu trả lời:


7

Một số chương trình có thể tìm thấy các bản sao dựa trên nội dung hình ảnh. Một số ứng dụng quản lý tài sản sẽ làm điều đó và cũng có những chương trình dành riêng. Nếu bạn Google 'phát hiện các hình ảnh trùng lặp', bạn sẽ thấy khá nhiều tùy chọn. Xem những cái nào có sẵn cho nền tảng của bạn.

Một giải pháp khác là chỉ cần nhập các tệp với 'bỏ qua tùy chọn trùng lặp'. Picasa, miễn phí, có thể làm điều đó.


Google phát hiện các hình ảnh trùng lặp thực sự hoạt động như đã hứa. Có một số lượng tốt các phần mềm như vậy được tìm thấy. Bạn có thể giới thiệu bất cứ điều gì khác ngoài Picasa không?
Esa Paulasto

4

Đối với Linux, hãy thử FSlint . Nó hơi chậm, nhưng chắc chắn sẽ tìm thấy bản sao.


FSlint sẽ tìm kiếm các tệp có cùng giá trị băm. Như vậy nó sẽ tìm thấy bản sao của bất kỳ tập tin. Nó sẽ không giúp với kịch bản 'cùng một hình ảnh siêu dữ liệu khác nhau' hoặc với các phiên bản đã thay đổi kích thước của bản gốc.
seb

4

dupeGuru Picture Edition là một công cụ tìm hình ảnh trùng lặp có thể tùy chỉnh cho Windows, Mac OS X và Linux.

Có một vài phiên bản dupeGuru (phiên bản tiêu chuẩn, âm nhạc và hình ảnh) và phiên bản hình ảnh cho phép bạn tìm thấy hình ảnh tương tự trực quan thông qua thuật toán so sánh chặn bitmap, trong số các phương pháp khác (như dấu thời gian hình ảnh gốc EXIF ​​hoặc các tệp giống hệt nhau) .

Nó có nhiều tính năng hữu ích khác như thư mục loại trừ, hỗ trợ thư viện iPhoto / Aperture và tùy chỉnh đáng kể cách phát hiện các bản sao và những gì nó làm với chúng.


3

Picasa có một công cụ tìm tệp trùng lặp nhưng thật khó để nói bạn đang xem gì: Chạy Picasa; nhấp chuột Tools> Experimental> Show Duplicate Files. Nó hoạt động nhưng hãy cẩn thận về những gì bạn đang xóa.

Một tùy chọn khác là "Trình tìm tệp nhanh trùng lặp" miễn phí :

Trình tìm tệp trùng lặp nhanh

Điều tôi thích ở đây là nó cho phép bạn xem trước ảnh trước khi quyết định bạn không cần bản sao.

văn bản thay thế

Điều đó hoạt động tốt miễn là các tệp giống hệt nhau , nhưng nếu bạn đang tìm kiếm những bức ảnh tương tự (ví dụ: cùng một bức ảnh nhưng được thay đổi kích thước, xoay hoặc thao tác), bạn có thể muốn xem xét phiên bản nâng cấp của chúng:

Hình ảnh tương tự trùng lặp Trình tìm kiếm hình ảnh

Tôi đã không sử dụng chương trình này nhưng tôi đã sử dụng một chương trình rất giống nhau (không còn được thực hiện) và tôi thấy nó rất hữu ích. Họ có một bản tải xuống miễn phí nên có thể đáng để kiểm tra.


Tôi đã thử công cụ tìm picasa dupe, nhưng dường như nó phù hợp với các hình ảnh tương tự, không phải các tệp giống hệt nhau.
chris

2

digikam (linux, windows và mac) có một thanh bên có phiên bản có tiêu đề

Tab Phiên bản hiển thị lịch sử và các phiên bản đã lưu của một bức ảnh. Với ba nút ở góc trên cùng bên phải, bạn có thể chọn giữa một danh sách đơn giản các phiên bản đã lưu, chế độ xem dạng cây và danh sách kết hợp hiển thị các phiên bản cùng với các hành động được thực hiện với ảnh đã chọn.

và một tìm kiếm khác có tiêu đề

Tìm kiếm nhanh là hộp tìm kiếm thích ứng ở đầu hộp thoại tìm kiếm (Thanh bên trái) và cung cấp cho bạn một phương tiện đơn giản để tìm kiếm cơ sở dữ liệu digiKam với một truy vấn duy nhất. Bạn có thể nhập bất kỳ đối số nào trong trường Tìm kiếm: văn bản và nó sẽ được sử dụng để xác định kết quả. Chẳng hạn, bạn có thể nhập chuỗi 'birthday' để tìm kiếm cơ sở dữ liệu đầy đủ cho các lần xuất hiện của từ 'birthday' trong tất cả các trường văn bản siêu dữ liệu hoặc '05 .png 'để tìm kiếm tên tệp hình ảnh cụ thể '05 .png' ( không thoát như trong regexpressions cần thiết).

(Nó cũng có cài đặt nâng cao cho phép nhiều tìm kiếm boolean)

và một tiêu đề khác mờ

digiKam mô tả mọi hình ảnh bằng một số dài bằng cách sử dụng một kỹ thuật đặc biệt (thuật toán Haar) để có thể so sánh các hình ảnh bằng cách so sánh chữ ký được tính toán này. Sự khác biệt về số ít hơn giữa hai chữ ký hình ảnh, chúng càng giống nhau. Kỹ thuật này có ba triển khai trong digiKam: ...

  1. Bản sao
  2. Hình ảnh (mục tương tự)
  3. Phác thảo

Mặc dù việc tạo ra "chữ ký" và kiểm tra chéo chúng trên một số lượng lớn hình ảnh có thể là một quá trình chậm. Ngoài ra, hãy lưu ý rằng một số người không phải là người hâm mộ vì đây là dự án KDE không tích hợp hoàn toàn với các môi trường máy tính để bàn khác và nó cố gắng trở thành một ứng dụng tất cả trong một với tải xuống hình ảnh, danh mục / từ khóa, phát triển RAW, xử lý hình ảnh và hơn thế nữa bao gồm.


1

Same.pictures là một chương trình trực tuyến để tìm các bản sao gần và chính xác.

Tôi đã viết nó bởi vì Picasa thường tìm các bản sao chính xác . Và bây giờ Picasa đã biến mất.


1

Theo quan điểm của tôi. Tôi đã sử dụng:

Pixith github.com/saolaolsson/pixipl

VisiPics Visipics.info

tạo ảnh vui nhộn Duplicate Finder Ảnh duplicate-finder.com

Một điều cần xem xét là "độ mờ" của tìm kiếm. Đôi khi chương trình tìm thấy những bức ảnh tương tự, ví dụ, các biến thể của cùng một buổi chụp hình. Đừng có một kích hoạt hạnh phúc khi xóa hình ảnh của bạn.


Xin vui lòng, sao lưu hình ảnh của bạn trước khi xóa bất cứ điều gì.


0

Acdsee là một ứng dụng duyệt ảnh đơn giản / phổ biến có tính năng này (Công cụ -> Tìm bản sao).


0

Trên máy Mac của tôi, tôi đã thành công tuyệt vời với PhotoSweeper ( http://overmacs.com/ ). Nó có thể hoạt động trực tiếp thông qua hệ thống tệp hoặc thông qua phần mềm chụp ảnh phổ biến như Apple Photos và Adobe Lightroom. Nó có thể tìm thấy các bản sao chính xác hoặc các tệp hình ảnh tương tự. Và ở mức 10 đô la, đó là một vụ đánh cắp.


-1

DeDup-Image là một tập lệnh bash để tự động tìm và xóa các hình ảnh / ảnh trùng lặp giống hệt nhau, ngay cả khi siêu dữ liệu khác nhau. Nó luôn giữ bản sao lớn nhất, có thể chứa nhiều siêu dữ liệu nhất và xóa tất cả các đối tượng tìm thấy khác dựa trên SHA256-HASH của thông tin hình ảnh thực mà không có bất kỳ siêu dữ liệu nào. Vì tập lệnh cần xử lý một biến thể từ mỗi hình ảnh mà không có siêu dữ liệu, nên nó hơi chậm và tốn nhiều bộ xử lý hơn các chương trình hoặc tập lệnh chỉ có thể tìm kiếm các tệp hoàn toàn giống nhau.


4
Chương trình này trông rất nguy hiểm vì nó tự động xóa. Tôi thực sự, thực sự sẽ không muốn bất kỳ chương trình nào bị xóa các tập tin ở đây và đó.
Rafael
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.