Có cách nào để tìm các tập tin tương tự (không trùng lặp) không?


12

Mục tiêu cuối cùng của tôi là tái cấu trúc mã được viết bởi đồng nghiệp của tôi. Vì vậy, có một công cụ có thể tìm thấy các tập tin khác nhau chỉ trong vài từ?

(Chỉnh sửa: đây là cho Mac, nhưng những người khác cũng có thể thích câu trả lời không phải của Mac.)


@harry, đưa ra lịch sử sửa đổi , tôi đoán bạn đã đăng một câu trả lời của Windows, bị từ chối vì chỉ sau đó yêu cầu Mac mới xuất hiện? Tôi muốn bỏ yêu cầu Mac và xem câu trả lời của bạn (nếu đó là một câu trả lời không phải là Mac tốt)!
Arjan

@Arjan: Xong.
harrymc

Đối với máy Mac, tôi tự hỏi liệu Spotlight có thể được sử dụng không. Tôi nghi ngờ điều đó, nhưng nếu bạn biết một cách để làm mọi thứ trong Spotlight, thì mdfindlệnh có thể giúp viết một số tập lệnh để tự động hóa mọi thứ. Tuy nhiên, tôi nghĩ nó sẽ luôn chỉ sử dụng dữ liệu meta. Do đó, việc tìm các tệp tương tự có thể giới hạn về loại tệp, nhưng không giới hạn nội dung tệp. Không có điếu xì gà.
Arjan

Câu trả lời:


5

Simian làm điều này cho mã nguồn của một số ngôn ngữ. Tốt nhất là tìm mã hóa copy-n-paste trắng trợn. Sự phát triển của nó dường như đã bị đình trệ, nhưng nó hoạt động đủ tốt.


Không giúp được gì nhiều - trong ứng dụng rails có rất nhiều partials rất giống nhau, nó chỉ nói rằng tôi có những dòng tương tự trong
Development.log

Bạn đã cung cấp cho nó các tập tin đúng để phân tích? Bạn có thể quan tâm đến nguồn của bạn, không development.log. Đối với đường ray, hãy xem flay rubyforge.org/frs/ Kẻ
Benjamin Bannier

Có, tôi đã cung cấp cho nó tất cả các tệp trong thư mục ứng dụng rails
tig

2

(Cho cửa sổ)

Sản phẩm Anti-Twin (miễn phí cho sử dụng cá nhân) tuyên bố có thể làm điều này:

Nếu bạn muốn Anti-Twin không chỉ tìm kiếm các bản sao đầy đủ mà cả các tệp tương tự, bạn có thể giảm kết quả khớp tối thiểu mong muốn từ giá trị mặc định 100% xuống còn 60%. Chức năng này đã được thiết kế đặc biệt để tìm kiếm các tệp gần như giống hệt nhau, nơi chỉ một chi tiết nhỏ được thay đổi. Anti-Twin sử dụng tìm kiếm tương tự ngay khi bạn nhập giá trị dưới 100%. Việc so sánh tương tự mất nhiều thời gian hơn so với tìm kiếm trùng lặp đầy đủ 100%!

Thật không may, tìm kiếm tương tự như là một phần của so sánh byte theo byte chỉ có ý nghĩa đối với một vài loại tệp, bởi vì sự tương tự chỉ có thể được phát hiện nếu các tệp không được nén và không được mã hóa. Các tệp không nén là các văn bản không được định dạng (.TXT) và HTML.


Tôi đang sử dụng mac và chạy một thứ gì đó thông qua rượu vang, song song hoặc những thứ tương tự sẽ không giúp việc tái cấu trúc trở nên dễ dàng hơn, chỉ khó hơn :)
tig

@tig: Bạn nên đã chỉ định điều này trong bài viết của bạn. Tôi đã thêm thẻ mac.
harrymc

@Arjan: Tôi đã xóa bỏ câu trả lời này, như bạn yêu cầu.
harrymc

đúng vậy Đã xóa [mac]thẻ một lần nữa. Đáng lẽ ra [osx]dù sao đi nữa ;-)
Arjan
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.