Những trang web chia sẻ hình ảnh lộ số sê-ri máy ảnh?


26

Những trang web nào phơi bày số sê-ri thân máy ảnh từ ảnh gốc EXIF?

Flickr là một trang web chia sẻ ảnh hiển thị rất nhiều siêu dữ liệu ảnh (từ dữ liệu EXIF ) và thậm chí giúp bạn dễ dàng truy cập nhờ API Flickr . Picasaweb của Google cũng cung cấp một số thông tin từ EXIF ​​nhưng không phải số sê-ri.

Có bất kỳ trang web khác có thể giúp tôi?

Để biết thêm về những gì tôi đang làm, tôi đang cố gắng đối chiếu cơ sở dữ liệu về số sê-ri máy ảnh và URL của hình ảnh nơi chúng được tìm thấy. Đây chỉ là tôi làm một cái gì đó miễn phí với hy vọng chúng ta có thể bắt được một số người ăn cắp máy ảnh quý giá của chúng ta! Tôi hy vọng điều này không quá lạc đề vì tôi không cố bán bất cứ thứ gì, chỉ cố gắng làm một số điều tốt!

Tuyên bố miễn trừ trách nhiệm: Tôi là tác giả của stolencamerafinder ;)


Cập nhật - Theo yêu cầu của fbuchinger, đây là bản cập nhật nhanh về trạng thái dự án:

Nhiều trang web (bao gồm cả facebook không may) loại bỏ các makernote ra khỏi EXIF. Cho đến nay, tôi đã tìm thấy nguồn số sê-ri phong phú nhất là Flickr. Tôi cho rằng đó là vì mọi người thường tải lên hình ảnh kích thước đầy đủ (đọc "chưa được chỉnh sửa"). Trên trang web của tôi ( stolencamerafinder.com ) tôi cung cấp một ứng dụng webstart java thu thập dữ liệu flickr thông qua API của nó. Vì có giới hạn về tốc độ tôi thực hiện các cuộc gọi API, tôi đã viết nó để công việc được chia sẻ giữa số lượng máy khách khởi động web, do đó giảm băng thông và CPU trên máy khách càng nhiều người chạy nó. Nếu bạn đang đọc cái này và bạn có, giả sử, quản trị viên truy cập vào một máy chủ tại nơi làm việc không hoạt động nhiều, tại sao không để nó chạy trên đó;)

Tôi cũng đã viết một plugin Google Chrome để theo dõi các hình ảnh trên các trang web có số sê-ri được nhúng. Tôi không mong đợi một sản lượng rất cao từ ứng dụng này, ý tưởng chính là khám phá những trang web nào có thể là nguồn tốt để viết các công cụ gián điệp bespoke cho và sau đó thu thập chúng.

Tôi đã công khai API của mình cho stolencamerafinder và đang tìm kiếm các lập trình viên khác để giúp tôi viết các chương trình có thể đóng vai trò là trình thu thập dữ liệu web.

Tôi đã thu thập được nhiều dữ liệu thú vị khi thực hiện dự án này mà tôi sẽ sớm đưa lên trang web, chẳng hạn như các mẫu máy ảnh nào và không viết các số sê-ri hữu ích. Ví dụ, Nikon D50 chỉ ghi "D50" làm số sê-ri!

Tôi sẽ vô cùng biết ơn về bất kỳ phản hồi nào (tốt hay xấu!) Bạn có thể có về dự án của tôi.

-Matt


8
Có thể hữu ích hơn và có thể bán trên thị trường, sẽ cung cấp một dịch vụ để theo dõi những bức ảnh "của bạn" đã được sử dụng, có khả năng không có giấy phép.
Rowland Shaw

tôi đã cập nhật câu trả lời của mình
fbuchinger

Câu trả lời:


6

Tôi thích ý tưởng của một kẻ bắt trộm. ;)

Tôi đã nhận thấy rằng DeviantArt.com dường như "nắm bắt" tất cả các siêu dữ liệu EXIF ​​được nhúng trong bất kỳ hình ảnh được tải lên nào. Nó không hiển thị tất cả, tuy nhiên có một số phần của trang web (nhiều phần chỉ dành cho thành viên trả tiền) hiển thị thông tin chi tiết hơn về hình ảnh được tải lên và tôi đã thấy dữ liệu thẻ đầy đủ được liệt kê.

Tôi đoán, về mặt kỹ thuật, nếu bạn có thể làm điều gì đó tương tự như TinEye.com (Tìm kiếm hình ảnh ngược) lập chỉ mục hình ảnh và tìm kiếm theo độ tương tự nội dung. TinEye tiện dụng ở chỗ nó phù hợp với hình ảnh theo nội dung, nhưng nó có những hạn chế. Photomanipulation được tạo ra với một số hình ảnh có bản quyền rất khó xác định. Tìm kiếm theo số sê-ri sẽ cung cấp một cách tiếp cận thay thế, miễn phí.

Về mặt kỹ thuật, bạn có thể nhận được bất kỳ dữ liệu exif nào được nhúng trong hình ảnh được tải lên Internet. Nếu số sê-ri máy ảnh được nhúng, bạn sẽ có những gì bạn đang tìm kiếm. Bạn sẽ cần phải cạo một bản sao của từng hình ảnh từ các trang web mà bạn lập chỉ mục, trích xuất bất kỳ EXIF ​​(hoặc dữ liệu thẻ khác) từ các hình ảnh được lập chỉ mục và theo dõi thông tin bằng một liên kết trở lại nguồn. Bạn cũng có thể sử dụng các công cụ tìm kiếm lớn như Bing và Google để tìm hình ảnh để lập chỉ mục (tìm kiếm hình ảnh từ khóa cơ bản, chẳng hạn như tên nhiếp ảnh gia, địa điểm, v.v. có thể không cần phải giữ hình ảnh xung quanh (và làm như vậy có thể liên quan đến các vấn đề pháp lý), nhưng ít nhất bạn sẽ có một chỉ mục dữ liệu thẻ EXIF ​​/ IPTC, có thể là số sê-ri và liên kết nguồn.


1
Một lưu ý là, nếu ảnh bị thao túng theo bất kỳ cách nào thì EXIF ​​rất có thể bị xóa hoặc giảm. Tính khả dụng của dữ liệu EXIF ​​trên trang web chia sẻ ảnh và tìm kiếm hình ảnh chung hoàn toàn phụ thuộc vào nội dung meta hình ảnh được tải lên. Tuy nhiên, tìm kiếm khả năng của meta có thể được sử dụng để tìm kiếm máy ảnh bị đánh cắp là một ý tưởng tốt.
nik

@nik: Đúng, bạn sẽ cảm thấy xót xa cho bất cứ điều gì được tải lên ... Thật tệ khi công việc trong hầu hết các công cụ, như Photoshop, Lightroom, v.v. không lưu giữ dữ liệu thẻ qua các lần lưu và sửa đổi.
jrista

Cảm ơn đã chỉ ra tineye. Chúng có tới 1,6 tỷ hình ảnh khiến 0,3 triệu của tôi trông thật rác rưởi! Nhưng nếu họ làm được thì tôi cũng có thể! Tôi sẽ bắt tay vào việc viết một trình thu thập dữ liệu web chung chung hơn cho tất cả các trang web ...
matt đốt cháy

@matt: Đúng, họ có 1,6 tỷ, nhưng họ không tìm kiếm theo số sê-ri. Nếu bạn có thể tìm kiếm theo cả nội dung và số sê-ri, bạn sẽ có lợi thế với chúng. ; P
jrista

Lưu ý rằng trên nhiều trang web, bạn không thể truy cập tệp gốc trừ khi bạn có một số trạng thái thành viên hoặc kết nối với người dùng đã tải lên. Vì vậy, bạn chỉ có thể tải xuống phiên bản thu nhỏ mà thường có sọc EXIF. Công cụ tải lên đôi khi cũng làm điều đó, gửi tệp chỉ có thông tin bản quyền. Lưu ý: Facebook loại bỏ tất cả, thậm chí bản quyền từ EXIF ​​và đã nhận được rất nhiều sức nóng từ các nhiếp ảnh gia cho điều đó.
Itai

6

CẬP NHẬT:

Cảm ơn đã cập nhật trạng thái dự án! Trước hết, cách tiếp cận với ứng dụng webstart java rất thú vị - bạn có sử dụng các khóa api flickr khác nhau cho mỗi phiên bản webstart không hoặc flickr có giới hạn các yêu cầu api dựa trên kết hợp địa chỉ khóa / địa chỉ ip không?

Tôi đã chạy ứng dụng webstart của bạn và nó mang lại 0 số sê-ri sau khi quét 50 ảnh. Tôi đã không nhìn vào mã nguồn của bạn, nhưng bạn nên lưu ý rằng chỉ một số ít các máy quay (chủ yếu là dslrs) ghi số sê-ri vào siêu dữ liệu exif.

Tôi khuyên bạn nên tải xuống các hình ảnh mẫu từ Kho lưu trữ thông tin Meta của Phil Harvey và chạy exiftool trên đó để xem mô hình nào thực sự mang lại số sê-ri. Sau đó, bạn có thể thu hẹp tìm kiếm ứng dụng webstart của mình cho các mô hình này và do đó cải thiện tỷ lệ thành công cao.


Tôi vấp phải câu hỏi của bạn khi tôi mới bắt đầu khám phá photo.stackexchange.com.

2 năm trước, tôi có một ý tưởng rất giống với stolencamerafinder và thực sự bắt đầu thực hiện nó trong python. Tuy nhiên tôi đã dừng nó vì nhiều lý do:

  • Hầu hết các số sê-ri máy ảnh được lưu trữ trong dữ liệu EXIF ​​đều có thể chỉnh sửa và do đó có thể điều chỉnh được (ít nhất là với exiftool) -> có nguy cơ cảnh báo sai hoặc "spam số sê-ri" (ít nhất là khi dịch vụ bắt đầu phổ biến)

  • Hầu hết mọi người sử dụng trình tải lên hình ảnh thay đổi kích thước hình ảnh của họ và do đó thường loại bỏ tất cả hoặc nhiều phần của dữ liệu EXIF ​​(Hãy nhớ rằng serialnumber luôn được lưu trữ trong một số makernote exif độc quyền thường bị bỏ trong quá trình chuyển đổi hình ảnh) -> tỷ lệ hình ảnh được kiểm tra thấp : trích xuất số sê-ri.

tuy nhiên tôi tò mò làm thế nào dự án của bạn đã phát triển ... bạn có thể đưa ra một bản tóm tắt trạng thái ngắn không?


Chào. Tôi vừa thêm một bản cập nhật trong câu hỏi chính ở trên. Nếu bạn có bất kỳ câu hỏi / gợi ý nào tôi muốn nghe chúng. -Matt
matt đốt cháy

Tôi chỉ sử dụng một khóa API, nhưng mỗi phiên bản webstart giao tiếp qua trang web để cân bằng tải công việc để không vượt quá hạn ngạch.
matt đốt

Tôi lo ngại tại sao ứng dụng webstart không hoạt động với bạn. Nó sẽ tìm thấy serial trong khoảng 1/4 của tất cả các bức ảnh được quét. Có bất kỳ tin nhắn trong nhật ký giao diện điều khiển java? Tôi đã tải xuống những hình ảnh mẫu đó một cách ngắn gọn và viết một kịch bản python để tạo ra một số thống kê. Tôi sẽ đăng chúng trực tuyến sớm vì những người khác có thể thấy nó thú vị.
matt bị bỏng

6

Vì câu trả lời đầu tiên của tôi tập trung nhiều hơn vào các chi tiết kỹ thuật, tôi quyết định mở câu trả lời thứ hai để cung cấp cho bạn một số tổng quan về ý tưởng "máy quay phim" ban đầu của tôi có tên là "CATT" (Công cụ chống trộm máy ảnh). Vui lòng sử dụng ý tưởng của tôi, nhưng xin vui lòng cho tôi biết ...

Trái ngược với stolencamerafinder, CATT hoạt động trên cơ sở chọn tham gia. Là chủ sở hữu của một máy ảnh, bạn đăng ký tại trang CATT, tạo hồ sơ người dùng và sau đó đăng ký máy ảnh của bạn.

Để làm như vậy, bạn được yêu cầu chụp ảnh một số Mã QR được tạo ngẫu nhiên hiển thị trên màn hình. Sau đó, bạn tải ảnh chưa sửa đổi lên trang CATT. Khi tải lên hoàn tất, máy chủ sẽ đọc siêu dữ liệu của ảnh và kiểm tra số sê-ri được nhúng. Nó cũng cố gắng giải mã QRCode từ hình ảnh và so sánh nó với hàm băm được lưu trữ. Điều này là để ngăn người nào đó có thể đăng ký máy ảnh của bạn bằng cách chỉ cần tải lên một bức ảnh tùy ý chụp bằng máy ảnh đó.

Khi máy ảnh của bạn bị đánh cắp, bạn đăng nhập tại trang CATT và đánh dấu thiết bị đó là bị đánh cắp. Để theo dõi các máy ảnh bị đánh cắp, chúng tôi đã lên kế hoạch cho trình phân tích cú pháp số sê-ri exif phía máy khách trong javascript dưới dạng tập lệnh mozilla greasemonkey (tương tự như tiện ích mở rộng chrome của bạn). Nó chỉ nên thực thi trên các trang flickr có chứa hình ảnh gốc (nhờ hỗ trợ mẫu url của greasemonkey) để không làm chậm trình duyệt quá nhiều. Tập lệnh sẽ liên lạc với máy chủ CATT một cách thường xuyên để lấy danh sách các chuỗi cam bị đánh cắp. Nếu sê-ri của hình ảnh hiện đang hiển thị khớp, nó sẽ hiển thị cảnh báo.

Tôi thấy rằng tiện ích mở rộng chrome của bạn tuân theo một cách tiếp cận tương tự (mặc dù nó dường như chỉ thu thập các chuỗi). Trong trường hợp của bạn, tôi sẽ tận dụng tiện ích mở rộng với W3C File Api (hiện là Firefox và Chrome), để người dùng cũng có thể kiểm tra ảnh được lưu trữ cục bộ chứ không chỉ các ảnh được nhúng trong các trang web. Điều này chắc chắn sẽ làm tăng "thu hoạch số sê-ri" của bạn, bởi vì không có "người trung gian" (flickr facebook, v.v.) sẽ loại bỏ dữ liệu exif.

Dưới đây là bản demo Mozilla thú vị về Trích xuất Exif với API tệp W3C .


Cảm ơn rất nhiều vì điều này, một số thông tin và ý tưởng tuyệt vời. Mã QR là v. Thông minh. Tôi không chắc tôi hiểu API tệp hữu ích như thế nào đối với tôi theo cách bạn đề cập (người sẽ cho phép truy cập tệp cục bộ và có hình ảnh từ máy ảnh bị đánh cắp) nhưng đó chính xác là những gì tôi đang tìm cách viết đơn giản công cụ trích xuất nối tiếp cho trang chủ của trang web của tôi. Thay vì "Nhập số sê-ri của bạn" tôi chỉ có thể cho phép mọi người tìm kiếm với hình ảnh họ đã có (nó cũng ngăn ngừa các lỗi). Một lợi thế khác là đôi khi tôi phải sử dụng số sê-ri nội bộ làm ID chứ không phải số trên hộp máy ảnh.
matt đốt

Ngẫu nhiên, trang demo đó chỉ hoạt động với tôi trong firefox, không phải Chrome. Tôi cũng bắt đầu nghĩ rằng trang này không lý tưởng để thảo luận về tất cả những điều này nhưng nó sẽ làm ngay bây giờ! ps. Tôi đang đi du lịch qua châu Á vào lúc này vì vậy đừng bị xúc phạm nếu tôi mất vài ngày (/ tuần) để trả lời, những bình luận của bạn rất hữu ích với tôi, cảm ơn.
matt bị bỏng

bản demo exif reader hoạt động trong chrome> 5, lỗi là do chức năng ghi nhật ký không cần thiết (kiểm tra trong bảng điều khiển chrome và xác định lại nó là func trống). Chúc bạn đi du lịch vui vẻ!
fbuchinger

Về trường hợp sử dụng tệp cục bộ: Tôi nghĩ chúng tôi có ý nghĩa tương tự - trích xuất nối tiếp js cam cho các tệp cục bộ là một phần của trang web stolencamerafinder của bạn, không nhất thiết phải là tiện ích mở rộng. Nó có thể được sử dụng để xác định trạng thái cam dựa trên một số ảnh mẫu (ví dụ: được chụp trong khi mua một cam đã sử dụng để đảm bảo nó không bị đánh cắp từ người khác). BTW: bạn đã tự mình mở rộng trình phân tích cú pháp Exif của Jacob Seidelin hay là trích xuất số sê-ri công việc của anh ấy?
fbuchinger

Tôi đã tự mở rộng trình phân tích cú pháp của mình nhưng chỉ có thể đọc được phần đọc makernote của Canon và Panasonic. (kiến thức của tôi về định dạng IFD là kém nhất). Tôi cần phải cung cấp cho anh ta tín dụng thích hợp cho công việc của mình trên trang web của tôi vì đó chủ yếu là công việc của anh ta. Khi tôi hài lòng với các chỉnh sửa của mình, tôi sẽ gửi lại cho anh ấy như một phiên bản cải tiến / thay thế có thể.
matt đốt cháy
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.