Các cách để xây dựng lại các pixel bị xáo trộn của một tập tin video?


8

Giả sử rằng bạn có một tệp video mà thứ tự pixel đã được xáo trộn một lần. Đó là, một thứ tự ngẫu nhiên đã được xác định một lần và áp dụng cho tất cả các khung.

Có tồn tại một số cách tiếp cận đã biết để lấy thứ tự pixel ban đầu không?

Tôi có một số ý tưởng xung quanh việc truy xuất cấu trúc liên kết ban đầu bằng cách đặt các pixel mà các giá trị được tương quan trong không gian và thời gian gần nhau hơn. Tôi tự hỏi nếu điều này đã được nghiên cứu và nếu các thuật toán hiệu quả đã được công bố.

Ngoài ra, vấn đề này có thể được coi là một cách để chiếu lên ma trận 2D một tập hợp các giá trị thay đổi theo thời gian để có thể áp dụng các kỹ thuật thị giác máy tính (như CNN), với giả định rằng các giá trị này thực sự có tương quan với nhau.


1
Điều này có vẻ như một vấn đề đồ chơi hoặc thách thức hack? Ít nhất nó dường như không liên quan đến mã hóa video trong thế giới thực, bởi vì nó sẽ rất tệ cho băng thông và không an toàn lắm, trong khi mã hóa luồng byte bằng cách sử dụng, ví dụ AES rất nhanh và đáng tin cậy. Tôi cho rằng một câu hỏi ngay lập tức là: Bạn có dữ liệu thực tế và một vấn đề cần giải quyết, hoặc bạn đang hỏi một cách trừu tượng, không quan tâm?
Neil Slater

Đúng vậy, các ứng dụng tiềm năng không liên quan đến giải mã / hack nhưng thực sự nhắm đến việc áp dụng các kỹ thuật thị giác máy tính cho bất kỳ miền nào mà dữ liệu không được tổ chức dưới dạng hình ảnh ... bằng cách tổ chức dữ liệu dưới dạng hình ảnh. Vì vậy, nếu vấn đề đồ chơi có thể được giải quyết trên video, tôi tin rằng nó có thể có những phát triển thú vị được áp dụng cho dữ liệu phi 2D.
Denis Dollfus

Có vẻ thú vị, mặc dù tôi nghĩ rất nhiều trong một "thử nó và xem nếu nó hoạt động, tìm ra bất kỳ lý thuyết nào sau này". Không có lý do nào để tôi nghi ngờ rằng mối tương quan giữa các tính năng trong một tập dữ liệu tùy ý sẽ cho phép xây dựng một biểu đồ giống như lưới. Mặc dù đối với các tập dữ liệu đã làm sau đó tôi có thể thấy lý do có thể hữu ích khi sử dụng phân tích hình ảnh trên dữ liệu được sắp xếp lại. Việc có ai nhìn vào sự xáo trộn các pixel này hay không phụ thuộc vào việc nó có liên quan đến bất kỳ vấn đề hữu ích hay thú vị nào không - tôi không thể nghĩ ra một vấn đề, nhưng tôi không phải là nhà nghiên cứu. . .
Neil Slater

Tôi vừa gặp vấn đề tương tự nhưng trong bối cảnh khác nhau: dsp.stackexchange.com/questions/59808/ mẹo
Dilawar

Câu trả lời:


3

Đây là một vấn đề kết hợp hấp dẫn. Tôi sẽ làm nổi bật từng pixel bằng cách sử dụng quỹ đạo theo thời gian đầy đủ của nó, sau đó nhúng chúng vào lưới bằng cách sử dụng k lân cận gần nhất. Mục tiêu thực sự là tối đa hóa khả năng video là một chuỗi các hình ảnh tự nhiên (đời thực), bạn có thể kiểm tra bằng trình phân loại, nhưng bạn có thể thoát khỏi chỉ với chi phí mượt mà; nói, tổng của sự khác biệt giữa các pixel liền kề. Khi bạn đã bắt đầu điền vào lưới, các ràng buộc về độ mịn sẽ giảm không gian tìm kiếm (vì một pixel sẽ phải gần với nhiều pixel khác), do đó tăng tốc mọi thứ, giả sử bạn đang sử dụng cấu trúc dữ liệu hiệu quả để truy vấn hàng xóm gần nhất; xem ví dụ http://www.itu.dk/people/pagh/SSS/ann-benchmark/


4

Một giải pháp chung cho điều này không tồn tại, ngay cả khi chúng ta thêm một số giả định về sự phân bố của các màu, ví dụ như màu sắc trong hình ảnh hoặc khớp nối tạm thời, chẳng hạn như các khung liên tiếp là tương tự nhau.

Vấn đề

Đặt là khung gốc, mỗi khung có pixel. Đặt là hoán vị được áp dụng cho các pixel của mỗi khung trước khi chúng ta có được chúng. Bạn có thể nghĩ là cuốn sách mã của kẻ thù. n m P PF1,,FinmPP

Bây giờ, là đầu vào, chúng tôi đang nhận được . Mục tiêu là tìm hoán vị nghịch đảo để khôi phục lại hình ảnh. Do đó, là bản đồ nhận dạng và ví dụ . Lưu ý rằng chúng tôi không biết bất kỳ khung chính xác .Q Q P = I Q ( P ( F 1 ) ) = F 1 F iP(F1),,P(Fn)QQP=IQ(P(F1))=F1Fi

Hãy Làchức năng hoán vị có thể của các pixel .m ! mQ1,...,Qm!m!m

Mục đích là để chọn độc đáo Để .j{1,,m!}QjP=I

Không có giải pháp chung

Theo mô hình thống kê của chúng tôi, điều này có nghĩa là chọn giúp tối đa hóa khả năng được rút ra từ cùng một phân phối như thống kê tham chiếu cho hình ảnh và thống kê tạm thời giữa các khung liên tiếp và là kiến ​​thức trước đây của chúng tôi.QjQj(P(Fi))Qj(P(Fi)Qj(P(Fi+1)

Có một ví dụ đối lập chính tắc trong đó kẻ thù cung cấp cho bạn một bộ phim được xáo trộn với hai khung hình trong đó tất cả các pixel có cùng màu, vì vậy , và cho mỗi . Do đó, đối với tất cả , số liệu thống kê trong khung và giữa khung có thể được trang bị cho mỗi và không cung cấp cho chúng tôi thông tin nào để chọn hoán vị khả năng tối đa (trừ trường hợp suy biến trong đó ).n=2F1= =F2Qj(F1)= =Qj(F2)= =F1= =F2jjjQjm!= =1

Do đó, chúng tôi không thể đảm bảo tính duy nhất và vấn đề không thể giải quyết được nếu không có giả định thêm.

Giả định thêm

Thật thú vị để xem liệu chúng ta có thể giải quyết vấn đề bằng cách thêm nhiều ràng buộc hơn.

Nếu chúng ta hạn chế kẻ thù để chỉ gửi cho chúng tôi phim "thật" và giả sử có đủ pixel và khung khác nhau để sao cho độc đáo với khả năng tối đa tồn tại, chúng ta sẽ vẫn phải tính toán thống kê cho hoán vị khung để tìm tối đa.QjÔi(m!×n)

Đây là vũ lực phá mã.

Để hưởng lợi từ các mạng thần kinh và đặc biệt là lan truyền ngược, chúng ta sẽ cần một hàm mất khác biệt đối với đầu vào (là mã hóa của hoặc hoán vị của chúng ta ). Câu hỏi sau đó, sẽ là để xem nếu một chức năng như vậy có thể được tìm thấy.jQj

Mặt khác, vấn đề tương tự như phân tích mật mã trong trường hợp đặc biệt khi chúng ta biết rằng cuốn sách mã của kẻ thù là một hoán vị của văn bản rõ ràng (hoặc hình ảnh rõ ràng).


Việc đề cập đến kẻ thù khiến tôi tự hỏi liệu người ta có thể giả mạo một bộ phim tranh giành sẽ có hai giải pháp mà cả hai đều trông giống như phim thật hay không.
Denis Dollfus

Đây là cốt lõi của vấn đề tôi đang phải đối mặt ngay bây giờ: dsp.stackexchange.com/questions/59808/ Lần . Mặc dù tôi có thể cho rằng hoạt động (trong video được liên kết với bài đăng này) là miễn phí và được nhóm lại.
Dilawar
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.