Có rất nhiều sự tinh tế giữa ý nghĩa của tích chập và tương quan. Cả hai đều thuộc về ý tưởng rộng hơn về các sản phẩm bên trong và các hình chiếu trong đại số tuyến tính, tức là chiếu một vectơ lên một vectơ khác để xác định mức độ "mạnh" của nó theo hướng sau.
Ý tưởng này mở rộng sang lĩnh vực mạng thần kinh, nơi chúng tôi chiếu một mẫu dữ liệu lên từng hàng của ma trận, để xác định mức độ "phù hợp" của hàng đó. Mỗi hàng đại diện cho một lớp đối tượng nhất định. Ví dụ: mỗi hàng có thể phân loại một chữ cái trong bảng chữ cái để nhận dạng chữ viết tay. Người ta thường gọi mỗi hàng là một nơron, nhưng nó cũng có thể được gọi là bộ lọc phù hợp.
Về bản chất, chúng tôi đang đo lường mức độ tương tự của hai thứ hoặc cố gắng tìm một tính năng cụ thể trong một thứ gì đó, ví dụ như tín hiệu hoặc hình ảnh. Ví dụ: khi bạn kết hợp tín hiệu với bộ lọc thông dải, bạn đang cố gắng tìm hiểu nội dung của nó trong băng tần đó. Khi bạn tương quan tín hiệu với hình sin, ví dụ DFT, bạn đang tìm kiếm cường độ của tần số hình sin trong tín hiệu. Lưu ý rằng trong trường hợp sau, mối tương quan không trượt, nhưng bạn vẫn "tương quan" hai điều. Bạn đang sử dụng một sản phẩm bên trong để chiếu tín hiệu lên hình sin.
Vậy thì, sự khác biệt là gì? Chà, xem xét rằng với tích chập, tín hiệu ngược với bộ lọc. Với tín hiệu thay đổi theo thời gian, điều này có tác dụng là dữ liệu được tương quan theo thứ tự nó đi vào bộ lọc. Hiện tại, hãy xác định mối tương quan đơn giản là một sản phẩm chấm, tức là chiếu một thứ lên một thứ khác. Vì vậy, khi bắt đầu, chúng ta tương quan phần đầu tiên của tín hiệu với phần đầu tiên của bộ lọc. Khi tín hiệu tiếp tục qua bộ lọc, mối tương quan trở nên hoàn thiện hơn. Lưu ý rằng mỗi phần tử trong tín hiệu chỉ được nhân với phần tử của bộ lọc mà nó "chạm" vào thời điểm đó.
Vì vậy, với sự tích chập, chúng ta có mối tương quan theo một nghĩa nào đó, nhưng chúng ta cũng đang cố gắng duy trì trật tự kịp thời khi những thay đổi xảy ra khi tín hiệu tương tác với hệ thống. Tuy nhiên, nếu bộ lọc đối xứng, như thường lệ, nó không thực sự quan trọng. Kết hợp và tương quan sẽ mang lại kết quả tương tự.
Với mối tương quan, chúng tôi chỉ so sánh hai tín hiệu và không cố gắng duy trì thứ tự các sự kiện. Để so sánh chúng, chúng tôi muốn chúng đối mặt theo cùng một hướng, nghĩa là xếp hàng. Chúng tôi trượt một tín hiệu này sang tín hiệu khác để chúng tôi có thể kiểm tra độ tương tự của chúng trong mỗi cửa sổ thời gian, trong trường hợp chúng lệch pha với nhau hoặc chúng tôi đang tìm kiếm tín hiệu nhỏ hơn trong tín hiệu lớn hơn.
Trong xử lý hình ảnh, mọi thứ có một chút khác biệt. Chúng tôi không quan tâm đến thời gian. Convolution vẫn có một số tính chất toán học hữu ích . Tuy nhiên, nếu bạn đang cố khớp các phần của hình ảnh lớn hơn với hình nhỏ hơn (nghĩa là lọc phù hợp), bạn sẽ không muốn lật nó vì sau đó các tính năng sẽ không được xếp hàng. Trừ khi, tất nhiên, bộ lọc là đối xứng. Trong xử lý ảnh, sự tương quan và tích chập đôi khi được sử dụng thay thế cho nhau, đặc biệt là với các mạng lưới thần kinh . Rõ ràng, thời gian vẫn có liên quan nếu hình ảnh là một biểu diễn trừu tượng của dữ liệu 2 chiều, trong đó một chiều là thời gian - ví dụ: phổ.
Vì vậy, tóm lại, cả tương quan và tích chập đều là các sản phẩm bên trong trượt, được sử dụng để chiếu một thứ lên một thứ khác khi chúng thay đổi theo không gian hoặc thời gian. Convolution được sử dụng khi thứ tự là quan trọng và thường được sử dụng để chuyển đổi dữ liệu. Tương quan thường được sử dụng để tìm một thứ nhỏ hơn bên trong một thứ lớn hơn, tức là để khớp. Nếu ít nhất một trong hai "thứ" đối xứng, thì việc bạn sử dụng là gì.