Mức độ khác biệt giữa mối tương quan và mối quan hệ nhân quả có liên quan đến Google?


21

Bối cảnh

Một câu hỏi phổ biến trên trang web này là " Những tội lỗi thống kê phổ biến là gì? ". Một trong những tội lỗi được đề cập là giả định rằng liên kết "tương quan hàm ý nhân quả ..."

Sau đó, trong các bình luận với 5 lượt upvote, có ý kiến ​​cho rằng: "Google kiếm được 65 tỷ đô la một năm không quan tâm đến sự khác biệt".

Có nguy cơ phân tích quá mức một quip ánh sáng, tôi nghĩ rằng đây có thể là một điểm thảo luận hữu ích để làm sáng tỏ sự khác biệt giữa tương quan và nguyên nhân và sự liên quan thực tế của sự khác biệt; và có lẽ nó có thể làm nổi bật một cái gì đó về mối quan hệ giữa học máy và sự khác biệt giữa tương quan và nguyên nhân.

Tôi cho rằng nhận xét đang giải quyết các công nghệ làm nền tảng cho việc tạo ra kết quả của công cụ tìm kiếm và các công nghệ liên quan đến hiển thị quảng cáo.

Câu hỏi

  • Mức độ khác biệt giữa tương quan và quan hệ nhân quả có liên quan đến việc tạo thu nhập của Google, có lẽ tập trung đặc biệt vào việc tạo thu nhập thông qua các công nghệ liên quan đến hiển thị quảng cáo và kết quả tìm kiếm chất lượng?

Thật buồn cười, tôi đã xem bình luận đó sớm hơn một chút.
Lặp lại

2
Blog của Revolutions đã có một bài đăng vào tuần trước về cách Google sử dụng R để làm cho quảng cáo trực tuyến hiệu quả hơn . Thật không may, họ không đi vào quá nhiều chi tiết ...
nico

Câu trả lời:


13

Câu trả lời đơn giản là Google (hoặc bất kỳ ai) nên quan tâm đến sự khác biệt đến mức mà họ dự định can thiệp . Kiến thức nhân quả cho bạn biết về tác động của các can thiệp (hành động) trong một miền nhất định.

Ví dụ: nếu Google muốn tăng tỷ lệ nhấp vào quảng cáo, tăng số lượng người dùng GMail hoặc Google+ hoặc khiến người dùng sử dụng Google thay vì Bing, thì họ cần biết tác động của các hành động tiềm năng (ví dụ: tăng kích thước phông chữ của quảng cáo, quảng cáo Google+ trên tạp chí in hoặc công khai sự khác biệt giữa kết quả tìm kiếm của Google và Bing, tương ứng). Tương quan là đủ tốt để làm cho công cụ tìm kiếm của Google hoạt động tốt, nhưng đối với các hệ thống khác của họ (và toàn bộ hoạt động kinh doanh của họ), sự khác biệt thường là vấn đề.

Điều đáng chú ý là Google (và nhiều công ty có doanh nghiệp dựa trên web) liên tục chạy thử nghiệm trực tuyến. Đây là cách đơn giản nhất và tốt nhất để xác định và ước tính phụ thuộc nguyên nhân.


(+1) miễn là các yếu tố dự đoán a) tương quan và b) cho phép dự đoán kết quả trong tương lai một cách chính xác, người ta không nên quan tâm đến nguyên nhân.
steffen

2
Chúng ta đang bước vào kỷ nguyên hồi sinh của nghiên cứu thực nghiệm về khoa học hành vi. Trong những năm 1950, gần như tất cả các thống kê là nghiên cứu thử nghiệm, với các ứng dụng trong nông nghiệp. Nhưng vào khoảng những năm 1980, mọi người đã nhận ra những kỹ thuật này không giúp ích nhiều cho dữ liệu quan sát, đó là tất cả những gì bạn có thể làm trong hầu hết các ngành khoa học xã hội. Bây giờ, ít nhất là trong các lĩnh vực nghiên cứu tiếp thị trực tuyến, nếu bạn là Amazon hoặc Google hoặc Bing, bạn có thể chạy thử nghiệm và có được hình thức suy luận nguyên nhân rõ ràng nhất có thể.
StasK

@StasK, Xem xét kích thước mẫu mà họ có khả năng xử lý ngay cả một thử nghiệm "ngắn" mà họ có khả năng tạo ra kết quả rất hữu ích. Thật là một kho báu phải có.
Brandon Bertelsen

Thật thú vị khi lưu ý rằng cơ sở "nhóm" của Google thực sự rất nghèo. Kiểu như họ đã xây dựng một cơ sở thảo luận nhóm có tương quan với việc tốt, nhưng họ không tìm ra nguyên nhân nào khiến một cơ sở thảo luận nhóm trở nên tốt. Nhưng đây là một vấn đề phổ biến trong tiếp thị - tất cả các tính năng quá thường xuyên của các sản phẩm cạnh tranh được sao chép mà không hiểu động cơ cơ bản của các tính năng.
Daniel R Hicks

1
@StasK: Thế giới thực có lẽ không lý tưởng như bạn giả vờ ở đây. Tôi đồng ý rằng các thí nghiệm là một công cụ tuyệt vời để thực hiện suy luận nguyên nhân. Tuy nhiên, các thí nghiệm cũng nêu ra những vấn đề cụ thể Đôi khi có thể tốt hơn là đưa ra những suy luận nguyên nhân bằng một nghiên cứu quan sát hơn là với một thí nghiệm. Một lời chỉ trích có thể là ý nghĩa của kết quả từ các thí nghiệm được kiểm soát có thể được khái quát thành cài đặt "thực tế sống". Một số tác giả gọi đây là "hiệu lực bên ngoài".

6

Đầu tiên, nó chỉ là một quip và không chính xác. Google có rất nhiều nhà thống kê rất tài năng, chuyên gia phục hồi thông tin, nhà ngôn ngữ học, nhà kinh tế học, một số nhà tâm lý học và những người khác. Những người này dành nhiều thời gian để giáo dục rất nhiều người không thống kê về sự khác biệt giữa mối tương quan và mối quan hệ nhân quả. Cho rằng đó là một tổ chức lớn, có thể có túi, thậm chí túi lớn, thiếu hiểu biết, nhưng khẳng định chắc chắn là sai. Hơn nữa, rất nhiều nền giáo dục đó phải đối mặt với khách hàng, đặc biệt là các nhà quảng cáo.

Câu trả lời sâu sắc hơn: Sự khác biệt là vô cùng quan trọng. Chỉ cần nhìn vào xếp hạng kết quả tìm kiếm và cho phép tôi mở rộng ra ngoài "tương quan" để bao gồm các biện pháp tương tự, chức năng cho điểm, v.v. Một số trang được đo lường là kết quả tốt cho một số truy vấn nhất định. Chúng có nhiều tính năng dự đoán rất quan trọng đối với thứ hạng của chúng. Ngược lại với các trang tốt có kết quả tốt cho các truy vấn này là một tập hợp các trang web là các trang có kết quả rất tệ cho cùng một truy vấn. Tuy nhiên, những người tạo ra những trang đó đã dành rất nhiều nỗ lực để làm cho chúng trông giống như những trang tốt theo quan điểm số, chẳng hạn như kết hợp văn bản, liên kết internet, v.v. Tuy nhiên, chỉ vì các trang này "tương tự" với các trang tốt không có nghĩa là trên thực tế, đây là những trang tốt. Do đó, Google đã đầu tư và sẽ tiếp tục đầu tư rất nhiều nỗ lực để xác định những tính năng hợp lý nào phân biệt (riêng biệt) trang tốt và xấu.

Điều này không hoàn toàn tương quan và quan hệ nhân quả, nhưng nó sâu sắc hơn thế. Các trang tốt cho một số truy vấn nhất định có thể ánh xạ vào một không gian số nơi chúng xuất hiện tương tự và khác biệt với nhiều trang không liên quan hoặc xấu, nhưng chỉ vì các kết quả nằm trong cùng một vùng của không gian tính năng không có nghĩa là chúng đến từ cùng một tập hợp con "chất lượng cao" của trang web.

Câu trả lời đơn giản hơn: Một viễn cảnh rất đơn giản là giải quyết thứ hạng của kết quả. Kết quả tốt nhất nên là đầu tiên, nhưng chỉ vì thứ gì đó được xếp hạng đầu tiên không có nghĩa đó là kết quả tốt nhất. Theo một số số liệu về tính điểm, bạn có thể thấy rằng xếp hạng của Google tương quan với tiêu chuẩn vàng về đánh giá chất lượng, nhưng điều đó không có nghĩa là xếp hạng của họ ngụ ý rằng kết quả thực sự theo thứ tự này về chất lượng và mức độ phù hợp.

Cập nhật (câu trả lời thứ ba): Theo thời gian, có một khía cạnh khác ảnh hưởng đến tất cả chúng ta: đó là kết quả hàng đầu của Google có thể được coi là có thẩm quyền, bởi vì đó là kết quả hàng đầu trên Google. Mặc dù phân tích liên kết (ví dụ: "PageRank" - một phương pháp để phân tích liên kết) là một nỗ lực phản ánh sự cho phép nhận thức, theo thời gian, các trang mới về một chủ đề có thể đơn giản củng cố cấu trúc liên kết đó bằng cách liên kết với kết quả hàng đầu trên Google. Một trang mới có thẩm quyền hơn có vấn đề với phần đầu liên quan đến kết quả đầu tiên. Vì Google muốn cung cấp trang phù hợp nhất hiện nay , một loạt các yếu tố, bao gồm cả hiện tượng được gọi là "giàu làm giàu", phát sinh do ảnh hưởng ngầm của mối tương quan đối với quan hệ nhân quả.

Cập nhật (câu trả lời thứ tư): Tôi nhận ra (đối với một bình luận bên dưới) rằng có thể hữu ích khi đọc Allegory of the Cave của Plato để hiểu cách giải thích mối tương quan và nguyên nhân như là kết quả của "phản xạ / dự đoán" của thực tế & cách chúng tôi (hoặc máy móc của chúng tôi) nhận thức nó. Tương quan, bị giới hạn nghiêm ngặt trong Tương quan của Pearson, quá hạn chế như một cách giải thích về vấn đề liên kết hiểu lầm (rộng hơn là chỉ tương quan) và quan hệ nhân quả.


Tôi không đồng ý. Nếu ai đó lạm dụng các yếu tố dự đoán để tạo thứ hạng trang cao nhân tạo, thì mục tiêu ngụ ý các yếu tố dự đoán, ngược lại với những gì google dự định khi tạo thuật toán xếp hạng trang. Vì số liệu thực sự vẫn giữ nguyên ("trang bên phải", theo đó thứ hạng trang chỉ là xấp xỉ), nên các yếu tố dự đoán sẽ mất tương quan và do đó phải thay đổi. Do đó, google không quan tâm đến quan hệ nhân quả liên quan đến số liệu thực sự "trang bên phải", nhưng đối với số liệu gần đúng được gọi là thứ hạng trang.
steffen

Không xúc phạm, nhưng bạn có vẻ hơi bối rối về một số vấn đề. "PageRank" là một khái niệm được xác định rõ ràng và chỉ là một yếu tố dự đoán. Vấn đề chính bạn đang xem xét là quy trình công nghiệp liên quan đến việc xác định và tạo một bộ đào tạo cũng như phù hợp với mong đợi của người dùng. Thật không may, các ý kiến ​​là một nơi khủng khiếp để bắt đầu một giới thiệu dài về học máy ứng dụng.
Lặp lại

Bạn có nghĩa là trong quá trình tạo ra dự đoán và đánh giá bởi kiến ​​thức chuyên môn chỉ có "dự đoán nhân quả" được tạo ra? Miễn là một người tuân theo quy trình như vậy và không rơi vào phương pháp thử và sai, bạn đã đúng, google quan tâm;).
steffen

Bạn khá đúng. Vấn đề là theo thời gian, nó trở nên vô cùng khó khăn để cố gắng nói ra những dự đoán phản ánh quan hệ nhân quả khi có những kẻ thù cản trở bạn. Nếu một người dự đoán không có một loại giải thích nguyên nhân nào đó (vì chúng hiếm khi thực sự là nguyên nhân trong tự nhiên), thì thật khó để biện minh khi các baddies tiến hóa và làm nhòe khu vực của không gian dự đoán.
Lặp lại

2
@Brandon: Không đùa đâu. Điều này là tốt nhất khi tôi cố gắng tìm kiếm các sự kiện gần đây hoặc các sự kiện sắp tới. Thường xuyên hơn, tôi phải nhập năm hiện tại hoặc thậm chí là MM-YYYY hiện tại (hoặc thực hiện tìm kiếm nâng cao) để có được các trang có liên quan. Đó là một sự đánh đổi giữa cấu trúc liên kết và sự mới mẻ và Google đã hiểu sai mà không cần thêm sự giúp đỡ từ tôi. Trong thực tế, điều đó đã dẫn tôi đến Bing một vài lần, vì khó chịu với việc cố gắng bỏ qua các trang cũ. Điều tương tự cũng đúng trên SO: các câu trả lời đầu tiên thường có vẻ nhận được nhiều sự ủng hộ hơn các câu trả lời sau, điều này có thể đúng hơn. :)
Lặp lại

5

Tác giả của quip đây.

Nhận xét này được lấy cảm hứng một phần từ cuộc nói chuyện của David Mease (tại Google), nơi ông nói, và tôi diễn giải, các công ty bảo hiểm xe hơi không quan tâm nếu là nam gây ra nhiều tai nạn, miễn là tương quan, họ phải tính phí nhiều hơn. Trên thực tế, không thể thay đổi giới tính của ai đó trong một thử nghiệm, vì vậy nguyên nhân không bao giờ có thể được hiển thị.

Theo cùng một cách, Google không thực sự cần quan tâm nếu màu đỏ khiến ai đó nhấp vào quảng cáo, nếu tương quan với nhiều nhấp chuột hơn, họ có thể tính phí nhiều hơn cho quảng cáo đó.

Nó cũng được lấy cảm hứng từ bài viết này trong Wired: The End of Theory: The Data Deluge làm cho phương pháp khoa học trở nên lỗi thời . Một câu trích dẫn:

"Triết lý sáng lập của Google là chúng tôi không biết tại sao trang này tốt hơn trang đó: Nếu số liệu thống kê về các liên kết đến nói rằng, điều đó là đủ tốt."

Rõ ràng, Google có nhiều người rất thông minh biết sự khác biệt giữa quan hệ nhân quả và tương quan, nhưng trong trường hợp của họ, họ có thể kiếm được nhiều tiền mà không quan tâm đến nó.


1
Để giải thích ... Như tôi đã đề cập, có rất nhiều người ở Google thực sự quan tâm đến nó, cũng như David Mease. (Btw, anh ấy không ở Stanford, trừ khi có tin tức tôi bỏ lỡ; có lẽ bạn đã tham gia khóa học năm 2007 của anh ấy?) Nhưng, bạn nói đúng là nhiều người không biết động cơ đốt trong hoạt động như thế nào, nó không ảnh hưởng khả năng lái xe của họ. Các kỹ sư và nhà nghiên cứu ô tô giỏi, tuy nhiên, làm cho nó hoạt động tốt hơn bởi vì họ làm. Điều tương tự cho các kỹ sư & nhà nghiên cứu tại Google. Thật không may, bài báo Wired đó không phải là bài trình bày rõ ràng nhất về luận án của Norvig.
Lặp lại

Cảm ơn Neil cho bối cảnh. Tôi hy vọng bạn không phiền tôi sử dụng bình luận của bạn như nguồn cảm hứng cho một câu hỏi.
Jeromy Anglim

@jeromy, hoàn toàn không
Neil McGuigan

1

Tôi đồng ý với David : Sự khác biệt là vấn đề nếu bạn có ý định can thiệp và Google có thể kiểm tra kết quả can thiệp bằng cách chạy thử nghiệm có kiểm soát. (Lịch trình tối ưu của các thử nghiệm như vậy phụ thuộc vào tập hợp các giả thuyết nguyên nhân mà bạn học được từ các thử nghiệm trước đó cộng với dữ liệu quan sát , do đó, mối tương quan vẫn hữu ích!)

Có một lý do thứ hai Google có thể muốn tìm hiểu các mối quan hệ nhân quả. Mối quan hệ nhân quả mạnh mẽ hơn đối với sự can thiệp của người chơi khác . Các can thiệp có xu hướng cục bộ, vì vậy chúng có thể thay đổi một phần của mạng lưới nhân quả nhưng không thay đổi tất cả các cơ chế nhân quả khác. Ngược lại, các mối quan hệ dự đoán có thể thất bại nếu một liên kết nhân quả ở xa bị phá vỡ. Internet liên tục thay đổi và Google nên quan tâm đến các tính năng của môi trường trực tuyến mạnh mẽ hơn đối với những thay đổi đó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.