Nguồn gốc của ký hiệu kiểu Wilkinson, chẳng hạn như (1 | id) cho các hiệu ứng ngẫu nhiên trong các công thức mô hình hỗn hợp trong R


16

Các công thức mô hình trong R như

y ~ x + a*b + c:d

được dựa trên cái gọi là ký hiệu Wilkinson : Wilkinson và Rogers năm 1973, Mô tả biểu tượng của các mô hình nhân tố để phân tích phương sai .

Bài viết này đã không thảo luận về các ký hiệu cho các mô hình hỗn hợp (có thể không tồn tại trước đó). Vì vậy, các công thức mô hình hỗn hợp được sử dụng trong lme4và các gói liên quan trong R như ở đâu

y ~ x + a*b + c:d + (1|school) + (a*b||town)

đến từ? Ai giới thiệu họ lần đầu tiên, và khi nào? Có bất kỳ điều khoản đã thỏa thuận như "ký hiệu Wilkinson" cho họ không? Tôi đặc biệt đề cập đến các điều khoản như

(model formula |  grouping variable)
(model formula || grouping variable)

Câu trả lời:


11

Ký hiệu |đã xuất hiện trong các nlmetài liệu kể từ phiên bản 3.1-1 và có lẽ là cuối năm 1999; chúng ta có thể dễ dàng kiểm tra xem trên kho lưu trữ mã CRAN nlme . nlmekhông sử dụng ký hiệu này, ví dụ thử library(nlme); formula(Orthodont); sự |xuất hiện - vì vậy những năm 2000 đã tắt. Vì vậy, hãy đào .... " Phương pháp đồ họa cho dữ liệu với nhiều cấp độ lồng nhau " Pinheiro & Bates (1997) trong đó groupedDatatrình xây dựng được giới thiệu. Và họ nói: " Công thức trong một đối tượng dữ liệu được nhóm có cùng mẫu với công thức được sử dụng trong lệnh gọi hàm chức năng đồ họa Trellis trong S-PLUS, chẳng hạn như xyplot " Điều này có nghĩa là P & B hoạt động. .. Bell Labs (RIP) đã phát triển hệ thống đồ họa Trellis thực sự sử dụng toán tử|đã chỉ ra các nhóm. Điều đó có thể có nghĩa là ... " Thiết kế trực quan và kiểm soát màn hình Trellis " của Becker et al. (1996) có một cái gì đó để làm với điều này. Ký hiệu không được giới thiệu trong bài viết này nhưng nó là tài liệu tham khảo hiển thị Trellis điện tử đầu tiên tôi có thể tìm thấy.

Về cơ bản chúng ta cần đào sâu văn học trực quan vào thời điểm này. Có lẽ tôi sẽ kiểm tra cuốn sách Visualization Data (1993) của Cleveland và các tác phẩm đầu tiên của Deepayan Sarkar (người đã phát triển lattice). Lưu ý rằng toán tử thực tế | (và ||) là các toán tử nguyên thủy thực sự vì chúng được liên kết với các ORtoán tử, vì vậy vấn đề chỉ là thời gian cho đến khi ai đó làm quá tải chúng. Mặc dù không có câu trả lời đầy đủ, tôi cực kỳ nghi ngờ P & B đã kiểm tra hệ thống trực quan tuyệt vời của đồng nghiệp của họ (các âm mưu trong bài báo năm 1996 này khá tốt cho các tiêu chuẩn cuối năm 2010) và nhận ra rằng ai đó (Becker, Cleveland và Shyu) đã thực hiện một số công việc này (có thể thậm chí đã thảo luận điều này với họ vào thời điểm đó) và chỉ theo dõi những gì đã có. Tức là|toán tử bắt nguồn từ ký hiệu đồ họa. Trellis gần như chắc chắn đã sử dụng nó; người tiền nhiệm tiềm năng của Trellis có thể cũng đã làm như vậy nhưng dấu chân điện tử của họ rất khó theo dõi.

Nói chung, tôi nghĩ rằng bạn có thể muốn trang này trên NLME: Phần mềm cho các mô hình hiệu ứng hỗn hợp của Bell Labs để biết thêm thông tin lịch sử nlme.


1
Cảm ơn rất nhiều! Đúng là nó nlmesử dụng |nhưng tôi không nghĩ nó dùng ()để biểu thị các hiệu ứng ngẫu nhiên, phải không? Các hiệu ứng ngẫu nhiên được liệt kê như là một đối số riêng cho lệnh gọi hàm. Có phải nó được lme4giới thiệu (x|id)như là một phần của cùng một công thức?
amip nói phục hồi Monica

2
Tôi nghĩ rằng bạn đang đọc quá nhiều vào sự hiện diện của dấu ngoặc đơn; Tôi hoàn toàn nghi ngờ rằng chúng tồn tại cho các mục đích phân tích cú pháp được đưa ra lme4sử dụng một cú pháp thống nhất cho tất cả các thuật ngữ. Ví dụ fm1 <- lmer(Reaction ~ Days | Subject, sleepstudy)hoạt động tốt mà không có dấu ngoặc đơn.
usεr11852 nói Phục hồi Monic

Oh. Thật. Đừng bao giờ nghĩ về nó theo cách này :)
amip nói rằng Rebstate Monica

Bates chỉ xác nhận rằng phần ngẫu nhiên được giới thiệu bởi các tác giả nlme (trong đó anh ta là một): twitter.com/BatesDmbates/status/1111283948615802881
Jonas Lindeløv

@ JonasLindeløv: Tuyệt! Cảm ơn đã chia sẻ, tôi sẽ tạo một liên kết đến câu trả lời vào tối mai.
usεr11852 nói Phục hồi Monic
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.