Sử dụng hồi quy tuyến tính phân đoạn làm bằng chứng cho giới hạn tuổi thọ của con người


8

Thiên nhiên công bố năm nay bài báo sau: Bằng chứng về giới hạn tuổi thọ của con người 1 , trong đó các tác giả cho rằng "kết quả của họ cho thấy rằng tuổi thọ tối đa của con người là cố định và chịu các ràng buộc tự nhiên."

Một trong những phân tích thống kê của bài báo này đã được đưa ra tại một số trang web, bao gồm bài báo Tự nhiên đã sai về giới hạn 115 năm đối với tuổi thọ của con ngườiBằng chứng về giới hạn đánh giá ngang hàng hiệu quả , vì nó xuất hiện trên một số phương tiện truyền thông phổ biến.

Nghiên cứu dựa trên một số điều, dựa trên dữ liệu từ cơ sở dữ liệu chi tiết về tuổi chết tối đa hàng năm. Trong số các phân tích của họ, con số sau đây được bao gồm :

http://www.nature.com/nature/journal/v538/n7624/images/nature19793-sf6.jpg

Về cơ bản, các tác giả cho rằng có một điểm dừng, và vì vậy họ đã thực hiện hồi quy phân đoạn trước khoảng năm 1995 và sau thời điểm đó trở đi. Hồi quy được sử dụng làm bằng chứng cho giới hạn tuổi thọ của con người.

Liệu nó có ý nghĩa mặc dù? Nếu không, phương pháp nào tốt hơn có thể được sử dụng để nghiên cứu những dữ liệu này?

[1] Đồng, Xiao, Brandon Milholland và Jan Vijg. "Bằng chứng cho một giới hạn cho tuổi thọ của con người." Thiên nhiên 538.7624 (2016): 257-259.


4
Hồi quy tuyến tính đối với extrema có vẻ kỳ lạ ... và rõ ràng là họ đã sử dụng hồi quy phân đoạn không liên tục, điều này là bất thường ...
kjetil b halvorsen

3
@kjetilbhalvorsen đồng ý. Extrema là những ví dụ nổi tiếng về dữ liệu vi phạm các giả định thông thường khá dữ dội. Tôi tự hỏi làm thế nào một thói quen khả năng tối đa cho dữ liệu Gumbel sẽ thực hiện ... bằng cách sử dụng kỹ thuật phân tích sinh tồn được đặt tên khéo léo .
AdamO

Câu trả lời:


2

Trước hết, hãy trích xuất thủ công các giá trị từ Hình 2 ban đầu của chúng và vẽ dữ liệu mà không có bất kỳ màu hoặc đường hồi quy nào thiên vị kiểm tra trực quan đầu tiên của chúng tôi về dữ liệu thô.

year <- c(1968, 1970, 1973, 1975, 1978, 1979, 1980, 1981, 1982, 
          1983, 1984, 1985, 1986, 1987, 1988, 1989, 1990, 1991, 
          1992, 1994, 1993, 1995, 1996, 1998, 1997, 1999, 2000, 
          2001, 2002, 2003, 2004, 2005, 2006)
age <- c(111, 111, 112, 111, 111, 110, 111, 113, 113, 113, 111, 
         114, 113, 114, 114, 112, 112, 112, 114, 115, 117, 112, 
         114, 115, 121, 119, 114, 115, 115, 114, 113, 114, 112)

plot(year,age,xlab="Year",
     ylab="Yearly maximum reported age at death (years)", 
     pch=20,cex=2,ylim=c(108,124),xlim=c(1960,2010))

Chúng tôi đạt được:

phân tán tuổi so với năm

Và, hãy làm tương tự cho dữ liệu trong Hình 6 (như được trình bày trong câu hỏi trên):

age <- c(113, 109, 109, 110, 113, 109, 110, 111, 111, 111, 
         112, 112, 113, 111, 111, 113, 113, 113, 114, 115, 
         113, 114, 122, 119, 117, 114, 115, 115, 114, 114, 
         115, 116, 115, 115, 114, 114, 116, 116, 117)
year <- c(1954, 1957, 1958, 1958, 1963, 1964, 1965, 1967,
          1968, 1970, 1975, 1972, 1976, 1976, 1977, 1980, 
          1981, 1982, 1984, 1985, 1986, 1987, 1997, 1998, 
          1998, 1999, 2001, 2001, 2002, 2003, 2006, 2006,
          2008, 2007, 2010, 2011, 2011, 2012, 2015)

plot(year,age,xlab="Year",
     ylab="MRAD from GRG", 
     pch=20,cex=2,ylim=c(108,124),xlim=c(1950,2020))

nhập mô tả hình ảnh ở đây

Có vẻ như một mô hình hồi quy tuyến tính đơn giản sẽ là ứng cử viên tự nhiên thách thức mô hình điểm thay đổi ít phức tạp hơn mà các tác giả đề xuất. Thật vậy, Philipp Berens và Tom Wallis đã làm như vậy và công bố phân tích lại của họ trên github: https://github.com/philippberens/lifespan


1
Bạn dường như đã phạm sai lầm khi lấy các giá trị từ hình - dữ liệu bị thiếu trong một số năm.
Scortchi - Phục hồi Monica

Hmm ... Theo Berens & Wallis , các tác giả giải thích rằng "việc thiếu mất tích là do thực tế là những người MRAD trẻ hơn Jeanne Calment, người đang giữ kỷ lục người già nhất thế giới vào thời điểm đó". Vì vậy, dữ liệu về những người khác, mỗi người trong số họ là người lớn tuổi nhất chết trong năm mất, bị bỏ qua do sự tiếp tục sống sót của một người lớn tuổi. Âm thanh như một công thức cho một điểm dừng!
Scortchi - Phục hồi Monica

2
Trong phiên bản đầu tiên của bài đăng, tôi chỉ đưa vào Hình 2. Tôi đã thêm dữ liệu từ Hình 6, trong đó chúng ta có thể thấy khoảng cách thảo luận.
Brandmaier

Lấy làm tiếc! Tôi đã cho rằng đó là con số tương tự như trong câu hỏi.
Scortchi - Phục hồi Monica

4

±

  1. Khái niệm về tuổi thọ tự nhiên xung đột với sự vượt trội của nghiên cứu về lão hóa, di truyền và telomere.
  2. Một thiết kế thử nghiệm để giải quyết tuổi thọ tự nhiên của con người là cần thiết bằng cách sử dụng công nghệ "cơ thể trên chip".
  3. 50 năm là hoàn toàn tầm thường trong quá trình lịch sử của loài người. Đã có nhiều điểm trong quá khứ, nơi một xu hướng tăng tuổi thọ được theo sau bởi một xu hướng giảm.
  4. Dữ liệu như những dữ liệu được trình bày có thể đã được mô phỏng từ một mô hình phi tuyến tính có sự không liên tục và / hoặc tiệm cận không thể đo lường được.
  5. Vì mục tiêu của mô hình là dự đoán, các giả định phân phối và tính chính xác của mô hình trung bình là cần thiết và không (có vẻ như) chúng không được kiểm tra cũng như không được đáp ứng.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.