Các lý do thống kê đằng sau việc xác định chỉ số BMI là cân nặng / chiều cao gì?


10

Có thể câu hỏi này có câu trả lời trong y học, nhưng có bất kỳ lý do thống kê nào tại sao chỉ số BMI được tính là không? Tại sao không ví dụ chỉ là ? Ý tưởng đầu tiên của tôi là nó có liên quan đến hồi quy bậc hai.weight/height2weight/height


Mẫu dữ liệu thực (200 cá nhân có cân nặng, chiều cao, tuổi và giới tính):

structure(list(Age = c(18L, 21L, 17L, 20L, 19L, 53L, 27L, 22L, 
19L, 27L, 19L, 20L, 19L, 20L, 42L, 17L, 23L, 20L, 20L, 19L, 20L, 
19L, 19L, 18L, 19L, 15L, 19L, 15L, 19L, 21L, 60L, 19L, 17L, 23L, 
60L, 33L, 24L, 19L, 19L, 22L, 20L, 21L, 19L, 19L, 20L, 18L, 19L, 
20L, 22L, 20L, 20L, 27L, 19L, 22L, 19L, 20L, 20L, 21L, 16L, 19L, 
41L, 54L, 18L, 23L, 19L, 19L, 22L, 18L, 20L, 19L, 25L, 18L, 20L, 
15L, 61L, 19L, 34L, 15L, 19L, 16L, 19L, 18L, 15L, 20L, 20L, 20L, 
20L, 19L, 16L, 37L, 37L, 18L, 20L, 16L, 20L, 36L, 18L, 19L, 19L, 
20L, 18L, 17L, 22L, 17L, 22L, 16L, 24L, 17L, 33L, 17L, 17L, 15L, 
18L, 18L, 16L, 20L, 29L, 24L, 18L, 17L, 18L, 36L, 16L, 17L, 20L, 
16L, 43L, 19L, 18L, 20L, 19L, 18L, 21L, 19L, 20L, 23L, 19L, 19L, 
20L, 24L, 19L, 20L, 38L, 18L, 17L, 19L, 19L, 20L, 20L, 21L, 20L, 
20L, 42L, 17L, 20L, 25L, 20L, 21L, 21L, 22L, 19L, 25L, 19L, 40L, 
25L, 52L, 25L, 21L, 20L, 41L, 34L, 24L, 30L, 21L, 27L, 47L, 21L, 
16L, 31L, 21L, 37L, 20L, 22L, 19L, 20L, 25L, 23L, 20L, 20L, 21L, 
36L, 19L, 21L, 16L, 20L, 18L, 21L, 21L, 18L, 19L), Height = c(180L, 
175L, 178L, 160L, 172L, 172L, 180L, 165L, 160L, 187L, 165L, 176L, 
164L, 155L, 166L, 167L, 171L, 158L, 170L, 182L, 182L, 175L, 197L, 
170L, 165L, 176L, 167L, 170L, 168L, 163L, 155L, 152L, 158L, 165L, 
180L, 187L, 177L, 170L, 178L, 170L, 170L, NA, 188L, 180L, 161L, 
178L, 178L, 165L, 187L, 178L, 168L, 168L, 180L, 192L, 188L, 173L, 
193L, 184L, 167L, 177L, 177L, 160L, 167L, 190L, 187L, 163L, 173L, 
165L, 190L, 178L, 167L, 160L, 169L, 174L, 165L, 176L, 183L, 166L, 
178L, 158L, 180L, 167L, 170L, 170L, 180L, 184L, 170L, 180L, 169L, 
165L, 156L, 166L, 178L, 162L, 178L, 181L, 168L, 185L, 175L, 167L, 
193L, 160L, 171L, 182L, 165L, 174L, 169L, 185L, 173L, 170L, 182L, 
165L, 160L, 158L, 186L, 173L, 168L, 172L, 164L, 185L, 175L, 162L, 
182L, 170L, 187L, 169L, 178L, 189L, 166L, 161L, 180L, 185L, 179L, 
170L, 184L, 180L, 166L, 167L, 178L, 175L, 190L, 178L, 157L, 179L, 
180L, 168L, 164L, 187L, 174L, 176L, 170L, 170L, 168L, 158L, 175L, 
174L, 170L, 173L, 158L, 185L, 170L, 178L, 166L, 176L, 167L, 168L, 
169L, 168L, 178L, 183L, 166L, 165L, 160L, 176L, 186L, 162L, 172L, 
164L, 171L, 175L, 164L, 165L, 160L, 180L, 170L, 180L, 175L, 167L, 
165L, 168L, 176L, 166L, 164L, 165L, 180L, 173L, 168L, 177L, 167L, 
173L), Weight = c(60L, 63L, 70L, 46L, 60L, 68L, 80L, 68L, 55L, 
89L, 55L, 63L, 60L, 44L, 62L, 57L, 59L, 50L, 60L, 65L, 63L, 72L, 
96L, 50L, 55L, 53L, 54L, 49L, 72L, 49L, 75L, 47L, 57L, 70L, 105L, 
85L, 80L, 55L, 67L, 60L, 70L, NA, 76L, 85L, 53L, 69L, 74L, 50L, 
91L, 68L, 55L, 55L, 57L, 80L, 98L, 58L, 85L, 120L, 62L, 63L, 
88L, 80L, 57L, 90L, 83L, 51L, 52L, 65L, 92L, 58L, 76L, 53L, 64L, 
63L, 72L, 68L, 110L, 52L, 68L, 50L, 78L, 57L, 75L, 55L, 75L, 
68L, 60L, 65L, 48L, 56L, 65L, 65L, 88L, 55L, 68L, 74L, 65L, 62L, 
58L, 55L, 84L, 60L, 52L, 92L, 60L, 65L, 50L, 73L, 51L, 60L, 76L, 
48L, 50L, 53L, 63L, 68L, 56L, 68L, 60L, 70L, 65L, 52L, 75L, 65L, 
68L, 63L, 54L, 76L, 60L, 59L, 80L, 74L, 96L, 68L, 72L, 62L, 58L, 
50L, 75L, 70L, 85L, 67L, 65L, 55L, 78L, 58L, 53L, 56L, 72L, 62L, 
60L, 56L, 82L, 70L, 53L, 67L, 58L, 58L, 49L, 90L, 58L, 77L, 55L, 
70L, 64L, 98L, 60L, 60L, 65L, 74L, 99L, 49L, 47L, 75L, 77L, 74L, 
68L, 50L, 66L, 75L, 54L, 60L, 65L, 80L, 90L, 95L, 79L, 57L, 70L, 
60L, 85L, 44L, 58L, 50L, 88L, 60L, 54L, 68L, 56L, 69L), Gender = c(1L, 
1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 1L, 2L, 1L, 2L, 
2L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 
1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 
1L, 2L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 
2L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 
1L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 2L, 1L, 1L, 2L, 1L, 
1L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 1L, 1L, 2L, 
1L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 
2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 
1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 
1L, 2L, 1L, 1L, 2L, 2L, 1L)), .Names = c("Age", "Height", "Weight", 
"Gender"), row.names = 304:503, class = "data.frame")

5
Ngày nay các công thức như thế này sẽ loại bỏ hồi quy tuyến tính của log (trọng lượng) so với log (chiều cao), mà (vì lý do sinh học và thống kê) là một cách tự nhiên hơn để phân tích các đại lượng này.
whuber

8
Tôi đã hy vọng minh họa điều này với dữ liệu thực. Lần truy cập đầu tiên của Google được tìm thấy trên "dữ liệu chiều cao cân nặng" là một bộ dữ liệu lớn được lưu trữ trên UCLA . Nó rõ ràng là giả mạo! Các phân phối biên được phân phối hoàn toàn bình thường (các thử nghiệm SW với các mẫu con 5000 hầu như luôn có giá trị p gần 1/2): không ngoại lệ, không bị tổn thương thấp (từ hỗn hợp giới tính), không bị lệch (từ hỗn hợp các độ tuổi). Những dữ liệu này được cho là "được sử dụng để phát triển ... biểu đồ tăng trưởng của Hồng Kông cho ... chỉ số khối cơ thể (BMI)." Điều đó cực kỳ tanh.
whuber

3
Cảm ơn, nhưng những dữ liệu đó có thể quá giới hạn để mang lại cảm giác tốt về cách thay đổi chiều cao và cân nặng. Tối thiểu họ cần được phân loại theo giới tính và độ tuổi. Tuy nhiên, rõ ràng là các logarit về chiều cao và cân nặng tốt hơn để phân tích: chúng làm giảm tính không đồng nhất mà @ttnphns đề cập và chúng cũng giúp phân phối phần dư đối xứng hơn. Điều thú vị là hồi quy trọng lượng log so với chiều cao log cho độ dốc . Điều đó so sánh gần như chính xác với ước tính của Quetelet là 5/2 được trích dẫn bởi AdamO. 5 / 2 = 2,52.55±0.285/2=2.5
whuber

4
So sánh library(MASS); rlm(log(Weight) ~ log(Height) + cut(Age, 3) + as.factor(Gender), data=y)với rlm(Weight ~ Height + cut(Age, 3) + as.factor(Gender), data=y)(và chẩn đoán cốt truyện cho cả hai sự phù hợp) để thấy hiệu quả nổi bật của việc sử dụng logarit: chúng thực sự ổn định và đối xứng với phần dư. Trong cả hai mô hình giới đều có ý nghĩa và tuổi tác cũng vậy; mối quan hệ với tuổi là phi tuyến. Điều rất thú vị là hệ số log (chiều cao) trong mô hình đầu tiên hiện ở khoảng thay vì . ( là dữ liệu của bạn với các giá trị bị thiếu đã bị xóa.) Tôi không thấy bất kỳ tương tác nào. 2.51.62.5y
whuber

3
@whuber, tôi đã thử mã của bạn với kích thước mẫu đầy đủ (n = 1336) và hệ số log (chiều cao) là khoảng 1,77.
Miroslav Sabo

Câu trả lời:


13

Đánh giá này, bởi Eknoyan (2007) có nhiều hơn bạn có thể muốn biết về Quetelet và phát minh của ông về chỉ số khối cơ thể.

Phiên bản ngắn là BMI trông phân phối bình thường, trong khi chỉ có cân nặng, hoặc cân nặng / chiều cao thì không, và Quetelet quan tâm đến việc mô tả một người đàn ông "bình thường" thông qua các phân phối bình thường. Cũng có một số đối số nguyên tắc đầu tiên, dựa trên cách mọi người phát triển, và một số công việc gần đây đã cố gắng liên hệ quy mô đó trở lại một số cơ chế sinh học.

Điều đáng chú ý là giá trị của BMI đang được tranh luận khá sôi nổi. Nó tương quan với độ béo khá tốt, nhưng mức giảm cho thiếu cân / thừa cân / béo phì không hoàn toàn phù hợp với kết quả chăm sóc sức khỏe.


10
Quan trọng hơn, ông đã xem xét weight/height^3điều này sẽ được hiểu là mật độ (theo trực giác có ý nghĩa), nhưng đã chọn chỉ số BMI cổ điển vì phân phối bình thường như bạn nói.
AdamO

4
@AdamO Tuy nhiên, người lớn thường chỉ phát triển ở 2 trong 3 chiều ...
James

10

Từ "Một chuyên luận về con người và sự phát triển của khoa" của Adolphe Quetelet:

Nếu con người tăng đều về mọi chiều, cân nặng của anh ta ở các độ tuổi khác nhau sẽ bằng khối lập phương chiều cao của anh ta. Bây giờ, đây không phải là những gì chúng ta thực sự quan sát. Việc tăng cân chậm hơn, ngoại trừ trong năm đầu tiên sau khi sinh; sau đó tỷ lệ chúng tôi vừa chỉ ra là khá thường xuyên được quan sát. Nhưng sau giai đoạn này, và cho đến gần tuổi dậy thì, cân nặng tăng gần bằng bình phương chiều cao. Sự phát triển của cân nặng một lần nữa trở nên rất nhanh ở tuổi dậy thì và gần như dừng lại sau năm thứ hai mươi lăm. Nói chung, chúng ta không sai lầm nhiều khi chúng ta cho rằng trong quá trình phát triển, bình phương cân nặng ở các độ tuổi khác nhau là sức mạnh thứ năm của chiều cao; điều này tự nhiên dẫn đến kết luận này, trong việc hỗ trợ hằng số trọng lực cụ thể, rằng sự tăng trưởng theo chiều ngang của con người nhỏ hơn so với phương thẳng đứng.

Xem ở đây .

Anh không quan tâm đến đặc điểm của béo phì nhưng mối quan hệ giữa cân nặng và chiều cao vì anh rất quan tâm đến sinh trắc học và đường cong hình chuông. Phát hiện của Quetelet chỉ ra rằng BMI có sự phân bố xấp xỉ bình thường trong dân số. Điều này biểu thị cho anh ta rằng anh ta đã tìm thấy mối quan hệ "chính xác". (thật thú vị, chỉ một hoặc hai thập kỷ sau, Francis Galton sẽ tiếp cận vấn đề "phân phối chiều cao" trong dân số và đồng xu với thuật ngữ "Hồi quy theo nghĩa").

Điều đáng chú ý là chỉ số BMI là một tai họa của sinh trắc học trong thời hiện đại vì nghiên cứu của Framingham đã vươn xa đến mức sử dụng BMI như một cách để xác định béo phì. Vẫn còn thiếu bất kỳ yếu tố dự báo tốt nào về béo phì (và kết quả liên quan đến sức khỏe của chúng). Tỷ lệ đo vòng eo / hông là một ứng cử viên đầy triển vọng. Hy vọng khi siêu âm trở nên rẻ hơn và tốt hơn, các bác sĩ sẽ sử dụng chúng để xác định không chỉ béo phì, mà cả chất béo và vôi hóa trong các cơ quan và đưa ra khuyến nghị chăm sóc dựa trên những điều đó.


1
Cụm từ "bình phương cân nặng ở các độ tuổi khác nhau là sức mạnh thứ năm của chiều cao" gợi ý cho tôi . Trong mọi trường hợp, trích dẫn không liên quan đến những người lớn khác nhau có chiều cao khác nhau mà là một cá nhân trong quá trình phát triển2.5
Henry

1
Quetelet đang suy luận về sự phát triển của cá nhân từ việc quan sát một mẫu dựa trên dân số. Tôi nghĩ rằng ông cũng bình luận thêm rằng, trung bình, một người có thể làm tốt với cân nặng và chiều cao theo cấp số nhân 2,5 (trên tất cả hoặc hầu hết các độ tuổi), nhưng cụ thể ở người lớn mối quan hệ là bậc hai.
AdamO

1
Tôi nghĩ rằng tỷ lệ giữa eo và hông thực sự được xem xét bởi Quetelet hoặc những người cùng thời với anh ta, nhưng cũng bị từ chối vì nó thường không được phân phối. Chúng ta đã đi được bao xa ....
Matt Krause

8

Ngày nay, BMI được sử dụng chủ yếu vì khả năng ước tính khối lượng mỡ nội tạng ở bụng, rất hữu ích trong việc nghiên cứu nguy cơ tim mạch. Đối với một nghiên cứu trường hợp phân tích mức độ đầy đủ của BMI trong sàng lọc bệnh tiểu đường, hãy xem Chương 15 của http://biostat.mc.vanderbilt.edu/CferenceBios330 trong Bản tin . Một số đánh giá là có. Bạn sẽ thấy rằng một sức mạnh tốt hơn về chiều cao là gần 2,5 nhưng bạn có thể làm tốt hơn so với việc sử dụng chiều cao và cân nặng.


2
Đây là một nhận xét tuyệt vời - nhưng dường như nó không giải quyết được câu hỏi yêu cầu "lý do thống kê" trong công thức BMI tiêu chuẩn.
whuber

1
Đó là trong trích dẫn Quetelet ở trên.
Frank Harrell
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.