Là tần số alen quan sát được ít hơn đáng kể so với dự đoán?


10

Câu hỏi : Làm thế nào tôi có thể xây dựng một thử nghiệm để xác định xem tần số "núi" quan sát được (Hình 1) thấp hơn đáng kể ở vùng núi trung tâm đến phía nam so với dự đoán (Hình 2) theo mô hình lựa chọn sinh thái ( xem bên dưới để biết chi tiết )?

Vấn đề : Suy nghĩ ban đầu của tôi là hồi quy các phần dư của mô hình so với vĩ độ: kinh độ và độ cao (điều này chỉ dẫn đến sự tương tác giữa vĩ độ và kinh độ là đáng kể). Vấn đề là phần dư (Hình 3) có thể phản ánh sự biến đổi không được giải thích bởi mô hình và / hoặc đó là điều gì đó xảy ra về mặt sinh học, ví dụ alen không có thời gian để lan xuống phía nam đến tiềm năng của nó hoặc có một số rào cản đối với dòng gen. Nếu bạn so sánh tần số alen núi (Hình 1) so với dự kiến ​​(Hình 2), có một sự khác biệt rõ ràng, đặc biệt là ở vùng núi trung tâm đến phía nam của Thụy Điển và Na Uy. Tôi chấp nhận rằng mô hình có thể không giải thích tất cả các biến thể, nhưng tôi có thể đưa ra một thử nghiệm hợp lý để khám phá ý tưởng rằng alen núi không đạt được tiềm năng của nó ở vùng núi trung tâm đến miền nam không?

Lý lịch: Tôi có một điểm đánh dấu AFLP hai chiều có phân bố tần số dường như được liên kết với núi (và vĩ độ: kinh độ) so với môi trường sống ở vùng đất thấp trên bán đảo Scandinavi (Hình 1). "Núi" -allele gần như cố định ở phía bắc, đó là miền núi. Nó gần như vắng mặt hoặc cố định cho "vùng đất thấp" -allele ở phía nam, nơi thiếu những ngọn núi. Khi một người di chuyển từ bắc xuống nam trong dãy núi, "núi" -allele xảy ra với tần suất thấp hơn. Sự khác biệt về tần số "núi" -allele từ Bắc tới Nam có thể đơn giản là do thực vật học hoặc quá trình lịch sử, vì khu vực này được thuộc địa từ cả phía bắc và phía nam. Ví dụ, nếu alen núi bắt nguồn từ dân số phía bắc, có lẽ nó đã không có thời gian để mở rộng hoàn toàn vào dân số phía nam,

Giả thuyết làm việc của tôi là tần số "núi" -allele là kết quả của chọn lọc sinh thái (giả thuyết null là chọn lọc trung tính).

Đối với mô hình lựa chọn sinh thái của tôi, tôi đã sử dụng mô hình phụ gia tổng quát (GAM) với tần số alen nhị thức làm biến phản ứng (129 địa điểm được lấy mẫu trên Fennoscandinavia với 10 đến 20 cá thể được lấy mẫu ở mỗi địa điểm) và một số biến mùa khí hậu và tăng trưởng như các biến dự đoán. Các kết quả mô hình như sau (TMAX04-06 = nhiệt độ tối đa vào tháng Tư-tháng Sáu, Phen_NPPMN = năng suất thảm thực vật mùa sinh trưởng trung bình, PET_HE_YR = thoát hơi nước tiềm năng hàng năm, Dist_Coast = khoảng cách đến bờ biển):

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

nhập mô tả hình ảnh ở đây

Hình 1. Tần số "núi" quan sát được đối với điểm đánh dấu AFLP hai chiều. Các đường đồng mức 0,1 tần số, màu sắc là độ cao với màu xanh lam cho mức thấp nhất và màu đỏ cao nhất.

nhập mô tả hình ảnh ở đây

Hình 2. Tần số "núi" được dự đoán cho điểm đánh dấu AFLP hai chiều. Các đường đồng mức 0,1 tần số, màu sắc là độ cao với màu xanh lam cho mức thấp nhất và màu đỏ cao nhất.

nhập mô tả hình ảnh ở đây

Hình 3. Mô hình lựa chọn sinh thái (sử dụng GAM) được chia nhỏ theo toàn bộ khu vực nghiên cứu (Fennoscandinavia) và riêng cho Na Uy, Thụy Điển và Phần Lan. Các đường đứt nét màu đỏ đại diện cho một vùng tiếp xúc thứ cấp giữa các quần thể phía bắc và phía nam được suy ra từ các dấu hiệu AFLP khác và phân tích đồng vị ổn định của lông được trồng trên khu vực trú đông riêng biệt của chúng ở Châu Phi. Đường chấm đen mỏng là trung tâm của khu vực.


1
Cảm ơn số lượng lớn của chi tiết. Làm thế nào để mô hình null đi vào câu hỏi? Dường như chỉ có mô hình lựa chọn sinh thái quan trọng trong việc so sánh quan sát so với dự kiến.
gui11aume

Dữ liệu thực tế của bạn ở đây là gì? Đầu ra mô hình cho biết "n = 129", nhưng đó có phải là 129 cá nhân, hay 129 vị trí tại mỗi vị trí mà bạn có tần số alen hay ...?
vào

Xin lỗi tôi muốn cung cấp càng nhiều nền tảng càng tốt để cho phép tất cả các bạn hiểu rõ nhất logic (hoặc phi logic) trong cách tiếp cận của tôi đối với bản thảo mà tôi đang phát triển. Câu hỏi của tôi đứng ở đầu, tôi muốn tìm một lý do để xác định xem sự khác biệt giữa quan sát và dự kiến ​​là khác nhau đáng kể. Điều này có thể cho tôi biết liệu alen vẫn còn lan rộng hay có một số rào cản để đạt được giá trị mong đợi. Đối với "N = 129", vì đây là tần số alen, điều này có nghĩa là 129 trang web thường có từ 10 đến 20 cá nhân được lấy mẫu tại mỗi trang web.
Keith Larson

Bạn đề cập rằng các cá nhân dường như là hoảng loạn cho các locus của mẹ và automsomal. Bạn có quyền truy cập vào những dữ liệu này? Làm thế nào bạn đánh giá panmixia?
Sameer

Câu trả lời:


1

Câu hỏi này có thể đã chết, nhưng các biểu đồ ở đây rất đẹp và câu trả lời ở đây cảm thấy rõ ràng bằng trực giác. Nếu bạn đang tìm kiếm một alen "núi", sự lựa chọn rõ ràng sẽ là sử dụng độ cao (hoặc một số thay thế của nó) làm công cụ dự đoán của bạn. Nếu điều đó cho thấy mối liên quan đáng kể với tần số alen, nó sẽ cung cấp bằng chứng mạnh mẽ cho giả thuyết của bạn.

Bạn có thể thêm vào các biến dự đoán nhiều hơn mô tả các khía cạnh khác của ngọn núi so với độ cao của nó - ví dụ: địa hình "độ gồ ghề" hoặc kiểu thảm thực vật - là vùng núi độc đáo và cũng có thể được liên kết với tần số alen.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.