Tôi đã xem qua một bài báo mới từ nhóm Berkeley NLP về kiểm tra thống kê, Một cuộc điều tra theo kinh nghiệm về ý nghĩa thống kê trong NLP .
Có mã giả để tính giá trị p trong bài báo, về cơ bản, ý tưởng là tập hợp mẫu của được lấy mẫu với sự thay thế từ dữ liệu . Sau đó
, trong đó là mức tăng số liệu.
Tôi có thể hiểu công thức tính giá trị p trong bài kiểm tra ý nghĩa thống kê trên giấy của Koehn để đánh giá bản dịch máy , trong đó:
, where and are the metric gain for system and respectively.
Is there any explanation or reference for the formula . The authors also noted that if the mean of is and is symmetric, then both formulas above are equivalent.