" Có bất kỳ định nghĩa chính xác, tức là số, cho sự thưa thớt không? " Và bằng số , tôi hiểu cả tính toán và thực tế là "có thể sử dụng". Tôi nghĩ rằng: chưa, ít nhất, không có sự đồng thuận, nhưng có một số ứng cử viên xứng đáng. Tùy chọn đầu tiên " chỉ tính các thuật ngữ khác không " là chính xác, nhưng không hiệu quả (nhạy cảm với xấp xỉ bằng số và nhiễu, và rất phức tạp để tối ưu hóa). Tùy chọn thứ hai " hầu hết các yếu tố của tín hiệu là 0 hoặc gần bằng 0 " là không chính xác, trên "hầu hết" và "gần với".
Vì vậy, " một thước đo chính xác của sự thưa thớt " vẫn khó nắm bắt, không có các khía cạnh chính thức hơn. Một nỗ lực gần đây để xác định độ thưa được thực hiện trong Hurley và Rickard, 2009 So sánh các biện pháp về độ thưa thớt , Giao dịch của IEEE về Lý thuyết thông tin.
Ý tưởng của họ là cung cấp một bộ tiên đề mà một biện pháp thưa thớt tốt phải thực hiện; chẳng hạn, tín hiệu x nhân với hằng số khác không, α x , nên có cùng độ thưa. Nói cách khác, số đo độ thưa phải là 0 đồng nhất. Vui thay, proxy ℓ1 trong cảm biến nén, hoặc trong hồi quy lasso là 1 đồng nhất. Đây thực sự là trường hợp của mọi chỉ tiêu hoặc bán chuẩn ℓp , ngay cả khi chúng có xu hướng đo lường (không mạnh mẽ) ℓ0 khi p → 0 .
Vì vậy, họ chi tiết sáu tiên đề của họ, thực hiện các tính toán, mượn từ phân tích sự giàu có:
- Robin Hood (lấy từ người giàu, tặng cho người nghèo làm giảm sự thưa thớt),
- Thu nhỏ (nhân liên tục bảo tồn độ thưa),
- Tide tăng (thêm cùng một tài khoản khác không làm giảm độ thưa thớt),
- Nhân bản (sao chép dữ liệu bảo tồn độ thưa thớt),
- Bill Gates (Một người đàn ông ngày càng giàu có tăng độ thưa thớt),
- Em bé (thêm giá trị 0 làm tăng độ thưa)
ℓ1/ ℓ2pq ℓp/ ℓqx0<p≤q
1≤ℓp(x)ℓq(x)≤ℓ0(x)1/p−1/q
1x
c(k)Cα.(k)−αα