Giả sử bạn muốn đi câu cá ở hồ gần đó từ 8 giờ sáng đến 8 giờ tối. Do đánh bắt quá mức, một đạo luật đã được đưa ra nói rằng bạn chỉ có thể bắt một con cá mỗi ngày. Khi bạn bắt được một con cá, bạn có thể chọn giữ nó (và do đó về nhà với con cá đó), hoặc ném nó trở lại hồ và tiếp tục câu cá (nhưng có nguy cơ sau đó giải quyết với một con cá nhỏ hơn hoặc không có con cá nào). Bạn muốn bắt một con cá càng lớn càng tốt; cụ thể, bạn muốn tối đa hóa khối lượng cá dự kiến bạn mang về nhà.
Chính thức, chúng tôi có thể thiết lập vấn đề này như sau: cá được đánh bắt ở một tỷ lệ nhất định (vì vậy, thời gian cần thiết để bắt cá tiếp theo của bạn theo phân phối theo cấp số nhân đã biết) và kích cỡ của cá đánh bắt theo phân phối (còn được biết đến) . Chúng tôi muốn một số quy trình quyết định, với thời gian hiện tại và kích cỡ của một con cá bạn vừa bắt được, quyết định giữ cá hay ném lại.
Vì vậy, câu hỏi là: quyết định này nên được thực hiện như thế nào? Có một số cách đơn giản (hoặc phức tạp) để quyết định khi nào nên dừng câu cá? Tôi nghĩ vấn đề này tương đương với việc xác định, trong một thời gian nhất định, khối lượng cá dự kiến mà một ngư dân tối ưu sẽ mang về nhà nếu chúng bắt đầu vào thời điểm t; quá trình quyết định tối ưu sẽ giữ một con cá nếu và chỉ khi con cá nặng hơn khối lượng dự kiến. Nhưng điều đó có vẻ như tự giới thiệu; chúng tôi đang xác định chiến lược đánh bắt tối ưu theo cách đánh bắt tối ưu và tôi không chắc chắn nên tiến hành như thế nào.