Củng cố tiêu cực: làm thế nào để thay thế một đối tượng?

18

Beauce Shepherd của tôi bây giờ được 9 tháng tuổi, chúng tôi đã theo dõi một số lớp giáo dục hành vi với một huấn luyện viên cá nhân và mọi thứ diễn ra rất tốt. Trước khi con chó làm như anh ta muốn và bây giờ, anh ta chỉ nghe thật tốt!

Theo đề nghị của giảng viên, một số hành vi đã được củng cố tích cực và một số tiêu cực. Vấn đề chúng ta đang gặp phải bây giờ là với những hành vi mà chúng ta củng cố một cách tiêu cực. Chúng tôi đang sử dụng một hộp kim loại để tạo ra âm thanh, con chó ghét nó và vâng lời. Nó luôn được sử dụng sau khi "không" như là một hình phạt thứ hai. Mọi thứ hoạt động hoàn hảo, và bây giờ chúng tôi không cần phải sử dụng hộp nữa khi anh ấy cư xử chính xác.

Vấn đề là chúng tôi nghĩ rằng chúng tôi sẽ cần phải thay thế hộp bằng một thứ khác vì bây giờ anh ấy đã học được rằng nếu chúng tôi không có hộp, sẽ không có âm thanh nào và vì vậy anh ấy tham gia vào hành vi không mong muốn. Bây giờ nó bắt đầu trở thành một vấn đề vì chúng ta cần phải mang chiếc hộp đi khắp mọi nơi, bởi vì nếu chúng ta không có nó, anh ấy sẽ sử dụng cơ hội.

Có cách nào chúng ta có thể khắc phục điều này bằng cách thay thế hộp bằng cơ thể của chúng ta hoặc một cái gì đó?

Lưu ý: Anh ấy đã bị bỏ rơi một tháng trước và anh ấy đã can đảm cho chúng tôi ít hơn một chút nhưng vẫn làm điều đó khi chúng tôi không có hộp tiện dụng.

Cảm ơn bạn

dogs behavior training

— Salketer
nguồn

1

Có lẽ bạn nên hỏi huấn luyện viên của mình câu hỏi này, nhưng một khi cốt thép âm (hộp kim loại) có tác dụng kiềm chế hành vi không mong muốn của anh ta, giờ bạn có nên bắt đầu củng cố những hành vi tốt không? Ví dụ, nếu con chó của tôi tiếp tục đi lên đi văng, tôi có thể (1) lắc hộp kim loại để ngăn cản nó, và sau đó khi nó biết đi trên đi văng là không mong muốn, tôi sẽ (2) khen ngợi và đối xử rộng rãi bất cứ khi nào nó đặt trên sàn gần đi văng hoặc tương tự.

— Steve D

1

:) Tôi thích cách những con chó có thể tự học những điều đó, sau khi quan sát ... "không có hộp, này, tôi có thể làm bất cứ điều gì tôi muốn!" :) :) :)

— woliveirajr

10

Bất cứ khi nào thảo luận về điều hòa hoạt động, nó sẽ giúp nói cùng một ngôn ngữ:

Củng cố: Một hành động được thiết kế để tăng tần suất một hành vi
Trừng phạt: Một hành động được thiết kế để giảm tần suất của một hành vi
Tích cực: Sự hiện diện của một kích thích
Tiêu cực: Sự vắng mặt của một kích thích

Các thuật ngữ này có thể tạo thành bốn kết hợp khác nhau ( NB: Ví dụ trong ngoặc là ví dụ, không phải lời khuyên!):

Củng cố tích cực: Trình bày một kích thích để tăng tần suất của một hành vi (ví dụ: đưa ra một điều trị khi con chó ngồi trên lệnh)
Củng cố tiêu cực: Loại bỏ một kích thích để tăng tần suất của một hành vi (ví dụ: Người đưa thư đi sau khi con chó sủa vào nó)
Hình phạt tích cực: Trình bày một kích thích để giảm tần suất của một hành vi (ví dụ như đánh con chó khi nó đi tiểu trên thảm)
Hình phạt tiêu cực: Loại bỏ một kích thích để giảm tần suất của một hành vi (ví dụ rời khỏi phòng khi con chó nhảy lên bạn)

Trong thực tế, những điều này có thể bị rối loạn. Ví dụ, bạn tạo ra tiếng ồn với hộp là một kích thích được thiết kế để giảm tần suất của hành vi, vì vậy về mặt kỹ thuật đó là một ví dụ về hình phạt tích cực, nhưng nếu bạn dừng tiếng ồn khi chó thực hiện hành vi đúng, bạn cũng loại bỏ một kích thích tăng tần số của hành vi chính xác, hey thế nào!, củng cố tiêu cực.

Nhưng điều đó giả định rằng có một hành vi đúng để con chó của bạn thực hiện. Bạn không chỉ định hành vi không mong muốn là gì hoặc nếu có một hành vi thay thế mong muốn mà bạn đang cố gắng củng cố. Nếu tất cả những gì bạn làm với tiếng ồn đang cố ngăn anh ta làm điều gì đó, thì bạn đang cung cấp hình phạt thay vì củng cố tiêu cực.

Trong cả hai trường hợp, một phần của vấn đề của bạn có lẽ là bạn chỉ đang sử dụng các biện pháp củng cố và trừng phạt chính, tức là những vấn đề mà con chó không cần phải học. Thực phẩm, ví dụ, là một chất tăng cường chính. Con chó biết thức ăn là một điều tốt mà không cần phải học nó. Bằng cách mở rộng, tiếng ồn là một kẻ trừng phạt chính, vì nó không thoải mái cho con chó nghe. Ngược lại, những người củng cố và trừng phạt thứ cấp là những người mà con chó đã học được.

Ví dụ kinh điển là tiếng chuông của Pavlov rằng anh sẽ gọi mỗi khi anh cung cấp cho chú chó thức ăn. Bằng cách liên tục ghép một chất tăng cường chính với một kích thích, kích thích có thể bắt đầu hoạt động như một chất tăng cường thứ cấp. Đó là, con chó biết rằng tiếng chuông báo hiệu sự xuất hiện của thức ăn và sẽ phản ứng tương ứng.

Bạn đề cập rằng bạn sử dụng từ "không" (hy vọng trong giọng nói nghiêm khắc, những con chó khá lão luyện trong ngữ điệu sành điệu) khi nói với con chó của bạn, cùng với tiếng ồn. "Không" nên hoạt động như một người trừng phạt thứ cấp, giống như cách khen ngợi có thể hoạt động như một chất tăng cường thứ cấp. Nhưng có lẽ bạn đã thất bại trong việc loại bỏ tiếng ồn thực tế dần dần, bằng cách đôi khi chỉ nói "không" nhưng không tạo ra tiếng ồn.

Vấn đề là, đến bây giờ, con chó của bạn đã nhận ra rằng "không" không có hộp xung quanh có nghĩa là không có người trừng phạt chính, tức là hai con không liên quan, và do đó, nó được cứu khi nó không ở gần.

Tôi đề nghị bạn nên mở một câu hỏi mới mô tả (các) hành vi thực tế mà bạn muốn ngăn cản và chúng tôi có thể giúp bạn tìm cách sử dụng toàn bộ phổ điều kiện của nhân viên để giúp chú chó của bạn học được những gì bạn muốn làm.

— Thomas
nguồn

5

@ThomasH là một câu trả lời xuất sắc và chạm vào câu hỏi sử dụng những kẻ trừng phạt thứ cấp một cách rất chính xác.

Ở đây tôi chỉ thêm một số ý kiến về hai khía cạnh của vấn đề.

Trừng phạt hành vi sai trái so với củng cố hành vi đúng

Ngay cả khi "lý thuyết" hoạt động giống nhau ở "bên gia cố" và "bên trừng phạt" và các hiệu ứng có thể hiệu quả như vậy, chúng ta cũng không nên quên rằng việc đàn áp một hành vi không dạy con chó phải làm gì thay vào đó và tập trung chủ yếu vào phần "không" của khóa đào tạo dẫn đến quản lý vi mô : bạn liên tục cần dạy cho chó những điều mà nó không nên làm. Ngay cả khi con chó biết rằng anh ta không nên làm X trong một tình huống nhất định, anh ta vẫn tự do thực hiện Y, Z, v.v. Nếu bạn tích cực dạy anh ta (củng cố anh ta) làm W thay vào đó có thể sẽ ngăn chặn một vòng luẩn quẩn nào đó và làm mọi người vui

Gia tăng tỷ lệ thay đổi / hình phạt

@ThomasH giải thích khái niệm tăng cường thứ cấp hoặc trừng phạt.

Một khía cạnh cần lưu ý là, trái với những củng cố / trừng phạt chính, những thứ yếu phải được khen thưởng (bằng cách này hay cách khác) bằng cách sử dụng một lịch trình thay đổi .

Thức ăn là một chất tăng cường chính. Mỗi lần con chó lấy một miếng thức ăn, nó được gia cố.

Nhưng một từ khóa như "có" hoặc một cú nhấp chuột có thể trở thành một từ bổ trợ thứ cấp. Nó được liên kết với một cốt thép chính tiếp theo. Điểm mấu chốt là nó hoạt động vì con chó biết rằng chất tăng cường thứ cấp được thưởng, bởi chất tăng cường chính. Một khi điều này được học, liên kết phải được duy trì với phần thưởng thực tế. Khi bắt đầu (trong quá trình đào tạo), phần thưởng sẽ đến mỗi lần, sau đó nó có thể được thưởng bằng một lịch trình thay đổi. Lịch trình thay đổi đang thực sự củng cố liên kết vì con chó không thể lường trước được khi nào phần thưởng chính sẽ đến.

Lưu ý rằng điều này thường được áp dụng cho các cốt thép cấp ba : cue "ngồi" thực sự là một chất tăng cường, vì nó có thể dẫn đến một chất tăng cường khác (ví dụ một cú nhấp chuột) dẫn đến phần thưởng thực tế.

Chúng tôi thường không bao giờ phân tách chất tăng cường thứ cấp (nhấp chuột) từ chất tăng cường chính (ví dụ như phần thưởng thực phẩm). Điều đó giữ cho liên kết giữa hai cực kỳ mạnh mẽ và tỷ lệ biến được áp dụng giữa cue (gia cố cấp ba) và nhấp chuột.

Tuy nhiên, trong trường hợp hình phạt bạn không có "hình phạt cấp ba" thực sự, do đó, tỷ lệ "củng cố" thay đổi (được hiểu là hình phạt trong trường hợp này) là giữa hình phạt thứ cấp của bạn ("không") và hình phạt thực tế ( cái hộp).

— Cedric H.
nguồn