動物行為學講座之動物如何學習（1）：基本學習理論-中國寵物網-寵物行業權威新聞信息百科知識服務平臺

全國最全的寵物物種資料庫養貓咪或狗狗要花多少錢？

FAVINK個性化網頁收藏夾沒用過的化妝品怎么看好壞導言

與動物打交道的關鍵是從動物的角度來看世界，這就需要理解學習理論。雖然這在訓練過程中非常有用，它在試圖糾正有問題的動物行為時更是基本的知識。

基本學習理論：

雖然馴化物種都有五種基本的官能，即看-視覺、聽-聽覺、聞-嗅覺、嘗-味覺和觸摸-觸覺，但它們的感官能力并不相同，更不用說與人類的感官能力相同了。因此，動物對世界的感知是不同的，這將會顯著地影響動物交流的方式，不僅是它們彼此間-同種的交流，而且也包括與其他物種的交流-非同種。在每個情況下你都應該仔細考慮此點，并認識到動物是不會說話的交流者。

學習理論的原理是來自對行為所進行的實驗研究。學習，也叫作制約，可以定義為“任何反應方面出現的相對永久的變化，產生該變化的原因是經歷”-McGreevy, 2001。但是，并非所有行為變化都是由于學習而發生的。有些行為變化，比如渴時飲水，就是由于動機的變化。

行為是由其結果控制的。如果結果是“好的”，那該行為就更有可能被重復，與此相反，如果結果是“壞的”，該行為就不太可能被重復。這也稱為“效果律”，即行為是由其結果而修訂的。當動物接受訓練時，我們實際上是在操作其經歷。

學習種類

人們認知和研究過的學習方法有許多種。不過，用以糾正狗和貓的行為的普遍使用的兩條原理是古典制約和操作制約。經典制約，也稱為巴甫洛夫制約，最初是由巴甫洛夫在上個世紀初研究的。據說，當某個中性刺激物-條件刺激物，CS與一個具有生物意義的事件-非條件刺激物，UCS反復同時出現時，就會發生制約，結果，當CS單獨出現時，就會產生一個反應-條件反應，CR-Atkinson, Atkinson and Hilgard, 1983,McFarland, 1985。

比如，“好狗”這個詞本來是中性的，這個詞對狗毫無意義。但是，當這個詞與具有生物意義的事件-如給一點吃食或拍拍狗的頭一起出現時，通過巴甫洛夫制約，這個詞就可能成為一個CS。舉例中所說的條件反應可能會是搖尾巴。

操作制約是完成狗的訓練的主要方法。操作制約教給動物做出一個自動反應，以便獲得鼓勵或獎勵。給予積極的獎勵，比如食物，能增加某一特定反應被重復的機會-Skinner, 1974。這樣狗就學會了行為是由其結果控制的。同樣的，動物會做出某一行為以獲得第二次獎勵，或刺激，而這個鼓勵或刺激總是與主強化刺激物同時出現-比如說，“好狗”這個詞，總是伴隨著食物獎勵。

某一行為是否會被重復要看結果的本質而定。因此，如果結果是令人愉快的，比如一點食物，那么該行為就更可能被重復-Skinner, 1974。應用這一方法論就可以讓動物形成新的行為，比如用口頭或視覺命令狗“坐下”或“別動”。

我們研究了各種參數，看這些參數對通過操作制約來獲得或保持一個反應的能力的影響。比如，做出反應后必須立即給予獎勵，這樣才有效果。還可以通過部分強化時間表來維持某種行為，即按照時間表對特定反應給予間歇性的獎勵-Mazur, 1994。

因此，要教會一種新的行為，比如“坐下”，需要通過一個影響過程來訓練小狗。開始的時候，對小狗的任何接近“坐下”的行為都要給予獎勵，逐漸地過渡到只強化與期望的反應非常接近的行為反應。一旦小狗看到食物，就能可靠地作出反應，命令就與需要的反應伴隨發生了。當小狗學會該行為后，就可以使用一個可變的強化日程，對小狗的反應每隔三至四次才給予獎品，但應該總是表揚它，這樣學會的行為才可能堅持-Atkinson, Atkinson and Hilgard, 1983; McFarland, 1985。獎品，或者正強化，可以是任何動物想要的東西，比如食品、出去散步、游戲，或者與主人玩耍。

強化有兩種，主強化和次強化。動物已經進化到了能夠本能地意識到，主強化要么是“好”或“壞”，就是說動物不需要學習就知道食物和交配之類的主強化是“好的”，因為這些是生存要素，它們也知道缺水是“壞的”。而象拍拍頭或“好孩子”等詞之類的次強化的價值，動物就必須通過學習才知道。

主強化刺激下的學習比較快。但是，次強化能夠加強訓練。因此，在許多情況下，我們使用食物作為獎品，因為大多數狗都喜歡食物。但是如果我們再給一個輕拍，或給予口頭鼓勵如“好狗”等，其效果會得到增強，因為能夠加強反應-Voith, 1979; Owren, 1987; Weston, 1990。

概要地說，學習可以分成兩大類型：

操作制約：

培訓時，教給動物作出某個反應以獲得一個獎品。例如，如果最后結果是令人期待的，“坐下”之類的反應就可能會重復，因此結果決定反應。

[1] [2] 下一頁

導言

基本學習理論：

學習種類

概要地說，學習可以分成兩大類型：

操作制約：

培訓時，教給動物作出某個反應以獲得一個獎品。例如，如果最后結果是令人期待的，“坐下”之類的反應就可能會重復，因此結果決定反應。