塑形如何发展学习
发布日期:2018-09-22 08:32 来源:https://mp.weixin.qq.com/s/vkS 浏览量:次
自由塑形(Freeshaping)提供一个窗口,让我们一窥训练对象的思路历程,我们看得到训练对象如何逐步作出接近解答的选择,也看得到牠们何时已穷途末路。
如果让我观察塑形狗儿行为的训练,我能看出这只狗的记性。狗儿受到塑形的行为或许和某物件有关,接着牠为了取食而远离物件,于是物件不再存在牠的视野,有些狗儿完全明白它的位置在哪里,边吃边转过身朝它走去。有些狗则完全沈浸于享受美食的片刻,全然忘记那个物件,这些记性不佳的狗儿回神后常以惹人怜爱的表情望向训练者:「我知道我刚做了某件事,但是我现在完全不记得它是啥。」通常狗儿出现这种『刚刚我是做到哪里咧?』的现象后,即出现一高一低挑动眉毛的犬类特殊技能,在棕眉的黄金雪达犬身上很容易观察到这个动作。
狗儿脑子里「维持成功」的能力随着增强史(reinforcement history,译注:即曾获增强的次数)的增加而强化。当狗儿碰触砖块的行为被增强的次数越多,牠们取食后回到这个行为的速度越快,事实上有些狗儿边吃东西就会边做出这个行为──我以此评估牠是否已确切了解当时的塑形要求,它也显示提高要求标准的难易度。食物奬励的给予位置对于塑形的过程及进展速度具有极大影响,你能够使训练对象发展出记忆能力,或者使牠超乎能力地学习。
我在多数塑形练习(不管训练狗或人)常观察到一种「响片响后仍继续行动」(going through the click)的过程,举例来说,我们有时会玩Genabacab游戏(译注:探索响片训练的互动游戏),由一人塑形另一人碰触某物件,训练者抓时间点很准,在对方手指稍微轻触物件时便按下响片,但是若是狗儿的话牠们会继续把那个物件推一推、滚一滚或咬起来。再举一例,例如塑形狗儿以前脚搭上圆锥或踏上第一阶楼梯,当牠听到响片声后牠仍继续推动圆锥或跑上楼梯,几乎所有例子中,训练者或训练对象都不是响片训练的新手,这些行为显示,牠们明白「响片标定行为」的概念,因而完成了这些行为。
问问训练者我们就会知道狗儿明白「响片响时的行为是正确的」,那么牠们为何持续行动?对于狗儿和训练者而言,响片声并非终结行为,它似乎标定了某项意图之下的行为。
如果我们让狗儿持续发展这项行为,它将越发强烈──推得更用力,或更快跑上楼梯──显示响片声使训练对象联结到的行为并不是训练者所要的行为。
当训练对象提供了「大体行为」(gross behavior),我们身为塑形者的义务是微调教导方式,如果这个大体行为与所要行为无关,这次训练可能就必须突然间结束,引人挫折。
我们经常利用某个为时不长的行为捕捉另一个行为。数以百计的行为都是大体行为的迷你版本,利用响片停止行为的作用雕塑行为──举起前脚碰圆锥的动作是挥挥脚的初期动作,趴下时压低肩膀的动作是敬礼的开始,用根趾头碰某项物件的行为是推动、翻面、滚动、拾起或旋动这个物件的启始动作,迷你行为让我们能够改变行为发展方向或发展的速度。我们『定格』小小行为的能力使训练对象能够倾听到更精确的讯息。
当你开始教导训练对象倾听响片声,递送奬励的动作必须中断牠继续完成大体动作的进程,如果有只狗很想弄坏房里另一头的某个物件,早点按下响片同时毫无延迟地迅速把食物送到狗儿后方,这样就可以停止牠发展出不乐见的行为。
以人类(迟钝)的眼睛看来,响片声出现时人似乎就丢出了食物,起初几次按响片给赏时这不会是个问题,当狗儿听见响片声,假如牠的眼角余光瞄到递送食物的手迅速丢出食物,牠就会定住不动,刚开始牠可能不会理会手的动作,但很快地,你会看到牠靠近物件时注视着递送食物的那只手,接下来的测试就是在按下响片后停一秒再送出食物,看看牠在响片声出现时是否停止动作。
我偏好在行为发生地点几步之外的地方给予食物,目的是让牠可以重新动作,让我能够监看类似动作,比较行为的进展。
有次响片研习会上我主持了一个微塑形讲座,我的训练对象是只很棒的七个月可丽牧羊犬(rough collie),名叫昆斯。训练目标是教牠把前脚搭在讲台旁四步阶梯的第一阶上,这是必要的导盲犬行为,导盲犬会停在这个姿势,等待人给予讯号再上楼梯。
昆斯知道现在牠是目光焦点,只想「上台」去,在牠眼里看不到阶梯,更别提第一阶了!当牠接近讲台时,牠听到响片,便飞奔到我腿上(七个月大的牠还不太明白自己长大了!)。
如果你不断教导狗儿听到响片时跑来找你的手领赏,牠在听到响片后会朝着你的方向激动起来,你可以在按响片后直接把食物递到狗儿所在的位置,但是如果想避免牠在响片声出现后持续行动,这个作法仍不够迅速,于是响片将增强意图,而你若试图加快直接喂食的动作,你得极为小心,不要无意间让狗儿留意到这个动作,因而把它和响片声起了联想。
我对昆斯的作法是,在我再度用到响片之前,我得先做一些把食物丢到牠身后的大动作,让牠发展出概念,了解我给予食物的方式。
这对牠是相当新的概念,只重复了几次,接着当牠接近讲台阶梯时我再度按下响片,我当时利用了一个「响片视觉讯号」打断这个行为,让它与响片声同时出现。
七个月的牠还不太能控制自己的身体动作,完全是大刺刺的作风,由「意图」驱使,我家狗肯恩有时仍会回到这种模式,「意图」热情地打招呼,对于我较能接受的打招呼方式,此时牠的认知通常会蒸发人间,只剩下『意图』这么做的意念。
约经过四次一分钟的训练后,我们成功塑形昆斯把前脚搭在阶梯上,牠的身体仍然因为想飞奔上台的意念而表现兴奋,但是在响片声出现后牠可以稍微停着一两秒不动,这对牠年轻的心灵是个很棒的练习──不只让牠更留意到响片出现的确切时间和自己的行为,也让牠学会在响片声和取食之间稍微停一下下。
我坚决相信塑形最大的好处是使训练对象得以发展,它不只是在诱导无效时用来获得行为的训练方法,学习被塑形的概念好比学习人生的必要技能,以因应各种无可预期的突发状况──这对一只七个月大的狗儿尤其重要!
对于习惯被增强意图的狗儿,我们需要找到不同策略才能定格当下的动作,你同样可以利用食物的转移方式,但是它只有在训练对象拥有想要奬励的高度动机时才能生效。我曾经使坏,设计了一套方法,让训练对象必须在我把奬励放入罐内或给别人之前就去拿食物,这作法有些处罚性质,但是它使狗儿在听到响片声后专心一意──牠去拿奬励的反应得快一些,否则它就会消失。
有个很像我家狗梅波说话的小小声音指出:「等一下,按到意图的动作也可能有其用处。」我最早开始塑形梅波时明白了这一点,为了刺激牠的想像,我在地上放了数个有趣的物件(当时牠九个月大,一心以自我为主),当牠注视某项物件我就会按下响片,她领了赏后就直接跑回那项物件,如果叫牠先举前脚挥挥,然后当牠注视凳子时按下响片,牠就一定会朝着凳子过去再用前脚点它一下。
我极确信这便是黄金雪达犬的思路流程,也相信牠所注视的东西就是牠心中所想的东西,响片所按到的并不完全是牠来到物件面前时要进行特定行为的意念,但是我们可以因此而省略许多塑形步骤。
我确信你们当中有许多人对自己的狗也有类似的体认,我认为狗儿理解人类意图的能力比我们理解牠们的强,不过我还是很想探索这个领域。
我们可能用另一个标定讯号确认意图吗?