viernes, 10 de junio de 2011

TUTORIAL CLICKER TRAINING 8ª LECCIÓN PROGRAMAS DE REFUERZO

PROGRAMAS DE REFUERZO

A menudo todas las personas que se inician en el clicker se preguntan ¿si toda la vida se tiene que estar haciendo click y premios?
Hasta ahora hemos explicado que tenemos que reforzar todos los comportamientos deseados con un click y premio. En las primeras fases del adiestramiento deberia ser así, no reforzar un comportamiento deseado ayuda a confundir al perro, si reforzamos continuamente el comportamiento correcto, este tendera a repetirse con más frecuencia.
Cuando el comportamiento siempre se da correctamente y lo hayas trabajado en los tres niveles de distracción, habrás de dejar de reforzarlo paulatinamente, primero refuerzas la mayoría, luego la mitad, después de vez en cuando y por último sólo alguno que otro. Un buen adiestrador acabaría reforzando sólo las mejores, las mas rápidas, la mas precisas... De esta forma el perro no tendrá la mínima duda de que esta realizando el comportamiento correcto. Esto es lo que se considera poner el comportamiento bajo un "prograna de refuerzo". Los motivos por los que se deben utizar estos programas son.
  1. El comportamiento es más resistente a la extincinción.
  2. Facilita el proceso de moldeado.
  3. Reporta mayores beneficios.
"La resistencia a la extinción se manifiesta de la siguiente forma: si un animal está demasiado   acostumbrado a obtener  un refuerzo en cada ocasión, se producirá una caida brusca, una gran colisión en el comportamiento cuando deje de presentarse el refuerzo. El comportamiento desaparece: dejará de darse por que han remitido los refuerzos. por el contrario si el animal recibe los refuerzos de vez en cuando le constara tiempo percatarse de que el reforzador ha cesado" (Jean Donaldson).

PROGRAMAS DE ADIESTRAMIENTO 
Existen diferentes progranas de reformiento. Los más comunes son de razón fija (RF), y de ratio variable ó razon variable(RV).
Un programa de razón fija, significa que se refuerza al perro siempre que realiza el comportamiento,  con independencia del tiempo que se tarde en hacerlo o la calidad del mismo.
En cambio un programa de reforzamiento de razón variable  proporciona refuerzo x número de respuestas correctas, permitiendo de esta forma seleccionar la mejor ejecutada, la más rapida etc. De esta forma el perro comprende que no se trata sólo de realizar el comportamiento si no de que modo.
Lo ideal es obtener una frecuencia óptima de progreso sin que el perro pierda el interés por seguir en el juego.

¿COMO EMPEZAR A APLICARLOS?
Si hemos cubierto todas las etapas de generalización del comportamiento ahora se trata de elevar el listón  y empezar a desarrollar rutinas, para ir mejorando la calidad de las ejecuciones y a su vez ir retirando progresiva y muy lentamente los refuerzos, aunque conviene sorprenderles con refuerzos de modo aleatorio para que el perro mantenga el interes.
Por ejemplo podemos hacer secuencias con los comportamientos que hemos trabajado para finalmente recompensar, primero lo podemos cada seis movimientos, despúes cada 2, luego cada 4, despúes cada 8, después cada 3 y así sucesivamente.



ADIESTRAMIENTO DE PARÁMETROS POR SEPARADO
Cuidado no nos confundamos, cuando añadimos al ejercicio nuevos parámetros como aumentar la duración, movimiento, distracciones... deberemos trabajar cada uno por separado para que finalmente los podamos combinar. Sentarse y quedarse quieto, tienen los siguientes parametros:
  1. Distancia: separador entre el adiestrador y el perro.
  2. Duración: tiempo que  debe permanecer el perro en la posición despúes de ausentarse el adiestrador un instante.
  3. Distracciones: grado de distracción del entorno en el que esta trabajando el perro.
Siempre trabajaremos los diferentes aspectos por separados antes de intentar combinarlos y posteriormente los combinaremos de modo progresivo.

No hay comentarios:

Publicar un comentario