El adiestramiento en positivo no quiere decir adiestramiento "bueno" sino reforzar una conducta con la obtención de algo deseado.
Los animales no manejan conceptos morales ni emiten actos altruistas. Buscan obtener recursos o cosas que quieren y evitar peligros o cosas que no quieren. Así de simple. Si nosotros tomamos parte en ese proceso seremos “atractivos” o “rechazados” por ese animal según sea el caso.
Volviendo al tema de los delfines y otros mamíferos marinos a los que no se les puede colocar una correa como al perro o un bocado metálico como al caballo, desde hace mucho se les adiestra a través del adiestramiento en positivo. Eso de tener a un enorme y pesado animal nadando fuera del alcance de su adiestrador, impide enseñarle a tirones o regaños. Son difíciles de coger y castigar cuando no hacen lo que se espera de ellos. En cambio se puede marcar con un sonido cuando hacen algo que se espera que repitan y darles un pescado.
Hoy en día la evidencia es irrefutable. El conductismo cobra adeptos minuto a minuto. Los amantes de las emociones (condicionamiento clásico*) se inventan todos los días “nuevos métodos” con nombres rimbombantes y de mucho “punch” publicitario que no escapan del uso enmascarado y evidente de las Leyes del Aprendizaje plasmadas en el análisis conductual (una de las 4 consecuencias de un comportamiento es el refuerzo positivo).
Empezamos a ver perros, caballos y hasta peces haciendo rutinas de comportamientos super complejas que opacarían a todo lo visto en estas series de las que hice referencia. Y además las ejecutan con gozo y alegría. ¿Será que los super poderes de los delfines no son producto del tamaño de su cerebro sino de la manera en que son entrenados?.
La expresión “Adiestramiento en positivo” no se refiere técnicamente a un adiestramiento “bueno” sino a una de las cuatro consecuencias que pueden derivar de una conducta emitida. ¡Aunque publicitariamente suena muy bien! Tal vez por eso se usa tanto. Tampoco deja de ser cierto que es la consecuencia ideal para lograr aprendizajes de manera justa y alegre para todos, animal y adiestrador.
Profundizando en detalles técnicos, es necesario definir qué es el “refuerzo positivo” para que se entienda que no se refiere a los conceptos «bueno» o «malo» (que no son más que criterios personales y culturales de los humanos). Cuando un organismo recibe un estímulo ambiental y emite una conducta, la consecuencia puede ser que le agrade o que le desagrade (o simplemente ni lo uno ni lo otro). Si le agrada se denomina REFUERZO y si le desagrada se denomina CASTIGO. Y en ambos casos pueden ser positivos o negativos. Refuerzos (agradan): R+ o R-, Castigo (desagradan): C+ o C-. Bajo estos cuatro consecuentes se produce aprendizaje pero los términos positivo/negativo se refieren a la aparición o desaparición de un apetitivo (algo que gusta) o un aversivo (algo que desagrada o duele). Daré un ejemplo de cada uno para que lo vean con claridad:
Refuerzo Positivo (R+): “Comando: Ven” (estímulo ambiental) -> Perro se acerca (conducta) -> Consecuencia: aparece salchicha (apetitivo) (perro feliz porque obtuvo algo que le gusta).
Refuerzo Negativo (R-): “Comando: Ven” (mientras das tirón) (aversivo) -> Perro viene (conducta) -> Consecuencia: Dejas de tirarle (perro feliz porque acercándose logró que dejaras de tirarle).
Castigo Positivo (C+): Zapatilla deportiva (estímulo ambiental) -> Perro la mastica (conducta) -> Consecuencia: Le pegas y gritas NO!!! (aversivo) (perro triste porque le pegas y gritas).
Castigo Negativo (C-): Zapatilla deportiva (estímulo ambiental) -> Perro la mastica (conducta) -> Consecuencia: desaparece la zapatilla (apetitivo) (perro triste porque le quitaste la zapatilla que estaba buenísima).
La expresión “Adiestramiento en positivo” no se refiere técnicamente a un adiestramiento “bueno” sino a una de las cuatro consecuencias que pueden derivar de una conducta emitida ante la presencia de un estímulo ambiental.
Como verán tanto en el caso de refuerzo positivo como negativo, la conducta (venir) se fortaleció, sólo que en el caso del R+ el perro viene con la expectativa de recibir algo que le gusta y en el caso del R- viene con la expectativa de evitar algo que no le gusta. En el caso de castigo tanto positivo como negativo la conducta (masticar la zapatilla) se debilitó. En el caso del C+ el perro deja de masticar la zapatilla tras recibir algo que molesta y en el caso del C- deja de masticar la zapatilla simplemente porque su conducta ha hecho desaparecer lo que le gusta.
Pero además del uso de aversivos (cosas desagradables) uno de los problemas de basar nuestro plan de educación en castigos cuando deseamos que el perro detenga un comportamiento inadecuado, es que terminamos logrando que el perro no emita ninguno más y nos quiera mucho menos. Matamos sus ganas de hacer cosas frente a nosotros. Nos esquivarán para hacerlas en nuestra ausencia y en realidad eso no es lo que se quiere al educar un perro. El humano se centra en que el perro no haga esto o no haga aquello cuando en realidad lo que quiere es que el perro haga algo distinto e incompatible con lo no deseado y para que esto ocurra necesitamos que el perro haga intentos para poder reforzar lo que si deseamos. Eso es el refuerzo positivo.
Alimentar la creatividad del animal, motivarlo a intentar cosas y manipular el ambiente para que tenga éxito dando con lo esperado y así recibir como consecuencia algún apetitivo para fortalecer esa conducta en específico.
Un claro ejemplo del desastre que conlleva el uso de castigo lo vemos en el colegio. Cuando un maestro pregunta algo al alumnado a cambio de algún punto en la nota y un niño levanta la mano y responde. Las probabilidades de que vuelva a intervenir en la próxima pregunta del profesor dependerán más de la actitud de los compañeros y maestro que de si su respuesta fue acertada o no. Supongamos que responde equivocadamente pero los compañeros se ríen de manera cómplice con él y hasta el maestro se ríe.
Probablemente volverá a levantar la mano aún sin saber la respuesta. Porque lo que ha sido reforzado fue su intento, su voluntad, no su conocimiento. Así es más probable que en algún intento responda bien y gane el elogio del profe, de sus padres y el punto. En cambio, si el niño responde mal o bien pero los compañeros se burlan o le hacen mala cara y el maestro le dice que no se le escucha que hable más fuerte arrugando la expresión, la moral del niño cae y probablemente se cohiba de intervenir la siguiente vez, aún sabiendo la respuesta correcta.
El Adiestramiento en Positivo es centrarse en premiar y reforzar con apetitivos las conductas que queremos o que se aproximen a ella, ignorando las que no, en vez de castigar los desaciertos. Así se estimula la creatividad y voluntad del perro esforzándose por dar con la respuesta acertada y extinguiendo todas aquellas que no dieron resultado. Por esto es que me hace tan feliz ver que cada día crece el interés por esta forma de educar, que no es un método ni un procedimiento, sino la capitalización de las leyes del aprendizaje. En otra entrada hablaré sobre la extinción de conducta, una forma natural de que nuestro perro abandone hábitos no queridos por nosotros sin el uso del nefasto castigo positivo.
*Condicionamiento Clásico: Modelo de aprendizaje por asociación entre el estímulo y la respuesta involuntaria del organismo.