Este é um artigo fundamentalmente destinado aos Adestradores Profissionais que utilizam o Adestramento Positivo como método de ensino e que, por qualquer motivo, desconheçam as bases e os mecanismos que esse método utiliza na aprendizagem animal. Também é uma excelente oportunidade para corrigir um pouco a denominação de “Adestramento Positivo” que se atribui a este método uma vez que, mesmo nesta forma de aprendizagem, para corrigir os comportamentos inadequados utiliza-se sempre o “Castigo Negativo”.
O conceito de Condicionamento Operante, também por vezes chamado Condicionamento Instrumental ou Aprendizagem Instrumental foi criado por B. F. Skinner (1904-1990), baseando-se na Lei do Efeito de Edward L. Thorndike (1874-1949) que teorizou; as respostas que produziam consequências mais satisfatórias, foram "escolhidas" pela experiência e portanto, aumentaram de frequência. Algumas consequências reforçavam o comportamento, outras enfraqueciam-no.
O Condicionamento Operante
O condicionamento operante é o que ocorre quando aumenta ou diminui a frequência de um comportamento baseado nas consequências que o produziu anteriormente. Os comportamentos operantes são influenciados pelas suas consequências. O condicionamento operante aplica-se ao comportamento para alcançar objectivos. Os cães motivam-se para conseguir certos objectivos na vida, sejam de necessidade imediata, como conseguir oxigénio, ou o que seria alcançar uma experiência agradável subjectiva como pode encontrar no brinquedo preferido ou num odor para cheirar. Os cães fazem aquilo que os ajuda a conseguir o que querem ou que necessitam. Os comportamentos que realizam para conseguir tais objectivos estão muito influenciados pelo nível de êxito de métodos utilizados no contexto actual. Se um cão quer que o seu dono volte para ele, ladra e consegue que ele volte, seja por casualidade ou intencionalmente por parte do dono, então a probabilidade de que ladre no futuro aumentará exponencialmente. Se a estratégia teve êxito então repeti-la-á de novo.
A lei de efeito de Thorndike estabelece a noção básica do condicionamento operante: “se um comportamento tem como resultado um evento satisfatório então esse comportamento vê-se reforçado (fortalecido) e se um comportamento tem como consequência um evento desagradável então esse comportamento enfraquecerá”. Recordamos que o facto de que uma consequência seja considerada “satisfatória” ou “irritante” depende totalmente da perspectiva do animal que realiza o comportamento. Se o cão quer que o deixemos em paz e nos afastamos então o comportamento utilizado para conseguir tal objectivo ver-se-á reforçado positivamente. Por outro lado, se o cão quer que nos mantenhamos ao pé dele ou que lhe façamos festas e se nos afastamos, isso não seria um reforço positivo. De facto, para o cão isso seria um castigo negativo. Ao fim de contas tudo se reduz ao que o cão quer e se consegue o que quer como resultado do seu comportamento ou não. O facto de que algo se reforce ou se castigue não determina como nós o sentimos ou o que pensamos sobre o estímulo que foi apresentado ou retirado. A única maneira de sabermos se algo foi reforçado ou castigado é observar a frequência do comportamento, se é aumentada ou não. Tentemos concentrarmo-nos no efeito das nossas acções no comportamento em questão, mais do que pensarmos que algo deveria ter efeito de reforço ou de castigo.
Procedimentos do Condicionamento Operante
Genericamente existem quatro procedimentos que produzem um condicionamento operante.
Um animal pode experimentar consequências que provenham de distintas fontes. O dono ou outros animais podem ser a origem de tais consequências. O ambiente também. Há outras consequências que podem provir do próprio cão: os produtos químicos excitantes ou analgésicos que chegam ao cérebro do cão quando se sensibiliza podem-lhe provocar uma experiência agradável, por exemplo, e esta situação pode aumentar a frequência do comportamento que levou a essa resposta sensibilizada. Alguns cães aprendem a auto-mutilarem-se devido às respostas químicas que provocam no seu corpo. Poderá entender-se este comportamento como uma forma de se auto-medicarem.
Reforço Positivo (R+)
R+ implica o aparecimento de algo agradável para o animal. Se lhe apresentamos algo que ele entende como bom, então o comportamento que apresentou quando o recebeu será reforçado. Os cães com este tipo de comportamentos reforçados continuam a apresentá-los para que obtenham respostas positivas. São os primeiros a procurar e maximizar reforços.
O instante da apresentação do reforço é importante. O comportamento que realizava o cão quando recebeu o reforço aumentará em frequência. Assim que fizer algo que queremos premiar e se esperamos três segundos para o fazer, fica-se sem saber o que foi efectivamente premiado (e aí é muito importante o uso do clicker como marcador). Pode dar-se o caso de o cão ter feito uma dezena de coisas nesse espaço de tempo, e uma ou duas delas são as que serão reforçadas e nenhuma delas poderá ter nada a ver com o comportamento que queríamos reforçar. Pode acontecer também que julgamos que estamos a castigar um comportamento mas não importa o que nós achamos: só importa o que pensa o animal e se o toma como reforço positivo, então, isso é o que conta. Por exemplo, muitas pessoas pensam que gritar e empurrar o cão quando salta para atrair a nossa atenção é um castigo mas de facto essas acções podem reforçar o comportamento porque o cão procura atenção quando salta; gritar-lhe e empurrá-lo é dar-lhe atenção. O comportamento aumenta em frequência e nós não somos capazes de o reconhecer porque sentimos que as nossas acções deveriam castigar e esta situação bloqueia a nossa capacidade para avaliar de forma correcta os efeitos das suas acções. Outro exemplo: uma vez que o cão se habitua ao castigo, o seu corpo liberta uma grande quantidade de hormonas de luta contra o stress quando é castigado. Estes produtos químicos são muito aditivos desde o ponto de vista fisiológico e provocam prazer. O dono não consegue notar o aumento do comportamento porque está “seguro” de que deveria ser um castigo quando na realidade o castigo resulta num grande reforço. Para evitar estas situações devemos observar o efeito real sobre o comportamento para determinar se algo é um reforço ou não.
Castigo Negativo (C-)
C- implica retirar ao cão algo que lhe dá satisfação. Se o cão quer a nossa atenção ou apoio, afastamo-nos dele quando faz algo errado. Com este procedimento irá diminuir o frequência do seu comportamento. Se lhe colocamos uma guloseima diante do nariz, como isco, e entretanto se comporta de forma inapropriada, se lha tiramos (se a damos a outro cão ou se a comemos nós) a frequência desse comportamento inapropriado será reduzido, já que não deu resultado para conseguir o reforço.
Castigo Positivo (C+)
C+ implica apresentar ao animal algo que ele conote como negativo ou desagradável. Se lhe damos um puxão de trela, uma palmada ou uma severa reprimenda então o comportamento que realizava nesse momento seguramente diminuiu de frequência. Os cães são os primeiros a quererem minimizar os castigos e portanto comportam-se de maneira a evitá-los, a menos que exista um reforço que supere a experiência negativa. Não se deveria usar o C+ se existem opções de R+ e só deverá ser utilizado por um profissional que o deve programar com cuidado. O uso indiscriminado e sem conhecimento do C+ não é ético. Para se usar um C+ devem ser observados numerosos critérios. Primeiro deve ser suficientemente intenso para surpreender e erradicar o comportamento. Segundo, deve se aplicado cada vez que se produz o comportamento. Terceiro, o C+ deve ser utilizado imediatamente depois de ter acontecido o comportamento a corrigir. Quarto, devemos ensinar ao cão um comportamento alternativo que pode realizar para evitar o C+. Quinto, o comportamento deverá cessar ou reduzir-se significativamente com um par de aplicações do C+. Numa situação ideal o cão deveria apresentar um novo comportamento imediatamente depois de se aplicar o C+. Se existe um historial de reforço desse comportamento então será muito difícil que seja afectado pelo C+.
Não é que o castigo não funcione. Funciona se aplicado correctamente (que raramente acontece, mesmo aplicado por profissionais). O problema é que a aplicação do castigo não é ético se existe uma opção de R+ disponível e esse pode ser o caso. O C+ tão pouco é desejável se tivermos em conta os efeitos secundários. O condicionamento operante ocorre ao mesmo tempo que o condicionamento clássico (ou pavloviano). O cão associa as coisas agradáveis e desagradáveis com a pessoa que lhas apresenta, nós!. A menos que as façamos correctamente, inclusivamente neste caso, o cão experimentará uma resposta de stress e a aprendizagem será inibida. Além disso o cão tem que realizar um comportamento para ser castigado e cada ensaio do comportamento reforça de forma intrínseca e lhe dá mais confiança. E por que não prevenir o ensaio, baixar o valor do reforço do comportamento e aumentar o valor do reforço de um comportamento ou opção alternativa? Além disso, utilizar um C+ faz-nos entrar em areias movediças. Uma vez que se decide considerar o C+ como uma opção, normalmente deixamos de ser criativos para procurar um método de R+. A explicação está no facto da utilização do C+ ser mais fácil e requerer menos reflexão e também porque reforça descarregar coisas sobre o pobre animal. Aqueles que não utilizam o uso do C+ por opção são mais criativos e procuram maneiras menos arriscadas para alterar o comportamento.
Reforço Negativo (R-)
R- implica eliminar algo que o animal considere desagradável, a sua aplicação obriga à presença do C+. Se estrangularmos o cão, quando o levamos num colar de estrangulamento, na altura em que ele deixar de puxar estamos a aplicar um R- e uma vez que o animal o experimenta várias vezes reduzir-se-á a frequência do comportamento, a menos que exista um reforço que compense a má experiência ou a menos que a experiência do estímulo aversivo seja tão intensa que iniba o córtex cerebral (parte do cérebro que realiza a função cognitiva e a aprendizagem) ou a menos que se habitue a ele. Uma resposta emocional a uma experiência negativa inibirá a aprendizagem. O R- não deverá ser utilizado se existirem opções de R+ (é seguro que existem se se tiver disposição para pensar no assunto de forma criativa).
É importante salientar, por ser de extrema importância, que um C+ deve sempre terminar com um R-
Conheça melhor:
http://pt.wikipedia.org/wiki/Condicionamento_operante
http://psicologiaexperimental.blogs.sapo.pt/877.html