손다이크의 도구적 조건형성과 스키너의 조작적 조건형성

이전 포스팅에서 고전적 조건형성에 대해 소개했습니다. 이번 포스팅에서는 손다이크의 도구적 조건형성과 스키너의 조작적 조건형성에 대해 다뤄보겠습니다.

손다이크의 도구적 조건형성

손다이크는 동물의 사고능력에 관한 객관적인 실험 증거를 얻고자 병아리, 고양이를 대상으로 동물 실험을 하였는데, 손다이크가 실시한 유명한 실험은 고양이를 대상으로 한 문제 해결 실험입니다.

고양이를 문제 상자 안에 넣고 고양이가 볼 수는 있지만, 발이 닿지 않는 곳에 먹이를 두었습니다. 문제 상자의 문을 여는 방법은 발판을 누르거나 고리를 당기면 됩니다. 배가 고픈 고양이는 처음에는 틈새를 비집고 나가려고 하거나, 틈으로 발을 내밀거나, 상자를 발톱으로 긁거나 물어뜯었습니다. 그러던 중 우연히 고리를 당기거나 혹은 발판을 눌러서탈출하게 되면 고양이는 갑갑하고 통제된 환경으로부터 자유와 먹이를 보상받게 됩니다.

먹이를 보상받은 후, 다시 문제 상자 안으로 집어넣으면 또 다시 문이 열리는 것과는 무관한 행동을 하게 되지만, 이런 시행이 반복됨에 따라 무관한 행동은 줄어들게 되고 마침내 문제 상자에 넣자마자 고양이는 곧바로 발판을 누르거나 고리를 당겨서 밖으로 나오게 됩니다.

여기서 고양이가 발판을 누르는 것은 외적 자극의 영향이라기 보다는 자발적이고 능동적인 행동입니다.

이러한 반응을 도구적 조건형성이라고 합니다.

손다이크는 고양이가 발판을 누르거나 고리를 당기는 것을 학습한 것은 추리에 의해 문제를 해결하는 것이 아니라, 이런 저런 시도를 해 보던 중에 우연히 올바를 행동을 하게 된 것이며, 올바른 행동 이후 보상을 받으면 시행을 거듭하면서 올바른 행동과 보상 사이의 연합이 형성되는 것으로 봅니다.

이처럼 동물 학습은 추상적인 지적학습의 결과가 아닌 수많은 시행착오를 거듭하면서 이루어진다고 볼 수 있는데, 손다이크는 이를 시행착오 학습이라고 정의하였습니다.

손다이크의 실험에서 발판을 누르거나 고리를 당기고 밖으로 나온 고양이에게 연필과 같은 것으로 보상을 준다면 발판을 누르거나 고리를 당기는 행동을 학습하진 않았을 것입니다.

즉, 피학습자가 원하는 것을 보상해 주었을 때 가장 학습이 잘 일어나게 되는데 이것을 '효과의 법칙'이라고 부릅니다.

스키너의 조작적 조건형성

스키너는 손다이크에 의해 도구적 조건형성이 확립된 후 '스키너 상자'라는 장치를 제작하여 학습과 행동에 관한 지식의 폭을 크게 넓혔습니다.

스키너 상자는 레버를 누르거나 불빛이 켜진 단추를 누를 수 있도록 장치가 되어 있고, 먹이가 나오는 장치도 되어 있습니다.

상자 안에 배고픈 쥐를 넣었을 경우, 쥐가 우연히 레버를 누르면 먹이가 나옵니다. 이 과정을 반복하고 나면 쥐는 레버를 누르면 먹이가 나온다는 것을 학습합니다.

스키너 상자 속의 쥐 또한 손다이크의 고양이처럼 처음에는 여러 행동을 보이지만 훈련이 진행됨에 따라 레버를 누르는 반응이 빨라지게 됩니다.

스키너는 레버와 같은 반응을 '조작 반응' 이라고 불렀는데, 그 이유는 쥐들이 환경을 변화시키기 위해 환경에 조작을 가했기 때문입니다.

또한 그는 적절한 조작 행동을 습득하는 절차를 '조작적 조건형성'이라고 불렀습니다.

스키너는 반응률을 증가시키는 먹이를 '보상'이나 '만족스러운 결과'로 부르지 않고, 반응을 강화시킨다는 의미로 '강화물'이라고 불렀으며, 행동을 강화시키는 절차를 '강화'라고 불렀습니다.

강화란 특정한 자극이나 반응 뒤에 어떤 바람직하거나 좋은 것이 제공되는 것을 말합니다.

강화 절차에는 정적 강화와 부적 강화가 있습니다.

정적 강화는 먹이와 같이 보통 동물이 좋아하는 것으로 반응 뒤에 이것이 주어지면 반응의 빈도가 증가되는 것입니다.

예를 들어, 동물들은 음식이나 물을 얻기 위하여 레버를 누르고, 문을 여는 것을 학습하는 것으로, 이 과정에서 음식이나 물(정적 강화물)은 동물들이 생득적으로 좋아하는 성질을 가지고 있습니다.

이에 비해 부적 강화는 전기쇼크나 고통같이 동물이 피하려고 하는 자극이 반응 뒤에 제거되거나 감소됨으로써 반응빈도를 증가시키는 절차입니다.

즉, 어떤 것이 감소되거나 종결될 때 진행 중인 행동이 재현될 가능성이 증가하는 것으로, 전기충격이나 시끄러운 소리(부적 강화물)를 회피하기 위하여 도망가는 것을 학습하는 것입니다.

예를 들어, 아동들은 칭찬(정적 강화물)을 받기 위하여 피아노 연습을 하거나, 싫증 나는 숙제(부적 강화물)를 하지 않기 위하여 피아노 연습을 할 수 있습니다.

동물의 경우, 음식이나 물(정적 강화물)을 얻기 위해서 레버를 누르고 문을 여는 것을 학습할 뿐만 아니라, 전기 충격이나 시끄러운 소리(부적 강화물)로부터 도망가기 위하여 행동하는 것을 학습할 수도 있습니다.

따라서, 정적 강화물과 부적 강화물 모두 새로운 행동의 학습을 가져오고 현존하는 행동의 빈도를 높이는 역할을 합니다.

'영유아 발달 정보' 카테고리의 다른 글

피아제의 인지발달 이론 (0)	2025.04.14
반두라의 사회학습 이론 (0)	2025.04.14
행동주의 이론 - 고전적 조건형성 (0)	2025.04.14
에릭슨의 사회적 정신역동 이론 (0)	2025.04.14
정신역동 이론 - 프로이트의 정신분석 이론 3(구강기, 항문기, 남근기) (0)	2025.04.14

빵글이의 하루

손다이크의 도구적 조건형성과 스키너의 조작적 조건형성