這篇主要就是講獎懲的問題,因為以前想過類似的事情,寫過類似的文章,所以寫起來比較行文暢快(?)。
有興趣多了解一些的朋友可以讀我寫的〈誠實的選擇。(論獎懲)〉
底下文章中提到的《桃源二村》,是一位行為主義的心理學家寫的書,我自己沒有讀過(也許我應該要讀過再寫會比較好?),讀了網路上的書評,大致可以猜測內容是一群人到了桃源二村(類比於陶淵明的〈桃花源記〉)觀光,帶領他們參觀的人逐步向他們解釋這個局部的社會是如何用行為主義的方式建立起來的,並且回應他人的質疑。
-----
心理學作業五:行為主義的理想國。
開頭先讓我情緒化一點,以為能用行為主義塑造出各種想要的人,或是建造出理想的社會,這種想法是完全可笑的,可笑到我一時之間不知道該從何反駁起。(一方面此刻心情不是太好,才有了這樣的開頭)
接下來會個別論述,先從「給我一群嬰兒,我可以要他們變成怎樣就變成怎樣。」這個論述反駁起,我期許自己能用越少的社會情境因素去反駁,反駁的力道會越強。
就從行為主義實驗出的「習得性無助」來解釋,把狗放在沒有辦法逃離的籠子裡,給予牠電擊,一開始牠會試著找尋逃離的方式,嘗試一段時間無解之後就會放棄,即使再有機會也變得不願嘗試,寧可默默接受電擊。光從這個事實就能推出上述論述的問題。我準備說行為主義連想讓一隻狗變成怎樣就變成怎樣都沒有辦法。
何謂「嘗試一段時間」?設想我今天將狗放在一個看似沒有辦法逃離的籠子(一樣給電擊),但其實裡面有難以預想的機關設置,例如狗依照固定順序碰觸了200個按鈕,門就會打開,那麼狗是會一直試到牠成功按出機關呢?還是牠在這個過程中就會產生「習得性無助」?想必狗是不可能無止盡地嘗試下去(當然在原本的實驗中,我們可以看到,有些狗比較不容易產生習得性無助的感覺),若是狗總是會無止盡地嘗試下去,那麼我們根本不可能觀測到習得性無助的現象。
行為主義者會反駁我說:「你這樣做當然不行,但如果你先訓練狗按一個按鈕,再訓練牠按下一個按鈕,依此類推,我們當然是可以把狗訓練成依照固定順序按出200個按鈕,離開籠子。」這樣的說法也不無道理。那再設想一個情境,籠子裡就只有一個按鈕,按了就可以出來,那個按鈕一開始放在一般成年狗的腳的大小踩得進去的洞裡。把狗放進去訓練牠,一開始牠按得到那個按鈕,出得來,之後我們漸漸把洞口縮小,牠一開始大概仍會試著勉強壓進去,但直到牠的腳踩不進去那個洞之後,牠是會死命地嘗試把腳塞進洞裡(削足適履?),還是牠會在嘗試一段時間之後放棄?
要注意到,或許狗真的有這個能力,可以藉由擠壓自己的腳慢慢地把它壓小,終至某一天可以塞進去那個洞,但牠當然也有可能在這個過程中就已經產生了習得性無助(也許因為腳的痛苦帶來的不適更勝過電擊)。
行為主義說我們可以訓練動物做到牠本能能力範圍所及的事情,我們當然不能教狗飛,教魚在陸地上走路,但想想我上面提出的例子,怎麼樣的行為才算是本能能力範圍所及的事情?狗如果(狠下心來)把自己的腳咬掉一半(變細),牠確實可以按到按鈕,但牠會這麼做嗎?或不要說全部的狗--「大多數的狗會這麼做嗎?」
我認為行為主義不得不承認,回應獎賞和懲罰的方式不只一種,不是只有達成目標才是解答,「習得性無助」也是回應獎懲的一種方式,當你試圖用操作制約去影響狗(動物)的行為時,牠可以按對按鈕回應你、得到你的獎賞;但牠也有可能會因為不斷嘗試都無效而習得無助,問題在於這條界線在哪?非常簡單的行為當然不太可能習得無助,但困難一點的事情,可能有些狗嘗試一下就能做到,有些狗要嘗試很久才能做到(天生能力的變異),我們也已經知道習得無助的時間不是每隻狗都一樣,那麼哪些狗會選擇「達成目標」,哪些狗會「習得無助」呢?即使我們有統計上的結果出來,也完全不能使我們準確預測單隻狗的行為,挑出一隻狗,這隻狗會被制約成功,還是放棄?
同樣的情況類推到人類,這條界線的模糊程度就更大了(我認為),但我姑且假設這條界線沒有變得更大,只是仍然存在,那麼這個嬰兒是會被操作制約訓練成律師呢?還是他會在過程中習得無助?
如果今天行為主義者說的是:「給我一群嬰兒,我設法用行為主義將他們訓練成律師,在這過程中大約有70%的人會達成目標,其餘30%的人會習得無助。」那我勉強可以同意。但想讓他們變成怎樣就變成怎樣,我會請他們回應上述狗的問題,甚至可以更簡單一點地問:「你能肯定如果有逃出籠子的辦法的話,這隻特定的狗絕不會放棄嗎?」
也許行為主義者還是會認為,要讓狗做出傷害牠自己身體的行為也是可以制約的(畢竟要人傷害自己也是有可能的),我再提一個假設的實驗。把狗放在籠子裡,給予其充足的食物(讓牠有能量),並週期性地給予電擊,籠子打開門的條件是狗在內部數次撞擊籠子(可以用撞擊作功的值來測量),為了滿足「從簡單的基礎開始訓練起」的前提,一開始設定牠只需要撞一兩下的力量就會打開,過一周後調高需要作功的值(例如變成要撞三四下),再過一周再調高,如此反覆操作個一年,看狗是不是會被制約成進去籠子以後就「一直撞籠子撞2個小時(也許要更久),為了逃離電擊。」亦或是牠會在實驗過程中就習得無助。我預測是會習得無助(但我當然沒有任何證據)。
再來回應《桃源二村》,基本上我的反駁論點與上述類似。
行為主義認為能夠藉由獎賞跟懲罰(姑且不談古典制約)的方式制約人(人也是動物)的行為,概念上就是,我們覺得好的行為,就獎賞他,反之懲罰他。意思是我們預先設想了一種「目標(典範)」的行為,獎賞或懲罰的目的都是為了設法使對方朝這個「目標」前進,而行為主義預設對方會做出「達成目標」的行為來回應獎懲。
那碰上的困境類似,即人「回應獎懲」的方式不唯一,人可以回應獎懲的方式有太多種了,略提幾個:
(1)試圖毀滅掉獎懲自己的人/東西。
(2)試圖盡可能避開獎懲自己的人/東西。
(3)試圖反過來控制獎懲自己的人/東西。
(4)自我毀滅。
那條決定人會選擇「達成目標」(因為目標如同按按鈕般簡單)跟「其他種回應獎懲的方式」的界線在哪?跨出那條界線以外的行為要怎麼用行為主義制約?個體的變異性應當會影響個人的界線高低(如同上述想像中狗的實驗),對整體人類皆一致的界線標準應當不存在。
假設真的找到了一個對大多數人通用的界線,並且對違反界線以外事情的人類,直接將其抹殺,我們用「人擇」取代「天擇」,執意將「能用行為主義制約多數到所有行為」的基因留下,如此或許真的有可能在幾千、幾萬世代以後,達成《桃園二村》的理想國,畢竟我們要扭轉的是演化數億年留存下來的基因,這個基因使得我們對現實世界的獎懲不總是有同個反應,有些人被火燙傷會遠離火,有些人則會試著承受它,有些人會想滅掉它,有些人會冒著生命危險研究它,如果人類一致性選擇「達成目標」(例如說是遠離火)的行為,可能會讓我們在情況稍微產生變異(例如周圍起了森林大火)時就全部採取相同行為而被滅絕。
我們現存的基因就是離《桃園二村》的理想仍非常遙遠的基因,我們有書念不好的人會攻擊教育體制;有不想受父母管教的人會離家出走;有不想受法律約束的人會鑽研法律漏洞;有工作做不下去的人選擇自殺。我們不只會選擇達成目標而被獎賞或不被懲罰,我們主觀上(我現在才用到主觀)也會考慮這樣的獎懲合不合理,因而採取不同的回應方式,不同的回應方式不一定會滅絕自身的基因,也有可能找出其他出路,或是幫助其他有相似基因的人找到出路。
如果要我為行為主義設想一個我認為可行的《桃源二村》成真的論述,我會這麼說:「給我一群人類,以及全然隔離其他人的實驗環境,建立一個定好精確界線的獎懲裝置,這個裝置會對界線內的行為給予獎懲,對做出超出界線行為的人直接抹殺,從現在起給我數億年的時間來人擇這個實驗環境裡的人類,在那之後就是我們的理想國了。」(至於這個理想國會不會因為地球環境的輕碰就滅絕,那就是另回事了)
-----