讀古今文學網 > 態度改變與社會影響 > 附錄B 態度及其成分的測量 >

附錄B 態度及其成分的測量

在實驗研究與現場研究中,研究者測量人們的反應。在本文中,我們將考察許多研究,就因變量如何被測量進行簡短描述。同時,我們將對一些基本測量技術進行詳細的描述。儘管某一特定的研究常常需要對一些特殊的測量進行調整,但這些基本測量技術常常是特殊測量的基礎。我們將主要關注態度的測量,這是本文的核心概念。同樣,我們將會簡略地提及如何對態度系統的其他成分進行測量。

如果你停下來思考一下,那麼你將發現態度的測量並非一項容易的任務。如何能夠測量一個人頭腦中的看法?如你可能猜測到的那樣,這個問題的惟一解決方法就是使這個人將內部態度外顯出來,然後你就能夠對它進行評定了。換言之,你必須使這個人將其內在態度轉換為外在行為。而這一外在行為可能涉及到完成一個紙筆測驗或問卷。

態度量表

人們已經開發出了許多不同的紙筆測驗來測量態度。在這些測驗中,有4種類型的測驗經過不斷修訂,已經較為成熟。這些主要的技術是瑟斯頓的等距量表法(Thurstone』s method of equalappearing interval),利克特的累積評定法(Likert』s method of summated ratings),格特曼的量表圖分析法(Guttman』s scalogram)以及奧斯古德的語義區分技術(Osgood』s semantic differential)。下面我們將簡要地回顧一下這些方法,希望能夠使你更加清晰地理解社會心理學家如何獲得數據,如何從這些數據中得出精彩的推論。

所要討論的每種技術,對所用測驗項目的性質和對所提供的個體態度的信息都有著不同的假設。然而,所有這些方法的某些基本假設是共通的。首先,它們假設可以通過量化技術來測量主觀的態度,因此每個人的觀點可以通過計分來表述。其次,它們假設一條測驗項目的含義對於所有被試都是相同的,因此對所有被試的同樣反應,計分相同。這些假設可能並不總是正確的,但是不包括這些假設的測量技術至今還沒有開發出來。

瑟斯頓的等距量表法。1929年,瑟斯頓在他關於宗教態度的研究中發展出了第一個態度測量的主要技術。他編製的量表把精確的測量引入到了一個以前從未曾用量表研究過的領域。瑟斯頓假設,人們能夠獲得關於某個特定問題的觀點陳述,能夠就此問題在明確的喜歡—不喜歡這一維度上對觀點陳述進行排序。進而,我們能夠在一個連續體上對相鄰的兩個陳述以相等的間距進行排序。由於後一個假設,我們能夠對不同的人之間彼此態度的差異程度進行判斷。瑟斯頓還假設,不同陳述間是彼此不關聯的,每個陳述是獨立於其他陳述而存在的。也就是說,對一個陳述的接受並不必然意味著對其他任何一個陳述的接受。

瑟斯頓量表由關於某一特定問題的20個獨立觀點陳述所組成。每個陳述均會獲得一個量化的量表值,這個量表值取決於在一個連續體上對該陳述判斷的平均數。在測量人們對一個特定問題的態度時,要求人們仔細地選擇那些他們贊同的陳述。每一個人的得分是他所選擇了的那些項目的平均量表值。以下是這類量表的一個簡縮版例子。

瑟斯頓量表的一個顯而易見的特徵是,陳述間的間隔是近乎等距的。量表的這一特性是通過量表的編制方法來達到的。第一步是收集關於某個特定問題的大量觀點陳述。任何含糊不清、不明確、有歧義的陳述,或者持相反態度的人可能會同時贊同的陳述,立刻被放棄。然後,由一組鑒定者根據這些陳述所表達的對問題的贊同或者不贊同程度,但不考慮鑒定者自己的態度,將剩餘的陳述劃分為11個類別。這些類別因此構成了一個量表,量表涉及關於特定問題的觀點,從非常贊同,中性,再到極端不贊同。通過將所有鑒定者的評分進行列表,從而有可能計算出每個陳述的量表值(陳述的平均量表值),以及鑒定者對它的位置表示贊同的程度(評定的分佈)。最終量表所選擇的那些陳述具有很高的鑒定者一致性,並且沿著連續體分佈在彼此相對等距的位置上。因此,一個人對某個特定問題的態度,可以從他對這套最終量表項目的反應中獲得。

利克特的累積評定法。瑟斯頓量表在應用上的缺陷之一是,它的編制非常費力和耗時。為了解決這一問題,利克特發展出了一種不同的技術,運用這一技術能夠相對容易地形成一個同等可信的態度量表。利克特量表由關於某一問題的一系列觀點陳述組成。然而,與瑟斯頓量表相反的是,利克特量表通過要求一個人指出對每個項目贊同或不贊同的程度從而對他的態度進行測量。讓這個人在5點反應量表(非常同意、同意、不確定、不同意、非常不同意)上,對每個項目進行評定,從而測量了他的態度。一個人的態度分數就是他每個項目評分的總和。以下是一個單一量表項目的例子。

A.「判處一級謀殺的罪犯死刑是一件好事」

利克特假設,量表中的每個陳述在同一態度維度上是一個線性函數。這一假設是對個人單個項目得分累加(或者說得更正式一些,對所有評定求和)從而得到最終分數的基礎。這一假設的更進一步意義是,量表中的項目必須與一個共同的屬性有高相關,因此各個項目相互間有了高相關;這一點與瑟斯頓量表相反,在瑟斯頓量表中,各個項目是獨特的和獨立的。需要指出,利克特從未假設過量表值是等距的。例如,「同意」與「非常同意」之間的差異很有可能遠遠大於了「同意」與「不確定」之間的差異。這就意味著利克特量表能夠提供關於人們在一個連續體上態度排序的信息,但是它無法準確地指出不同態度之間可能多麼接近或者相差得多遠。

利克特量表的編制方法與瑟斯頓最初收集和編輯大量觀點陳述的過程相似。然後,由一個被試樣本根據他們自己對這些陳述的意見在5點反應量表上對剩餘的陳述進行評定。這一點與瑟斯頓的技術相反;在瑟斯頓的技術中,由受過專門訓練的鑒定者來做出評定,鑒定者做出評定的依據是陳述在連續體上所處位置這種相對客觀的標準,而非個人的觀點。利克特量表由那些最大限度區分出總分最高與總分最低的被試樣本的項目所組成。

格特曼的量表圖分析法。第三種量表編製技術基於這樣一種假設:可以通過在「接受的困難性」這一連續體上排序的一套陳述,對一個單獨的和單維的特質進行測量。也就是說,陳述是從能被絕大多數人輕易接受到幾乎不被人所認可。此類量表的項目是可累加的,因為對一個項目的接受意味著個體接受那些更小量級的(那些更容易被接收的)所有陳述。在一定程度上這一假設是正確的,如果知道了個體所能接受的最困難的陳述,那麼就可以預知他對其他陳述的態度了。這類量表的一個示例如下:

為了獲得一個表述單一維度的量表,格特曼向被試樣本呈現一套初始項目,並且記錄他們在何種程度上按照特定回答模式對項目作答。這些特定回答模式,被稱作標量類型(scale types),遵循一個特定的階梯形順序。被試可能不會接受任何一個項目(得分為0),可能只會接受項目A(得分為1),也可能會接受項目A和B(得分為2),甚至還可能會受項目A、B和C(得分為3)等等。如果被試做出了非標量反應模式(nonscale response pattern)(例如,只接受項目C而不接受其他更小量級的項目),那麼就認為他犯了一個或者更多的反應錯誤。通過分析所犯反應錯誤的數量,格特曼能夠確定這套初始項目在何種程度上反映了單一屬性(即它們的可測量性達到了何種程度)。通過刪除糟糕的項目和對被試樣本重測,直至形成一套可測量性較好的項目,這樣就獲得了最終量表。

於是,通過使個體選擇出量表上所有他可接受的陳述,就可以測量出個體的態度。各種格特曼量表被用在了關於態度捲入的研究中,以決定人們接受與拒絕的範圍(見第6章)。最後的得分是在相應標量類型上的分數,或者最接近於其反應的標量類型上的分數(如果個體做出了非標量反應模式)。後一種計分程序表明,我們幾乎不可能開發出一個完美的單維量表。這可能是因為人們的實際反應不是基於那個假定的單一維度,而是基於一個不同的維度或多個維度。

奧斯古德的語義區分技術。上述三種方法都是通過使人們指出自己對各種觀點陳述的贊同程度來對態度進行測量。與這一途徑相反,奧斯古德通過關注人們對一個單詞或者概念所賦予的意義來研究態度。這一技術所暗含的一個基本假設是,存在著一個維度數量未知的語義空間,任何詞語或概念的意義都可以表述為這個語義空間的一個特殊點。奧斯古德的方法是,讓人們在一套語義量表上對一個特定概念進行判斷。這些量表由以中性為中點並包含了七個可辨別等級的成對反義詞所構成。例如,通過讓某個特定的人在一套語義量表上對「核能」進行評定,可以獲得「核能」這一概念對這個人的意義。

對由這種方法收集到的評定進行分析,可以揭示人們在刻畫他們自己經驗時用到的特殊維度、視作意義相同或不同的概念類型,以及對特殊概念所賦予的意義強度。奧斯古德自己的研究表明,人們在判斷概念時主要會用到3個獨立維度(Osgood et al., 1957)。他將這些維度稱為評價因素(例如好—壞)、潛力因素(例如強—弱)以及活動因素(例如主動—被動)。儘管這一方法能夠提供許多關於概念的信息,但是一個人所賦予概念的意義如何與其態度發生關聯,卻完全不清楚。

實驗中的單一項目量表與少量項目的量表。在大多數關於態度或態度改變的研究中,特別是實驗室研究中,態度測量只由單一或少數幾個項目組成。通常,測量使用利克特量表形式,而不是系統化地編製多項目的問卷。例如,在一項說服研究中,在說服信息呈現後緊接著出現的第一個項目,複述了信息的結論,並要求被試在利克特量表上就他對信息的贊同程度進行評定;評定可能會是5點、10點、甚至30點或更多點的量表,並且會在其中一些分數處附加描述性的標記。例如:

大學應該向學生徵收每學期50美元的停車費:

也可以運用修正過的語義區分技術。通常所選擇的語義量表強調好—壞這一維度,這一維度最符合把態度作為總體性評價的這一定義。例如,在聆聽了倡導徵收學生停車費的信息後,被試可能會被要求「在以下四個維度上對向學生收取停車費這一想法進行評定」。維度可能是好的—壞的,明智的—愚蠢的,贊同的—不贊同的,以及有益的—有害的。在一些情況中,可能會對每個學生的4個評定進行累加,而最後的總分則被視作這一被試的態度得分。

除了這些常用的方法外,也會使用一些特殊的自評量表。例如,可能要求被試針對一個態度客體在「喜歡—不喜歡」這一尺度上做出自我評價。

對自我的態度測量。實際上,不同研究在態度測量的方式上相互間有很多差異。這種一致性的缺乏引發了解釋性和可比性的問題。事實上,不僅僅是量表或被試反應任務的不同。即使使用非常相似的測量系統,實驗可能也會運用不同的技術來將這些相同的反應轉換為定量導出的自變量。當兩項研究要求被試在支持—反對和喜歡—厭惡的尺度上標注一個點從而給出他的觀點時,我們就可以看到後一個問題。態度的改變可根據以下任何一種測量來加以描述:(1)顯示了任何積極改變的被試百分比;(2)顯示了「巨大」、「中等的」、「微弱的」或者「沒有」改變的被試百分比(任意定義的類別);(3)淨百分比的變化(積極變化減去消極變化);(4)上述三種測量的任意結合;(5)改變了的絕對平均尺度距離;以及(6)實際發生的改變與可能發生的改變的比值。

態度測量的多樣性有其積極的一面。首先,如果即使採用了不同的測量技術也出現了相似的結果,那麼我們能夠更加自信地認為,這些結果是有效的和可推廣的——所研究的自變量確實以觀測到的方式對態度產生影響(Campbell&Fiske,1959)。如果只以完全相同的方式對因變量進行測量,那麼有可能是測量程序自身導致了所觀察到的結果。其次,精心挑選和開發的態度測量(即使是由少數項目構成的量表)相互間在得分上通常具有高相關,這暗示著它們所測量的是態度的相似方面。第三,我們注意到,不同研究者和不同研究可能不會恰好全都關注於同一態度構想。例如,一些理論闡述或應用研究問題可能主要關注於作為信念和認知總體的態度,而其他理論闡述或應用研究問題可能主要關注態度的情感成分。在前一種情形中,瑟斯頓量表可能最為合適;而在後一種情形中,在喜歡—厭惡和好—壞尺度上的評定可能正合我們所需。兩者關注的內容都與態度有關,但是無論在概念上還是在操作上,測量都不相同——它們本不該相同。

對態度系統其他成分的測量

在本書的各個章節中,我們看到了對由個體態度導出的實際行為進行測量的各種案例。例如,在一些說服研究中,實驗者能夠向被試提供機會,使其按照說服信息所灌輸的新態度來行動:簽署請願書、獻血、購買產品或者做出信息所推薦的其他一些反應。在依從與認知不協調的研究中,研究者觀察了諸如購買彩票、對另一個被試撒謊以及公開拒絕團體決策等行為。當的確無法對行為進行觀察時,研究者可能會測量通常與未來行為有關係、但卻不是絕對相關的行為意向(見第1章和第5章)。研究者可能會要求被試在數值量表上評定出他們有多大的可能性會做出某一行為(例如,購買產品或者戒煙)。

近年來,社會心理學家對測量態度系統中認知成分的興趣日漸增長。一項通常被用於說服研究中的常用技術是觀念枚舉法(thoughtlisting method)(Greenwald, 1968;Petty&Cacioppo, 1981)。被試在聆聽或閱讀信息後,被要求寫下他們自己所能想到的任何與所探討的問題和信息有關的想法。要求被試把他們的想法分類為「單獨的觀念」,並且發給他們一套被分隔為多個部分的答題紙,讓其在紙上逐一寫下自己的想法。這一任務有時間限制(通常是3分鐘)。稍後,兩個或更多的評判者對這些想法進行評分和分類(評判者們從不知道被試所處的實驗條件)。依據實驗關注焦點的不同,可以對每個想法進行各種不同的分類,包括贊成還是反對信息的立場,是反映了信息的內容還是被試自己產生的想法,是與信息本身有關還是與溝通者有關,等等。通過考察某些種類的想法,研究者通常能夠獲知與態度的信念和知識基礎有關的大量內容,以及信息或其他處理如何影響這些心理變量。

根據觀念的複雜程度、觀念的評價一致性和議題的知識等維度,可以使用內容分析技術(content analysis technique)來對文章、團體慎思擇宜(group deliberation)和其他言語反應進行分析。

反應時測量和生理測量也被用來測量有關態度的概念。人們發出信號表示贊成或反對簡短的態度陳述所花費的時間(稱為反應時)被用來研究態度的可及性以及強度。

生理測量,例如心律和皮膚電反應(與出汗類似),長期以來一直被用於探究態度系統中的情緒與情感成分。傳統的生理測量程序能夠有效地測量出情緒與情感強度的改變,但是無法揭示這些反應所反映出來的是積極態度還是消極態度。然而近來,研究者們正在研究人們對社會刺激的一些非常特殊的身體反應,再加上進一步的測試,就可能揭示出人們對某一社會刺激的真實態度傾向。例如,在一項精心設計的研究中,研究者觀察到,當人們聆聽和思考說服性信息時,在他們嘴周圍的面部肌肉活動有一些微小但可測量的變化(Cacioppo&Petty, 1987)。當信息接收者進行反駁時,其面部肌肉改變是一種模式,而當信息引發了積極、贊同的認知反應時,其面部肌肉改變又是另一種模式。這一研究建立在有關情緒與面部表情之間已知的相互關係之上(見第7章)。

總而言之,可以說在態度改變與社會影響的研究中所使用的測量技術是多種多樣的,其中一些方法比另一些更為成熟。