讀古今文學網 > 實驗是如何終結的? > 鴨子、兔子與誤差 >

鴨子、兔子與誤差

20世紀早期實驗物理學界的大事件可以說是非同尋常,表2.1和圖2.15對此進行了概括。首先,在旋磁實驗的嘗試中,麥克斯韋一無所獲。經典場論貌似無需物質載流子的概念,在幾十年的時間裡,該方面的重大成就使得所有種類的旋磁實驗均遭到了淘汰。通過洛倫茲電子理論,物質流概念得到了復興,英國物理學界對陰極射線的物質性也給予了強烈的關注。此時,理查森復甦了麥克斯韋的研究事業,但是仍然一無所獲。在對這些研究並不知情的情況下,巴奈特開始著手研究逆效應:旋轉鐵棒時,較後來實驗表明的、他「理應」發現的強度而言,檢測到的磁場強度是其五倍以上。1915年,在閱讀了理查森的論文並對自己的實驗進行修正後,巴奈特得出的g值接近2.3,並對這一解釋感到相當滿意:原子中正離子繞軌旋轉的方向與負電子的方向相反。但是,在結合了地心的未知情況後,他的主要結論卻是:這一效應可能說明了地球自轉是地磁產生的原因。

表2.1 旋磁實驗結果匯總

圖2.15 發表年份與g因子值的對比。實線描繪的是巴奈特研究結果的時間函數。愛因斯坦的理論預期值是g=1;後來的實驗和理論給出的g值均約為2。

幾乎與此同時,愛因斯坦和德哈斯一同進行了實驗。愛因斯坦同巴奈特不同,他有充分理由確信g=1。陀螺儀曾經是重要的航海設備,是由繞軌電子形成的、假定的「原子陀螺儀」的完美模型,對其相關的專利工作愛因斯坦仍記憶猶新。此外,在帝國物理技術學會進行的磁學實驗為洛倫茲的電動力學理論、朗之萬對居裡定律的解釋、普朗克的零點能量猜想和安培的分子電流假說提供了實證機會。愛因斯坦和德哈斯構建了至少四組不同的實驗裝置後,最終貌似證實了這一理論:繞軌電子是導致永磁性的原因。他們確定的g值為1.02±0.10;在次年進行的二次定量系列實驗中,德哈斯得到的g值為1.2。巴奈特明顯受到了愛因斯坦理論和實驗的影響,在重複了實驗後,他獲得的結論是對繞軌電子理論的證實:g值在1.4和1.1之間。

三名各自進行研究的實驗家斯圖爾特、貝克和阿維德森很快確定了g值不等於1。他們分別發表了各自的試驗結果,值接近愛因斯坦的值的兩倍。在數月後,巴奈特再次發表文章,肯定地表示他相信g值約為2。在隨後的兩年裡,他改進了實驗結果,摒棄了愛因斯坦的理論,轉而接受了亞伯拉罕電子理論中的一種,用以解釋自己的實驗結論g=1.89。

與此同時,德哈斯瞭解到至少其他四位研究人員發現的g值是他得出的原始值的兩倍左右,於是他在1921年重複進行了實驗工作。在當年的索爾維物理學會議上,德哈斯報告中的g值為1.54,並表示自己認為g值仍然是一個開放性問題。隨後,他又最後一次重複了該實驗,實驗的累積結果為g=1.08,與他在六年前同愛因斯坦獲得的最初結果間的差距百分比較小。1922年,愛因斯坦在柏林也堅稱g值仍為開放性問題。在這一時期,巴奈特夫婦進一步改善了實驗方法,最終在1925年發表的重要論文中表示,g的平均值為1.929±0.006。最初,巴奈特依賴於蘭德對塞曼效應光譜數據和旋轉效應的結合。到了1933年,狄拉克理論廣為人知,巴奈特連同廣泛的物理學界均將他的研究結果歸因於電子自旋與繞軌旋轉間複雜的相互作用。

很明顯,在決定結束這些各種各樣的實驗時,理論預期扮演了重要的角色。但是它是如何做到的?針對理論傾向對實驗結果的影響方式而言,存在著許多更具影響力的解釋,其中一種是由托馬斯·庫恩提出的。[1]他認為,測試新理論所需的測量值通常會在我們的實驗能力範圍內對現象造成影響。結果導致了隨機誤差相對於目標效應大小而言非常巨大。這為實驗家和理論家保留了解釋必然具有多重含義的研究結果的可能,並以此作為對自己首選理論的確證。若存在更為精確的測量技術,則這些完全相同的結果理應能夠輕易證實相反的理論。

比如,庫恩引用了皮埃爾·西蒙·德·拉普拉斯(Pierre Simon de Laplace)對空氣中音速的預測。拉普拉斯算出的理論預測同弗朗索瓦·德拉羅什(FranCois Delaroche)和克勞德路易斯·貝拉爾德(Claude-Louis Berard)測出的實驗參數間具有高度的一致性,在2.5%以內。目前的物理學觀點認為,拉普拉斯熱質論的應用範圍中誤差為40%;德拉羅什和貝拉爾德的測量值的誤差相似,均與現代測量值間相差12%左右。庫恩認為,實驗與理論間的任何一致性均是由實驗和理論間共有的不確定性導致的。在這類情況下,「對實證檢驗的選擇和評價實際上就是偏好和判斷的問題,是對理論的選擇和評價」。[2]庫恩又總結說,符合拉普拉斯理論的測量值,如德拉羅什和貝拉爾德等人的測量值,肯定也符合其他理論,「僅在『幾乎』一詞形容下的實驗普及範圍內,自然才被證明為能夠對測量者的理論傾向做出反應」。[3]

庫恩的解釋同他與漢森經常引用的可逆的格式塔意象圖法十分相符。在觀察者觀看其中一張圖片時,正因為觀察者傾向於看見鴨子而非兔子,所以一定的紋路和曲線才具有了意義。那些與整體關聯重要性不大的細節被錯過或忽略了。庫恩在探討拉普拉斯時,也保留了一個異曲同工的類似情況:在開展的眾多實驗中,有的與理論一致,而有的相反。誤差的來源多種多樣,不確定性的擴展也十分廣泛。當我們窺視著混亂的實驗世界時,會發現理論家們或有理論傾向的實驗家們可能傾向於獲得可以證實其預期的數據,而非同其產生矛盾的數據。隨著此類研究結果的傳播,相矛盾的理論獲得同樣的「支持性」證據群組也就不足為奇了。

理論是如何影響實驗結果的?筆者希望可以對此給出不同的解釋,這一解釋既非基於格式塔式的選擇,亦非基於隨機誤差的廣泛傳播。對理論與實驗間關係的理解是取決於對實驗者工作中涉及的不同理論層面的理解,以及對各種將實驗與理論元素聯接起來的機制的分析。首先,具有決定性作用的是愛因斯坦和德哈斯的理論信仰:電流渦動由繞軌電子產生,這一信仰又轉化為確切的量化預測。但需要注意的是並非所有理論層面都是相當的。愛因斯坦和德哈斯擁有一個量具,用以測量效應,這正是麥克斯韋明顯不具備的。換言之,電子軌道詳細模型的重要性遠遠不能與對電荷e和質量m的說明相提並論。這些說明由先前的實驗延續下來,並通過這一一般性概念進行理論上的關聯:若電荷與質量具有關聯,則角動量與磁矩互成正比。在缺少e/m值一類量具的情況下,麥克斯韋感到十分茫然:他連可期待何種數量集效應都無從知曉,因此也無法計算出哪一背景效應具有重要性,無法預測出儀器傾斜測量的精確程度。

理論對實驗的另一種影響是通過數學描述本身,施加的層面更為明確。毫無疑問,1917年巴奈特的理論預期之所以得以鞏固(如同對德哈斯、貝克和阿維德森的支持一樣),是源於對所寫等式兩邊表示法的頻繁切換:測定量L/M、與其理論上相等的量2m/e。由此,模型背後的理論假說暫時遠離了視線,一個重要而又具有概念性不同的任務——提供新的荷質比值——走到了台前。簡而言之,實驗家們一直將旋磁實驗視為荷質比研究,進而將安培渦動歸入已有學科範疇。在這種思維定式之下,會認為旋磁比約為1也在預料之中。

在理論模型的細節層面上,愛因斯坦也表現出了對零點能量和原子結構的關注。鑒於這樣的考量,愛因斯坦相信g值不僅數量級應當單一,而且應該只是1.0,而非2、4或1/2。此時困難就在於如何從實驗中提取出較為精確的結果。這些操作的精確度較高,因此亟需謹記:在愛因斯坦與德哈斯的鐵棒實驗中,鐵棒所反射光束的振蕩移動是以毫米為單位的,巴奈特效應也依賴於約10-5高斯數量級的磁場。在具有難度的背景條件下,對精度的需求使得誤差分析必不可少。若阻礙是來自隨機誤差,則應對步驟將清晰可見:查找並努力消除結果間的差量。但是,這一點之所以至關重要,還是因為系統性誤差來源多樣,若欲囊括標準偏差較大的指示器示蹤,則平均值將較為分散。系統誤差的影響範圍較為狹窄。

讓我們回到文字記錄中來。在1921年索爾維會議相關的發表文章中,德哈斯這樣寫道:

我們一同獲得的值與我自己獲得的值之間差異較大,對此我必須說,這些實驗的操作時間很短暫,我們已經盡量以無可辯駁的方式進行效應檢測。對效應計算中所用的數值僅有大體的瞭解。因此我們沒有測量磁化線圈的磁場,而是進行了計算;而且線圈的纏繞不是很整齊,並不是為了實驗目的而製作的。我們也沒有測量鐵棒磁化作用,僅僅進行了估算……在我們看來這些初步結果十分令人滿意,我們將最佳g值認作1.02也是很容易理解的。[4]

這些誤差並不會導致結果的傳播,地球磁場不完全中和相關的各種背景也不會導致其傳播。事實上在1915年,愛因斯坦和德哈斯給出的概率誤差為10%,即他們的結果與g值2間具有10個標準差。g值的差異由系統性誤差引起的可能性更大,這與德哈斯報告的內容是完全一致的。通過對貝克測出的飽和磁化量記錄的一瞥,我們可以發現他得出的數值比愛因斯坦和德哈斯的「估算值」要高出27%。這會使他們的g值獲得相應的提高。[5]

系統性誤差方面的解釋並不會使我們依賴於格式塔圖像或詞義的全局性變化。巴奈特後來也對g值1這一判斷進行了認真的思考:

因為長久以來疑似存在的系統性誤差……1917年使用磁力計進行觀察時,獲得的結果同1914、1915年通過電磁感應方法獲得的結果大不相同,這一點現在已經得到了完全證實。[6]

在愛因斯坦和德哈斯最初的測量結果中,g值2超出了巴奈特1917年的數據範圍(g=1.1至1.4)。巴奈特指出了其他的系統性誤差,其中包括一些看似無關的因素,如外部經過的電車、地球磁場的不完全補償以及旋轉過程中鐵棒的膨脹等。其中並未包括統計學傳播的零散答案。

前文引用的德哈斯和巴奈特的話表明,實驗者們對系統性誤差帶來的誤區有清楚的認識。在這些實驗及後兩章中將探討的許多其他實驗中,此類誤差的消除在一開始就是實驗工作的首要目標。對於實驗家們而言,背景控制並非無關緊要,它是活動本身的一大要素。

將背景由前景中分離開來,需要重要的規模機械——旋磁探索一類實驗花費不多且改造簡易。後文的第4章中將談及20世紀末期的大質量粒子探測器,與此不同的是該世紀早期的實驗家們可以通過構建方式,在誤差來源出現時輕而易舉地進行改造。通過鐵棒周圍纏繞線圈的物理學方式,德哈斯確保了螺線管和鐵棒間的對齊;通過增加補償線圈的數量,斯圖爾特更徹底消除了地球磁場;為了頻率測量這一唯一目的,貝克建立起與基本裝置幾乎完全相同的另一台設備;為了檢測渦電流,巴奈特使用銅質轉子取代了鐵質轉子。

因此,預算量、裝置規格和複雜程度都具有重要性。所有這些旋磁實驗都是在大學物理實驗室或物理研究所進行的,如卡內基研究所或帝國物理技術學會等。通過技術工人的幫助,實驗設備在樓下的店舖中就能建造。[7]愛因斯坦、德哈斯以及巴奈特的實驗裝置都可以與麥克斯韋的計劃方案得到精準契合。巴奈特使用了電動機(能量來源)推動機械齒輪系(傳導機制),進而使鐵棒產生旋轉(見圖2.13)。鐵棒自轉後開始被磁化。其磁場可以通過磁力計或磁通計(測量儀表)進行檢測。愛因斯坦和德哈斯的實驗裝置較為簡單,包含一台發電機(能量來源)、導線(傳導機制)以及在懸浮鐵棒中產生振蕩磁矩的線圈。當鐵棒繞其中軸旋轉時,通過鐵棒上安裝的鏡子(測量儀表)反射光束,檢測到了運動情況。

兩次實驗的主要裝置部件小巧,可以安放在一張桌面上。1918年至1922年間,巴奈特使用的儀器和其他開銷為平均每年3300美元(4100美元)。[8](本書中括號內的金額數字表示符合標準普爾指數的、1967年發行的美元標準幣值;針對美元之外的貨幣,該數額表示首先換算為美元,而後升高為標準幣值。)[9]此外,卡內基研究所的商舖工作人員及巴奈特實驗室助手的同期薪酬為平均每年2310美元,共計每年6610美元(8300美元)。[10]

愛因斯坦與德哈斯的實驗以及斯圖爾特、貝克和阿維德森等物理學家的相關工作均可以運用與巴奈特曾使用的同一等級的機電設備。一般而言,磁化旋轉研究的花銷較巴奈特的研究花費稍少一些。磁化作用引起的旋轉屬於大型效應,觀察設備所需花費較少。查詢1918年的標準商品目錄後可以發現,相對較好的發電機需要200美元(250美元),電流計、電流表、電壓表等分別需要50美元(60美元)左右,電磁鐵也需要幾美元。[11]貝克使用了照相設備,愛因斯坦和德哈斯使用了諧振器來測量頻率,而貝克自己使用導線和線圈製造了諧振儀器;所有這些實驗家們需要花費約2000美元(2500美元)進行旋磁實驗的配備,其中人工成本甚至等同於硬件設備的花銷。20世紀初期,對於前文所指的麥克斯韋一派大多數實驗而言,這樣的花銷是相當有代表性的。比如,高性能電磁鐵約需(2000美元),高壓蓄電池花費在(4000至5000美元)不等,大型感應線圈需要(400美元)以上,X射線管花費(10至40美元不等),精密的光譜儀也要花費約(1500美元)。[12]

花費相對較少的這些裝置,實驗者們在核查舊的實驗過程時可以進行重新設計,更改單個元件,以及迅速構建心中所想的特定儀器。當儀器花費增加時,這些決定的做出將面臨相當大的困難。為消除背景效應,實驗者將從機械裝置本身部分性地轉移至數據的約簡。


註釋

[1] Kuhn,「Function,」Isis 52(1961):161-193.

[2] Kuhn,「Caloric Theory,」Isis 49(1958):140.

[3] Kuhn,Essential Tension(1977),200-201.

[4] De Haas,「Le moment,」Atomes(1923),212.

[5] 貝克的鐵桿中至少有一根看上去在約為1599 cgs的單位體積下實現了飽和磁化,而愛因斯坦和德哈斯使用的樣本在1260 cgs下實現了明確的飽和磁化。(阿維德森也報告了一次比愛因斯坦和德哈斯的更高程度的飽和磁化現象。)當然,也許貝克並沒有使用完全相同的那一種合金,但是在通往正確方向的過程中,這個偏差至少可謂導致誤差的一個重要原因。參見Beck,「Molekularstrome,」Ann.Phys.60(1919):109-149.on 131.

[6] S.J.Barnett and L.J.H.Barnett,「Improved Experiments,」Phys.Rev.20(1922):90.

[7] 參見Palmer and Rice,Modern Physics Buildings(1961).在本世紀初,關於物理學的材料狀態的最佳歷史成果是收集了大量的信息。參見Forman,Heilbron,Weart,「Personnel,」Hist.Stud.Phys.Sci.5(1975):1-185;關於物理建築物的建築風格參見第104至114頁。

[8] Smith and Fleming,「Barnett Expenses」(1922),BP.

[9] 兌換率非常低。一美元的購買力是標準和貧困形成的時間函數,參見Basic Statistics(1982),79;瑞士法郎和美元之間的兌換率參見World Alamanac(1964-1968).

[10] Smith and Fleming,「Barnett Expenses」(1922),BP.此外,地磁學部門建造了一個特別的建築,便於巴奈特和其他人員可以使用敏感的磁設備進行工作。1922年的費用為35000美元(70000美元)。

[11] Central Scientific Co.,Laboratory Apparatus(1918),205ff.

[12] Forman et al.,「Personnel,Funding,and Productivity,」Hist.Stud.Phys.Sci.5(1975):88-89.