
大數(shù)據(jù)文摘出品
來(lái)源:medium、eurekalert
編譯:千雪、張秋玥、夏雅薇
“演講就是力量:演講是說(shuō)服,是皈依,是強(qiáng)迫?!薄瓲柗颉の譅柖唷?ài)默生。
在美國(guó)2020年總統(tǒng)大選結(jié)果揭曉之際,想必拜登和特朗普都已經(jīng)起草好了自己的那份總統(tǒng)就職演講,希望以勝利者的姿態(tài)對(duì)全世界發(fā)表感言。
其實(shí)自美國(guó)誕生以來(lái),總統(tǒng)的演講既是對(duì)國(guó)家現(xiàn)狀的反映,也是對(duì)總統(tǒng)認(rèn)為國(guó)家應(yīng)該走向何方所需變革的呼吁。
從1789年喬治·華盛頓的第一次就職演講,到1977年吉米·卡特關(guān)于全國(guó)能源問(wèn)題的演說(shuō),再到2019年唐納德·特朗普的國(guó)情咨文,迄今為止(2020年)每一位總統(tǒng)都有自己獨(dú)特的演講風(fēng)格。文摘菌也想看看,運(yùn)用自然語(yǔ)言處理和主題建模,能否分析出美國(guó)總統(tǒng)歷史中演講詞匯所傳達(dá)的信息、情感和復(fù)雜性。
通過(guò)使用數(shù)據(jù)科學(xué)技術(shù)進(jìn)行自然語(yǔ)言處理和無(wú)監(jiān)督學(xué)習(xí),本文作者研究了990多篇總統(tǒng)演講表達(dá)的情感、演講內(nèi)容的復(fù)雜程度和關(guān)注重點(diǎn),以便更好地了解總統(tǒng)們對(duì)演講能力的運(yùn)用。然后根據(jù)時(shí)間線(xiàn)和不同政黨的區(qū)分,試圖找出他們的演講趨勢(shì)、模式,還有其他見(jiàn)解。本項(xiàng)目將對(duì)美國(guó)歷史上所有總統(tǒng)的演講進(jìn)行分析。
以下是一些值得一看的結(jié)論:
美國(guó)總統(tǒng)們的情緒:特朗普語(yǔ)氣更積極更快樂(lè),內(nèi)容上則更固執(zhí)己見(jiàn)使用的工具:TextBlob的情緒性和主觀性。
語(yǔ)言情緒的測(cè)量方式有兩種:情緒性(從消極/悲傷的語(yǔ)氣轉(zhuǎn)變?yōu)楦e極/快樂(lè)的語(yǔ)氣)和主觀性(從表達(dá)客觀事實(shí)轉(zhuǎn)變?yōu)檩敵龈鄠€(gè)人觀點(diǎn))。
下面是情緒分析的結(jié)果,每個(gè)點(diǎn)代表一個(gè)不同的總統(tǒng),每種顏色代表一個(gè)政黨。

正如你在圖表中所看到的,沒(méi)有明顯的顏色簇,這意味著總統(tǒng)們的情緒不會(huì)因?yàn)辄h派不同而出現(xiàn)區(qū)分,在其中影響更多的似乎是個(gè)人的情緒轉(zhuǎn)變。
分開(kāi)來(lái),我們來(lái)看看共和黨總統(tǒng)們的情緒。

圖中你可以看到總統(tǒng)的名字。
從這些圖表中我們可以看到,與其他美國(guó)總統(tǒng)相比,富蘭克林·皮爾斯的語(yǔ)氣更消極更悲傷,內(nèi)容上則更真實(shí),這一方面與他個(gè)人性格有關(guān),另一方面也與當(dāng)時(shí)的時(shí)代大背景相關(guān);而唐納德·特朗普的語(yǔ)氣更積極更快樂(lè),內(nèi)容上則更固執(zhí)己見(jiàn)。

請(qǐng)記住,情緒性和主觀性并不能告訴我們總統(tǒng)在說(shuō)什么;一個(gè)總統(tǒng)可以說(shuō)一些積極的話(huà),但這些話(huà)對(duì)人們產(chǎn)生的影響可能是負(fù)面的。這種情緒分析只能告訴我們,某位總統(tǒng)是如何傳達(dá)他想表達(dá)的內(nèi)容的,以及他們是使用客觀事實(shí)還是使用個(gè)人觀點(diǎn)來(lái)支持他們的聲明。
哪些美國(guó)總統(tǒng)的演講最老練?演講用詞趨向簡(jiǎn)單化,情感表達(dá)更強(qiáng)烈使用的工具:textstat的等級(jí)分析。
“語(yǔ)言的復(fù)雜程度”是基于一個(gè)人要讀懂一篇文章所需要的學(xué)歷層次衡量標(biāo)準(zhǔn)——這里的標(biāo)準(zhǔn)是聽(tīng)到一篇演講時(shí),可以完全理解它的平均學(xué)歷層次。
下圖顯示了多年以來(lái),每一篇演講都被評(píng)為了什么層次。我們?nèi)匀挥貌煌念伾珌?lái)代表政黨。

從圖中我們可以看出,在美國(guó)早期,總統(tǒng)的演講技巧更為高明。
平均而言,需要大學(xué)水平或更高學(xué)歷的人才能理解。到了20世紀(jì)20年代左右,演講的復(fù)雜程度開(kāi)始下降,這種趨勢(shì)一直延續(xù)到今天。這樣做的一個(gè)潛在原因可能是受總統(tǒng)自己詞匯量的影響,也可能是一個(gè)經(jīng)過(guò)深思熟慮的決定;20世紀(jì)20年代,收音機(jī)在普通家庭中逐漸普及,越來(lái)越多的人可以聽(tīng)到總統(tǒng)演講。
那么,總統(tǒng)們是否主動(dòng)改變了他們的詞匯,使他們能夠與更廣泛的聽(tīng)眾有所共鳴?這一分析并不能明確地告訴我們答案,但這絕對(duì)是一個(gè)值得探索的有趣領(lǐng)域。
還要注意的是,各個(gè)級(jí)別的政黨層次不齊,這表明各政黨在演講技巧方面沒(méi)有明顯差別。
已有其他研究驗(yàn)證了這一觀點(diǎn):當(dāng)今美國(guó)政壇演講用詞趨向簡(jiǎn)單化,情感表達(dá)更強(qiáng)烈。
堪薩斯州立大學(xué)校內(nèi)一個(gè)計(jì)算機(jī)科學(xué)研究團(tuán)隊(duì)分析了1873年至2010年共和黨與民主黨議員的近200萬(wàn)次國(guó)會(huì)演講的內(nèi)容。他們的分析表明,當(dāng)今政治演講的風(fēng)格實(shí)際上與幾十年前的國(guó)會(huì)政治演講風(fēng)格已經(jīng)截然不同。
在最近發(fā)表在Heliyon期刊上的研究論文“138年來(lái)國(guó)會(huì)演講的數(shù)據(jù)分析”中,堪州計(jì)算機(jī)科學(xué)專(zhuān)業(yè)的學(xué)生Ethan Tucker和Colton Capps以及計(jì)算機(jī)科學(xué)副教授Lior Shamir使用自動(dòng)文本分析算法來(lái)分析各個(gè)年份的國(guó)會(huì)演講。
研究表明,自1980年代初以來(lái),與女性身份有關(guān)的單詞(例如she,her,hers,woman,women等等)的出現(xiàn)頻率一直在增加,而與男性相關(guān)的單詞出現(xiàn)頻率則在下降。與1950年代相比,與21世紀(jì)女性身份相關(guān)的單詞出現(xiàn)頻率高出五倍,但仍低于與男性身份相關(guān)的單詞出現(xiàn)頻率。自1990年代以來(lái),與共和黨議員的演講相比,民主黨議員的演講中有關(guān)女性身份的用語(yǔ)出現(xiàn)得更為頻繁。
研究還表明,這些年來(lái)的閱讀難度水平也發(fā)生了顯著變化。該分析測(cè)量了Coleman-Liau可讀性指數(shù),該指數(shù)可估計(jì)特定文本的閱讀難度水平并將其與教育水平相關(guān)聯(lián)。分析表明,共和黨和民主黨議員的國(guó)會(huì)演講的閱讀難度從18世紀(jì)的八年級(jí)水平一直提高到1970年代的十年級(jí)。但是自1976年以來(lái),政治演講的閱讀水平一直在下降,到21世紀(jì),它已經(jīng)低于九年級(jí)水平。直到1970年代初,國(guó)會(huì)議員在演講中所使用的詞匯也存在同樣的趨勢(shì)。那之后的閱讀難度至今依然在下降。
研究人員對(duì)演講的分析還顯示,與18世紀(jì)和19世紀(jì)初國(guó)會(huì)演講相比,最近的國(guó)會(huì)演講表達(dá)了更強(qiáng)烈的情緒,無(wú)論是積極還是消極情緒。政治演講中的情緒逐漸變得更加積極,并在1960年代達(dá)到頂峰,但在1970年代間突然變得非常消極。而自1970年代以來(lái),在國(guó)會(huì)演講中表達(dá)的情緒又重新變得越來(lái)越積極。
根據(jù)這項(xiàng)研究,演講的閱讀水平和詞匯量的下降可能與1970年代開(kāi)始在國(guó)會(huì)在大眾傳媒中的曝光率增加(包括現(xiàn)場(chǎng)廣播和電視報(bào)道)有關(guān)。國(guó)會(huì)議員開(kāi)始逐漸調(diào)整他們的演講風(fēng)格,通過(guò)媒體向公眾講話(huà),而不是與其他立法者講話(huà)。
美國(guó)總統(tǒng)演講的主題:從法律、公權(quán)力到就業(yè)家庭使用的工具:使用gensim的LDA模型進(jìn)行無(wú)監(jiān)督主題建模。
現(xiàn)在讓我們來(lái)試著更好地理解總統(tǒng)演講的內(nèi)容。
使用潛在Dirichlet分配(LDA)主題建模,確定了7個(gè)總統(tǒng)演講的主題:
1.美國(guó)就業(yè)和家庭的幫助&需求
2.法律、憲法和權(quán)利
3.法律、條約和行動(dòng)
4.公共權(quán)力&職責(zé)
5.美國(guó)自由之戰(zhàn)
6.工作&商業(yè)
7.用戰(zhàn)爭(zhēng)&武力實(shí)現(xiàn)世界和平
在這些主題之間需要注意的是詞語(yǔ)的定位和平衡,比如“美國(guó)自由之戰(zhàn)”和“用戰(zhàn)爭(zhēng)&武力實(shí)現(xiàn)世界和平”,其中一個(gè)目標(biāo)與其他目標(biāo)相互緩沖,比如“發(fā)動(dòng)戰(zhàn)爭(zhēng)可以獲得美國(guó)自由”,或者“尋求世界和平,但也會(huì)有戰(zhàn)爭(zhēng)發(fā)生”。
以下是這七個(gè)話(huà)題多年來(lái)在總統(tǒng)演講中的流行趨勢(shì):

我們?cè)俅慰吹?,在演講的主題上,政黨之間并沒(méi)有太多的區(qū)別,相反,隨著時(shí)間線(xiàn)的推移,反而出現(xiàn)了越來(lái)越大的差異。在美國(guó)發(fā)展的早期,我們看到“法律、條約和行動(dòng)”與“公共權(quán)力&職責(zé)”更加普遍。最近幾年,我們看到“美國(guó)就業(yè)和家庭的幫助&需求”,“用戰(zhàn)爭(zhēng)&武力實(shí)現(xiàn)世界和平”,“美國(guó)自由之戰(zhàn)”更受總統(tǒng)歡迎。
讓我們用另一種角度來(lái)審視這些話(huà)題,即根據(jù)美國(guó)不同的歷史時(shí)期,看一個(gè)話(huà)題在美國(guó)歷史上的哪個(gè)時(shí)期出現(xiàn)過(guò)。顏色代表每個(gè)政治演講題目:

從這張圖中我們可以看出,某些歷史時(shí)期似乎是總統(tǒng)演講主題結(jié)束或到來(lái)的時(shí)期。例如,在新政時(shí)期,我們第一次看到“美國(guó)就業(yè)和家庭”上升為總統(tǒng)演講的主要話(huà)題,此后幾乎每個(gè)時(shí)代我們都會(huì)看到它的出現(xiàn)。
綜述綜上所述,這個(gè)項(xiàng)目的分析告訴我們:
情緒似乎因總統(tǒng)而異,而非政黨。 在演講中使用復(fù)雜詞匯這一潮流已經(jīng)過(guò)時(shí)多年。 演講主題多年來(lái)變化較大,但各個(gè)政黨之間的主題差別不大。 演講主題與國(guó)家狀況和公眾關(guān)注的方面有關(guān)。歷史事件可能會(huì)成為一種催化劑,促使幾代人的演講主題發(fā)生轉(zhuǎn)變。
最后,我想再次強(qiáng)調(diào),這一分析顯示了一些總統(tǒng)演講的趨勢(shì)和模式,但同樣重要的是,它向我們表明,從表面上看,總統(tǒng)之間、政黨之間的講話(huà)基調(diào)和定位都可能存在相似之處。有鑒于此,我們更需要關(guān)注總統(tǒng)演講的深層實(shí)質(zhì)內(nèi)容,為總統(tǒng)進(jìn)行知情投票和知情支持。
相關(guān)報(bào)道:
https://www.eurekalert.org/pub_releases/2020-08/ksu-ast081820.php
https://towardsdatascience.com/us-presidential-voices-over-the-ages-35678518f82b
責(zé)任編輯:
