Tags

, , , , , , ,

【轉載注】特朗普自從上臺以來,一直是媒體和學者關注的焦點。這位「推特治國」的總統,不僅極具話題性,也伴隨着豐富的數據集。這無疑是政治新聞報道中,非常適合數據驅動報道的議題。這篇文章來自兩位港大的同學,初稿形成于 Open Data Day Hong Kong 2017 的黑客松,由 Initium Lab 編輯和發表。轉載此文有兩個契機。一是 Open Data Day Hong Kong 2018 將于3月3日在港大舉行,屆時全港的開放數據行動者、公民科技愛好者、記者、學者、市民將匯聚一堂,發起專案,並在一天的時間內做出原型。部分項目組會在活動之後繼續研發,形成出色的數據應用或者數據報道。這篇文章是一個經典的案例,無論從選題、數據搜集/分析/可視化,還是項目執行,都極具代表性。黑客松讓不同背景的參與者,在高壓下腦力激盪、通力合作,可以很高效地找到有趣的選題,並做出原型。而將原型轉化爲最終作品,往往會花上數倍于黑客松現場的時間,並且需要專業技能的介入。希望通過這篇文章,讓正在努力學習 Python、R、Javascript 的傳播同學看到一種可能性——獨行者最速,衆行者最遠。轉載的第二個契機是,最近NBC發出了有關俄羅斯在Twitter上虛假帳號的數據集和報道。特朗普的崛起讓大量精英階層感覺到是一記耳光,他們慌了,不斷苛責媒體和社交網絡。究竟俄羅斯有沒有從中作祟?作用有多大?爲什麼特朗普的支持者如此之多,但民調竟沒發現?是隨機誤差還是系統誤差?這些疑問會在很長一段時間內不斷閃現,而人們熱衷於各種蛛絲馬跡。可以說,盯住特朗普、盯住Twitter總會有用不完的數據,寫不完的故事。這篇文章是很典型的文本分析于可視化,用R完成,可借鑑處頗多。

原文起


美國新晉總統唐納德·特朗普(Donald Trump)以其極端言論在一眾政客裡獨領風騷。端Lab曾於2016年撰文分析特朗普與其競選對手希拉里·柯林頓(Hillary Clinton)面對媒體採訪時不同的言論風格,發現特朗普發言多用簡單句型,且善於用第二人稱敘事獲取觀眾共鳴。

除去媒體採訪,推特發言亦是特朗普競選的宣傳的另一愨道。因此本文選取唐納德·特朗普(下簡稱特朗普)及其女兒伊萬卡·特朗普(下簡稱伊萬卡)的推特數據作為樣本,利用文本信息挖掘方法(text mining methods),來分析他們在社交網絡上展示的話語特點。

 

話癆特朗普

從發推文總數量來看,特朗普遠勝其女伊萬卡。2009到2016年,特朗普發布推文總數量三萬餘條,平均每天十條。而其女伊萬卡發文總量為一萬一千餘條,平均每天三條。二人皆疑似推特深度用戶。

下圖顯示,特朗普推文数量從2011年起開始狂飆突進,並於2013年和2015年分別達到峰值。而伊萬卡的發文風格則更加穩健,只是在2016年時有所增加,可能是為特朗普競選造勢之故?

特朗普家族最喜愛的推特發佈平台

特朗普與伊萬卡身為上流社會人士,當然不能滿足於用單一平台發布推文。

下表展示了特朗普父女較常使用的推特客戶端。他們在這些客戶端上發布的推文條數大於100。可以看出特朗普鍾愛安卓和網頁客戶端,而伊萬卡口味更加多元,除去推特網頁客戶端之外,更勇於嘗試 Buffer, Instagram, Sprout,BlackBerry,UberSocial 等各種較新的平台。她似乎並不鍾愛安卓手機。

加入發文時間後,我們的分析發現,特朗普最初多使用网页推特发布消息,於2013年左右開始使用安卓手機系統客戶端發推特。2016左右,設備鳥槍換炮,用起了高大上的蘋果iOS系統客戶端。相比之下,伊萬卡發文的平台有較強階段性。2010年左右她與其父一樣是推特網頁版的忠實用戶,2011到2012年間還使用了其他設備和平台,如 Uber, BlackBerry等。2012年後她似乎開始喜愛上Instagram和iPhone平台。有意思的是,2015年她突然開始頻繁使用Buffer這款軟件,2016年則移情Sprout。這兩款均為社交網站管理平台,可以同時連結並管理Facebook、Twitter、Instagram等帳戶。從圖上來看,使用Buffer的時間段和Sprout的時間段並無交接,因此伊萬卡女士似乎更鍾意Sprout的用戶體驗。

詞彙偏好

下圖列出不同詞彙在特朗普和伊萬卡的推特中分別出現的比例。可以發現,兩人共同姓氏「trump」,以及一些常用詞「tonight」,「world」,「win」, 「forward」在雙方微博中出現的比例均較高。

同時,和上文發現類似的是,伊萬卡常用詞更偏向時尚、商業和生活,例如「advice」,「shops」,「chic」,「founder」,「intern」 等等。而特朗普有更多和政治、政策以及競選相關的詞彙,如「senator」,「endorsement」,「broken」,「complete」等。最能體現這一區別的一個例子是,伊萬卡大量使用了「tips」這一詞彙,儼然一位人生導師。而特朗普則大量使用了「Obama」,和他總統競選人的身份相符。

父女口癖變遷史

下圖列出09年到16年之間,Trump 的 tweets 中常用詞彙的變化。09年到12年間,「Apprentice」頻繁出現在 Trump 的 tweets 中。這緣於一部真人職場秀The Apprentice,求職者在節目中分成兩組比賽,並在每一集中從輸的隊伍中淘汰一名貢獻最小的成員。節目最後的優勝者,有機會去經營Trump旗下的一個公司。在這個節目中,Trump做了14季的Host;決定參選總統後,他辭去了這個職位。當Trump獲勝的時候,人們驚呼其在 Twitter 上強大的影響力。可是回過去看,Trump 在利用媒體方面的技能,確實勝過世界上的很多領導者 – 從「TV Show 億萬富豪」到「Twitter 治國總統」,似乎並不意外。

上文提到,「Tips」是 Ivanka 的口頭禪之一。細看其中內容,除了大量轉推的經驗分享,大多還添加了特定的 Twitter 標籤,(hashtag)比如「#interntips」、「#healthtips」等等。而另一方面,「trump」的提及卻越來越少,在總統競選期間降到最低;同一時期「Tips」出現最爲頻繁。09年到14年間,Ivanka 的 tweets 中大量出現「trump」,大多與 Trump 家族的產業有關,比如 「@trumpgolf」、「#trumptower」、「@trumpwinery」、「#trumphotels」、…… 這些 Twitter 帳號和 hashtag 之間,大量互動和互聯,都吸引了不少粉絲。看罷數據,不得不感嘆, Ivanka 在運營 Twitter 方面的技能,與專業團隊無異。如果說15年前 Ivanka 的運作手法是「硬廣」,那麼從15年中旬開始,放棄「trump」、轉推「tips」、搖身一變人生導師,則更是技高一籌。

最易引發「轉發」和「喜歡」的詞彙

「轉發」和「喜歡」均為發布者和關注者的某種互動形式。因此,通過分析獲得更多「轉發」和「喜歡」的推特詞彙特點,既可以分析出發布者的心態,也可以分析出關注群體對特定內容的偏好。紐約時報2011年一項針對社交媒體的調查發現,用戶在社交媒體上分享信息主要有五種情況:分享娛樂性消息、自我包裝和認同、增強社交關係、進行對話,以及推廣新聞、產品信息等【注2】。

下圖展示了在特朗普和伊萬卡的推特數據裡,哪些詞彙容易引發更多轉發。特朗普的推特詞彙中,獲取轉發數最高的為「hamilton」,「praying」和「wikileaks」。而伊萬卡的則為「policy」,「family」,「theodore」。這些詞彙個人性較弱,更類似對特定消息的推廣,符合二人公眾人物的身分。

「Hamilton」的高出鏡率可能因為如下這條推特 –

Donald J. Trump ✔@realDonaldTrump
The Theater must always be a safe and special place.The cast of Hamilton was very rude last > night to a very good man, Mike Pence. Apologize!
9:56 PM – 19 Nov 2016
43,592 43,592 Retweets 149,734 149,734 likes

在這條發布與2016年11月19日,獲得四萬三千多條轉發的推文中,特朗普指責音樂劇 「Hamilton」的劇組對副總統 Mike Pence 進行騷擾。Mike Pence 之前觀賞了該音樂劇。表演結束後,劇組成員當眾向他表達了對新當選政府的不信任,和對未來的期待。這一舉動似乎激怒了特朗普,他在推特上發文要求劇組向副總統道歉。

詞彙「praying」的信息量較少。「wikileaks」可能與特朗普競選時多次強調該網站揭露的希拉里郵件醜聞有關。可以想像,含有類似內容的推特因為具有新聞性,較易引發交流,從而引起轉發和討論。

關於伊萬卡的推特分析,「theodore」是她新出生兒子的名字,這也和「family」獲得較高轉發量相吻合。另一方面,這可能反映出美國文化對家庭價值的重視。與上文類似,包含詞彙「policy」的推特,可能因為其新聞性和內容性而獲得較高轉發。

最易引發「喜歡」的詞彙

關於社交媒體上用戶「喜歡」某條推特,或者「點贊」的行為,來自社交媒體管理網站Buffer(伊萬卡之前最愛)分析認為,點贊的行為動機可分為四種:類似線下交流時點頭等打招呼的行為,對自己認同的某些價值再度肯定,表達同情,以及獲取現實回報(如餐廳打折等)。分析特朗普和伊萬卡獲取「點贊」數最多的推特詞彙可以發現,兩人的前三名大致與獲取轉發數較高的推特相同。唯一區別在於特朗普發布的「electoral」詞彙亦獲得較多喜歡。這可能是支持者表達鼓勵的行為反映。


註釋:


Author/ Li Yiming, Li Yuqiong