[新聞] 大數據助攻 台劇創作掀開新頁
https://www.cna.com.tw/news/firstnews/202103145002.aspx
影視製作導入大數據是近年國際趨勢,2016年《我們與惡的距離》首次為台劇點了第一把
火,如今星火燎原。
文:葉冠吟
21歲到30歲的年輕人最關心什麼?
分齡統整2019年Google關鍵字搜索:21歲是生日與禮物;22到24歲,在乎自己是否還能長
高;大學、研究所畢業後的25到28歲,開始在意存款;到了29、30歲,煩惱如泉湧,從婚
姻、轉職、薪水、存款到健康檢查……一連串議題,多到連表格都寫不下。
「30歲最痛苦,煩惱一堆」,資策會數位服務創新研究所副主任徐毓良,指著投影幕上的
數據感慨說道。
這是公共電視迷你劇集《大債時代》劇本設定的輔助數據資料,也是資策會服創所團隊繼
金鐘獎台劇《我們與惡的距離》後,第二度與公視合作,以大數據分析協作劇本開發。
探討青年負債議題的《大債時代》,由張書豪、林柏宏、李霈瑜(大霈)主演,三人飾演
高中死黨,畢業後各奔前程,分別成為公司負責人、斜槓創業家與銀行債務催收員。但32
歲那年,張書豪跳樓輕生,兩位好友替張書豪解決所留鉅額債務的同時,也得各自面對沉
重的生活壓力。
編劇的大數據門診 處方來自PTT
「年輕人碰到債會躲起來嗎?」「買毒品的年齡層?在哪買?」「年輕人最常見的債務是
什麼?」「30歲受薪階級的平均月薪是多少?」「企業掏空案到底要掏要多少錢才算多?
」「黑道討債和銀行債權管理的差異?」
一如有著十萬個為什麼,方夢貞形容與資策會合作的過程,就像跟醫生定期門診,只是處
方來自扎實的數據資料。
徐毓良指出,《大債時代》與《我們與惡的距離》兩者提出的數據輔助需求不同,前者已
有故事大綱和人物設定架構,後者則是在「無差別殺人事件」主題的資訊海中,撈出劇本
線索。
徐毓良認為合作的方向很明確,就是回答方夢貞提出的問題,並判斷劇本可能需要的數據
內容,分類後,再利用文字探勘的方式取得資料。
首先當然是以「債」、「年輕世代」相關內容為關鍵字,從PTT(批踢踢實業坊)、臉書
、新聞網站、網路論壇,挑選出網友評論度、分享轉貼數量高的文章,搜集符合主題及需
求的內容。同時,也就不同個案問題爬梳法院判決書,甚或是外送的菜單。
徐毓良指出,藉由PTT上的資訊,很容易就可找到各職業的個案。「30歲左右的人,會在
職涯版分享工作經驗和過程。」團隊就從中找到銀行、行銷、高科技等各行業的年輕人個
案,觀察他們對於生活、薪水、職場、房貸等看法與抱怨,或覺得哪些工作比較好賺錢。
鑑於《我們與惡的距離》資料過於龐雜,導致編劇呂蒔媛難以消化,徐毓良面對《大債時
代》,將上萬筆資料刪減、統整成100筆,再轉譯成方夢貞團隊能理解閱讀的形式:例如
文字雲、表格、關鍵字等,同時也將資料匯集成小型資料庫,供編劇日後查詢參考。
大數據反覆驗證 戲劇縮影現實人生
經歷4個月反覆驗證,方夢貞與《大債時代》編劇團隊藉由大數據資料,調整故事情節與
人物設定。她苦笑:「來回修改的過程是辛苦的,但改完後就不會心虛虛的,確實符合現
狀」。
方夢貞透露,原本規劃林柏宏的角色是要揭發公司的掏空弊案,但經由數據考證才驚覺,
這是公司少數人才可能接觸的案件。「20多歲的人,不論職等或資歷都不大可能接觸到這
麼機密的事,況且大部分年輕人連租房、買房都有困難,甚至吃飽都成問題,更在意尋找
自我價值的認同。」最後,只好將這條支線刪除。
另一條放棄的劇情線,是「年輕上班族因壓力吸毒」。徐毓良分享,團隊爬梳500多篇法
院判決書和文獻,發這個年齡層根本不大會接觸毒品。「20、30歲這群人,生活壓力都喘
不過來,根本沒錢買毒品,經濟寬裕的中年人與家庭富裕的孩子,反而才是主要使用者。
」
方夢貞分享,編劇團隊除了刪除不合現實的設定,也從數據中找到先前未注意的職業,掌
握年輕人在意的趨勢,從而豐富了劇中角色的內容。
編劇團隊刪除不符現實的劇情之外,也藉由數據增添人物角色豐富度:例如主角年齡提高
了5歲,變成30多歲。方夢貞解釋:「剛畢業的新鮮人,面臨的壓力還沒那麼明顯,大概
工作8、9年有些存款後,家裡與社會對你比較有期待,而30歲世代就是被夾在中間,最痛
苦的那一層。」
徐毓良團隊在PTT利用自動索引程式「爬蟲」發現的「銀行債權催收員」一職,最終也成
為了女主角的職業。劇本原先設定女主角是公務員,為賺錢買房兼職家教,與「債」的距
離較遠,沒想到後來發現,在民間貸款機構與非法討債集團之外,還有銀行債權管理部門
這樣的催收工作。
在編劇把女主角年齡拉高,變成銀行債權管理部門的小主管後,副業也改為時下流行的外
送員,讓工作性質和內容更符合劇情走向,角色更加立體。
徐毓良指出,大數據並非左右編劇創作,反而是個輔助,幫助編劇找出田野調查過程被遺
漏、未被看見的資訊。方夢貞也附議,「數據是趨勢,田調是細節」,兩者相輔相成,提
升了編劇設定劇本大方向的效率,也撈出有趣的趨勢議題。
橫跨機器與編劇語言 徐毓良讀數據定乾坤
《大債時代》播出後,許多觀眾都說在戲裡看到了自己與親友:「99%的我們都是詠晴,
即使房價再高、也要硬咬著牙買房。」「大債時代就是目前年輕人的縮影。」
方夢貞在宣傳《大債時代》時,也特別感謝徐毓良團隊的協助,讓劇本真實呈現當代青年
面對生存困境的無奈,講出新世代心聲。
攤開4個月的合作過程,其實《大債時代》與資策會團隊僅開了7次會。這意味必須在短期
內精準理解、回應劇組的問題。方夢貞本來得知要與資策會共事時,擔心雙方會有溝通障
礙,「沒想到他們對影視術語不陌生,還會舉出歐美劇中的類似情節跟我們分享」。
徐毓良笑言自己做的事,就是簡單三步驟:聽懂客戶問題;翻譯給機器;最後再把機器產
出的結果,轉譯回客戶。「如果聽不懂客戶需求,有再高的技術、再強的敏銳度都沒用,
解決問題才是關鍵。」
但是這翻譯機的建立,可不簡單!
徐毓良在2016年結束《我們與惡的距離》的合作之後,投入2年時間,以實驗性質免費與
影視工作者合作,除了精進數據技術,也學習瞭解編劇到底需要什麼,編劇是如何思考,
熱心的編劇友人,還替徐毓良開了一長串書單。
「全部都看完了,但沒有看很細啦!」徐毓良的辦公桌放滿密密麻麻的參考書,從創作經
典《場景設定創意辭海》、《故事的解剖》、《暢銷書密碼》,到沒書皮、被拆成方便攜
帶的無名書。
與編劇溝通之路沒有捷徑,只有涓滴累積。尤其資策會執行劇本開發的團隊,
包含徐毓良在內,僅有3個人,偶爾加個0.5,請工程師協助「爬蟲」。徐毓良坦言,沒有
政府的專案支持下,單仰賴大數據協助劇本開發,無法養活整個部門。「太新的事情,要
人掏錢不容易。」
萬般設定起頭難 照世明燈大數據
目前徐毓良的團隊,有5、6個案子正在進行,從剖析年輕女性的感情觀、年輕人大學畢業
後的出路,掌握世代價值觀差異、協助國外IP轉化成本土共感元素,還有運用司法文本與
社群數據找到犯罪手法,驗證背景設定等等。
徐毓良認為,在許許多多的戲劇類型中,大數據最能提供協助的有兩種:一是「有開放資
料文本的」,二是「劇情觀點多元且混亂的」,像《我們與惡的距離》就是在探討社會對
隨機殺人事件的不同觀感。
徐毓良指出,每個人看資料,下意識只會看喜歡的東西,自動過濾不熟悉的內容,「尤其
政治特別明顯,綠的就喜歡看綠的,藍的喜歡看藍,看到另一黨就會生氣,可是事實應是
把藍綠白拼起來後,中間那塊才較接近真實,而我們就是試圖還原。」
不過大數據也非萬能,「有數據是基礎,數據量夠大才是大數據」,徐毓良解釋,像刻畫
台灣工地百態的《做工的人》,或以消防員為主題的《火神的眼淚》,這類網路資料量較
少的職業,還是得仰賴編劇的田野調查與實際探訪職場職人。
大數據對於歷史、神怪題材,也較難提供協助。徐毓良分享,曾有人想請他協助調查國共
內戰後,被國民黨留下或被帶回台灣的華僑老兵資料,想寫成劇本,但徐毓良只能婉拒。
「你在Google查到的內容,就是我能做的,這比較適合問歷史、民俗專家」。
但徐毓良特別想打破一個迷思,不是只有「寫實劇」能用大數據輔助,「科幻」類型也是
有所助益,「我可以做出未來年表」。
2002年,由湯姆克魯斯主演的電影《關鍵報告》(Minority Report)中,未來世界的警
察已可透過犯罪預示系統,事先埋伏、逮捕嫌犯。片中展現的擴增實境(AR)、觸控螢幕
、電子紙到無人車等,已經出現在我們生活周遭。
徐毓良指出,藉由政府法規以及科學雜誌等數據,替劇組寫出「未來年表」不是不可能。
說到底,徐毓良目前的成績,歸功於資策會服務14年所累積的專案經驗,再加上自己一顆
旺盛的好奇心。所有人丟出來的劇情問題,對他來說都是充實自己的題庫,也惟有如此,
才能繼續當編劇導演們的「徐」伯溫,以資料庫為影視產業卜一個未來。
要數據還是編劇 準確與套路的兩難
大數據能完全取代編劇嗎?
2015年成立的比利時人工智慧公司ScriptBook,專攻劇本分析。只要上傳劇本至
ScriptBook系統,6分鐘內就能完成分析、獲得詳細數據,包含角色魅力量表、目標族群
預測、觀眾滿意度指數等。ScriptBook也曾用演算法預測過去兩年上映電影的國際票房收
益,準確率高達86%,相當驚人。
https://www.scriptbook.io/
ScriptBook另一階段的目標是故事自動生成,在內建30萬份劇本資料的寫作系統中,編劇
只需輸入關鍵字與主題,選擇長度並選定角色特徵,系統就會填補剩下空白。他們認為人
類與AI共同寫作,未來將成常態。
早在4、5年前,中國影視圈也已利用大數據分析,整合影視劇、演藝人員資訊,預測市場
反應,協助資方利用AI選擇演員,預測選角組合對票房的影響。
徐毓良笑言,在中國工作的編劇友人曾告訴他,每個人電腦都有一個劇本分析器,稿子寫
完,就丟進去驗證哪些地方需要加強,才能成為「爆款劇」。「但我朋友就不願意,因為
劇本就會長得很套路。」
嘲諷這種套路,也被中國玩成另類自娛。
「資深遊戲玩家老張意外穿越到自己玩了10年的『武林爭霸』遊戲世界中,從此擁有所向
披靡的強大力量,但他在穿越之初,就因誤會成為武林公敵,隨之而來的是一連串的圍剿
和陰謀……」
以上內容,是由中國數據視覺化團隊DATAMUSE開發的自動劇本生成器「國產爛劇製造廠」
所產製的內容,只要選取故事類型,輸入兩位主角名字,就能即時生成劇情介紹。
https://datamuse.guokr.com/
DATAMUSE表示,自動劇本生成器的製作初衷,是在思考為何中國拍攝技術越來越好時,低
分國產劇卻越來越多。他們爬梳6000多部中國戲劇作品,從導演、劇情、演員多角度挖掘
數據規律,設計出這個自動劇本生成器。
DATAMUSE感慨,當編劇想推展劇情時,就喜歡以「昏迷、搬家、出軌、流產和精神病等橋
段,反覆填充」,這意味著編劇缺乏想像力。
藍色數據海 我想要一個未來
數據的科技藍海,投影在方夢貞工作室的白牆上,她站在牆前,程式語言交織在臉上。
《大債時代》是方夢貞首部利用大數據開發的作品,合作經驗愉快,也替劇組扣緊時事議
題。徐毓良團隊既是觀眾又是數據分析者,能客觀提供意見,也能精簡資訊,「光從1、2
萬筆資料,變成100、200筆,閱讀量直接少100倍。」
方夢貞坦言,過去創作像土法煉鋼,沒有科技協助,寫劇本找演員全靠「直覺跟猜」,雖
然盡力閱讀相關報導與案例,最終主創團隊只能以經驗值輔助,嗅出時下議題或趨勢。
但是把作品丟回市場,能不能引起觀眾共鳴?方夢貞笑回:「跟判斷一個人會不會紅一樣
,這個行業都帶著一點點賭的成分。」就像當初劇組選擇林柏宏飾演創業屢次失敗、油而
卻不令人厭的楊大器。
「柏宏一坐下來,聊沒多久,聽他講小時候爸媽做生意、到處賣東西的故事。角色身上那
亟欲成功,賺錢讓家裡過好生活的心情,他完全理解。那是我從沒聽過的柏宏,那時我就
在他身上看到大器的影子。」
或許這就是大數據無法看到的細節,方夢貞幽默地聳聳肩,「但你可以用數據知道,6成
觀眾都覺得這個人很帥,那紅的機率確實比較高。」
對於大數據與影視的關係,方夢貞既樂觀也保守,雖不否認大數據可能扼殺創意,但若有
機會再使用大數據分析、開發劇本,會以輔助形式來尋找線索或驗證疑問。
「若全然依賴大數據,我會覺得有些可惜,有些戲劇能打動人、吸引人,是因為它超乎一
般人的生活。如果只看一般人注意的,就不會看到有趣的點。」方夢貞眼裡閃著光,或許
也有那麼幾部電影、戲劇,是帶著觀眾的想像,飛到更遙遠之處。
大數據是能幫你快速抓住大方向、推你一把。不過更遠的路,或許情感、直覺、創意更是
有用。方夢貞調皮的說:「連大方向都抓不到,再多小細節都沒有用啦!」
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.128.156.69 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Scenarist/M.1616049124.A.B74.html
Scenarist 近期熱門文章
PTT影音娛樂區 即時熱門文章