應用強化學習與知識圖譜於故事共述生成之研究
Author: 李聿鎧, 張嘉惠
Publish Year: 2023
Update by: March 26, 2025
摘要
模仿重述一則故事是一種培養學生敘事力的方法,但對於記憶力較差或是無法自己完成描述一個故事的學生來說,這也可能帶來一些困難。因此,我們希望利用自然語言處理技術,開發一款故事共述對話模組,該模組能與學生共述一則英語故事,藉此培養學生的敘事能力。然而,故事共述是一項相對較少人涉及且相對新穎的任務。其次,目前也沒有現成的故事共述對話語料集可供使用,若要求對話機器人從實際與學生互動中學習,可能會相當耗費時間與金錢成本,這使得我們需要使用機器對機器方法結合強化學習來生成相應的資料集;而缺乏強化式學習中所需的奬勵函數,也是系統設計的挑戰。在故事共述中,模型需具備兩大能力:(1) 理解故事的內容,以掌握故事劇情和資訊;(2) 根據目前對話討論其餘故事相關劇情。我們採用開放領域資訊擷取技術來建構知識圖譜,故事知識圖譜不僅可以擷取重要資訊,還提供結構化的知識表示,有助於模型理解和組織故事資訊。同時,我們使用多代理人強化學習方法,讓兩個代理人根據對話歷史從知識圖譜中選擇相關的事實來生成回覆,並共同完成故事共述的任務。基於這些能力,對話模組可以在故事共述過程中有效引入故事元素,例如當用戶提到一個特定的情節或角色時,模型可以進一步展開故事情節,提供相關背景和發展。透過強化學習方法,我們能根據目前的對話歷史與候選回覆中,做出更明智的選擇。相較於僅依照時間順序回覆,我們的模型經由自我訓練的獎勵評估,性能從67.01% 提升至70.81%,上升了約3.8%。