應用自動資訊擷取於故事書問答之研究

Author: 高愷言

Publish Year: 2022-07

Update by: March 26, 2025

摘要

對於教學者來說,如何從故事文本中,產生高品質且通順的問題-答案配對是一件耗時且耗力的事情,其目的不是要讓學生回答不出來,而是需要經過巧妙的設計將文本中的重要資訊當成答案,並且生成與之相對應的問題。本論文透過預訓練模型進行生成式的問題-答案配對產生,接著擷取文本中的資訊,進行模板式生成問題-答案配對。對話問答也是透過預訓練模型,並對目標領域進行fine tuned,來生成適當的回應。本論文的方法主要分為兩個部分,第一部分是生成式問題-答案產生,使用answer-aware的方法,先從文本中parse出名詞短語以及動詞相關語句,並且在輸入的部分加上答案的類別對於BART模型進行fine-tuned,最後透過DistilBERT模型進行問題-答案配對排序,使用答案類別可以讓模型生成的問題-答案配對的品質更好,數量也會增加。最後我們也分析了問題-答案生成人工效能評估,並利用問題回應使用的評估方法ROUGE-L做為評估問題-答案配對的指標,發現其相關性比排序分數還要高,可做為問題-答案配對篩選方式。第二部分是模板式生成:使用pipeline的方法,先將實體擷取出來,組成兩兩配對後輸入ALBERT based模型進行關係擷取,並且在輸入語句時使用上下文的資訊,最後將擷取出來的關係作為模板式生成的要素。