低資源な法ドメイン含意タスクにおけるデータ拡張

Published in 言語処理学会第29回年次大会発表論文集, 2023

Abstract
法ドメインではアノテーションが高コストのため学習データが不足する問題がある.本稿では,COLIEETASK4を用いて,ラベル付き学習データのルールベースによる拡張と,言語モデル事前学習の際の擬似的な学習データ拡張の効果検証を行う.実験の結果,提案手法である反対解釈によるデータ拡張手法が最良の性能を示した.

Recommended citation:
伊藤光一, 山田寛章, 徳永健伸. 低資源な法ドメイン含意タスクにおけるデータ拡張. 言語処理学会第29回年次大会発表論文集, pp. 990-885, 2023年3月.

Download paper here