日本語不法行為事件データセットの構築

Published in 言語処理学会第30回年次大会発表論文集, 2024

Abstract
本研究は日本語・日本法における法的判断予測研究のためのデータセットである,日本語不法行為事件データセット(JapaneseTort-case Dataset, JTD) を提案する.JTDは不法行為判断予測タスク及びその根拠抽出タスク向けに設計されている.根拠抽出タスクは不法行為の成否判断に際して重要な根拠となった主張を,原告または被告の主張の中から抽出するタスクである.JTDには41人の法律専門家によって注釈付けされた3,477件の民事事件判決書に基づいて構築されており,7,978事例(事例に内包される原告・被告らの主張は59,697事例)が収録されている.ベースライン実験によりJTDの各タスクの実現可能性を確認し,さらに不法行為判断予測・根拠抽出の両タスクを同時に学習させることで性能が改善することを示した.

Recommended citation:
山田寛章, 徳永健伸, 小原隆太郎, 得津晶, 竹下啓介, 角田美穂子. 日本語不法行為事件データセットの構築. 言語処理学会第30回年次大会発表論文集, pp. 1045-1050, 2024年3月.

Download paper here