论文名称:Interpretable Low-Resource Legal Decision Making
论文ArXiv下载地址:https://arxiv.org/abs/2201.01164
论文AAAI官方下载地址:https://ojs.aaai.org/index.php/AAAI/article/view/21438/21187
论文官方GitHub项目,但是只放了README文件:RohanVB/Interpretable-Low-Resource-Legal-Decision-Making: Source code for paper “Interpretable Low-Resource Legal Decision Making”
本文是2022年AAAI论文。
本文的任务是输入案例事实描述文本,预测判决结果,即案例中提及的两个商标是否存在likelihood of confusion问题。
为了解决法律裁决任务中的可解释性问题,本文提出了预测中间标签的方法,并使用curriculum learning strategy解决了弱监督学习的问题,使模型可以利用到海量的仅用规则标注的noisy label的弱监督数据。
ILLSI这个模型简称是我编的。
likelihood of confusion:新商标与旧已有商标太像,会引起混淆,所以不允许。
低资源:深度学习模型会对小样本标注数据表现好(我觉得怪怪的……):(1) 迁移学习+finetune(对超参敏感)(2) 弱监督或远程监督
可解释性
(说要公布但是还没有公布)由两部分组成:
f
1
f_1
f1在端到端baseline上预训练(交叉熵)
f
2
f_2
f2在端到端baseline上预训练,损失函数:(Smooth L1 Loss:关注outliers)
E
i
n
t
e
r
n
E_{intern}
Eintern:transformer→前馈神经网络
融合:
实现中间标签生成时使用的curriculum learning:
(实验部分也拿多任务作为baseline了)
超参数:
f
2
f_2
f2的β设为1
E
i
n
t
e
r
n
E_{intern}
Eintern隐藏层维度300(随便设的),transformer 6 layers with 6 heads,前馈维度512
batch size为8
一张 RTX 2080Ti machine with 11 GB of memory
curriculum learning的bins数为3(在calibration experiments中用5)
中间标签的预测结果:
Expected Calibration Error (ECE)
不管怎么想我还是觉得这个任务应该用多模态范式来做,比如对比图片和发音。(我看到Analytics and EU Courts: The Case of Trademark Disputes这一篇真的用了CV,我心满离)
这数据集都没放出来,代码也没放出来,我issue提了也不回,复现个屁。