目录

传统的自然语言处理评估指标

EM(Exact Match)

BLEU(Bilingual Evaluation Understudy)


传统的自然语言处理评估指标

  1. 传统评估指标
    • EM(Exact Match)

      • 计算方式:如果生成的答案与参考答案完全相同(字符级完全匹配),则 EM 得分为 1,否则为 0。这是一种比较严格的评估指标
      • 举例:问题是 “太阳从哪边升起?”,参考答案是 “太阳从东边升起”。如果生成的答案是 “太阳从东边升起”,则 EM = 1;如果答案是 “太阳升起的方向是东”,则 EM = 0。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部