《AI产品经理需要了解的语音交互评价指标》阅读笔记

最近看到社区里的一篇文章,干货满满,有很多让我惊讶的内容:

  1. 实际工作中,识别率居然是使用一个叫“WER(词错误率,Word Error Rate)”的指标。
  2. 唤醒词的音节长度是有讲究的最少3个音节,比如“OK Google”和“Alexa”有四个音节,“Hey Siri”有三个音节;
  3. F1值 - 精准率和召回率的调和平均数
  4. CPS(Conversations Per Session,平均单次对话轮数)。这算是微软小冰最早期提出的指标。
  5. 语料自然度和人性化的程度,一般是使用人工评估的方式进行。

    详情