训练数据集:
一般来说,ML模型通过经验学习。因此,他们的预测能力会随着接触更多的数据而提高。同样的推理也用于NLU。
数据质量:
原始数据在经过清理、组织和标记后,对NLU模型是有价值的。
在对话式人工智能应用中,理解语言是过程的一部分。其他部分包括根据查询生成响应或采取行动。因此,感知和解释语言的过程应该快速完成。然而,在结果的质量与计算的速度之间可能会有一个权衡。应根据应用领域做出选择。
对不同解决方案领域的适应性是很重要的。这可以通过NLU解决方案的训练和持续学习能力来实现。
该解决方案应该便于非技术员工和技术员工使用。一个具有不同界面的解决方案可以考虑让非技术员工(例如客服人员)通过反馈来积极开发这个系统。
自然语言处理在今天很重要的主要原因可以通过以下几点来解释:
人们有各种不同的表达方式,有时这可能因人而异。特别是对于个人助理的成功,重要的一点是对用户的正确理解。NLU将语言的复杂结构转化为机器可读的结构。这使得文本分析成为可能,并使机器能够对人类的查询作出回应。
计算机可以以一致和无偏见的方式为24/7进行基于语言的分析。考虑到每天产生的原始数据量,NLU以及NLP对于有效分析这些数据至关重要。一个开发良好的基于NLU的应用程序可以阅读、聆听和分析这些数据。
分析师估计2020-2025年期间的年复合增长率>20%。根据在2019年的研究,预计到2025年,全球自然语言处理(NLP)市场价值将达到350亿美元,2020-2025年期间的年复合增长率将达到创纪录的22%。增长的主要根本原因是从以产品为中心转向以客户为中心的体验。对智能设备和物联网的需求不断增加,也促进了NLU的广泛使用。
例如,最近的一份报告指出了NLU在医疗保健方面的重要性。NLU通过改善决策支持系统和对病人结果的测量,有助于提高临床护理的质量。
NLU模型可以在单一和特定的任务上表现完美。然而,不同的任务会降低准确性和精确度。最好是通过使用客观指标来比较不同解决方案的性能。
例如,可以通过使用客户服务数据建立一个有大量实例(例如>100)的测试集,以比较不同的服务,从而建立一个基准。由于大多数服务都是以易于注册的API的形式提供的,所以对照API响应来检查应该是很容易的。
这里有一篇由人工智能语音平台SnipsAI撰写的基准文章,比较了不同对话式人工智能供应商的F1分数,这是衡量准确性的标准。
SnipsAI通过使用他们在上的开源数据集,将他们的系统与谷歌的API.ai、Facebook的Wit.ai、微软的Luis.ai和亚马逊的Alexa进行比较。该数据集包括他们测试的7种用户意图中的每一种的2400次查询。
GLUE及其优越的SuperGLUE是最广泛使用的基准,用于评估模型在一系列任务上的表现,而不是单一的任务,以保持对NLU性能的总体看法。它们由九个句子或句子对的语言理解任务、相似性和转述任务以及推理任务组成。GLUE还提供了一个基准的。
和许多新兴领域一样,技术巨头也在NLU中占据了重要地位。一些初创公司以及开源API也是生态系统的一部分。
全部评论
留言在赶来的路上...
发表评论