今天跟大家唠唠我这几天在公司搞的“乔丹队友”项目,别想歪了,不是真找乔丹打球,是给咱们的AI模型找个好搭档,让它更牛逼!
老大丢给我这个任务的时候,我一脸懵,啥是“乔丹队友”?后来才知道,就是要给现在的AI模型,配上一些辅助工具或者模块,让它在某些特定场景下,表现得更像乔丹,能carry全场。
我得摸清楚现在这个AI模型的能力,它擅长不擅长就像了解乔丹的得分能力一样。我找了几个同事,一起对模型做了个全方位的测试,包括文本生成、知识问答、逻辑推理等等。测下来发现,这模型,挺全能,但是深度不够,广度有余,但准度不足。就像乔丹身边那些队友,有篮板的,有防守的,但关键时刻能站出来得分的,不多。
就是找“队友”了。我想着既然模型在知识问答方面有点欠缺,那就给它配个知识库,就像给乔丹配个能传球的皮蓬。我调研了好几个知识库方案,包括向量数据库、图数据库等等。我选了个向量数据库,因为它可以把知识转化成向量,方便模型快速检索和匹配。
选好知识库,我就开始着手搭建。先是把一些常用的知识,比如公司产品介绍、行业报告、常见问题等等,一股脑儿地塞进了知识库里。然后,我写了个简单的接口,让AI模型可以调用这个知识库。
接口写完,就开始测试。结果,问题来了!模型有时候会从知识库里检索出一些不相关的答案,就像皮蓬传了个球,乔丹没接到,直接飞出界外了。
我开始排查问题,发现是知识库里的知识太杂乱,模型检索的时候,容易被干扰。于是我开始对知识库进行整理和清洗,把一些过时的、重复的、不相关的知识,全部清理掉。然后,我又对知识进行了分类和标注,让模型更容易找到需要的知识。
这还没完,我还发现模型在理解用户问题方面,也有点问题。有时候,用户的问题很模糊,模型就理解不了,就像乔丹想让皮蓬挡拆,结果皮蓬没明白,直接跑开了。
为了解决这个问题,我又给模型加了个“问题理解”模块。这个模块可以对用户的问题进行分析,提取关键词,然后根据关键词,从知识库里检索相关的知识。
经过这一系列的折腾,AI模型总算是有了点“乔丹队友”的样子。它在知识问答方面的表现,明显提升了不少。用户问个问题,它能快速、准确地给出答案。
这只是第一步。我还计划给模型配上更多的“队友”,比如推理引擎、决策模块等等,让它在更多的场景下,都能发挥出更大的作用。毕竟乔丹再厉害,也需要队友的支持,才能赢得总冠军嘛
还没有评论,来说两句吧...