Files
higress/plugins/wasm-go/extensions/ai-rag/README.md
2024-09-12 21:48:40 +08:00

3.6 KiB
Raw Blame History

title, keywords, description
title keywords description
AI RAG
AI网关
AI RAG
AI RAG 插件配置参考

功能说明

通过对接阿里云向量检索服务实现LLM-RAG流程如图所示

运行属性

插件执行阶段:默认阶段 插件执行优先级:400

配置说明

名称 数据类型 填写要求 默认值 描述
dashscope.apiKey string 必填 - 用于在访问通义千问服务时进行认证的令牌。
dashscope.serviceFQDN string 必填 - 通义千问服务名
dashscope.servicePort int 必填 - 通义千问服务端口
dashscope.serviceHost string 必填 - 访问通义千问服务时域名
dashvector.apiKey string 必填 - 用于在访问阿里云向量检索服务时进行认证的令牌。
dashvector.serviceFQDN string 必填 - 阿里云向量检索服务名
dashvector.servicePort int 必填 - 阿里云向量检索服务端口
dashvector.serviceHost string 必填 - 访问阿里云向量检索服务时域名
dashvector.topk int 必填 - 阿里云向量检索时获取向量数
dashvector.threshold float 必填 - 向量距离阈值,高于该阈值的文档会被过滤掉
dashvector.field string 必填 - 阿里云向量检索存储文档的字段名

插件开启后在使用链路追踪功能时会在span的attribute中添加rag检索到的文档id信息供排查问题使用。

示例

dashscope:
    apiKey: xxxxxxxxxxxxxxx
    serviceFQDN: dashscope
    servicePort: 443
    serviceHost: dashscope.aliyuncs.com
dashvector:
    apiKey: xxxxxxxxxxxxxxxxxxxx
    serviceFQDN: dashvector
    servicePort: 443
    serviceHost: vrs-cn-xxxxxxxxxxxxxxx.dashvector.cn-hangzhou.aliyuncs.com
    collection: xxxxxxxxxxxxxxx
    topk: 1
    threshold: 0.4
    field: raw

CEC-Corpus 数据集包含 332 篇突发事件的新闻报道的语料和标注数据,提取其原始的新闻稿文本,将其向量化后添加到阿里云向量检索服务。文本向量化的教程可以参考《基于向量检索服务与灵积实现语义搜索》

以下为使用RAG进行增强的例子原始请求为

海南追尾事故,发生在哪里?原因是什么?人员伤亡情况如何?

未经过RAG插件处理LLM返回的结果为

抱歉作为AI模型我无法实时获取和更新新闻事件的具体信息包括地点、原因、人员伤亡等细节。对于此类具体事件建议您查阅最新的新闻报道或官方通报以获取准确信息。您可以访问主流媒体网站、使用新闻应用或者关注相关政府部门的公告来获取这类动态资讯。

经过RAG插件处理后LLM返回的结果为

海南追尾事故发生在海文高速公路文昌至海口方向37公里处。关于事故的具体原因交警部门当时仍在进一步调查中所以根据提供的信息无法确定事故的确切原因。人员伤亡情况是1人死亡司机当场死亡另有8人受伤包括2名儿童和6名成人所有受伤人员都被解救并送往医院进行治疗。