文档中心 > AI PASS

创建知识库

更新时间:2025/03/12 访问次数:1038

本文阐述了构建知识库的系统化流程,旨在为开发人员提供对知识库及其组成单元和节点的创建与配置机制的指引。

前提条件

1)入驻淘宝开放平台,详情请参考AI应用开发商-接入指南

2)已经了解知识库的功能概述

3)已经了解知识库文本格式,详情请参考文件格式

操作步骤

步骤一:创建知识库

1. 登录淘宝开放平台,依次选择AI实验室 > 知识库 > 创建知识库,如下图所示:

2. 在知识库界面,点击创建知识库,如下图所示:

3. 在创建知识库界面,填写知识库基本信息,然后单击确认,进入单元管理界面,如下图所示:

1)名称:必填项,知识库名称,最多12个字符。

2)Logo:知识库logo图,若不上传新图片则使用默认图片。

3)描述必填项,不少于10个字符,最多60个字符,请仔细填写知识库描述,便于理解与区分。

4)类型:必选项,知识库类型,创建后知识库类型将不能更改,请谨慎选择。

说明如果此处选择商家专属,需要填写商家淘宝名称,商家专属的相关介绍,请参考概述

4. 在单元管理界面,单击创建单元,创建知识库单元节点。

步骤二:配置单元节点

在单元节点创建界面,有两种不同的文本类型,可根据不同单元类型,配置单元节点。

方式一:配置本地文档

1. 在单元节点创建界面,单元节点类型选择本地文档并配置相关属性,单击确定

1)类型:选择本地文档,目前仅支持txtdocxpdf三种格式。

2)标签知识单元分类标签,非必选。

3)时效:知识单元有效周期,非必选。

注意选择标签后,会影响知识点的召回效果;选择有效时长后,会在有效时长内进行召回。什么是知识库的召回,可参考概述

2. 在配置分段节点,填写最大分片长度,选择分片标识符,然后单击下一步

说明

1)最大分片长度:知识点的最大长度,分段长度最大512字符。

2)分片标识符:目前支持QA对小节段落中文句号中文分号中文问号英文句号英文分号英文问号换行自定义等。

3. 在添加内容节点,根据上一步选择的分片标识符上传本地文件,然后单击下一步

说明

1)本地文档准备的内容格式,请参考文件格式

2)文件仅支持docx、txt和pdf类型,且上传文件最多一次性上传10个文件,每个文件大小不超过2MB。

4. 在生成单元节点,生成分段完成后点击退出本页,后台继续执行按钮,返回单元管理界面。

方式二:配置本地表格

1. 在单元节点创建界面,单元节点类型选择本地表格并配置相关属性,单击确定

1)类型:选择本地表格,目前仅支持xlsxlsxxsv三种格式。

2)标签知识单元分类标签,非必选。

3)时效:知识单元有效周期,非必选。

注意:选择标签后,会影响知识点的召回效果;选择有效时长后,会在有效时长内进行召回。什么是知识库的召回,可参考概述

2. 在添加内容上传表格,然后单击下一步

说明

1)本地表格准备的内容格式,请参考文件格式

2)文件仅支持xls、xlsx和csv类型,且上传文件最多一次性上传1个文件,每个文件大小不超过2MB。

3. 在配置表结构节点,选择数据表相关信息,并点击预览数据,可查看表格数据,如下图所示:

1)数据表:上传表格文件中的数据表位置。

2)表头表头即表格中的列标题所在行。

3)数据起始行:数据所在的行数。

4)表结构:表头结构信息,通常为表格第一行字段信息。

数据表预览界面,如下图所示:

4. 在设置表结构中,勾选索引,然后单击下一步

1)是否索引:索引是召回表格整行内容时,勾选索引,则该字段将用于 Query 进行相似度匹配的召回。

注意:索引的勾选会影响知识点的召回效果,会通过询问的问题去匹配我们勾选索引的字段参数,匹配成功后会召回勾选索引的字段内容。

2)字段名:表格表头名称。

3)描述:表格表头字段含义。

4)生成单元节点,生成分段完成后点击退出本页,后台继续执行按钮,返回单元管理界面。

步骤三:启用单元节点

1. 在单元管理界面,启用新添加的单元节点,则本地文档配置成功。

恭喜!

恭喜您,通过本文内容已经完成了知识库的基础内容搭建,启用成功后,您可在创建AI员工中绑定知识库,或在工作流中使用知识库节点绑定该知识库。

FAQ

关于此文档暂时还没有FAQ
返回
顶部