本文旨在深入阐述知识库修正与单元分段更新的综合流程,为开发人员优化知识库内容与单元结构的迭代升级提供帮助。
1)已经了解知识库的功能概述。
2)已经了解知识库文本格式,详情请参考文本格式。
3)已经完成了知识库的创建,如何创建知识库请参考创建知识库。
1. 登录淘宝开放平台,依次选择AI 实验室 > 数据库 > 知识库,如下图所示:
2. 在知识库列表中,选择目标知识库点击标识,进入知识库编辑界面。
3. 在知识库编辑界面中,修改知识库基本信息,最后单击确定。
1)名称:必填项,知识库名称,最多12个字符。
2)Logo:知识库logo图,若不上传新图片则使用默认图片。
3)描述:必填项,不少于10个字符,最多60个字符,请仔细填写知识库描述,便于理解与区分。
4)类型:知识库类型,不可更改。
1. 在单元管理列表中,选择目标知识库单元,单击编辑,进入知识库单元编辑界面。
2. 在知识库单元详情界面,点击标识,进入知识库单元编辑界面。
3. 在知识库单元编辑界面中,修改知识库单元基本信息,最后单击确定。
1)名称:知识单元名称,必填项。
2)标签:知识单元分类标签,非必选。
3)时效:知识单元有效周期,非必选。
注意:选择标签后,会影响知识点的召回效果;选择有效时长后,会在有效时长内进行召回。什么是知识库的召回,可参考概述。
1. 新增单元分段
1.1. 在知识库单元编辑界面中,选择更新单元下的新增分段选项,如下图所示:
1.2. 根据单元类型上传本地文件,然后点击上传完成,开始分段按钮,完成新增单元分段。
说明:根据不同单元类型上传的文件格式不同,详情请参考文本格式。
2. 修改分段配置
2.1. 在知识库单元编辑界面中,选择更新单元下的修改分段配置选项,如下图所示:
2.2. 修改需要更新的分段配置,然后点击修改完成,开始分段按钮,完成修改分段配置。
说明:
1)最大分片长度:知识点的最大长度,分段长度最大512字符。
2)分片标识符:目前支持QA对、小节段落、中文句号、中文分号、中文问号、英文句号、英文分号、英文问号、换行、自定义等。
3. 重新导入
在知识库单元编辑界面中,选择更新单元下的重新导入选项,根据不同单元类型上传本地文件,上传完成后,即可更新单元分段信息,如下图所示:
说明:
1)重新导入将会清空单元内原有内容。
2)根据不同单元类型上传的文件格式不同,详情请参考文本格式。
3)根据不同单元类型上传文件步骤,请参考创建知识库-步骤二。
如果你完成了知识库的创建,你可以进行以下操作:
1)删除知识库