本文旨在为开发人员详述在知识库上传文档过程中所支持的文件格式规范,以及每种格式的示例和分片效果。
注意:目前本地文档仅支持txt、docx、pdf三种格式。
分片标识符 |
说明 |
QA对 |
以QA对形式进行分段。 |
中文句号 |
以中文句号(。)形式分段。 |
中文分号 |
以中文分号(;)形式分段。 |
中文问号 |
以中文问号(?)形式分段。 |
英文句号 |
以英文句号(.)形式分段。 |
英文分号 |
以英文分号(;)形式分段。 |
英文问号 |
以英文问号(?)形式分段。 |
换行 |
以换行(\n)形式分段。 |
自定义 |
通过自定义分段符号进行分段,例如,通过自定义&为分割符,则在文本中每一个&出现都是一个分段。 |
以QA对举例: