文件自动导入知识库

现在有这样一个需求。

公司在使用好队友搭建的信通小精灵过程中会上传各种文档附件,类似于这样的:

有没有相关的方法实现自动导入文档到jit的AI知识库进行分块,在这边每有一个文档,jit的AI知识库就可以同步获得。

主要是好队友那边没有什么机会可以调用jit的接口,jit这边倒是可以通过服务函数写入文件到知识库

行,我先试试看

关于这个的文档添加配置要怎么用呢?

示例代码如下:

def add(self, documentul):
        app.rags.information.addDocumentByBusinessId("TEST001", [{ "fileName": "WSL + Claude Code + Cursor 完整安装指南.pdf", "size": 143898, "url": documentul.value, "type": "application/pdf"}], {"chunkSeparator": ["\n"], "chunkSize": 1024, "chunkOverlap": 100}, {"chunkCleaning": True})

其中注意

  1. url使用的是参数值
  2. 其他文件名称,大小,类型你都可以用变量或者你自己写个函数去url中读取
  3. app.rags.information.addDocumentByBusinessId 中的rags.information换成你自己知识库

的fullname入下图

这个方法是添加文档的时候使用的固定值吧。我们想知道这个生成附件的使用方法以及在使用变量值的时候有没有方法实现从外部添加文档(比如通过写一个新的服务)。

我给的例子里面附件的url不是固定值,你看下代码里面的url是被传参覆盖了的