Langflow 中的加载器组件
信息
自 Langflow 1.1 版本起,加载器组件现在位于 组件 菜单下的 捆绑包 中。
加载器从各种来源(如数据库、网站和本地文件)将数据载入 Langflow。
在流程中使用加载器组件
此流程为载入流程的文档创建了一个问答聊天机器人。Unstructured.io 加载器组件从您的本地机器加载文件,然后将其解析成结构化的 数据 对象列表。这些加载的数据为 Open AI 组件响应您的问题提供信息。
Confluence
Confluence 组件与 Confluence wiki 协作平台集成,用于加载和处理文档。它利用 LangChain 的 ConfluenceLoader 从指定的 Confluence 空间获取内容。
参数
输入
名称 | 显示名称 | 信息 |
---|---|---|
url | 站点 URL | Confluence 空间的基础 URL,例如 https://company.atlassian.net/wiki。 |
username | 用户名 | Atlassian 用户邮箱地址,例如 email@example.com。 |
api_key | API 密钥 | Atlassian API 密钥。在 Atlassian 创建 API 密钥。 |
space_key | 空间密钥 | 要访问的 Confluence 空间的密钥。 |
cloud | 使用云服务? | 是否使用 Confluence 云服务。默认值为 true。 |
content_format | 内容格式 | 内容格式。默认值为 STORAGE。 |
max_pages | 最大页数 | 要检索的最大页数。默认值为 1000。 |
输出
名称 | 显示名称 | 信息 |
---|---|---|
data | 数据 | 包含加载的 Confluence 文档的数据对象列表。 |
GitLoader
GitLoader 组件使用 LangChain 的 GitLoader 从指定的 Git 仓库获取和加载文档。
参数
输入
名称 | 显示名称 | 信息 |
---|---|---|
repo_path | 仓库路径 | Git 仓库的本地路径。 |
clone_url | 克隆 URL | 用于克隆 Git 仓库的 URL。此字段是可选的。 |
branch | 分支 | 加载文件的分支。默认值为 main。 |
file_filter | 文件过滤器 | 用于过滤文件的模式。使用 .py 仅包含 Python 文件,或使用 !.py 排除 Python 文件。 |
content_filter | 内容过滤器 | 基于文件内容过滤文件的正则表达式模式。 |
输出
名称 | 显示名称 | 信息 |
---|---|---|
data | 数据 | 包含加载的 Git 仓库文档的数据对象列表。 |
Unstructured
此组件使用 Unstructured.io 无服务器 API 将文件加载并解析成结构化的 数据 对象列表。
参数
输入
名称 | 显示名称 | 信息 |
---|---|---|
file | 文件 | 要解析的文件的路径。支持的文件类型列在 Unstructured 文档 中。 |
api_key | API 密钥 | Unstructured.io 无服务器 API 密钥。 |
api_url | Unstructured.io API URL | Unstructured API 的 URL。此字段是可选的。 |
chunking_strategy | 分块策略 | 文档分块的策略。选项包括 basic、by_title、by_page 和 by_similarity。 |
unstructured_args | 附加参数 | Unstructured.io API 的附加参数字典。此字段是可选的。 |
输出
名称 | 显示名称 | 信息 |
---|---|---|
data | 数据 | 包含输入文件解析内容的 Data 对象列表。 |