跳到主要内容

Langflow 中的加载器组件

信息

自 Langflow 1.1 版本起,加载器组件现在位于 组件 菜单下的 捆绑包 中。

加载器从各种来源(如数据库、网站和本地文件)将数据载入 Langflow。

在流程中使用加载器组件

此流程为载入流程的文档创建了一个问答聊天机器人。Unstructured.io 加载器组件从您的本地机器加载文件,然后将其解析成结构化的 数据 对象列表。这些加载的数据为 Open AI 组件响应您的问题提供信息。

Sample Flow retrieving data with unstructured

Confluence

Confluence 组件与 Confluence wiki 协作平台集成,用于加载和处理文档。它利用 LangChain 的 ConfluenceLoader 从指定的 Confluence 空间获取内容。

参数

输入

名称显示名称信息
url站点 URLConfluence 空间的基础 URL,例如 https://company.atlassian.net/wiki
username用户名Atlassian 用户邮箱地址,例如 email@example.com
api_keyAPI 密钥Atlassian API 密钥。在 Atlassian 创建 API 密钥。
space_key空间密钥要访问的 Confluence 空间的密钥。
cloud使用云服务?是否使用 Confluence 云服务。默认值为 true。
content_format内容格式内容格式。默认值为 STORAGE。
max_pages最大页数要检索的最大页数。默认值为 1000。

输出

名称显示名称信息
data数据包含加载的 Confluence 文档的数据对象列表。

GitLoader

GitLoader 组件使用 LangChain 的 GitLoader 从指定的 Git 仓库获取和加载文档。

参数

输入

名称显示名称信息
repo_path仓库路径Git 仓库的本地路径。
clone_url克隆 URL用于克隆 Git 仓库的 URL。此字段是可选的。
branch分支加载文件的分支。默认值为 main。
file_filter文件过滤器用于过滤文件的模式。使用 .py 仅包含 Python 文件,或使用 !.py 排除 Python 文件。
content_filter内容过滤器基于文件内容过滤文件的正则表达式模式。

输出

名称显示名称信息
data数据包含加载的 Git 仓库文档的数据对象列表。

Unstructured

此组件使用 Unstructured.io 无服务器 API 将文件加载并解析成结构化的 数据 对象列表。

参数

输入

名称显示名称信息
file文件要解析的文件的路径。支持的文件类型列在 Unstructured 文档 中。
api_keyAPI 密钥Unstructured.io 无服务器 API 密钥。
api_urlUnstructured.io API URLUnstructured API 的 URL。此字段是可选的。
chunking_strategy分块策略文档分块的策略。选项包括 basic、by_title、by_page 和 by_similarity。
unstructured_args附加参数Unstructured.io API 的附加参数字典。此字段是可选的。

输出

名称显示名称信息
data数据包含输入文件解析内容的 Data 对象列表。
Search