发帖

楼主: 放大时代

107 0

[学科前沿] 使用 Langflow 和 Astra DB 创建 RAG 聊天机器人 [推广有奖]

0关注
0粉丝

等待验证会员

学前班

40%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 0 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 20 点
帖子: 1
精华: 0
在线时间: 0 小时
注册时间: 2018-7-12
最后登录: 2018-7-12

楼主

放大时代 发表于 2025-11-25 11:52:03 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

检索增强生成（RAG）是一种结合了传统信息检索技术与大型语言模型（LLM）的自然语言处理方法。它通过引入外部知识库中的上下文信息，提升生成文本的准确性与相关性。近年来，RAG在聊天机器人领域的应用日益广泛，使企业能够利用自身专有数据优化与客户的自动化交互体验。

towardsdatascience.com/creating-a-rag-chatbot-with-langflow-and-astra-db-582ad588cf37?source=collection_archive---------6-----------------------#2024-08-21

借助 Langflow 提供的可视化界面，可以便捷地构建基于向量数据库与 LLM 集成的 RAG 聊天机器人，实现上下文驱动的智能响应。本文将演示如何使用 Langflow 搭建一个端到端的 RAG 系统，并以经典的 Titanic 数据集作为上下文来源进行实践操作。

Langflow 是 LangChain 生态中的图形化开发工具，而 LangChain 自 2022 年 10 月发布以来，迅速成为 GitHub 上最受欢迎的开源项目之一。作为一个集中式开发环境，LangChain 支持多种主流文本生成和嵌入模型的集成，具备链式调用 LLM、管理提示词、连接向量数据库以加速检索，并将结果顺畅输出至外部 API 或任务流程的能力，极大地推动了人工智能应用的开发效率。

要开始构建 RAG 应用，首先需注册 Langflow 平台账户。创建新项目时，用户可从多个预设模板中选择适合的起点。对于本例中的 RAG 聊天机器人，推荐选用 “Vector Store RAG” 模板。该模板默认配置了 OpenAI 的嵌入与文本生成服务，但同样支持 Ollama、NVIDIA 和 Amazon Bedrock 等其他平台的快速接入，仅需设置相应的 API 密钥即可完成集成。

在启用任何 LLM 提供商之前，务必确认其集成状态已在系统中激活，如以下图片 2 所示。此外，可通过定义全局变量（如 API 密钥、模型名称等），简化后续各组件中的参数输入过程。

图片 2 — OpenAI 活跃集成与概览。来源：作者。

Vector Store RAG 模板包含两个主要流程：检索流程与生成流程。其中，检索部分负责将原始文档上传、分块、向量化并存储至向量数据库中。本案例采用 Astra DB 作为向量存储方案，用户可在 Langflow 界面内直接完成数据库实例的创建。目前系统已自动处理 Astra DB 的应用令牌获取，无需手动配置。

接下来需要创建用于保存嵌入向量的数据集合。该集合的维度必须与所选嵌入模型输出的向量维度保持一致。例如，若使用 OpenAI 的 text-embedding-3-small 模型，则应将集合维度设置为 1536。这一参数可在官方文档中查得，确保嵌入数据正确写入与检索。

下图展示了基于 Titanic 数据集构建的完整检索流程：

图片 3 — 来自 Titanic 数据集的检索流程。来源：作者。

该流程实现了从原始数据上传到向量存储的全链路自动化，为后续的问答系统提供了可靠的上下文支持。整个过程无需编写代码，完全通过拖拽式界面完成配置，极大降低了技术门槛。

最终使用的上下文数据集为 Titanic 数据集，用于丰富聊天机器人的知识背景，使其能够在查询相关历史信息时提供更精准的回答。

照片由 Igor Omilaev 提供，来自 Unsplash

在构建基于 RAG（检索增强生成）的聊天机器人时，首先需要处理 Titanic 数据集（采用 CC0 许可）。该数据集用于使系统能够回答关于乘客的详细信息及复杂问题。为实现这一目标，需先通过通用文件加载器导入数据，并使用全局变量“separator;”对内容进行分割，因为原始文件格式为 CSV。由于每个乘客将作为一个独立的数据块，因此块大小和块重叠均设置为 0。若输入为纯文本，则应启用块大小与重叠机制以确保嵌入的准确性。

经过处理后，生成的向量被存储于名为 titanic_vector_db 的向量数据库中，该数据库位于 demo_assistente 实例内。

towardsdatascience.com/creating-a-rag-chatbot-with-langflow-and-astra-db-582ad588cf37?source=collection_archive---------6-----------------------#2024-08-21

如图 4 所示，完整的 RAG 生成流程由用户的聊天输入触发。系统接收到请求后，会在向量数据库中执行相似性搜索，以获取与输入相关的上下文信息。例如，当用户提及名字“欧文”（Owen）时，系统会检索与其名称语义相近的向量记录，再通过解析器将其转换为可读文本，从而构建后续提示所需的背景内容。图 5 展示了此阶段的检索结果。

[此处为图片2]

值得注意的是，在整个流程中，必须保证嵌入模型的一致性——即用于构建向量数据库的嵌入模型也必须用于检索过程。否则，因向量空间不匹配，搜索结果将为空。这一点凸显了向量数据库在 RAG 架构中的关键性能优势：它能够在极短时间内完成上下文检索并传递至生成模块，从而提升整体响应效率。

接下来进入提示构建阶段。如图 6 所示，最终传递给 AI 模型的提示由两部分组成：一部分是经解析器转化后的检索上下文，另一部分则是用户的原始提问。这种结构化方式有效融合了外部知识与用户意图，为高质量生成奠定基础。

[此处为图片3]

在生成阶段，选用 GPT-4 模型并设置温度值为 0.5，这是当前聊天机器人推荐的标准配置。温度参数控制语言模型输出的随机程度：较低的数值倾向于产生更确定、直接的回答；而较高的数值则增加创造性，但可能导致逻辑混乱或幻觉现象。最后，只需配置 OpenAI API 密钥作为全局变量即可启动服务。

随后便可运行整个流程，并在交互式环境中测试效果。

[此处为图片4]

从图 7 中的对话示例可见，聊天机器人成功提取了相关上下文，并准确回应了有关乘客的具体问题。尽管结果显示泰坦尼克号上并无罗斯或杰克这两位虚构人物，略显遗憾，但这恰恰反映了系统的事实准确性。至此，一个基本的 RAG 聊天机器人已搭建完成。当然，未来可通过优化策略进一步提升其对话能力，减少潜在误解。

关于部署方案，存在多种选择。HuggingFace Spaces 提供了一种简便且具备可扩展硬件支持的方式，特别适合快速上线。此外，也可以在本地运行 Langflow，无需任何额外安装步骤。对于更复杂的生产环境，Langflow 支持通过 Kubernetes 集群、Docker 容器部署，或直接部署于 GCP 平台的虚拟机及 Google Cloud Shell 中。更多技术细节可参考官方文档。

随着低代码工具的发展，AI 应用正迎来新的时代。Langflow 凭借其直观的界面设计与丰富的模板集成，正在重塑人工智能在现实场景中的落地路径。如今，即使仅掌握基础 AI 知识的用户，也能构建出高度复杂的智能系统——而在十年前，这通常需要深厚的编程功底与深度学习框架经验才能实现。