楼主: 2019hansi
516 0

[其他论文] 优化LangChain框架中的文档分割方法:方法与应用 [推广有奖]

  • 3关注
  • 4粉丝

等待验证会员

院士

44%

还不是VIP/贵宾

-

威望
0
论坛币
14 个
通用积分
86.6083
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
40331 点
帖子
1759
精华
0
在线时间
809 小时
注册时间
2019-6-4
最后登录
2025-12-5

楼主
2019hansi 发表于 2024-1-5 10:13:53 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1 论文标题:优化LangChain框架中的文档分割方法:方法与应用

2 作者信息:蔡运生, 穆欣宇, 董 浩, 陈国铨, 孙 达:北京信息科技大学计算机学院,北京

3 出处和链接:蔡运生, 穆欣宇, 董浩, 陈国铨, 孙达. 优化LangChain框架中的文档分割方法:方法与应用[J]. 计算机科学与应用, 2023, 13(12): 2575-2586. https://doi.org/10.12677/CSA.2023.1312256

4 摘要:本研究旨在改进LangChain框架中的文档分割方法,以提高大型语言模型处理长文本的效率和准确性。通过分析现有的文档分割工具,发现其可能导致语义断裂和处理效率低下的问题。针对这些问题,提出了一种基于KMeans聚类算法的优化策略,以保持文本的语义连贯性和句子的原始顺序。构建了名为TextSplitter的类和名为chunk_file的函数,实现了新的文档分割和聚类方法。通过PK值评估法对优化策略的效果进行了验证,并通过实验展示了新方法相较于现有方法的优势。本研究不仅为LangChain框架的文档分割提供了有效的优化方案,也为处理大规模文本数据提供了有益的参考。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Chain lang LAN LITTER kmeans

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-5 16:18