Openai为什么不直接提供与实时数据结合的大语言模型?
- 任何AI模型都有训练集和测试集,如果所有数据都被利用,也就是如果最新的互联网数据完全进入了模型,那么,模型就失去了未来进一步发展的空间和机会,这就是为什么所有大模型都截止到过去的某个时间的原因;截止时间以后的数据,会做为将来更新模型参数的训练集和测试集;
- 运用层面,可以不考虑上述,因为模型参数的有效性在一两年的时间范围内,是无需担心的,也就是说,今天语言的使用情况,与模型参数形成时候的情况,可以认为是差不多的;
- 但是运用层面依然有问题,那就是如何检索互联网的问题。现在的方式就是带着用户的qurey,去搜索引擎找到相关网页,再交给llm处理