人类的好奇心驱使着我们不断探索和理解周围的世界,这也导致了各种工具的发明,以满足我们的求知欲。尽管人类的大脑无法处理和记忆大量信息,但人类在批判性思维、规划、反思以及利用现有工具与世界互动和解释方面表现出色,从而能够高效地找到答案
最近大型语言模型(LLMs)的进步表明,机器也可能具备上述类似于人类的能力,即使参数数量受限,也能展现出强大的能力。
在这篇论文中,我们介绍了KwaiAgents,一种基于LLMs的通用信息检索代理系统。在KwaiAgents中,我们提出了一个代理系统,它以LLMs作为认知核心,能够理解用户的查询、行为指南和外部文档的引用。该代理还可以从内部存储器中更新和检索信息,使用基于时间的搜索浏览工具包进行规划和执行操作,并最终提供全面的响应。我们进一步研究了系统在由GPT-4更低级别的LLMs提供支持时的性能,并引入了Meta-Agent Tuning(MAT)框架,旨在确保开源的7B或13B模型在许多代理系统中表现良好。我们利用基准和人工评估系统的能力进行系统验证。广泛的实验显示了我们代理系统相对于其他自主代理的优势,并凸显了我们经过精调的LLMs的增强的通用代理能力。
我们在https://github.com/KwaiKEG/KwaiAgents上发布了系统代码、模型、训练数据和基准的lite版本,供公众使用。
伯特兰·罗素(Bertrand Russell)曾深刻地说过,追求知识是他一生中简单但无比强烈的激情之一。历代人们致力于探索世界的复杂性,创造出精巧的组织和检索工具,以满足无尽的好奇心。
然而,认知科学的研究表明,人类平均在一小时内会遗忘约50%的新获得信息,这种现象被称为遗忘曲线。当个体试图在没有定期强化的情况下内化知识时,这一观察尤其成立。例如,虽然许多人轻松记得珠穆朗玛峰是“世界上最高的山”,但是“第五高的山”的身份常常会被遗忘。
然而,人类的优势在于批判性思维、规划、反思和灵活运用外部资源。面对知识空白,人们可以咨询谷歌等搜索引擎,或者求助于维基百科或书籍等知识库。这种认知和足智多谋的独特结合使人类区别于其他物种,常常使我们比最先进的计算机更有洞察力。