AI
LLM 模型的福音:QJL 量化技术实现 KV 缓存零开销压缩
近年来,大型语言模型(LLM)在各个领域 … 阅读更多
SoftMax 的困境:在稀疏性和多模态之间左右为难
SoftMax 是现代机器学习算法中无处 … 阅读更多
深度状态空间模型:稳定性与泛化能力
近年来,深度学习在时间序列建模领域取得了 … 阅读更多
毕昇:开启下一代人工智能应用开发的全新旅程
毕昇,顾名思义,取自活字印刷术的发明者, … 阅读更多
PaCE:让大型语言模型更安全、更可靠、更懂你
大型语言模型(LLM)正以前所未有的速度 … 阅读更多
轻量级参数高效微调:通过早期剪枝加速训练
在大型语言模型 (LLM) 时代,参数高 … 阅读更多
大型语言模型的“逢迎”:揭秘误导性关键词的危害与防御策略
大型语言模型(LLMs)在自然语言处理领 … 阅读更多
ELLE:让预训练语言模型持续高效吸收新领域知识
预训练语言模型(PLM)在自然语言处理领 … 阅读更多
大型语言模型的社会偏见:从不同视角看“你”的偏见
警告:本文包含可能具有冒犯性或令人不安的 … 阅读更多
Is Free Self-Alignment Possible?
This paper investiga … 阅读更多
让语音合成更具表现力:StyleMoE 的“分而治之”策略
近年来,语音合成技术取得了长足进步,合成 … 阅读更多
突破传统:利用大型语言模型提升财务数据异常检测
财务数据,尤其是来自总账的数据,记录着企 … 阅读更多
用XGBoost玩转排序任务:从原理到实战
在信息爆炸的时代,如何从海量信息中快速找 … 阅读更多
如何用XGBoost对搜索结果进行优化排序
XGBoost是一种强大的梯度提升算法, … 阅读更多
法律智慧的知识注入:通过诊断和正负样本强化学习探索大语言模型咨询
近年来,随着生成式大语言模型(LLMs) … 阅读更多
问答系统中的检索复杂度:解码复杂问题的奥秘
在信息爆炸的时代,问答系统(QA)成为了 … 阅读更多
对话式搜索引擎的排名操纵:一场悄无声息的“战争”
近年来,大型语言模型(LLM)作为强大的 … 阅读更多
大型语言模型真的像人脑一样思考吗?
近年来,大型语言模型(LLM)展现出惊人 … 阅读更多