【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。
刚刚,包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员,提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs!
通过一个轻量级文本编码器与一个级联超卷积解码器的组合,DnD能在数秒内,仅根据无标签的任务提示词,生成针对该任务的LoRA权重矩阵。
通过观察,研究人员发现,LoRA适配器无非是其训练数据的一个函数:梯度下降会将基础权重「拖拽」至一个特定任务的最优状态。
为了赋予模型「拖拽」的能力,团队将这些数据集的提示词与收集到的LoRA权重进行随机配对,构成DnD模型的训练数据——即「提示词-参数」对。
在推理阶段,团队只需将来自全新数据集(训练中未见过)的提示词输入DnD,仅需一次前向传播,即可获得为该任务量身定制的参数。
实验结果表明,在零样本测试集上,团队的方法相较于训练所用的LoRA模型的平均性能,取得了惊人的提升,并且能够很好地泛化到多种真实世界任务和不同尺寸的LLM。
此前,他在中国科学技术大学获得人工智能学士学位。并曾在北卡罗来纳大学教堂山分校Huaxiu Yao教授的指导下进行实习,以及在中国科学技术大学数据科学实验室跟着导师Xiang Wang度过了两年的时光。
Zhangyang Wang目前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系的终身副教授,并荣膺坦普尔顿基金会第7号捐赠教席。
他于2016年获伊利诺伊大学厄巴纳-香槟分校电气与计算机工程博士学位,师从计算机视觉泰斗黄煦涛(Thomas S.Huang)教授;并于2012年获中国科学技术大学电子工程与信息科学学士学位。
核心目标是创建结构化、?榛哪P捅硎:1)在过参数化模型空间中实现高效、鲁棒的学习;2)与符号知识及推理进行无缝连接。
此前,他在新加坡国立大学获得数据科学与机器学习博士学位,在中国科学院深圳先进技术研究院获得计算机技术硕士学位,在北京师范大学珠海校区获得学士学位。
叶玉卿《春庭欲晚》讲了什么故事对此,稻城县副县长洛绒同麦表示,由于香格里拉镇至亚丁村的路段地势陡峭,游客服务中心只能建在地势相对平坦、距保护区还有6公里的香格里拉镇上,其他管护站、检查站、消防站则是出于便于管理的考虑设在了紧邻游客服务中心的位置。去年10月24日,在石可准备向法院第二次提起离婚诉讼期间,已与其分居的丈夫刘某和另外多人,在街头把当时2岁多的小清从石可父母处抢走。该事件后来持续引发关注并多次登上热搜。叶玉卿《春庭欲晚》讲了什么故事《《下/流交易》BY:榴莲最好吃百度云》据报道,内塔尼亚胡已连续两晚召集安全内阁开会,为重启对伊军事行动做准备。他认定,战争目标仍未完成,伊朗仍未受到“结构性削弱”。这是属于他们全家的庆生画面,何超莲颜值依旧在线,精心打扮的她手捧蛋糕,肌肤好白,感觉姐姐何超云没有何超莲漂亮。
20260611 ? 叶玉卿《春庭欲晚》讲了什么故事“随着低空经济驶入发展快车道,我们也不断拓宽企业发展赛道,发力AI低空科教文旅、低空监管解决方案,依托核心技术,打造全维度低空服务能力。”高巨创新业务总监李晨亮说。《日剧《爱上你》》说回雯女,多年后商天娥承认,自己确实在别人讲邓萃雯是非时跟着搭腔,加上父亲生病心情不好,在片场没沟通好产生误会,后来解释清楚就没事了。
? 王昆记者 陈付军 摄
20260611 ? 叶玉卿《春庭欲晚》讲了什么故事需要提醒的是,本次现场咨询会仅提供岗位咨询和职业指导服务,不接受现场简历投递。所有符合条件的残疾人均需通过邮件正式报名,报名时间为2026年5月28日至6月3日。《XXXX》清晨,天刚放亮,景德镇浮梁县湘湖镇兰田村,景德镇陶瓷大学的法国留学生柯杨已经蹲在院角的窑炉前,往炉膛里添柴火。他试了试窑温,转身从工作台上拿起一只刚修好坯的瓷碗,对着晨光细看——碗壁薄得透亮。“手要稳,心要静。”他用带着南方口音的中文小声念叨。这是三年前一位当地老工匠教他的。
? 张恒亮记者 朱红海 摄
? 采访中就有这样一个场景。换衣服时,记者不由得多看了上田绮世的身体几眼。作为一名长期在对抗强度极高的荷甲锋线作战、并最终拿到最佳射手的球员,他的身体厚实得像铠甲一样,尤其是腰腹区域的力量感格外突出。这并不是单纯从肌肉量就能判断出来的。记者没多想,直接问道:“从身体层面来说,你已经达到完全体了吗?”《被全校当成公共座椅的小说有哪些狗》