Google DeepMind 学者研发Focused Transformer ，扩展大模型输出长度限制

• 2023年7月11日下午4:58 • 发现 • 阅读 15.48w

品玩7月11日讯，据 Arxiv 页面显示，Google DeepMind 研究团队近日联手华沙大学和波兰科学院等机构，研发一项名为 Focused Transformer 的技术。

Focused Transformer 技术旨在通过对比训练来扩展上下文长度的方法，可以用于大型语言模型。Focused Transformer 技术通过对比训练来增强 (key, value) 空间的结构，从而扩展了上下文长度。这项技术使得已经预训练的大型语言模型可以被重新训练来延长它们的有效上下文。

论文显示，研究团队使用一款名为 LongLLaMA 的大模型进行测试。经过实验，研究团队已经成功使用 LongLLaMA 模型在密码检索任务中实现了256K的上下文长度。

原创文章，作者：，如若转载，请注明出处：https://knewsmart.com/archives/172049

0 0 打赏

微信扫一扫

关于作者

0 文章

0 评论

粉丝

国微感知----创新性智能传感器提升头戴产品舒适体验

上一篇 2023年7月11日下午4:57

英伟达将占AI芯片市场至少九成份额

下一篇 2023年7月11日下午4:58

发现

ArkPro跻身今年最实用的节日礼品之列

深圳2025年12月12日 /美通社/ -- 随着节日送礼活动达到高潮，傲雷（Olight）的ArkPro脱颖而出，成为创作者、户外爱好者，以及寻求实用高端礼品的购物者的心头好。今年圣诞节，"具有真实价值的有用礼物"的兴起，正重…

新智派
21小时前
34.2K
全球首个"免化疗"：H药胃癌围手术适应症申报上市并被纳入优先审评

上市进程提速，有望成为全球首个获批用于胃癌围手术期治疗的抗PD-1单抗首个获CDE突破性疗法认定及首个被纳入优先审评的胃癌围手术期治疗药物全球首个胃癌围手术期以免疫单药取代术后辅助化疗的治疗方案，显著降低…

新智派
发现 23小时前
36.7K
30万客流、900万订单额见证科技破圈 ROBOT MALL合生汇快闪店圆满收官

北京2025年12月12日 /美通社/ -- 历经31天科技热潮，ROBOT MALL合生汇快闪店于11月30日圆满收官。作为首次进驻城市核心商圈的标杆实践，ROBOT MALL合生汇快闪店不仅成为热门科技打卡地，更实现了B端商业转化和C端认…

新智派
发现 1天前
37.9K
卫材在CTAD 2025上公布抗Tau抗体Etalanetug（E2814）新数据

东京2025年12月12日 /美通社/ -- 卫材宣布，在第十八届阿尔茨海默病临床试验大会（Clinical Trials on Alzheimer's Disease Conference，CTAD）上公布了抗tau抗体Etalanetug（研发代号：E2814）的新数据。Etalanetu…

新智派
发现 1天前
36.3K
Shake Shack北京大融城店开业，以科技美学打造社区灵感"食"光

上海2025年12月12日 /美通社/ -- 2025年12月12日，备受全球美食爱好者关注的Shake Shack在北京中关村大融城迎来了全新主题门店的盛大开业。新店坐落于北京科技创新核心地带，将纽约风味的招牌汉堡与中关村的科技氛…

新智派
发现 1天前
35.9K
德华安顾人寿增资获批，安顾坚定履行在中国的长期发展承诺

北京2025年12月12日 /美通社/ -- 安顾于12月12日宣布，其在华合资公司德华安顾人寿保险有限公司（以下简称"德华安顾人寿"）15.45亿元人民币增资方案已获国家金融监督管理总局山东监管局正式批准。德国安顾集团股份…

新智派
发现 1天前
34.9K
发现

英矽智能与太景达成管线授权合作，助力AI驱动的PHD抑制剂开发和商业化，用于慢性肾病（CKD）贫血治疗

英矽智能已授予太景在大中华区开发、商业化和分许可ISM4808的独家权利。这是一款AI驱动的潜在"同类最佳"口服PHD抑制剂，于2023年获得临床试验批件。此次合作将英矽智能的生成式AI发现平台能力与太景在临床和商业方…

新智派
1天前
33.3K
从"建筑垃圾"到"城市矿产"：在TEDxShenzhen，一场关于循环建造的思想实验

深圳2025年12月12日 /美通社/ -- 2025年12月7日，以"涌现・Emerging"为主题的TEDxShenzhen年度大会在深圳G&G创意社区启幕。作为全球最负盛名的跨界思想平台TED的本地化实践，TEDxShenzhen始终致力于在深圳这座"…

新智派
发现 1天前
36.4K
科技艺术跨界盛宴来袭《META THINKER 人机共生》机器人博览艺术展12月登陆黄浦

上海2025年12月12日 /美通社/ -- 2025年12月4日至7日，由META THINKER国际组委会、上海黄浦科创集团有限公司、上海外滩投资开发（集团）有限公司联合主办，上海麦塔鑫科文化传媒有限公司承办的《META THINKER 人机…

新智派
发现 1天前
37.4K
发现

"与麟同行，共创美业"，中化化肥发布生物磷肥新品水溶美麟美、麟葆

北京2025年12月12日 /美通社/ -- 2025年12月10日，中化化肥"与麟同行，共创美业" 生物磷肥水溶新品上市发布会在西北地区举行。在近百位经销商、种植大户等客户代表的共同见证下，中化化肥发布水溶美麟美、水溶麟葆…

新智派
1天前
40.6K

发表回复

登录后才能评论

Google DeepMind 学者研发Focused Transformer ，扩展大模型输出长度限制

关于作者

相关推荐

发表回复