星知
体验星知
核心优势
产品特点
适用场景
星知大模型
新闻资讯
星知智能体
登录
返回列表
美团发布原生多模态 LongCat-Next:视觉语音实现底层统一
美团发布LongCat-Next原生多模态大模型,以DiNA架构实现多模态底层统一,性能领先且已开源
发布时间:
2026/04/04 03:54
|
分类:
人工智能
4月3日,美团技术团队正式发布原生多模态大模型LongCat-Next。该模型突破传统“语言基座+插件”的拼凑架构,通过将图像、语音与文本统一转化为同源离散Token,实现原生“看”与“听”物理世界。其核心是DiNA(离散原生自回归)架构,实现全模态统一、理解与生成对称、极致压缩三大特性。性能上,该模型在OmniDocBench、MathVista、C-Eval等测试中超越多款专用模型,展现出强细粒度感知、视觉推理及跨模态协同能力。美团已将LongCat-Next及dNaViT分词器开源,为AI感知真实世界提供重要工具。
人工智能
星知
最近发布
千问APP深度接入国家药监局数据,上线数百万份药品及器械权威信息
2026/05/16
xAI 发布全新CLI工具Grok Build,助力开发者编码更高效!
2026/05/16
山姆·奥尔特曼深陷利益冲突质疑:在多家 OpenAI 合作伙伴中持股超 20 亿美元
2026/05/15
腾讯 Q1 业绩超预期,AI研发投入达到 225.4 亿元
2026/05/15