您当前位置:首页 办公软件 龙猫LongCat官方下载入口
类型:办公软件 版本:0.7.0 最新版
大小:84.0M 时间:2025-11-06



极速响应的全能AI伙伴,高效解决工作与生活难题。LongCat(中文名:龙猫)是美团自主研发的大语言模型,核心定位为“高效能、全场景适配的AI基础引擎”,凭借创新架构设计与全模态能力突破,已广泛应用于商家经营、C端生活服务等多个场景,同时以开源形式向行业开放核心能力。
B端包括餐饮等行业商家、开发者、企业技术团队;C端覆盖外卖用户、生活服务需求者、AI技术爱好者。模型能力依赖场景数据,垂直场景表现优于通用场景;开源版本需遵循MIT协议规范使用;部分应用功能(如视频通话)仍在迭代中,以官方最新更新为准。

LongCat在自我介绍中表明它由美团研发的一款人工智能语言模型。
LongCat-Flash-Omni最为突出的优势在于其具备真正的全模态能力,不仅可以联网搜索、同步处理文本、图像、音频和视频、等多种形式的信息,还能够进行实时的音视频互动。
但现阶段它仅支持文字和语音这两种输入形式,以及语音通话功能(视频通话功能目前正在筹备上线中、文件上传功能暂时仅在web端可用)。
美团LongCat1.0正式上线!
免费体验全球领先AI模型互动,更快的响应速度、更强大的功能体验,为你精准答疑解惑,轻松助力美好生活。

1、在本站下载安装本app,打开后需要同意并继续。

2、来到登录页面,输入手机号和验证码即可注册登录了。

3、进入主页可以直接开始进行对话了。

4、长按下面的按钮即可进行语音输入识别文字。

5、点击左边的键盘按钮就可以手动输入文字发送了。

6、支持语音通话的功能。

7、打开侧栏长按一条对话即可删除。

如何更新应用?
请前往App Store,点击您的头像,向下滚动找到LongCat应用,点击更新按钮。
忘记密码怎么办?
在登录页面点击"忘记密码",输入您的注册邮箱,我们将发送重置链接到您的邮箱。
如何联系客服?
您可以通过上方提供的邮箱地址联系我们的技术支持团队,我们会在24小时内回复您。
11月3日消息,美团LongCat团队今日宣布,LongCat-Flash 系列大模型再升级,正式发布全新家族成员——LongCat-Flash-Omni,并开源。
目前,新App已支持联网搜索、语音通话等功能,视频通话等功能会稍后上线;Web端则增加图片、文件上传和语音通话等功能。
iOS用户可直接在APP Store中搜索“LongCat”获取。
在此之前,LongCat仅通过官网(https://longcat.ai/)来为C端用户提供大模型的相关能力。
我们迅速下载该APP测试了一下,发现该模型最大的亮点,那就是“快”!(天下武功,唯快不破)
该模型总参数560B,激活参数仅27B,继承了LongCat-Flash系列“快”的基因,使其在保持庞大知识容量的同时,实现了极高的推理效率。
我们发现,从输入指令到生成token的时间间隔非常短暂,整个过程相当丝滑,小编感觉比豆包通义及微信元宝的反应速度都更快一些。

据悉,在当前主流旗舰模型的性能标准和参数规模下,这是首个能够实现全模态实时交互的开源模型,它能同时处理文本、图像、音频、视频,而且还能实时进行音视频交互。
据官方介绍,LongCat-Flash-Omni以LongCat-Flash系列的高效架构设计为基础(Shortcut-Connected MoE,含零计算专家),集成了高效多模态感知模块与语音重建模块,在总参数 5600 亿(激活参数 270 亿)的庞大参数规模下,仍实现低延迟的实时音视频交互能力,为开发者的多模态应用场景提供了更高效的技术选择。
美团采用了 Shortcut-connected MoE 架构,配合零计算专家(zero-computation experts)设计,就像高速公路上的ETC通道,让信息处理更高效,避免了“堵车”。

更重要的是,美团还提出了早期融合训练范式(Early-Fusion Training),能确保模型在获得多模态能力的同时,不会在单一模态上“偏科”。
并不是先语言训练,然后再后加上视觉或音频能力。这就像培养全能运动员,不能因为练游泳就忘了跑步,每天都要一起练,而不是先练两年游泳,然后再去学跑步。
这样的一体化架构,让这只“龙猫”实现了完全端到端的设计:视觉与音频编码器作为多模态感知器,LLM 直接处理输入并生成文本与语音 token,再通过轻量级音频解码器重建为自然语音波形。
此外,打开LongCat APP,从首页可以看到,它目前支持文字/语音两种输入方式,并能进行语音通话(视频通话功能正在跑步入场中),Web端还支持上传图片和文件。
在综合性的全模态基准测试(如Omni-Bench, WorldSense)上,超越Qwen3-Omni、Gemini-2.5-Flash,这款模型直接达到了开源SOTA水准(开源最先进水平),而且能和闭源的Gemini-2.5-Pro相媲美。 即使单拉出来文本、图像、音频、视频等各项模态能力,它也依旧能打(单项能力均位居开源模型前列),真正实现了“全模态不降智”。
文本:LongCat-Flash-Omni 延续了该系列卓越的文本基础能力,且在多领域均呈现领先性能。相较于 LongCat-Flash 系列早期版本,该模型不仅未出现文本能力的衰减,反而在部分领域实现了性能提升。这一结果不仅印证了该团队训练策略的有效性,更凸显出全模态模型训练中不同模态间的潜在协同价值。
图像理解:LongCat-Flash-Omni 的性能(RealWorldQA 74.8分)与闭源全模态模型 Gemini-2.5-Pro 相当,且优于开源模型 Qwen3-Omni;多图像任务优势尤为显著,核心得益于高质量交织图文、多图像及视频数据集上的训练成果。
音频能力:从自动语音识别(ASR)、文本到语音(TTS)、语音续写维度进行评估,Instruct Model 层面表现突出:ASR 在 LibriSpeech、AISHELL-1 等数据集上优于 Gemini-2.5-Pro;语音到文本翻译(S2TT)在 CoVost2 表现强劲;音频理解在 TUT2017、Nonspeech7k 等任务达当前最优;音频到文本对话在 OpenAudioBench、VoiceBench 表现优异,实时音视频交互评分接近闭源模型,类人性指标优于 GPT-4o,实现基础能力到实用交互的高效转化。
视频理解:LongCat-Flash-Omni 视频到文本任务性能达当前最优,短视频理解大幅优于现有参评模型,长视频理解比肩 Gemini-2.5-Pro 与 Qwen3-VL,这得益于动态帧采样、分层令牌聚合的视频处理策略,及高效骨干网络对长上下文的支持。
跨模态理解:性能优于 Gemini-2.5-Flash(非思考模式),比肩 Gemini-2.5-Pro(非思考模式);尤其在真实世界音视频理解WorldSense 基准测试上,相较其他开源全模态模型展现出显著的性能优势,印证其高效的多模态融合能力,是当前综合能力领先的开源全模态模型。
端到端交互:由于目前行业内尚未有成熟的实时多模态交互评估体系,LongCat团队构建了一套专属的端到端评测方案,该方案由定量用户评分(250 名用户评分)与定性专家分析(10 名专家,200 个对话样本)组成。

定量结果显示:围绕端到端交互的自然度与流畅度,LongCat-Flash-Omni 在开源模型中展现出显著优势 —— 其评分比当前最优开源模型 Qwen3-Omni 高出 0.56 分;定性结果显示:LongCat-Flash-Omni 在副语言理解、相关性与记忆能力三个维度与顶级模型持平,但是在实时性、类人性与准确性三个维度仍存在差距,也将在未来工作中进一步优化。
美团这款新发布模型也引发了外国网友的热议。其中有网友表示:“这家中国外卖公司可是大有来路,年营收高达数百亿美元,员工人数也超过 Meta,是那种可以把前沿模型开发当成副业来搞的巨头公司。”甚至点名扎克伯格:快来学着抄作业。


1.高效能计算:通过算力按需分配机制,在H800硬件上实现每秒超100词元的推理速度,处理100万输出词元成本仅0.7美元(约5元人民币),大幅低于行业同等规模模型,30天即可完成高效训练。
2.全模态能力突破:最新版本LongCat-Flash-Omni支持128K上下文窗口及超8分钟音视频交互,采用“分块式音视频特征交织机制”,图像理解性能对标闭源模型Gemini-2.5-Pro,短视频理解超越同类开源模型,长视频处理能力达到行业领先水平。
3.综合性能优异:在多项权威基准测试中表现突出——ArenaHard-V2对话推理得分为86.5,位列同类模型第二;IFEval、COLLIE等指令遵循基准测试中排名第一;智能体工具使用基准τ2-Bench、复杂场景基准VitaBench均展现顶级竞争力,编程能力在TerminalBench中位列第二。
1.商家经营智能助手(B端):驱动“袋鼠参谋”应用,整合美团数百万商家数据、亿级消费行为及十年本地经营经验,为餐饮等行业商家提供全链路经营解决方案,核心功能包括:
-赛道分析:提供竞品密度、人流趋势、菜品定价区间及前期投入成本核算(如北京写字楼盖浇饭快餐店最低50万启动资金测算);
-开店选址:结合租金与客群平衡,推荐精准区域(如上海精品咖啡店优先选择非核心CBD的园区商圈);
-菜品研发与运营:基于季节趋势、消费偏好推荐新品,提供消费者洞察与运营策略;
-操作便捷:支持自然语言对话交互,预设行业标签与引导问题,降低中小商家使用门槛。
2.C端生活服务助手:赋能“小美”AI生活秘书产品,定位为轻量化生活服务工具,核心功能包括智能外卖点单(自动填写位置、推荐菜品)、生活需求解答等,解决用户“选择困难症”,提升生活服务效率。
3.编程与开发者工具:集成于AI编程智能体NoCode,支持代码生成、终端命令行任务处理,在SWE-Bench-Verified基准测试中得分为60.4,具备辅助软件开发的实用能力。
1.场景深度绑定:区别于通用大模型,紧密结合美团本地生活生态,在餐饮经营、外卖服务等垂直场景中,通过数据闭环实现“数据+场景+专家”的一体化解决方案,实用性更强。
2.开源开放赋能:以MIT协议开源核心模型,允许企业、开发者二次开发,推动行业技术迭代,同时官方提供官网体验入口(https://longcat.ai/),降低普通用户体验门槛。
3.效率与成本平衡:通过创新架构设计,在大参数量保障性能的同时,实现低延迟、低成本运行,既满足企业级复杂场景需求,也适配轻量化应用部署。
修复了一些问题
支持( 0 ) 盖楼(回复)