Meta AI Announces New Framework for Multimodal AI Agents
📅 2026-03-05 15:00
🔖 ID: 150
📋 新闻概述
Meta AI发布新的多模态AI智能体框架,能够同时处理文本、图像、音频和视频。该框架名为"CMTA"(Cross-Modal Transformer Agents),采用了创新的跨模态注意力机制,使...
📄 原文翻译
Meta AI发布新的多模态AI智能体框架,能够同时处理文本、图像、音频和视频。该框架名为"CMTA"(Cross-Modal Transformer Agents),采用了创新的跨模态注意力机制,使AI能够在不同模态之间无缝切换和理解。测试显示,CMTA在视觉问答任务上准确率达到95%,同时保持了70%的文本生成速度优势。
🔗 查看原始文章
💡 AI点评