首页车问答问答详情

豆包视频通话来了吗?多模态感知带来AI陪伴新体验

2025-07-07 12:00 发布

近日,豆包APP上线了视频通话功能。这一升级依托于视觉推理模型和实时联网搜索能力,打造出一个“能看懂、听懂、善思考”的新一代AI交互体验。在视频通话过程中,豆包APP不仅能识别小米SU7汽车、木棉果等实物,还能根据桌面摆放习惯推测用户的MBTI性格类型,并基于视觉感知的内容进行AI创作。这看似简单的识别和回答过程,实际上蕴含着对周遭环境的理解和基于视觉理解内容的进一步联想和创作。与“识图”功能相比,视频聊天过程中的AI工具属性被淡化,更像一个具备人类Agent属性的存在,为AI端侧应用打开了全新的想象空间。

多模态的视听交互大模型是AI交互的基础。视觉情感感知通过面部识别算法(如检测微表情、眼神方向)来判断用户的情绪状态(高兴、困惑、疲惫);听觉情感感知则利用语音情感识别技术(分析语调、语速、关键词)识别用户的情感状态(焦虑、兴奋、低落)。多模态大模型的优势在于“视频画面 + 语音语调 + 环境数据”的融合分析。例如,当用户远程办公时抱怨“项目压力不大”,但视频画面中的凌乱桌面、疲惫神态与颤抖语音被系统综合判定为“高压状态”,从而识别出用户的真实情绪,并推送冥想音乐或时间管理建议,成为有温度的陪伴者。

近年来,国内的陪伴需求旺盛,催生了千亿级市场。单身经济的崛起、老龄化加剧以及育儿压力的攀升,都在推动情感陪伴的需求增长。单身人口预计到2025年将达到2.8亿,独居青年对情感陪伴的需求从“娱乐消遣”转向“深度互动”。同时,60岁以上人口占比突破20%,空巢老人对健康监测、心理慰藉的智能化需求迫切。此外,双职工家庭占比超过70%,父母对儿童陪伴机器人的教育辅助和安全监护功能需求旺盛。本轮AI技术浪潮有望探索新的情感陪伴边界,创新个性化交互内容,提升陪伴体验。

海内外AI公司正积极布局“AI陪伴”赛道。OpenAI以65亿美元收购苹果前设计总监Jony Ive的io公司,计划2026年推出首款“AI伴侣”,目标出货量为1亿台。该设备将集成多模态传感器(视觉摄像头、阵列麦克风、环境光传感器),通过实时情感分析实现“对话如朋友、陪伴似家人”的体验。此外,四川具身人形机器人科技有限公司计划在2025年底发布情感机器人产品“爱湫EMO1”,搭载自研情感认知系统,通过微表情识别、语境分析和触觉反馈实现拟人化交互。

小米SU7

随着多模态技术的深化落地,AI正从单纯的生产力工具蜕变为兼具情感连接与生活赋能的智能伙伴。科创人工智能ETF华夏(589010)紧密跟踪科创人工智能指数,精选AI核心资产,为投资者提供低门槛、高弹性的AI投资机会。投资于此类产品可以帮助投资者把握行业爆发式增长潜力,一键布局中国AI产业。

相关车系

小米汽车小米SU7
4.52
小米SU7
最低售价:21.59万

精彩栏目

限时优惠

查看更多