“肯定是有这个bigdream的”,在回答通义千问有没有破圈想法时,阿里云相关人士向北京商报记者直言,“敬请期待”。3月19日,阿里大模型产品“通义听悟”上线多项新功能,包括音视频问答助手“小悟”、支持一键AI改写等。从阿里内部使用到全网发布,通义听悟相比通义家族的其他应用,上线更早,也更高调。目前,通义听悟暂无toC收费的计划,未来通义听悟会嵌入通义千问App。对于这一系列计划,坊间见仁见智,有人说阿里擅长toB,这符合整个集团的风格,有人说这是技术能力不足的体现。不论原因,破圈都是大模型应用PK的关键。
不对用户收费
关键信息直接“问”出来,一键将口语转为书面表达……3月19日,通义听悟上线了6种新功能。以音视频问答助手“小悟”为例,通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,可实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。
北京商报记者登录通义听悟网站发现,首页右上方已出现“小悟”的动态图标,用户点击该图标即可与“小悟”互动,当记者提出概括当日录音的要求,“小悟”将录音进行了总结,并附上了引用的录音名称以及引用的时间点。
整体上看,通义听悟则保持了原有的产品设置,首页突出三个功能:开启实时记录、上传音视频、播客链接转写。这和年6月通义听悟启动公测时的定位一致,“瞄准具有高知识附加值的音视频内容场景,比如开会、上课、访谈、培训、面试、直播、看视频、听播客等”,阿里云CTO周婧云当时介绍。
上线以来,toC(用户)不收费的特点也被保留下来。对此,通义听悟产品负责人杨帆分享了这样一个故事,“商业模式的问题,每天用户都在跟我反馈,有的用户甚至问‘我能不能付费’,看到这些反馈我内心很感动。不过目前我们没有任何对C端收费的计划,C端的应用承载的使命,更多是向所有用户展现阿里技术的研究方向。通过API(应用程序编程接口)的方式在B(企业)端实现商业化,是我们的产品策略”。
第三方观察者对toC不收费有着自己的看法。“如果一款应用的技术水平较免费的产品或竞品没有质的提升,就不足以向用户收费,只能向B端收费。因为B端有打包捆绑销售、长期合作等模式。有市场地位就能强买强卖,这实际上是技术能力不足的情况下的一种销售方式”,文渊智库创始人王超告诉北京商报记者。
集成到“通义千问”App
一般来说,语音转写类产品采用会员制的付费模式。如用户使用通义听悟,可以通过登录、分享等方式获取转写时长。
3月19日,面对细分用户的计划浮出水面。当日通义听悟正式推出“高校公益计划”,所有中国内地高校师生通过后缀edu.cn的教育邮箱进行认证后,均可直接获赠小时转写时长,存储空间从20G拓展至G。
根据通义听悟用户分享的案例,用户大多通过PC使用通义听悟。