“肯定是有这个big dream的”,在回答通义千问有没有破圈想法时,阿里云相关人士向北京商报记者直言,“敬请期待”。3月19日,阿里大模型产品“通义听悟”上线多项新功能,包括音视频问答助手“小悟”、支持一键AI改写等。从阿里内部使用到全网发布,通义听悟相比通义家族的其他应用,上线更早,也更高调。目前,通义听悟暂无toC收费的计划,未来通义听悟会嵌入通义千问App。对于这一系列计划,坊间见仁见智,有人说阿里擅长toB,这符合整个集团的风格,有人说这是技术能力不足的体现。不论原因,破圈都是大模型应用PK的关键。
不对用户收费
关键信息直接“问”出来,一键将口语转为书面表达……3月19日,通义听悟上线了6种新功能。以音视频问答助手“小悟”为例,通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,可实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。
北京商报记者登录通义听悟网站发现,首页右上方已出现“小悟”的动态图标,用户点击该图标即可与“小悟”互动,当记者提出概括当日录音的要求,“小悟”将录音进行了总结,并附上了引用的录音名称以及引用的时间点。
整体上看,通义听悟则保持了原有的产品设置,首页突出三个功能:开启实时记录、上传音视频、播客链接转写。这和2023年6月通义听悟启动公测时的定位一致,“瞄准具有高知识附加值的音视频内容场景,比如开会、上课、访谈、培训、面试、直播、看视频、听播客等”,阿里云CTO周婧云当时介绍。
上线以来,toC(用户)不收费的特点也被保留下来。对此,通义听悟产品负责人杨帆分享了这样一个故事,“商业模式的问题,每天用户都在跟我反馈,有的用户甚至问‘我能不能付费’,看到这些反馈我内心很感动。不过目前我们没有任何对C端收费的计划,C端的应用承载的使命,更多是向所有用户展现阿里技术的研究方向。通过API(应用程序编程接口)的方式在B(企业)端实现商业化,是我们的产品策略”。
第三方观察者对toC不收费有着自己的看法。“如果一款应用的技术水平较免费的产品或竞品没有质的提升,就不足以向用户收费,只能向B端收费。因为B端有打包捆绑销售、长期合作等模式。有市场地位就能强买强卖,这实际上是技术能力不足的情况下的一种销售方式”,文渊智库创始人王超告诉北京商报记者。
集成到“通义千问”App
一般来说,语音转写类产品采用会员制的付费模式。如用户使用通义听悟,可以通过登录、分享等方式获取转写时长。
3月19日,面对细分用户的计划浮出水面。当日通义听悟正式推出“高校公益计划”,所有中国内地高校师生通过后缀edu.cn的教育邮箱进行认证后,均可直接获赠500小时转写时长,存储空间从20G拓展至200G。
根据通义听悟用户分享的案例,用户大多通过PC使用通义听悟。官网信息显示,通义听悟支持Chrome、Edge浏览器插件、钉钉、微信小程序。
在回答会否上线App版本时,通义听悟工程研发负责人邢君告诉北京商报记者,“听悟App是我们想做的,当前也有这个计划,第一期会在通义千问的App里面集成听悟的功能,很快会看到”。
通过一个时间轴可以更好地了解通义家族的发展历程。2023年4月,阿里云上线大模型产品通义千问,并邀请用户内测。6月聚焦音视频内容的通义听悟上线,7月AI绘画创作大模型通义万相开启定向邀测。
基于通义千问和通义万相,通义家族目前的8个行业模型包括:智能编码助手通义灵码、AI阅读助手通义智文、工作学习AI助手通义听悟、个性化角色创作平台通义星尘、智能投研助手通义点金、智能客服通义晓蜜、个人专属健康助手通义仁心、AI法律顾问通义法睿。2023年9月,通义千问通过备案正式向公众开放,次月通义千问苹果版App上线。
有破圈梦想
2023年ChatGPT大火时上线,又经历了百模大战,在PK大模型应用的当下,通义家族以及通义千问有无破圈的责任?阿里云智能公众与客户沟通部总监朱迅垚向北京商报记者表示,“通义千问肯定是有这个big dream的。在视觉领域、开源大模型领域,通义千问已经有比较破圈的事件。听悟是我们非常重要的拳头产品,破圈最好,但主要还是服务好专业人群和学生人群”。
回到通义听悟,杨帆向北京商报记者透露了最新数据,目前通义听悟用户注册数约500万,活跃用户日均转写音视频3次以上,平台每天处理字符数约20亿字。对于通义听悟团队而言,“我们内部更关心真实用户的使用”,杨帆解释,“目前大部分AI产品还是工具型,听悟是典型的低频刚需产品,不可能像微信一样,是每天用户使用频率非常高的App,我们更关注它的使用量”。
集成到通义千问,用通义千问来破圈,这在王超看来,“独立了就要独立赚钱,吃大锅饭更适合当下的阿里云。阿里云目前还是国内第一大云计算厂商,它的某个产品集成通义千问后,如果toB价格不变,那企业的感知是成本摊薄了。但在阿里云内部结算时,通义家族是有收入的”。
在和北京商报记者交流时,深度科技研究院院长张孝荣表示,“阿里云大模型应用既toC又toB,我认为它更适合toB”。
北京商报记者 魏蔚
3月19日,阿里大模型产品“通义听悟”上线多项新功能,包括音视频问答助手“小悟”、支持一键AI改写等。从阿里内部使用到全网发布,通义听悟相比通义家族的其他应用,上线更早,也更高调。目...[详细]
3月19日,根据虎牙发布的最新财报,2023年四季度虎牙营收15.3亿元,同比下降27.8%,2023年全年营收70亿元,较2022年减少24.5%,在非美国通用会计准则下,虎牙虽在2023年扭亏,但四季度未能延...[详细]
3月19日晚,中泰化学发布公告称,公司于近日收到中国证监会下发的立案告知书,因涉嫌信息披露违法违规,中国证监会决定对公司立案。中泰化学表示,公司将积极配合中国证监会的相关调查工作,...[详细]