首页 热门资讯文章正文

非凡大赏:AI视觉|三大竞速赛,实时、高清、可商用

热门资讯 2025年08月08日 00:51 1 admin

欢迎收听现场对话原文

7月18日,非凡资本以“应用无界,智创全球”为主题,在深圳益田威斯汀酒店主办「2025年度生成式AI全球化高峰论坛暨Go Global AI 100年度评选」圆满落幕。全天议程自上午9点至晚上18点,线上同步直播。内容以主旨演讲、巅峰对话和趋势圆桌为主,现场颁发“2025 Go Global AI 100”,并同步进行AI应用全球化发展论坛和AI硬件全球化发展论坛。其中AI应用全球化发展论坛由非凡产研承办,AI硬件全球化发展论坛由火星加速器承办,超过2000名来自全球的参与者、800家AI企业、400位创始人齐聚一堂。

在《AI视觉|三大竞速赛,实时、高清、可商用》圆桌会议上,主持人是非凡资本合伙人赵亮,嘉宾有Polyverse 创始人&CEO 郭炫 (Steven)、海艺互娱 CEO 马飞、橙果视界创始人&CEO 刘昆 (Leo)、JoggAI CEO 徐安邦、无问芯穹首席解决方案架构师刘川林。他们围绕“出海、产品、基础设施、交付价值”这几个关键词,带来了一次多维度交锋。

非凡大赏:AI视觉|三大竞速赛,实时、高清、可商用

01|从爆款出海到可持续增长:技术没有秘密,只有执行窗口

2024年5月,Polyverse的移动端应用AI Mirror和海艺互娱的Web端创作社区双双入选a16z发布的全球AI应用Top 20榜单,成为为数不多的中国出海代表。

他们的观点颇有共鸣:技术当然重要,但差异化和价值交付才构成真正的“时间窗口”。

Polyverse CEO郭炫认为,技术依旧是护城河,但真正拉开差距的是“价值密度”——即一个产品能为用户节省多少时间、金钱和精力。例如,一套价值2000美金的家居摄影服务,在AI Mirror平台上用5美金解决,价值就自然显现。

海艺互娱CEO马飞则进一步指出:在AI时代的“产品驱动阶段”,壁垒从不是不可撼动的护城河,而是你能为用户争取多少“缓冲时间”。靠的是极致效率——在正确的问题上,比对手更快跑完更长的路;同时,还要构建起人与人之间的连接,形成社区结构,才能实现更具粘性的增长。

一句话总结:“壁垒”不再是你能搭多厚的城墙,而是你能为用户抢下多少“注意力时差”。

02|交付力是新王道:从“做工具”到“做结果”的转型逻辑

to B创业者的判断更为现实。橙果视界CEO刘昆提出:AI视觉不是“做工具”的战争,而是“做结果”的比赛——交付才是壁垒,结果才是产品。

他分享了一个关键指标的转变:“我们发现客户不是为你用了AI这件事买单,而是为‘我用了你之后多卖了几个产品’这件事买单。”于是,他们提出了图像按效果收费的新模式——普通图片几毛钱,能用来做营销并商用授权的图片定价100元。这背后不是模型能力有多强,而是“最后一公里”服务能力是否到位。

但这并不意味着to B就要堆人力、打磨PPT。刘昆强调,他们已跑通一套“人+AI+中台”的协同交付机制,1–2个关键人员可以支撑多个企业客户的完整营销链路。这种组织上的“轻量化高交付”,是AI to B走向规模化的关键路径。

JoggAI CEO徐安邦也持相似观点:占领用户心智和极致产品迭代能力,是抢占市场的唯二抓手。他们快速推出的AI播客数字人产品,正是洞察到新模型对“拟人表现力”大幅提升的变化,并第一个落地,让获客成本显著下降。

03|基础设施的再分配:推理即服务的爆发正在加速

在AI视觉产品大规模部署背后,是一场隐形却关键的资源变革——推理资源分配方式的再定义。

无问芯穹首席架构师刘川林指出,2023年是“百模大战”,训练层面资源内卷严重。但2024年后,训练资源迅速向头部集中,99%的创业团队转而基于开源模型做SFT和微调。

这使得“推理”成为真正的刚需爆发点。

他观察到,许多原本传统互联网行业(如教育、招聘)转向AI后,其整体IT成本中推理算力的占比,正在从2–3%迅速上升到50%以上。而AI原生公司中,几乎90%都在做出海,因为他们更急迫需要找到能打平模型成本的市场验证路径。

这一趋势的背后,是AI从“技术成本中心”向“收入创造引擎”的角色转变。

04|视觉AI三大竞速赛:实时、高清、可商用

如果我们从讨论中提炼出视觉AI当前最关键的产品力方向,无非三件事:

实时性(Real-time:C端用户希望在3秒内生成爽感内容,B端用户希望素材交付周期缩短到分钟级。视频短剧、播客对话、AI主播,都要求AI生成能在交互中“不卡壳”。

高清度(HD Fidelity):尤其是在电商、营销等高要求场景中,AI生成内容要高度保真,商品纹理、logo不能变形。否则“生成得越多、审片成本越高”。

可商用性(Commercial-Ready):不仅仅是授权问题,更是结果能否落地的问题。从AI捏脸做IP形象,到用AI剪辑做投放视频,只有在业务指标上跑出闭环,客户才会真正愿意为“结果”买单。

而这三场竞速赛,不是模型之争,而是“模型+工程+业务理解力”的综合比拼。

05|产品交互的两类进化路径:不是所有人都适合聊天框

一个值得深思的观点来自Polyverse CEO郭炫:现在的AI产品往往都被默认做成chatbot,但这其实只适用于知道自己要什么的“搜索型用户”。

而另一类用户更像在“逛商场”——带着情绪、灵感和碎片时间来浏览。这类人更适合“推荐式界面、即时生成、沉浸体验”的交互方式。这也是为何AI Mirror更偏向“feed流+轻编辑”的方式,而非chatbot。

“AI是工具,但交互是体验。”产品设计的成功,或许比技术模型更能决定一个应用是否跑得长远。

06|海外更像AI的试验田,而非终点

从这场圆桌的所有讨论看,一个共识隐隐成形:海外用户的AI接受度、付费习惯、生态成熟度,的确显著高于国内。

无问芯穹提到,他们服务的AI应用公司中有90%都是出海业务为主。

Polyverse则更明确表态:海外的产品形态、用户行为、合规逻辑,他们已经较为熟悉,因此选择在海外先打穿模型和产品路径,未来再反哺国内市场。

这不是回避,而是一种顺势而为的产品战略——先去到“更容易被验证”的市场跑模型,再回到“更复杂但更大”的市场开拓生态。

如果说2023年是“模型演示年”,那么现在视觉AI赛道真正开始比拼“系统能力”——谁能让产品闭环更完整、交付路径更短、客户收益更显性。

在AI视觉的下半场,拼的不再是“生成得多不多”,而是“生成得值不值”。

技术快速趋同的当下,唯有“持续创造真实商业价值”的团队,才能在这场视觉智能竞速中,真正跑到最后。

07|对话原文

赵亮:向大家介绍一下咱们这场panel的嘉宾。首先两位是在海外非常爆火的AI to C产品应用的创始人:一位是Polyverse的Steven,他们的产品是AI mirror;另外一位是海艺互娱的CEO马飞。另外两家是在出海to B服务场景中表现非常出色的公司:一个是Photo G的Leo,另外一家是JoggAI的徐总。第五位嘉宾是咱们大模型基础设施的服务商,无问芯穹的刘总。欢迎各位嘉宾。首先请各位花一分钟时间,简单做一个自我介绍。咱们就先从Steven开始。

郭炫:大家好,我是郭炫,我们公司叫Polyverse,成立于2023年。我们早期在海外推出了一款AI图像生成的APP产品,叫AI mirror,目前是a16z全球top 20的移动端应用。我们主要打的是一些移动端的娱乐化图像和视频类场景,给用户提供有趣的AI生成内容,同时也孵化了创作者,他们也持续通过AI mirror去创作非常多有意思的生态内容。

马飞:大家好,我是海艺互娱的CEO马飞。海艺是一款AI多模态的创作社区。我们是在2023年3月份创立了海艺AI,今天在全球范围内连接了超过6500万的用户。我们的目标也非常的简单,就是想做一个AI的多模态社区,希望能连接全球更多的用户,给他们带来灵感创意,帮助他们以更低门槛的方式,把头脑里的想法变成生动的视觉内容。

刘昆:Hello大家好,我是橙果视界的founder CEO刘昆 Leo。我们2022年底就开始在开源社区中有一些比较活跃的参与。目前我们核心的产品叫Photo G,也在海外上线,有着一定的高粘性用户。我们专注在社交媒体的内容营销层面,致力于解决从社媒洞察到内容策略、生成、自动投放的全链路智能体。目前也服务了像国内及国际上一些头部的集团和品牌方。我们希望能够成为一家面向未来十年的AI agency或者AI广告公司。

徐安邦:大家好,我叫徐安邦,来自于JoggAI。我们主要做的是AIGC的数字人。我们大概上线一年的时间,已经服务全球几十万的内容创作者以及中小企业客户。我们主要想帮助这些客户用AI来生产营销视频,包括一些创意的视频。

刘川林:大家好,我叫刘传林,来自于无问芯穹。我们公司是由清华电子系推动成立的一家AI infra公司,提供从最底层的算力基础设施到上层的模型调用。我们希望通过技术和工程化手段,最终让算力做成更普惠的基础设施,让AGI触手可及。目前我们服务了包括国内主流的大模型公司、互联网应用公司,包括在场的刘总其实也是我们的客户。

赵亮:我问的第一个问题,咱们在座有两家同时入围今年5月份a16z榜单的企业,Polyverse入选了APP端的top 20,海艺的SeaartAI入选了web端的top 20。硅谷现在都在说AI产品创业,技术是没有秘密可言的,执行效率才是最关键的。作为两家明星的to C公司,你们是怎么看待护城河这个问题的?

郭炫:关于护城河这个问题,首先从我们的角度来看,我们认为技术还是有护城河的,可能跟一些主流观点不太一致。因为技术本身带来一个很强的时间差,在AI时代,如果你有技术的领先,规模扩张和用户积累的速度是之前难以想象的。这个领先的身位有可能是很难超越的。

其次,我们认为在AI时代,真正能够让你的壁垒或者差异化拉开的,很重要的一点是在于你给用户交付的价值。我们一直在思考,我们的产品最终给用户交付的内容是什么?在他们的场景里面究竟解决了什么问题?他们原先需要用多大的成本?例如,有些用户在我们平台生成家居照片,其实很难想象他们原先请一个专业摄影师去拍一套完整的家居图片是需要2000美金的。我们把可能原先2000刀的一个事情变成10刀或者是5刀就能解决掉,很自然地就有很多用户来用你的产品。

所以回过头来看,我认为现在谈AI壁垒这个事情还是有点太早了,但是谈差异化是一个合适的时间。而你跟竞争对手能够拉开差异化的部分,我认为是能够足够深入地洞察到实际场景,你生成的东西交付给用户,实际上产生了多大的价值。

赵亮:所以Steven的观点是技术还是有壁垒的,关于产品方面可能差异化更重要一些。我们接下来听听海艺的飞哥怎么看待这个问题。

马飞:其实在聊壁垒之前,我想先做一个定位。在我们看来,每一个技术浪潮会分为三个阶段:技术驱动、产品驱动、营销驱动。今天这个时代,它仍然是处于中间这个“产品驱动”的状态,当然底层的大模型还在持续迭代。

在这个时代怎么去构建壁垒?在我看来没有绝对的壁垒,所有的壁垒就是时间。就是你做的这个东西在别人进攻你的时候,你能拥有多少缓冲的时间。对于产品驱动这个阶段来说,最重要的是要去找到正确的问题,然后让你的组织有非常高的效率,快速去解决这个问题。它的核心是在最大公约数下面去抢占用户的心智,因为抢占用户心智是一个极其重要的东西。人是一个“喜新不厌旧”的人,他喜欢新的东西,但是最好这个新的东西能和他的旧东西有一定的连接。

在这个基础之上更好的一种方式是,你的平台能不能帮助社区里面的用户建立彼此的连接?我觉得整个人类结构上面最稳固的关系应该是夫妻关系,它本质上是建立了情感的连接和经济基础的连接。所以本质上,通过人与人的连接以及抢占心智,就有可能去做一个不是绝对的壁垒,但可能能抵御一段时间进攻的时间窗口。

赵亮:接下来可能问两位咱们to B服务的创始人是怎么看待技术壁垒这个问题的。因为坦白说,最近AI出海营销这个赛道应该说越来越拥挤,我们看到非常多的创业公司涌现出来。要不先请Photo G的Leo聊一下。

刘昆:我觉得这个问题从to B的角度讲,我可能会围绕一个词叫做“交付”。这个词最近也很热,尤其在今年硅谷提出来叫做"Result as a Service",就是在AI时代应该聚焦在结果的交付。

To B我们达成一次交易,让甲方付钱,本质上就是取决于你跟你的竞争对手谁的交付更好。To C场景可能交付会相对简单,因为他付的钱很少。但是to B场景我们往往会涉及到更大的金额,那相应就要求更好的交付。

做AI产品怎么去定义它的交付是好还是坏?我们自己在构建产品的时候,我们定义的差异化就是我们始终可能比其他的同类型竞品,我交付的闭环会更多一环,或者我的交付结果会更好。比如我们很早就提出来一个收费模式,平时每一次生成只收一个可能一毛钱,但是如果这张图你满意,我给你合规授权、高清放大和永久的商用使用权,那这张图我们可能收100块。客户非常的buy-in。所以从to B的产品和业务上,交付都会是一个核心的壁垒。

赵亮:我追问一个问题,既然结果的交付这么重要,那咱们是为了实现这个交付的质量,是通过服务来实现,还是通过产品和技术本身?因为如果是通过服务,那不就变成了一个堆人的事情了吗?

刘昆:我们刚开始其实非常想追求以SaaS为交付、以产品为交付。但是我带团队跑了几个月以后发现,核心点不是因为中国老板没钱,而是因为中国的公司始终要求的那个交付闭环比国外要长很多。所以始终在中国做to B业务,你始终要有人的参与。

AI时代会不会改变这一点?我觉得可能会改变一点,但是不会改变这个终局。如果我们锚定营销这个场景,以“把产品从卖一个变成卖100个”为终局的交付来看,这个事情目前坦诚来讲,还是没有办法全部由AI来完成的。它可能是一个"human-in-the-loop"的方式,就是“人+AI+人+AI”。但是显著来说,我们目前已经基本上跑通,可能是一个或者两个这样的人,加上我们自己搭的很多个中台和产品,去形成一套新的交付环,这个能带来的颠覆是一个革命性的东西。

徐安邦:我们服务的更多是那种prosumer,那种内容创作者或者企业里的marketer。我们这种商业模式,我们认为的壁垒有两点。一点是产品的创新,第二点其实跟前面海艺的嘉宾观点一样,是占领用户的心智。

产品创新是这样,现在的技术迭代非常快,快到说有些产品如果你这一两周不上,可能过了两周上了就都没有意义了。所以产品创新的意义就是,你能够非常了解技术发展的趋势,在当下用最新的技术去找到一个最合适的场景,做出工具来服务你正确的目标人群。

第二个就是所谓的占领心智。不同公司能力不一样,有的靠PR,有的靠投放,但目标就是最终你要让大家把你想做的这个场景跟你这个品牌挂钩起来。比如我们利用最新的AIGC视频模型,做了一个AI podcast的场景,就是两个人对话。以前做数字人没办法做到表现力很好,但新的模型能让这种播客的数字人表现力很好。我们是第一家推出来,获客成本就极低,导致我们有一波非常大的增长。

赵亮:我这边有一个问题问咱们无问芯穹的刘总。现在大模型的能力越来越强大,但算力终归还是有限的。在商业化过程中,肯定也要考虑到成本。想请刘总谈一谈你对目前整个市场的感受。

刘川林:客观说,我们确实看到了算力的分布有巨大的变化。2023年最开始是“百模大战”,所有公司都在卷模型,成本和算力都集中在训练上。但是在Devin之后,大家发现模型达到了一个新的能力,一类技术水平偏低的公司直接就卷没了,所有的训练投入都集中在头部那几家。

现在无论是中型互联网还是一些小型的创业公司,他们完全不再做自己模型的预训练,通过开源模型就能解决99%的问题,核心会做的只有额外的SFT或者微调。所以从训练这件事来讲,未来的分布会变成只有头部几家还在投入,大厂可能吃掉90%的市场。

然后从推理来讲,我觉得这是一个爆发的市场。在去年可能算力是AI服务的基础设施,那再往上一层,到AI应用爆发之后,MaaS服务(模型服务)其实是所有应用的基础设施。所以我认为未来整个推理还会不断激增,但它的形式不一定会从应用方直接穿透到算力层,他可能是穿透到几个大的模型公司,然后由大的模型公司去调用底层的推理算力。

并且我还看到一个有趣的现象,之前以AI为内核的初创公司,IT成本百分之八九十都是花在大模型服务上。但是我现在接触一些传统的互联网公司,比如做教育、做招聘的,他们会发现在运作一年之后,AI带来的不仅仅是提效,而且还有他们本身APP的增速。他会发现整个推理成本,从最一开始占比2-3%,到现在可能占比超过50%,这个发展是非常快的。

赵亮:接下来我想问Polyverse和海艺,在现在这个AI产品的时代,用户端的需求有没有发生什么变化?是不是还是像过去移动互联网时代用户的使用习惯?

马飞:在我们看来,用户他其实是没有变的。我们今天在做C端的AI应用,本质上没有变,就是我们仍然需要想尽各种办法去给他们下降门槛。就像我们的视频,从40集的连续剧,到电影,再到短视频,再到今天的短剧,我们人类的耐心是在逐渐降低的。整个消费群体越来越浮躁,越来越想在3秒、5秒之内就get到爆点和爽点。所以今天要做的事情和上一个时代是一样的,就是你需要更加极致地去迎合用户。

郭炫:我非常同意飞哥刚才聊到的,就是用户是没变的,但是他们的需求在变得更加旺盛,更加极致。我想要更个性化、更快、更丰富。从我们的角度来看,有了AI的加持,以前大规模用户的心声我们是很难做科学化分析的。现在我们有机会可以把一天几万条、十几万条的用户反馈,做非常细致和系统化的分析,这是一个非常好的基础。

其二,从表现形式来看,我们认为还要区分场景。我们目前看到很多agent产品都是以聊天框的形式去交付。这种交互形式比较适合那些知道自己想要什么,而且能完整表达出来的用户。另外一类AI产品,是用户他带着逛一逛、玩一玩的心态来的,有点像逛商场。这样的一些产品,它确实就不太适合chatbot这类型,老的这种互联网形式的推荐、排列,从目前的观察来看,还是一个比较合理的产品形态。

赵亮:那么在B端这一块,最近像Google的Veo 3、MiniMax、生数,其实都在发布新的多模态模型。我想问一个问题,在B端的服务场景中,你们觉得这些新的模型的可用性到底怎么样?他是不是真正能够为客户更好地解决问题?客户愿不愿意为这件事情去买单?

刘昆:我倒着回答,客户愿不愿意为这些升级的能力买单?这个我还真不好回答。因为我们从go-to-market的第一天,就关注我能给客户带来交付结果。所以我的感受是,这些新模型确实有给我们内部的研发成本和交付成本带来显著的降低。但是客户买不买单?从我的角度看,客户始终是为我提供的结果买单,这个行为是一直存在的。

第二个,这些模型能力的升级,最近出的几个模型都是用一种更高维的能力直接降维打击上一代模型。在GPT-4o和Veo 3推出的时候更明显。所以从我们作为一个初创公司,从研发的角度上,我们可能会更关注在更具体的研发,也就是我们希望提供完整的交付。我们会在这些基础模型的基础上去看,它距离客户的交付结果还有多远,然后这一点点距离,我们会重点去把它做到位。

徐安邦:像我们的场景要分开来说,新的模型发展,你让他来做什么很重要。我们有成功的案例,也有失败的案例。比如像最新的模型,我们把它用在做AI influencer上面,就非常的成功。为什么成功呢?就是以前有很多人不想出镜,这时候他用AI捏出来的人足够真实,时长也足够长,他就愿意用它来代替他去做内容。他对AI生成的东西,也不会说每个细节都要求到位。

然后我们其实在电商方面用AI去尝试的,目前来说不算很成功。因为电商客户有一个非常重要的需求,就是商品必须保持一致性。现在整个视频大模型最大的问题就是它是创意的,不是可控的。你现在给一个商品,最后生成出来的图,只要纹理不一样,只要logo少一撇,可能客户都不满意。所以客户买不买单,取决于你怎么去包装这个大模型。

赵亮:最后一个问题,我想留给Polyverse。因为我们发现Polyverse做的AI mirror这个产品,从day one开始可能就是面向海外市场。那么Polyverse是怎么看待国内市场的,以及接下来有没有规划来做国内市场?

郭炫:我们day one是做海外的。因为原先我跟马飞哥的背景很像,我们在做AI之前是做海外游戏的,所以比较熟悉海外的一些平台、合规、发行、用户习惯、付费习惯等等。我们已经build up了海外用户的一个mindset,所以我们的优势就是做海外。

短期内,目前在海外的AI应用、生态和商业模式,确实会比国内我们观察到的会多样一些,用户的空间也会多一些。所以我们会先结合自己的优势,把海外市场做好。当我们真的是在海外做出非常不错的成绩了,我们再会把国内市场一起做考虑。对于初创公司来说,海外和国内无论从获客方式、用户使用方式、UI交互习惯以及内容审美,其实都有比较大的差异。所以实际上,专注可能是一个比较重要的事情。

赵亮:请问刘总,据你的观察,你们服务的客户,到底是国内业务量更大一些,还是海外的业务量更大一些?

刘川林:是这样,我仔细想了一下,其实我们服务的AI应用公司好像90%都是在出海。因为这类公司它跟基础模型厂商、具身智能厂商和互联网厂商都不太一样。它需要快速去在市场上验证是不是能打平,这件事对他们是至关重要的。

所以从整个应用市场来讲,从AI的普及程度,我觉得我们国家对于应用的普及度相比于海外还不够。这个不够可能不是指我们应用的功能丰富度,而是普遍的用户接受度还不够。因为我发现,在国内真正意识到AI这件事,同时把AI用得好的,其实更是一小撮顶端的人。很多泛行业的用户并没有去深刻地钻研AI这件事。但是在海外的用户,他们其实更愿意去使用一些更新鲜的东西,并且他们的整个AI应用的普及度相对比较好,同时他们付费意愿也比较强。

赵亮:明白。因为时间的关系,我们今天的panel可能就到这里了。希望各位嘉宾的分享,能够让大家感受到从不同的位面分享的一些经验,给大家能够带来一些启发。

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动