本集简介
双语字幕
仅展示文本字幕,不包含中文音频;想边听边看,请使用 Bayt 播客 App。
哈喽,大家好,欢迎收听硅谷101,我是红军。
哈喽,大家好,欢迎收听硅谷101,我是红军。
随着 ai agent 越来越智能,未来会不会出现一人公司?
随着 ai agent 越来越智能,未来会不会出现一人公司?
想象一下,当你要开一家线下的礼品店。
想象一下,当你要开一家线下的礼品店。
那 agent 里面有一个专家团,可以帮你去做选品、运营、打跨越语种的电话、管理供应链,一个人就可以面向全球做生意。
那 agent 里面有一个专家团,可以帮你去做选品、运营、打跨越语种的电话、管理供应链,一个人就可以面向全球做生意。
今天我请来了阿里巴巴国际业务部的总裁张阔,他从一个大厂核心业务的决策逻辑来分析一下,他是怎么样把阿里26年的经验做成了一款B2B的AI工具,叫AXIO。
今天我请来了阿里巴巴国际业务部的总裁张阔,他从一个大厂核心业务的决策逻辑来分析一下,他是怎么样把阿里26年的经验做成了一款B2B的AI工具,叫AXIO。
目前呢,已经拥有1000万的月活用户,全球B2B业务的交易额高达30万亿美元,但是数字化的渗透率还有很大的空间。
目前呢,已经拥有1000万的月活用户,全球B2B业务的交易额高达30万亿美元,但是数字化的渗透率还有很大的空间。
大家都知,跨境B2B业务是阿里巴巴的商业原点。
大家都知,跨境B2B业务是阿里巴巴的商业原点。
那AI能不能撬动那个互联网都没有办法改变的庞大的存量市场,成为一个新的增长点呢?
那AI能不能撬动那个互联网都没有办法改变的庞大的存量市场,成为一个新的增长点呢?
这既是一个AI如何去重塑B2B贸易的典型案例,也是在OPEN CLOUD、CLOUD CO WORK这些新技术引发剧烈变动的周期中,一个掌舵人的决策逻辑。
这既是一个AI如何去重塑B2B贸易的典型案例,也是在OPEN CLOUD、CLOUD CO WORK这些新技术引发剧烈变动的周期中,一个掌舵人的决策逻辑。
那张阔也提出了一个非常有意思的判断,面对新模型,你的公司是兴奋、焦虑还是毫无感觉?
那张阔也提出了一个非常有意思的判断,面对新模型,你的公司是兴奋、焦虑还是毫无感觉?
最后一种才是最危险的。
最后一种才是最危险的。
下面就请收听我与张阔的对话。
下面就请收听我与张阔的对话。
哈喽,阔你好。
哈喽,阔你好。
你好。
你好。
最近我知道 GTC 期间您也在硅谷啊,要不要聊一下您在硅谷最近的一些感受?
最近我知道 GTC 期间您也在硅谷啊,要不要聊一下您在硅谷最近的一些感受?
因为其实现在大家有一个问题,就是觉得国内会有一点点信息焦虑,但是同时呢,大家又觉得国内的信息还是挺快的。
因为其实现在大家有一个问题,就是觉得国内会有一点点信息焦虑,但是同时呢,大家又觉得国内的信息还是挺快的。
您觉得你来了硅谷以后,硅谷跟国内 AI 的发展给你的体感上会有什么不一样?
您觉得你来了硅谷以后,硅谷跟国内 AI 的发展给你的体感上会有什么不一样?
我觉得从硅谷跟国内比,可能投资人的生态啊,和他整个创业者的生态,还是有比较大的差别的。
我觉得从硅谷跟国内比,可能投资人的生态啊,和他整个创业者的生态,还是有比较大的差别的。
我自己可能跟创业者和我们自己的最终用户,跟他们聊的比较多。
我自己可能跟创业者和我们自己的最终用户,跟他们聊的比较多。
我觉得这可能也分两个层面。
我觉得这可能也分两个层面。
一个呢,就是创业者生态,它的多元化,我觉得可能看到的更多一点。
一个呢,就是创业者生态,它的多元化,我觉得可能看到的更多一点。
就比如说在美国,我们除了说现在所有的创业可能都跟 ai 有关以外。
就比如说在美国,我们除了说现在所有的创业可能都跟 ai 有关以外。
ai 相关的产品的支撑,就是 ai 底层的这些基础设施,其实大家也投入非常多的内容,然后呢也有非常多的分层的生态位里边的角色出现吧。
ai 相关的产品的支撑,就是 ai 底层的这些基础设施,其实大家也投入非常多的内容,然后呢也有非常多的分层的生态位里边的角色出现吧。
你比如说像。
你比如说像。
什么TOGETHER AI FIREWORKS啊,这已经规模比较大了。
什么TOGETHER AI FIREWORKS啊,这已经规模比较大了。
它的存在就是要帮助上面这些应用更容易地获取模型,更低成本地去做INFERENCE啊等等。
它的存在就是要帮助上面这些应用更容易地获取模型,更低成本地去做INFERENCE啊等等。
再往上层面的就是做各种各样的,比如说去ENABLE AI的产品的一些小的构建基础设施,你比如说做语音到文字啊等等。
再往上层面的就是做各种各样的,比如说去ENABLE AI的产品的一些小的构建基础设施,你比如说做语音到文字啊等等。
就是你感觉好像是大模型前面会去做这些方向,但是就是有非常多的小公司。
就是你感觉好像是大模型前面会去做这些方向,但是就是有非常多的小公司。
在某一些垂直领域里边,能做的别人快一步。
在某一些垂直领域里边,能做的别人快一步。
就是永远你感觉在推土机前面几十米在跑,但是它一直能保持一定的身位,并且也能在这个大的环境里面有一定的生态位。
就是永远你感觉在推土机前面几十米在跑,但是它一直能保持一定的身位,并且也能在这个大的环境里面有一定的生态位。
很多的企业就愿意用这些中小企业提供的这些某一个角度的技术领先的产品。
很多的企业就愿意用这些中小企业提供的这些某一个角度的技术领先的产品。
我们也跟很多这种公司在合作,比如它的语音转文字,其实就是转得非常好,无论是时效啊还是准确性啊等等,它自己也是一个独立生态。
我们也跟很多这种公司在合作,比如它的语音转文字,其实就是转得非常好,无论是时效啊还是准确性啊等等,它自己也是一个独立生态。
有哪些软件?
有哪些软件?
比如我们合作的有个叫WHISPER FLOW.
比如我们合作的有个叫WHISPER FLOW.
哦,WHISPER FLOW这个很好。
哦,WHISPER FLOW这个很好。
对,就是呢,这跟我们XU和阿里巴巴COM又合作,因为我们现在也是多模态的输入的内容的QUERY的增速可能是百分之百吧。
对,就是呢,这跟我们XU和阿里巴巴COM又合作,因为我们现在也是多模态的输入的内容的QUERY的增速可能是百分之百吧。
更多的人愿意一段语音、拍张照片、发个视频上来,然后找到相关的商品。
更多的人愿意一段语音、拍张照片、发个视频上来,然后找到相关的商品。
就是我们要在这个方面要把体验打磨到最好嘛,所以也要跟最好的硅谷公司做合作。
就是我们要在这个方面要把体验打磨到最好嘛,所以也要跟最好的硅谷公司做合作。
然后第三类的就是垂直应用象限的了。
然后第三类的就是垂直应用象限的了。
现在硅谷有一些讨论说AI上来之后对SaaS等等可能有影响,那我觉得呢?
现在硅谷有一些讨论说AI上来之后对SaaS等等可能有影响,那我觉得呢?
这个可能也分两边看。
这个可能也分两边看。
对于SaaS这种商业模式,无疑基于TOKEN BASE、基于使用的这种计量方式,对原来的比如基于坐席这种计量方式比起来,可能还是一个更优的一个下一代的商业模型的基础吧。
对于SaaS这种商业模式,无疑基于TOKEN BASE、基于使用的这种计量方式,对原来的比如基于坐席这种计量方式比起来,可能还是一个更优的一个下一代的商业模型的基础吧。
但是呢,也有非常多的SaaS公司,我看到它比较成功的转型也是因为。
但是呢,也有非常多的SaaS公司,我看到它比较成功的转型也是因为。
有 AI 的加持,让他的产品比原来的产品更好用。
有 AI 的加持,让他的产品比原来的产品更好用。
比如我们最近看了一家帮助这些连锁的线下超市啊,包括提供食品的餐饮连锁去做小时工招聘。
比如我们最近看了一家帮助这些连锁的线下超市啊,包括提供食品的餐饮连锁去做小时工招聘。
你比如这个蓝领要跟原来 tax 做交互,通知你几点来,你都不乐意,收 up 率非常低。
你比如这个蓝领要跟原来 tax 做交互,通知你几点来,你都不乐意,收 up 率非常低。
现在要跟一个 agent 呢去做交互,这 agent 呢跟他讲好所有的事情,你要穿什么样的衣服来啊,你要怎么去报道啊,车停哪啊,你 sick leave 的情况是什么样的,干多少小时就可以给你去记你的社会保障啊等等。
现在要跟一个 agent 呢去做交互,这 agent 呢跟他讲好所有的事情,你要穿什么样的衣服来啊,你要怎么去报道啊,车停哪啊,你 sick leave 的情况是什么样的,干多少小时就可以给你去记你的社会保障啊等等。
就他了解更多,于是他收 up 率就更高了。
就他了解更多,于是他收 up 率就更高了。
所以你不能就一概而论,反正这出来了,于是你就都不好。
所以你不能就一概而论,反正这出来了,于是你就都不好。
那肯定不是对对对对,这是我最近听到最好的一个观点。
那肯定不是对对对对,这是我最近听到最好的一个观点。
就是其实只要你用得好,它可能反而是一个利好。
就是其实只要你用得好,它可能反而是一个利好。
关键都是在于人怎么用。
关键都是在于人怎么用。
没错,我觉得在整个硅谷层面还是看到全世界各地的人啊,包括这个全世界的钱都向这儿去涌入。
没错,我觉得在整个硅谷层面还是看到全世界各地的人啊,包括这个全世界的钱都向这儿去涌入。
你说国内焦虑,就这儿也很焦虑,就是每天晚上比如说搞一个。
你说国内焦虑,就这儿也很焦虑,就是每天晚上比如说搞一个。
小的路演、road show 啊之类的,就请500人,可能1000人来,最后门都关不上。
小的路演、road show 啊之类的,就请500人,可能1000人来,最后门都关不上。
从平时啊到周末,大概都是这个情况吧,就还是非常多的 idea 涌出。
从平时啊到周末,大概都是这个情况吧,就还是非常多的 idea 涌出。
第二个呢,也有一个可能要离开硅谷,情况就又不太一样,就包括北美也是一样,他可能核心更关心的还是到底产生什么价值,就你跟他讲 token 的 economy。
第二个呢,也有一个可能要离开硅谷,情况就又不太一样,就包括北美也是一样,他可能核心更关心的还是到底产生什么价值,就你跟他讲 token 的 economy。
这也不理解到底是什么。
这也不理解到底是什么。
但对于中小企业,它一定是理解 roi 是什么。
但对于中小企业,它一定是理解 roi 是什么。
什么东西能给我带来价值?
什么东西能给我带来价值?
那这个带来价值本身,对他们可能是个更重要的事情。
那这个带来价值本身,对他们可能是个更重要的事情。
现在大家还是在一个要充分的去论证和推进,怎么能把底层的 token 变成一个真正商业价值的过程。
现在大家还是在一个要充分的去论证和推进,怎么能把底层的 token 变成一个真正商业价值的过程。
对,您来的这一周正好是 gtc 的这一周,也是硅谷最热闹的这一周。
对,您来的这一周正好是 gtc 的这一周,也是硅谷最热闹的这一周。
我注意到这次在 jensen 黄他的 keynote 上,包括在他 open source 的论坛上,他其实提到最多的一个词就是 open claw。
我注意到这次在 jensen 黄他的 keynote 上,包括在他 open source 的论坛上,他其实提到最多的一个词就是 open claw。
我可以想象这个帮他带来了很多的算力需求啊,但是确实就连他都说他觉得中国现在大家已经开始在比赛养龙虾了。
我可以想象这个帮他带来了很多的算力需求啊,但是确实就连他都说他觉得中国现在大家已经开始在比赛养龙虾了。
中国对龙虾的热度其实是对美国人的热情要更高的。
中国对龙虾的热度其实是对美国人的热情要更高的。
上次其实我们俩吃饭也聊到嘛,您觉得在这个时间点上真正应该关注的是 Anthropic 的 CoWork,而不只是 Open Clock。
上次其实我们俩吃饭也聊到嘛,您觉得在这个时间点上真正应该关注的是 Anthropic 的 CoWork,而不只是 Open Clock。
可不可以展开讲一讲?
可不可以展开讲一讲?
嗯,好的,我先讲一下前面这部分。
嗯,好的,我先讲一下前面这部分。
因为这次黄这次可能核心的大的逻辑还是想讲TOKEN经济,因为确实呢,从芯片的角度来讲,对于单TOKEN的算力啊,包括成本还是指数级下降,在这个基础上可能会衍生出很多应用。
因为这次黄这次可能核心的大的逻辑还是想讲TOKEN经济,因为确实呢,从芯片的角度来讲,对于单TOKEN的算力啊,包括成本还是指数级下降,在这个基础上可能会衍生出很多应用。
然后OPEN CLOUD可能就是在这个大的基础上里边,可能最近比较现象级的应用问题呢,就是因为OPEN CLOUD还不是一个。
然后OPEN CLOUD可能就是在这个大的基础上里边,可能最近比较现象级的应用问题呢,就是因为OPEN CLOUD还不是一个。
非常简单易用的开箱即用的产品嘛,就要把它东西配置好啊,变成一个能解决你问题的产品。
非常简单易用的开箱即用的产品嘛,就要把它东西配置好啊,变成一个能解决你问题的产品。
还是相对对技术有点要求,就这个门槛也挡住很多人。
还是相对对技术有点要求,就这个门槛也挡住很多人。
当然更重要的是你到底能产生什么价值,长期留存下来的工作流可以帮助你解决问题。
当然更重要的是你到底能产生什么价值,长期留存下来的工作流可以帮助你解决问题。
但如果这个东西呢,留住的工作流非常有限,那可能过一段时间你会看到退潮。
但如果这个东西呢,留住的工作流非常有限,那可能过一段时间你会看到退潮。
在硅谷呢,我觉得 CLOCKWORK 这个设计范式也非常吸引人注意吧,至少有一段时间每做一个 PLUGIN,可能股市都会受一些影响。
在硅谷呢,我觉得 CLOCKWORK 这个设计范式也非常吸引人注意吧,至少有一段时间每做一个 PLUGIN,可能股市都会受一些影响。
但虽然它还在一个RESEARCH PREVIEW的这个早期吧,但是能看到非常多的下一代的工作台啊或者是AGENT PLATFORM的影子,就是它的分层的开放架构,它产品的设计体系啊,包括因为它本身是基于ANTHROPIC的模型嘛,它跟CLOUD模型之间的磨合的匹配度啊还是非常高的。
但虽然它还在一个RESEARCH PREVIEW的这个早期吧,但是能看到非常多的下一代的工作台啊或者是AGENT PLATFORM的影子,就是它的分层的开放架构,它产品的设计体系啊,包括因为它本身是基于ANTHROPIC的模型嘛,它跟CLOUD模型之间的磨合的匹配度啊还是非常高的。
嗯对您刚刚这段话启发了我,是不是OPEN CLOUD更适合TO C的应用场景?
嗯对您刚刚这段话启发了我,是不是OPEN CLOUD更适合TO C的应用场景?
因为我觉得从产品设计上来说,你其实只要把它接好。
因为我觉得从产品设计上来说,你其实只要把它接好。
我在一个聊天的对话框里告诉他一个事情,他就可以帮我去爬网页,包括把音频转成文字。
我在一个聊天的对话框里告诉他一个事情,他就可以帮我去爬网页,包括把音频转成文字。
甚至比如说我们的这个播客,假设录音出现了一些瑕疵,他还可以帮我去修音频、补瑕疵、去回声。
甚至比如说我们的这个播客,假设录音出现了一些瑕疵,他还可以帮我去修音频、补瑕疵、去回声。
但是COWORK它是不是更适合一个TO B的工作场景?
但是COWORK它是不是更适合一个TO B的工作场景?
因为我觉得大家在用AI的时候,有两种思想一直在争论。
因为我觉得大家在用AI的时候,有两种思想一直在争论。
我们到底应不应该把很多的工作分步骤来解决?
我们到底应不应该把很多的工作分步骤来解决?
因为很多人认为,凡事我还要一、二、三步,每一步我告诉你怎么做的,就证明人还在控制这个流程。
因为很多人认为,凡事我还要一、二、三步,每一步我告诉你怎么做的,就证明人还在控制这个流程。
他的思想就还不够AI NATIVE。
他的思想就还不够AI NATIVE。
但是反过来想,如果我真的是一个企业,我要真的把整个AI运用到我的播客制作中,我需要有一个非常明确的流程告诉他:一、二、三,你要做什么?
但是反过来想,如果我真的是一个企业,我要真的把整个AI运用到我的播客制作中,我需要有一个非常明确的流程告诉他:一、二、三,你要做什么?
且你每一步的准确性都要达到,就是你不能是一个给我这个质量不能保证的产品。
且你每一步的准确性都要达到,就是你不能是一个给我这个质量不能保证的产品。
所以我在想这两个产品它是不是其实对应的还是一个不一样的工作范式?
所以我在想这两个产品它是不是其实对应的还是一个不一样的工作范式?
open cloud 因为它本身开源和泛化的能力其实比较强嘛,不基于任何一个模型,因为它本身下面可以接多个模型,可以接多个工具啊等等。
open cloud 因为它本身开源和泛化的能力其实比较强嘛,不基于任何一个模型,因为它本身下面可以接多个模型,可以接多个工具啊等等。
对,但有人对它挑战的比较多的也是在这里边,因为开放性过强,以至于你进去到底要做什么,做的好。
对,但有人对它挑战的比较多的也是在这里边,因为开放性过强,以至于你进去到底要做什么,做的好。
他的整个 reinforcement learning 怎么设计?
他的整个 reinforcement learning 怎么设计?
因为它其实开放的范式嘛,到底什么东西做得好,怎么能记住这个做的是好的,这点还是需要花比较大的时间去磨合的,包括它的安全性的问题啊等等。
因为它其实开放的范式嘛,到底什么东西做得好,怎么能记住这个做的是好的,这点还是需要花比较大的时间去磨合的,包括它的安全性的问题啊等等。
CLOCKWORK呢,我觉得这个产品设计的面向对象可能更清晰一些,其实就是KNOWLEDGE WORKER,知识工作者。
CLOCKWORK呢,我觉得这个产品设计的面向对象可能更清晰一些,其实就是KNOWLEDGE WORKER,知识工作者。
最开始比较典型的类型就是开发人员、程序员,然后可能是分析师啊,做RESEARCH的。
最开始比较典型的类型就是开发人员、程序员,然后可能是分析师啊,做RESEARCH的。
Finance 啊,然后 lawyer 等等,就是原来需要大量的跟邮件、word、excel,是吧?
Finance 啊,然后 lawyer 等等,就是原来需要大量的跟邮件、word、excel,是吧?
以及一些互联网的信息去做交互的这个过程,就是在对那些问题其实处理的还是比较好的。
以及一些互联网的信息去做交互的这个过程,就是在对那些问题其实处理的还是比较好的。
然后呢,你说是一次性都处理完,还是 step by step 我觉得这两可能还不是一个核心的分野吧。
然后呢,你说是一次性都处理完,还是 step by step 我觉得这两可能还不是一个核心的分野吧。
因为这最 AGENTIC 的工具做的比较好的事情,它其实是所有工具的工具。
因为这最 AGENTIC 的工具做的比较好的事情,它其实是所有工具的工具。
就是不同的人用这个产品,最后你肯定用出你自己的样子嘛?
就是不同的人用这个产品,最后你肯定用出你自己的样子嘛?
因为你想要去完成的事情不一样,所以你会在每一个步骤上设计和给它校正。
因为你想要去完成的事情不一样,所以你会在每一个步骤上设计和给它校正。
就这个步骤做的是不是对的,如果对的就到下一个步骤,否则的话呢,你所有的步骤可能长在一起。
就这个步骤做的是不是对的,如果对的就到下一个步骤,否则的话呢,你所有的步骤可能长在一起。
你假设要做一个博客,要搞十八步。
你假设要做一个博客,要搞十八步。
每一步有误差10%,你最后90%的18次方,那你就基本上最后是个不可用结果。
每一步有误差10%,你最后90%的18次方,那你就基本上最后是个不可用结果。
就是你每一步要去跟它去做 verify 验证,一定要把核心的步骤差错率搞到最低。
就是你每一步要去跟它去做 verify 验证,一定要把核心的步骤差错率搞到最低。
你有你自己的衡量这个是成功的标准,对你这个 matrix 是什么样的?
你有你自己的衡量这个是成功的标准,对你这个 matrix 是什么样的?
就是大家基于自己的 expertise 去告诉整个 agentic two 的这个产品,最终你的输入和输出要符合这个标准。
就是大家基于自己的 expertise 去告诉整个 agentic two 的这个产品,最终你的输入和输出要符合这个标准。
那就是个好的结果。
那就是个好的结果。
然后呢这个 ai 不断的去强化学习这个结果,最后产生一个你更能接受的一个工具嘛。
然后呢这个 ai 不断的去强化学习这个结果,最后产生一个你更能接受的一个工具嘛。
就这个过程呢,如果不是开放式的。
就这个过程呢,如果不是开放式的。
其实 AI 很难去衡量中间哪一步做错了,就是它一定是,你有办法跟它去做交互,告诉它哪一步你能够把它做得更准确,这个工具最终才能给你起到最大作用。
其实 AI 很难去衡量中间哪一步做错了,就是它一定是,你有办法跟它去做交互,告诉它哪一步你能够把它做得更准确,这个工具最终才能给你起到最大作用。
但是呢,它一旦学会,接下来的推理过程和执行过程就很简单,单位 TOKEN 能产生的经济价值会更大。
但是呢,它一旦学会,接下来的推理过程和执行过程就很简单,单位 TOKEN 能产生的经济价值会更大。
嗯,要让 AI 去做到准确,这个事情就很难,它是一个门槛很高的事情。
嗯,要让 AI 去做到准确,这个事情就很难,它是一个门槛很高的事情。
没错,而且不同的行业吧,我觉得这个 stake 是不一样的。
没错,而且不同的行业吧,我觉得这个 stake 是不一样的。
就是刚才,比如讲 open cloud,如果帮助你每天去收集一些外部的信息,我觉得这个可能是一个阈值的事情,但收集的准还是不准啊,是不是符合你胃口啊,这个事情。
就是刚才,比如讲 open cloud,如果帮助你每天去收集一些外部的信息,我觉得这个可能是一个阈值的事情,但收集的准还是不准啊,是不是符合你胃口啊,这个事情。
它可能是一个 stake,你要基于这个信息去做量化交易,那就是下一个 stake 的事情。
它可能是一个 stake,你要基于这个信息去做量化交易,那就是下一个 stake 的事情。
是吧?
是吧?
如果你要需要这个信息指导你未来一年或者更长时间的生产作业,对你的整个生意的ROI产生很大的影响,那又是下一个阈值的事情。
如果你要需要这个信息指导你未来一年或者更长时间的生产作业,对你的整个生意的ROI产生很大的影响,那又是下一个阈值的事情。
对于每一个不同的领域吧,产出的期待的阈值不一样,你对工具的使用的方法,包括工具本身、工具背后这个模型,我觉得都是需要重新设计才能更好地发挥作用。
对于每一个不同的领域吧,产出的期待的阈值不一样,你对工具的使用的方法,包括工具本身、工具背后这个模型,我觉得都是需要重新设计才能更好地发挥作用。
嗯,对,今年我注意到你们去年推了一个叫做AXIO WORK。
嗯,对,今年我注意到你们去年推了一个叫做AXIO WORK。
它是帮很多的外贸TO B的厂家解决自己垂直领域的问题,然后用AI来做。
它是帮很多的外贸TO B的厂家解决自己垂直领域的问题,然后用AI来做。
今年我知道你们的这个软件很快也要升级了,就你能不能讲一下升级在哪些地方?
今年我知道你们的这个软件很快也要升级了,就你能不能讲一下升级在哪些地方?
因为这一两年AI发展的特别快,大家在这种非常快的节奏里面,你是怎么去考虑你的迭代,以及你现有业务跟传统业务的BALANCE。
因为这一两年AI发展的特别快,大家在这种非常快的节奏里面,你是怎么去考虑你的迭代,以及你现有业务跟传统业务的BALANCE。
好的,那首先呢,我们当时也做了一个推演嘛,就是B TO B的生意未来可能都会走向A TO A,就是AGENT TO AGENT。
好的,那首先呢,我们当时也做了一个推演嘛,就是B TO B的生意未来可能都会走向A TO A,就是AGENT TO AGENT。
那我们今天呢,其实是两个平行的业务系统,一个就是MARKETPLACE,就阿里巴巴DOT COM,阿里巴巴DOT COM自己它的所有这些搜索、沟通、推荐、交易、物流等等整个这一套体系。
那我们今天呢,其实是两个平行的业务系统,一个就是MARKETPLACE,就阿里巴巴DOT COM,阿里巴巴DOT COM自己它的所有这些搜索、沟通、推荐、交易、物流等等整个这一套体系。
其实也在快速的用AI重构的过程,就是原来买家从搜索一直到交易的过程,可能跟最早的搜索引擎啊,包括电商平台很像。
其实也在快速的用AI重构的过程,就是原来买家从搜索一直到交易的过程,可能跟最早的搜索引擎啊,包括电商平台很像。
那就今天你去基于阿里巴巴.
那就今天你去基于阿里巴巴.
COM,基于它的AI MODE去做事情,你就觉得它也是一个类似AI NATIVE的产品,就是非常多的交互是你跟AI去做交互,然后AI帮你去筛选大量的信息,帮你推进整个订单的流程,帮你去做最好的物流。
COM,基于它的AI MODE去做事情,你就觉得它也是一个类似AI NATIVE的产品,就是非常多的交互是你跟AI去做交互,然后AI帮你去筛选大量的信息,帮你推进整个订单的流程,帮你去做最好的物流。
包括 payment terms 的建议,然后最后帮助买家跟卖家快速完成线上的交易。
包括 payment terms 的建议,然后最后帮助买家跟卖家快速完成线上的交易。
另外一条线呢,就是 agent to agent,就是我们去年推出的产品叫 axu。
另外一条线呢,就是 agent to agent,就是我们去年推出的产品叫 axu。
就是 accio dot com 或者 accio dot ai 到今年三月份,它的 mau 已经到1000万。
就是 accio dot com 或者 accio dot ai 到今年三月份,它的 mau 已经到1000万。
就它还是一个 month over month 增长速度非常快的产品。
就它还是一个 month over month 增长速度非常快的产品。
它核心想解决的其实是围绕 sourcing 这一段的问题,但是 sourcing 有向前跟向后延展的部分。
它核心想解决的其实是围绕 sourcing 这一段的问题,但是 sourcing 有向前跟向后延展的部分。
就比如说呢,它最开始 sourcing 的起点是先找到下一个产品是什么,尤其对于中小企业,就是定义它下一个 killer 的 product 到底是什么,这是非常重要的事。
就比如说呢,它最开始 sourcing 的起点是先找到下一个产品是什么,尤其对于中小企业,就是定义它下一个 killer 的 product 到底是什么,这是非常重要的事。
如果这个事搞对了。
如果这个事搞对了。
你可能企业的现金流啊和业务可能就走入正轨,如果要是搞错了,那可能你就非常多的时间、非常大的试错成本。
你可能企业的现金流啊和业务可能就走入正轨,如果要是搞错了,那可能你就非常多的时间、非常大的试错成本。
所以一般从RESEARCH开始到形成这个IDEA,就IDEATION再做产品的设计DESIGN,然后再进入到供应商的筛选沟通环节,然后再进入到交易的流程,然后进入到商品的运输啊、售后啊等等这些流程。
所以一般从RESEARCH开始到形成这个IDEA,就IDEATION再做产品的设计DESIGN,然后再进入到供应商的筛选沟通环节,然后再进入到交易的流程,然后进入到商品的运输啊、售后啊等等这些流程。
XU是希望前面把整个SOURCING更大程度的自动化,通过AI帮助它提效。
XU是希望前面把整个SOURCING更大程度的自动化,通过AI帮助它提效。
我们看到呢,基于这种AGENCY BASED的模式,它从输入一个IDEA,比如输入一个INQUIRY开始,到最终建立一个比较SOLID的商业关系,基本上它的时间是缩短到原来的五分之一。
我们看到呢,基于这种AGENCY BASED的模式,它从输入一个IDEA,比如输入一个INQUIRY开始,到最终建立一个比较SOLID的商业关系,基本上它的时间是缩短到原来的五分之一。
就是原来你用一个礼拜要去办这件事儿,我专职SOURCING沟通这个过程。
就是原来你用一个礼拜要去办这件事儿,我专职SOURCING沟通这个过程。
然后你现在可能一天之内就可以完成,因为原来有语言的问题啊,时差的问题啊,原来买家跟卖家之间的设计,就没有 ai 的帮助,相对来讲可能是一个比较潦草的 idea 开始,然后卖家帮助你逐步的去完善设计。
然后你现在可能一天之内就可以完成,因为原来有语言的问题啊,时差的问题啊,原来买家跟卖家之间的设计,就没有 ai 的帮助,相对来讲可能是一个比较潦草的 idea 开始,然后卖家帮助你逐步的去完善设计。
那今天呢,ai 可以帮助你直接形成 design pack,形成一个非常专业的 technical 的设计文档。
那今天呢,ai 可以帮助你直接形成 design pack,形成一个非常专业的 technical 的设计文档。
包括图片、文字、3D等等。
包括图片、文字、3D等等。
就这样的话,买一个卖家的交互就可以非常高效顺畅,也比较专业的去完成。
就这样的话,买一个卖家的交互就可以非常高效顺畅,也比较专业的去完成。
对这个SOURCING,我理解成它其实就是一个卖家去定义产品的这种能力。
对这个SOURCING,我理解成它其实就是一个卖家去定义产品的这种能力。
以前是怎么做的?
以前是怎么做的?
为什么它的整个SOURCING的过程会需要五天?
为什么它的整个SOURCING的过程会需要五天?
AI做了什么,让它可以把这个环节缩短成一天。
AI做了什么,让它可以把这个环节缩短成一天。
第一步,AI包括XU的产品可以帮助他做的事情是什么?
第一步,AI包括XU的产品可以帮助他做的事情是什么?
就是。
就是。
帮他去理解,或者是 index 的全网的信息。
帮他去理解,或者是 index 的全网的信息。
从产生一个 idea 开始,你可能要做大量的碎片化的这些信息的 research。
从产生一个 idea 开始,你可能要做大量的碎片化的这些信息的 research。
就是类似的产品有哪些?
就是类似的产品有哪些?
类似的商品在 amazon 啊,或者在其他平台上被搜索的情况,它交易情况,评价是怎么样的?
类似的商品在 amazon 啊,或者在其他平台上被搜索的情况,它交易情况,评价是怎么样的?
它 trend 是怎么样的?
它 trend 是怎么样的?
然后大概期的商品定价在什么范围?
然后大概期的商品定价在什么范围?
要在这个范围基础上,你要去算 margin 是不是合理等等。
要在这个范围基础上,你要去算 margin 是不是合理等等。
这是一个要设计产品过程,就这个过程,原来你其实也需要有大量的 research 的工作,然后也有一些。
这是一个要设计产品过程,就这个过程,原来你其实也需要有大量的 research 的工作,然后也有一些。
比如在web二点零时代的resource工具,帮你提供一些数据啊等等。
比如在web二点零时代的resource工具,帮你提供一些数据啊等等。
但这些数据呢,你要让它做到非常第一个完整,第二个非常及时性和准确性。
但这些数据呢,你要让它做到非常第一个完整,第二个非常及时性和准确性。
其实在没有AI和AGENTIC TWO的帮助下是比较难的,因为它既要做到宽度很宽,同时要做到它要去读取那个网页和当时的信息,要保证这个准确度非常准确。
其实在没有AI和AGENTIC TWO的帮助下是比较难的,因为它既要做到宽度很宽,同时要做到它要去读取那个网页和当时的信息,要保证这个准确度非常准确。
对,所以其实您指的SOURCING它不仅仅说我是一个IDEA。
对,所以其实您指的SOURCING它不仅仅说我是一个IDEA。
它还包括我的这个想法在实现的过程中,它的供应链是不是可以支持你的产品的设计?
它还包括我的这个想法在实现的过程中,它的供应链是不是可以支持你的产品的设计?
我们拿苹果手机举例,你要用一个什么样的钢化玻璃,然后你业界是不是已经有这些技术了?
我们拿苹果手机举例,你要用一个什么样的钢化玻璃,然后你业界是不是已经有这些技术了?
它的设计上可不可以支持供应链,可不可以支持是有这些环节的。
它的设计上可不可以支持供应链,可不可以支持是有这些环节的。
那我再把这个问题稍微迁移到大模型领域一下,用你们的这个工具跟用比如说CLOUD或者CHATGPT JIMMY。
那我再把这个问题稍微迁移到大模型领域一下,用你们的这个工具跟用比如说CLOUD或者CHATGPT JIMMY。
它会有什么本质上的不一样吗?
它会有什么本质上的不一样吗?
我理解其实现在大模型在做这种深度的调研上,他们也做得很好。
我理解其实现在大模型在做这种深度的调研上,他们也做得很好。
至少我们现在的理解吧,对于我们自己的模型和整个工具有四个方向的投入,我觉得是至少当下的模型可能做得不够好,或者我们需要在它上面去额外做很多工作。
至少我们现在的理解吧,对于我们自己的模型和整个工具有四个方向的投入,我觉得是至少当下的模型可能做得不够好,或者我们需要在它上面去额外做很多工作。
第一个方面呢,就是关于这个信息的准确性。
第一个方面呢,就是关于这个信息的准确性。
有一些信息非常 critical,比如这些信息就包括你最终能够拿到的商品的价格。
有一些信息非常 critical,比如这些信息就包括你最终能够拿到的商品的价格。
即使我们今天去分析买卖之间沟通的上下文啊、合同等等,就是也要找到你这个商品里边最真实的价格是什么。
即使我们今天去分析买卖之间沟通的上下文啊、合同等等,就是也要找到你这个商品里边最真实的价格是什么。
就哪些里边可能是之前的隐藏价格啊,或者额外加进去的内容,你还是要找到这个市场最好的一个方案是什么。
就哪些里边可能是之前的隐藏价格啊,或者额外加进去的内容,你还是要找到这个市场最好的一个方案是什么。
然后有的呢,比如你最终要拿到这个到手价,去掉物流的费用,去掉关税的费用。
然后有的呢,比如你最终要拿到这个到手价,去掉物流的费用,去掉关税的费用。
这些呢都需要非常精确的信息。
这些呢都需要非常精确的信息。
另外还有一些就是要很多平台上的 signal 的信息,哪一类事情能做到,哪一类事情不能做到。
另外还有一些就是要很多平台上的 signal 的信息,哪一类事情能做到,哪一类事情不能做到。
每天在阿里巴巴 dot com 上都有上百万的沟通。
每天在阿里巴巴 dot com 上都有上百万的沟通。
对于不同的设计的 idea 的沟通啊,对于不同的技术细节的沟通,就这些事情都会去形成最终对于你整个从 ideation 到 design pack。
对于不同的设计的 idea 的沟通啊,对于不同的技术细节的沟通,就这些事情都会去形成最终对于你整个从 ideation 到 design pack。
这个过程中的一些非常精确的输入跟指导。
这个过程中的一些非常精确的输入跟指导。
它既基于我们过去26年的积累,也基于大量的现在积累这些互联网的工具,就是其实搜索也是一种工具。
它既基于我们过去26年的积累,也基于大量的现在积累这些互联网的工具,就是其实搜索也是一种工具。
说 indexing 所有这些内容也是一种工具,就这些工具把它组合在一起,我觉得是能解决第一个层面问题,就是你这个信息要尽量准确。
说 indexing 所有这些内容也是一种工具,就这些工具把它组合在一起,我觉得是能解决第一个层面问题,就是你这个信息要尽量准确。
你不能说可能的100%准确,但它90%的或者99的接近这个 facts,那可能对于这些用户来讲,就比大模型产生的 hallucination 可能就要好很多。
你不能说可能的100%准确,但它90%的或者99的接近这个 facts,那可能对于这些用户来讲,就比大模型产生的 hallucination 可能就要好很多。
对,定价差一点点,对商家的利润是决定性的因素。
对,定价差一点点,对商家的利润是决定性的因素。
对,就要帮助他尽量准确的去拿到这个信息。
对,就要帮助他尽量准确的去拿到这个信息。
第二个方面的探索,就是你要形成一个比较有效的强化学习的机制,就REINFORCEMENT LEARNING机制。
第二个方面的探索,就是你要形成一个比较有效的强化学习的机制,就REINFORCEMENT LEARNING机制。
你们怎么去做这种评估?
你们怎么去做这种评估?
因为强化学习里面最重要的就是我要去评估结果,然后让它顺着一个正确的评估的方式一直去优化。
因为强化学习里面最重要的就是我要去评估结果,然后让它顺着一个正确的评估的方式一直去优化。
所以你觉得在评估的过程中,有哪些是非常核心跟细节的点?
所以你觉得在评估的过程中,有哪些是非常核心跟细节的点?
你们怎么去评估这种可能没有一个标准答案的问题?
你们怎么去评估这种可能没有一个标准答案的问题?
是的,就第一个呢,我们肯定是先要把所有的步骤里边的每一步尽量把它搞对。
是的,就第一个呢,我们肯定是先要把所有的步骤里边的每一步尽量把它搞对。
因为它本身这个问题STAKE就比较高嘛,它就是一个比较严肃的和贵的问题。
因为它本身这个问题STAKE就比较高嘛,它就是一个比较严肃的和贵的问题。
所以用户在跟平台做交互的时候,它其实就会给非常多的FEEDBACK,就这个设计往这个分支是好还是不好,这个技术是满足还是不能满足,这个MARGIN到底是能满足不能满足等等,就是它本身就会给平台很多的反馈。
所以用户在跟平台做交互的时候,它其实就会给非常多的FEEDBACK,就这个设计往这个分支是好还是不好,这个技术是满足还是不能满足,这个MARGIN到底是能满足不能满足等等,就是它本身就会给平台很多的反馈。
在这个反馈的过程中,我们就会把逻辑的链条记录下来。
在这个反馈的过程中,我们就会把逻辑的链条记录下来。
它本身去优化的方式就是我们尽量让每个TOKEN能产生的价值更大,不要漫无目的的去做推理啊,或者去去做搜索。
它本身去优化的方式就是我们尽量让每个TOKEN能产生的价值更大,不要漫无目的的去做推理啊,或者去去做搜索。
按照这个方式去做,那可能单位TOKEN的经济价值最大,能产生的效率最高。
按照这个方式去做,那可能单位TOKEN的经济价值最大,能产生的效率最高。
这就是我们不断的REWARD这个系统的一个过程。
这就是我们不断的REWARD这个系统的一个过程。
第二个呢,就是在国际站有个好处,就是它能够形成一个闭环的反馈,就是最终你有个IDEA。
第二个呢,就是在国际站有个好处,就是它能够形成一个闭环的反馈,就是最终你有个IDEA。
到底最终形成了交易,还是没形成交易?
到底最终形成了交易,还是没形成交易?
然后你是持续去买,还是说 try 了几次之后发现这事 fail 了,就不 work 所以这些都是一个更长期的可以回到这个平台里面的信号。
然后你是持续去买,还是说 try 了几次之后发现这事 fail 了,就不 work 所以这些都是一个更长期的可以回到这个平台里面的信号。
就是当你有越来越多的行业,越来越多的人在去使用的过程,那整个这个产品它可能越来越向一个对的方向去发展,也包括它 research 的方向。
就是当你有越来越多的行业,越来越多的人在去使用的过程,那整个这个产品它可能越来越向一个对的方向去发展,也包括它 research 的方向。
嗯,所以其实你撮合了更多的交易,对他来说就是一个正反馈。
嗯,所以其实你撮合了更多的交易,对他来说就是一个正反馈。
可以这么理解。
可以这么理解。
对,每个行业会需要不同的强化学习的训练方法吗?
对,每个行业会需要不同的强化学习的训练方法吗?
还是说。
还是说。
现在大家的强化学习的训练方法,它是一样的。
现在大家的强化学习的训练方法,它是一样的。
细节的每一个行业,我现在可能还没有更多的信息给你去反馈。
细节的每一个行业,我现在可能还没有更多的信息给你去反馈。
但是TO B跟TO C肯定这方面差别很大,因为它的周期长嘛。
但是TO B跟TO C肯定这方面差别很大,因为它的周期长嘛。
其实每一步都有很多反馈,比如这个物流价格是合理不合理,关税算的价格是合理不合理,这个商品到了用户手上再进到下一步的反馈过程中,信号的周期啊,包括它长度啊等等都会非常长。
其实每一步都有很多反馈,比如这个物流价格是合理不合理,关税算的价格是合理不合理,这个商品到了用户手上再进到下一步的反馈过程中,信号的周期啊,包括它长度啊等等都会非常长。
所以我们对于长上下文的推理可能花的精力会更多一些。
所以我们对于长上下文的推理可能花的精力会更多一些。
第三个呢,还是要有一定的安全和可靠性保障。
第三个呢,还是要有一定的安全和可靠性保障。
要确保因为TO B的STICK比较高的这个问题,信息的完整性我们要去判断。
要确保因为TO B的STICK比较高的这个问题,信息的完整性我们要去判断。
同时每一步骤推理的严谨性我们也要有保障。
同时每一步骤推理的严谨性我们也要有保障。
同时呢,安全性我们也要分层去保障。
同时呢,安全性我们也要分层去保障。
就这个数据本身是安全的,我要去访问你自己的所有的这些系统里边的信息啊、数据啊等等,它要做沙箱上的隔离等等。
就这个数据本身是安全的,我要去访问你自己的所有的这些系统里边的信息啊、数据啊等等,它要做沙箱上的隔离等等。
再一个呢,因为推理的周期很长,如果出错了,我需要能够向前回滚,要确保整个推理的过程。
再一个呢,因为推理的周期很长,如果出错了,我需要能够向前回滚,要确保整个推理的过程。
我们也要保证你的上下文一直要一直要传递下去。
我们也要保证你的上下文一直要一直要传递下去。
最后一个呢,因为这个周期很长嘛,我们下一个版本推的叫AXIO WORK,就第一个版本就叫AXIO。
最后一个呢,因为这个周期很长嘛,我们下一个版本推的叫AXIO WORK,就第一个版本就叫AXIO。
它是一个基于BROWSER BASED的一个AGENT系统。
它是一个基于BROWSER BASED的一个AGENT系统。
AXIO WORK呢,你理解是装在DESKTOP上,就是它除了从设计。
AXIO WORK呢,你理解是装在DESKTOP上,就是它除了从设计。
到 sourcing 以外,它需要帮你可以完成你所有的 daily 的 operation,daily 的 operation 就变成你要开店、卖商品、管理库存,包括去接受客服的 feedback 呀等等。
到 sourcing 以外,它需要帮你可以完成你所有的 daily 的 operation,daily 的 operation 就变成你要开店、卖商品、管理库存,包括去接受客服的 feedback 呀等等。
这些因为有 computer use,browser use,我们可以帮最终的用户,海外这些买家完成它的下一个 step。
这些因为有 computer use,browser use,我们可以帮最终的用户,海外这些买家完成它的下一个 step。
但下一个 step 呢,进入到售卖售后这个环节,你可以理解它的上下文就是无限长。
但下一个 step 呢,进入到售卖售后这个环节,你可以理解它的上下文就是无限长。
从IDEA开始到SOURCING结束,它可能是一个一个月左右的周期。
从IDEA开始到SOURCING结束,它可能是一个一个月左右的周期。
那接下来你可能进入到半年或者一年左右的整个商品销售的周期,你要把无限长的上下文的信息把它分层的存储下来。
那接下来你可能进入到半年或者一年左右的整个商品销售的周期,你要把无限长的上下文的信息把它分层的存储下来。
有一些呢,就像现在大模型一样,就是上下文就跟人的思考一样。
有一些呢,就像现在大模型一样,就是上下文就跟人的思考一样。
咱们现在对话,我就要把现在能拿到的信息最好的方式推理展现。
咱们现在对话,我就要把现在能拿到的信息最好的方式推理展现。
有一些内容,比如像多模态内容,你要把它索引起来。
有一些内容,比如像多模态内容,你要把它索引起来。
之前你设计的这些产品的内容,其实对于你现在这个产品的设计就有很大帮助。
之前你设计的这些产品的内容,其实对于你现在这个产品的设计就有很大帮助。
还有一些信息呢,你就是需要的时候你去访问,你比如这个产品进入到售卖周期了,有非常多的CUSTOMER的反馈啊、FEEDBACK等等,就是这些信息也可以收集起来,进行让你在下一轮再做商业的时候帮你去优化。
还有一些信息呢,你就是需要的时候你去访问,你比如这个产品进入到售卖周期了,有非常多的CUSTOMER的反馈啊、FEEDBACK等等,就是这些信息也可以收集起来,进行让你在下一轮再做商业的时候帮你去优化。
最后一个方向我们刚才讲的就是这种无限长周期的上下文的设计。
最后一个方向我们刚才讲的就是这种无限长周期的上下文的设计。
以及内容的存储,所以围绕着数据的准确性,围绕着reinforcement learning这个奖励的机制,信息的安全啊,包括鲁棒性和最后我们这个超长周期的推理等等这几个方向。
以及内容的存储,所以围绕着数据的准确性,围绕着reinforcement learning这个奖励的机制,信息的安全啊,包括鲁棒性和最后我们这个超长周期的推理等等这几个方向。
还是我们需要花非常多的努力,从模型和工具层面做一些突破,才能真正解决好to B的商业的问题。
还是我们需要花非常多的努力,从模型和工具层面做一些突破,才能真正解决好to B的商业的问题。
嗯对哦刚刚这个讲的特别的完整啊,关于你刚刚提到的这个XU work,我其实还有很多问题,就是他们怎么去管理自己的日常工作,但在此之前有一个问题是。
嗯对哦刚刚这个讲的特别的完整啊,关于你刚刚提到的这个XU work,我其实还有很多问题,就是他们怎么去管理自己的日常工作,但在此之前有一个问题是。
如果底层的大模型更新了,或者说模型的能力大规模的提升了,你觉得对你们现有的工作跟 Xio 本身的这个模型来说,它是一个好事,还是说一个你需要马上执行,快速的切新模型,它是一个什么样的状态?
如果底层的大模型更新了,或者说模型的能力大规模的提升了,你觉得对你们现有的工作跟 Xio 本身的这个模型来说,它是一个好事,还是说一个你需要马上执行,快速的切新模型,它是一个什么样的状态?
我们期待的就是每当有一个新的 SOTA 模型出现。
我们期待的就是每当有一个新的 SOTA 模型出现。
整个这个产品应该变得比以前更聪明,或者它的体验更好,就这才能体现出你是一个 ai native 的一个产品,或者一个 agentic native 的产品。
整个这个产品应该变得比以前更聪明,或者它的体验更好,就这才能体现出你是一个 ai native 的一个产品,或者一个 agentic native 的产品。
就如果说出现新模型,其实跟你没关系,那是个更大的问题。
就如果说出现新模型,其实跟你没关系,那是个更大的问题。
同时呢,因为我们知道整个这个产品,其实它无论是在它的垂直的专业度啊,还是它对于模型本身的要求上,其实还是有非常非常多的工作的。
同时呢,因为我们知道整个这个产品,其实它无论是在它的垂直的专业度啊,还是它对于模型本身的要求上,其实还是有非常非常多的工作的。
我觉得它肯定不是一个上了一代模型,然后所有这些事情就都要重做了,肯定不是这个状态。
我觉得它肯定不是一个上了一代模型,然后所有这些事情就都要重做了,肯定不是这个状态。
因为我们本身现在的模型就是基于 soda,除了千问作为我们的一个基础的 base。
因为我们本身现在的模型就是基于 soda,除了千问作为我们的一个基础的 base。
我们在上面做很多优化以外,在多模态上做的好的模型,在 coding 能力上做的比较好的模型,在 agent 的推理能力上做的好的模型,我们都是尽量的把最好的模型在最好的应用场景里边把它利用起来。
我们在上面做很多优化以外,在多模态上做的好的模型,在 coding 能力上做的比较好的模型,在 agent 的推理能力上做的好的模型,我们都是尽量的把最好的模型在最好的应用场景里边把它利用起来。
当 agent 的不断执行过程中,就是不断的去压缩 token 让它每次的执行可以效率变得更高。
当 agent 的不断执行过程中,就是不断的去压缩 token 让它每次的执行可以效率变得更高。
嗯,你现在是接入的 deepseek 跟 queen 对吗?
嗯,你现在是接入的 deepseek 跟 queen 对吗?
国内的开源模型主要就是 queen。
国内的开源模型主要就是 queen。
海外的 Sota 模型呢,就是所有的这些 Sota 模型。
海外的 Sota 模型呢,就是所有的这些 Sota 模型。
呃,它是两个版本,就是分国内跟海外。
呃,它是两个版本,就是分国内跟海外。
不,就是国内的模型,我指的是国产的这些大模型。
不,就是国内的模型,我指的是国产的这些大模型。
因为阿里本身我们跟千问的合作的关系更紧密一些嘛。
因为阿里本身我们跟千问的合作的关系更紧密一些嘛。
当然 XU 这个产品现在更多的是海外中小企业在用,所以所有海外的这些 SOTA 模型我们也会使用。
当然 XU 这个产品现在更多的是海外中小企业在用,所以所有海外的这些 SOTA 模型我们也会使用。
哦,了解。
哦,了解。
了解刚刚你提到了XO WORK,它是一个工作流,可以帮大家管理在订单执行过程中的各种问题。
了解刚刚你提到了XO WORK,它是一个工作流,可以帮大家管理在订单执行过程中的各种问题。
那现在从商家的角度来说,他们在执行过程中会遇到哪些问题?
那现在从商家的角度来说,他们在执行过程中会遇到哪些问题?
我知道以前他们可能是会用各种各样的SARS产品去处理这些问题的。
我知道以前他们可能是会用各种各样的SARS产品去处理这些问题的。
因为最近 cowork 出来以后,大家也在说是不是 saas 已死啊,saas 的模式在被颠覆。
因为最近 cowork 出来以后,大家也在说是不是 saas 已死啊,saas 的模式在被颠覆。
我觉得正好这一个环节,我们可以从你的这个产品来展开。
我觉得正好这一个环节,我们可以从你的这个产品来展开。
去聊一聊大家现在的这个观点跟实际企业在应用中有什么样的 gap 好的。
去聊一聊大家现在的这个观点跟实际企业在应用中有什么样的 gap 好的。
axio work 如果跟原来的 axio 比起来呢,我觉得可能有两个差别。
axio work 如果跟原来的 axio 比起来呢,我觉得可能有两个差别。
第一个差别呢,我们是希望把整个商家经营的环节的闭环。
第一个差别呢,我们是希望把整个商家经营的环节的闭环。
把它完整掉。
把它完整掉。
你原来你可以理解,我们帮助他做了所有的 research 到商品的设计,到 sourcing 采购这个环节。
你原来你可以理解,我们帮助他做了所有的 research 到商品的设计,到 sourcing 采购这个环节。
之后就是他 daily 的商业的 operation 的环节,他要开店,经营线上的店,经营线下的店,然后接下来要完成下一轮的补货,下一轮的商品设计。
之后就是他 daily 的商业的 operation 的环节,他要开店,经营线上的店,经营线下的店,然后接下来要完成下一轮的补货,下一轮的商品设计。
然后要进入到售后的客服啊,包括销售的环节。
然后要进入到售后的客服啊,包括销售的环节。
如果企业本身还有雇员,可能也有 payroll 啊、finance 啊、tax 啊等等这些要求,就是我们的。
如果企业本身还有雇员,可能也有 payroll 啊、finance 啊、tax 啊等等这些要求,就是我们的。
希望这个agent platform第一呢,我们自己提供的能力就是核心从原来research到sourcing的全部能力。
希望这个agent platform第一呢,我们自己提供的能力就是核心从原来research到sourcing的全部能力。
这是我们可以帮他做的。
这是我们可以帮他做的。
第二个呢,利用现在的泛化的AI的能力,帮助他去经营很多,比如说开店啊、发布商品啊等等。
第二个呢,利用现在的泛化的AI的能力,帮助他去经营很多,比如说开店啊、发布商品啊等等。
我们现在都可以去BROWSER USE、COMPUTER USE的这些能力,帮他在SHOPIFY啊等等这些国外的marketplace平台上去做经营。
我们现在都可以去BROWSER USE、COMPUTER USE的这些能力,帮他在SHOPIFY啊等等这些国外的marketplace平台上去做经营。
第三部分呢,就是相对垂直领域的,比如说。
第三部分呢,就是相对垂直领域的,比如说。
Hr payroll 啊,finance 和 tax,我们就会接入一些在硅谷或者在美国做得很好的这些 agent 的产品,或者垂直向下的产品,把它接入到 xu 的 work 里边。
Hr payroll 啊,finance 和 tax,我们就会接入一些在硅谷或者在美国做得很好的这些 agent 的产品,或者垂直向下的产品,把它接入到 xu 的 work 里边。
最终目的还是希望给这些中小企业一个开箱即用的体验。
最终目的还是希望给这些中小企业一个开箱即用的体验。
刚才您讲的呢,cloud work 基于一些插件,对一些 saas 有影响,可能它的这个影响还是集中在 enterprise 这个 level 的层面上。
刚才您讲的呢,cloud work 基于一些插件,对一些 saas 有影响,可能它的这个影响还是集中在 enterprise 这个 level 的层面上。
对于中小企业呢,它可能不是若干个SARS的问题。
对于中小企业呢,它可能不是若干个SARS的问题。
对于中小企业,就大部分的北美线下,无论是NAIL SALON啊,还是这个FOOD CHAIN啊等等,你去他那儿一般都有一个很小的BACK OFFICE。
对于中小企业,就大部分的北美线下,无论是NAIL SALON啊,还是这个FOOD CHAIN啊等等,你去他那儿一般都有一个很小的BACK OFFICE。
那个很小BACK OFFICE里面坐着的人,基本还都只是办公,就什么PAYROLL啊,什么帮他们记他的SOCIAL SECURITY的问题啊等等,就记他工作了几小时这些很多还都是只是工作。
那个很小BACK OFFICE里面坐着的人,基本还都只是办公,就什么PAYROLL啊,什么帮他们记他的SOCIAL SECURITY的问题啊等等,就记他工作了几小时这些很多还都是只是工作。
就我们据今天呢,首先能把它数字化。
就我们据今天呢,首先能把它数字化。
其次呢,现在基于AGENCY BASE的产品能让整个流程更简单。
其次呢,现在基于AGENCY BASE的产品能让整个流程更简单。
基于AGENCY这套体验,至少我们觉得呢,跟原来的SAAS体验比起来,它是有可能做得更简化的。
基于AGENCY这套体验,至少我们觉得呢,跟原来的SAAS体验比起来,它是有可能做得更简化的。
而且它对于每一个中小企业,它都有办法去定义到底自己的核心的流程啊、逻辑是什么。
而且它对于每一个中小企业,它都有办法去定义到底自己的核心的流程啊、逻辑是什么。
但其实呢,如果要听每个人呢,你就发现你就给每个人都要重新定制一遍。
但其实呢,如果要听每个人呢,你就发现你就给每个人都要重新定制一遍。
这在原来SAAS这世界其实是。
这在原来SAAS这世界其实是。
难做到,除非你是8G的100万美金、1000万美金以上的,可能有人专门帮你去做。
难做到,除非你是8G的100万美金、1000万美金以上的,可能有人专门帮你去做。
但对于中小企业来讲,今天你有的条件就是你可以把你自己的成功的标准输入给这个模型,或者输入给这个真的的产品,它就基于你的这些输入去形成一个新的工作流,专门为你完成你自己的产品定义啊、产品发布啊,包括你自己做营销、做社媒的这个过程。
但对于中小企业来讲,今天你有的条件就是你可以把你自己的成功的标准输入给这个模型,或者输入给这个真的的产品,它就基于你的这些输入去形成一个新的工作流,专门为你完成你自己的产品定义啊、产品发布啊,包括你自己做营销、做社媒的这个过程。
而这个过程都可以更加自动化,因为我们至少30%~40%的企业可能就是SOLO ENTREPRENEUR,就是一人企业嘛。
而这个过程都可以更加自动化,因为我们至少30%~40%的企业可能就是SOLO ENTREPRENEUR,就是一人企业嘛。
我原来设计商品。
我原来设计商品。
我花一个礼拜三四天的时间,我觉得是值得。
我花一个礼拜三四天的时间,我觉得是值得。
但是我后边呢,还要花一个礼拜三四天的时间去做所有其他的细节的工作,要把它发到多个店铺上去,要在多个社交媒体上发内容,要在所有的平台上回CUSTOMER的FEEDBACK呀,在管理库存啊,再去进货等等这些事儿就很花时间。
但是我后边呢,还要花一个礼拜三四天的时间去做所有其他的细节的工作,要把它发到多个店铺上去,要在多个社交媒体上发内容,要在所有的平台上回CUSTOMER的FEEDBACK呀,在管理库存啊,再去进货等等这些事儿就很花时间。
那我们觉得所有这些事情也是可以基于XU WORK把它自动化掉,大部分工作人需要做比较少的交互。
那我们觉得所有这些事情也是可以基于XU WORK把它自动化掉,大部分工作人需要做比较少的交互。
就可以由 AI 通过多 agent 的方式去协同来完成。
就可以由 AI 通过多 agent 的方式去协同来完成。
OK 你指的中小企业,它是一个什么样的企业?
OK 你指的中小企业,它是一个什么样的企业?
比如说你说有百分之三十四十的这个中小企业,它是 solo entrepreneur。
比如说你说有百分之三十四十的这个中小企业,它是 solo entrepreneur。
这跟我理解的不太一样,因为我们以为阿里巴巴 B2B 的贸易应对的是很多的,比如说沃尔玛的后台供应链的 n 个环节。
这跟我理解的不太一样,因为我们以为阿里巴巴 B2B 的贸易应对的是很多的,比如说沃尔玛的后台供应链的 n 个环节。
所以我从国际站上来讲,它的用户肯定是分层的。
所以我从国际站上来讲,它的用户肯定是分层的。
一年可能采购几百万美金、上千万美金的也有,包括沃尔玛和AM总。
一年可能采购几百万美金、上千万美金的也有,包括沃尔玛和AM总。
我去看他也在国际站上采购,他们自己非常多的什么PACKAGING啊,你自己的产品也是在国际站上去做SOURCING。
我去看他也在国际站上采购,他们自己非常多的什么PACKAGING啊,你自己的产品也是在国际站上去做SOURCING。
整个金字塔结构的客户的群体也是有的,因为有非常多的比较SOLID的企业。
整个金字塔结构的客户的群体也是有的,因为有非常多的比较SOLID的企业。
其实从最开始也是SOUL TRIPPER开始去构建的嘛。
其实从最开始也是SOUL TRIPPER开始去构建的嘛。
我开始想做一个咖啡店,后来我这个商品做好了,我就变成了一个咖啡的连锁店。
我开始想做一个咖啡店,后来我这个商品做好了,我就变成了一个咖啡的连锁店。
再去进货,我就是不是给一家店进货,因为非常多的进货。
再去进货,我就是不是给一家店进货,因为非常多的进货。
就整个经济的形态其实就是这样,最底层有非常多个体经营者,在上边个体经营者就变成了一个比较大一点的商家,或者变成一个连锁商家,然后再往上就是我们大家能看到这些比较头部的这些solid entrepreneur。
就整个经济的形态其实就是这样,最底层有非常多个体经营者,在上边个体经营者就变成了一个比较大一点的商家,或者变成一个连锁商家,然后再往上就是我们大家能看到这些比较头部的这些solid entrepreneur。
然后我们这边的商家其实也是一样,他很多的大客户就是跟他伴随起来成长。
然后我们这边的商家其实也是一样,他很多的大客户就是跟他伴随起来成长。
所有那些企业都是发现了一个问题。
所有那些企业都是发现了一个问题。
然后定义一个产品,开始做 sourcing。
然后定义一个产品,开始做 sourcing。
慢慢他这个问题确实是个真问题,然后能 scale 了,那他的供应商就会跟他一起去成长。
慢慢他这个问题确实是个真问题,然后能 scale 了,那他的供应商就会跟他一起去成长。
所有这些实体经济的中小企业者,就是我们这个产品核心向他给的对象。
所有这些实体经济的中小企业者,就是我们这个产品核心向他给的对象。
所以我们就今天去看的面向他们,无论你给他一个 open cloud 还是给他一个 cloud cowork,它上面的一些产品基础的逻辑啊,包括的基础的开放的架构啊,还是其实有点难理解的。
所以我们就今天去看的面向他们,无论你给他一个 open cloud 还是给他一个 cloud cowork,它上面的一些产品基础的逻辑啊,包括的基础的开放的架构啊,还是其实有点难理解的。
你今天打开一个产品,从前面到后面告诉你,这有 skills 这有 hook 这有 agent 这有 connector 这是 plugin 我觉得大家有点晕。
你今天打开一个产品,从前面到后面告诉你,这有 skills 这有 hook 这有 agent 这有 connector 这是 plugin 我觉得大家有点晕。
对,你就是没点技术背景,你可能不理解每一个分层到底是什么意思,我为什么要点开每个东西去配一遍。
对,你就是没点技术背景,你可能不理解每一个分层到底是什么意思,我为什么要点开每个东西去配一遍。
而且我觉得对实体企业来说,这些没有接触过 ai 的人,你让他自己去搭一个 open cloud 都很难,就第一步就卡住了。
而且我觉得对实体企业来说,这些没有接触过 ai 的人,你让他自己去搭一个 open cloud 都很难,就第一步就卡住了。
对,就是核心还是我们希望这是个开箱即用的,比较简单的产品,能够解决他们日常一些 critical 的问题。
对,就是核心还是我们希望这是个开箱即用的,比较简单的产品,能够解决他们日常一些 critical 的问题。
同时 roi 一定是在它的合理的范围内。
同时 roi 一定是在它的合理的范围内。
嗯,所以你们的这个商业模式是怎么样的?
嗯,所以你们的这个商业模式是怎么样的?
就 exo。
就 exo。
exo 呢,我觉得是两部分,就是一部分比较好理解的就是 token based。
exo 呢,我觉得是两部分,就是一部分比较好理解的就是 token based。
就是我们自己有一些工具,他会去消耗一些 token 同时呢,我们有一些三方的 partner 比如 text 呀,hr payroll 啊和 finance 等等。
就是我们自己有一些工具,他会去消耗一些 token 同时呢,我们有一些三方的 partner 比如 text 呀,hr payroll 啊和 finance 等等。
他们接入到这个平台变成一个 sub agent 就也可以去消耗一些 token 这就是 token base 就基于使用。
他们接入到这个平台变成一个 sub agent 就也可以去消耗一些 token 这就是 token base 就基于使用。
但是可能设一个 cap 一个月20美金啊,还是多少,如果过了之后可能就不用了,或者说你就用 free 的额度,但是你可以基于自己的 usage 去提高自己的 cap。
但是可能设一个 cap 一个月20美金啊,还是多少,如果过了之后可能就不用了,或者说你就用 free 的额度,但是你可以基于自己的 usage 去提高自己的 cap。
第二大类的事情其实就是基于 marketplace 这些商业模式吧,因为你本身也是 demand 和 supply 那你的广告和你的服务中间产生的费用,比如说金流啊、物流啊等等。
第二大类的事情其实就是基于 marketplace 这些商业模式吧,因为你本身也是 demand 和 supply 那你的广告和你的服务中间产生的费用,比如说金流啊、物流啊等等。
可以继续成为你原来的这个商业模式,其实它是两个轨道并行。
可以继续成为你原来的这个商业模式,其实它是两个轨道并行。
对,我觉得佣金模式还比较好理解,但是广告模式就比如说在 ai 到来以后,如果大家现在比如说我连搜索跟 sourcing 都开始在 ai 软件里面去完成了的话。
对,我觉得佣金模式还比较好理解,但是广告模式就比如说在 ai 到来以后,如果大家现在比如说我连搜索跟 sourcing 都开始在 ai 软件里面去完成了的话。
那传统的 marketplace 它的广告它会受到冲击吗?
那传统的 marketplace 它的广告它会受到冲击吗?
展开剩余字幕(还有 277 条)
我觉得首先呢,就是 display 那种广告肯定就是没有什么太大意义,就大家更多的还是 performance based 的广告为主。
我觉得首先呢,就是 display 那种广告肯定就是没有什么太大意义,就大家更多的还是 performance based 的广告为主。
我们现在去看到呢,AI 比如对于阿里巴巴 dot com 来讲,它两方面都有帮助。
我们现在去看到呢,AI 比如对于阿里巴巴 dot com 来讲,它两方面都有帮助。
第一个方面就是它让搜索量变多了。
第一个方面就是它让搜索量变多了。
AI 让搜索量变多了,这个怎么理解?
AI 让搜索量变多了,这个怎么理解?
因为它更好的理解了你的意图。
因为它更好的理解了你的意图。
就是你原来可能输一个非常短的关键词,在非常多的供应商里面去找。
就是你原来可能输一个非常短的关键词,在非常多的供应商里面去找。
现在你可以比较丰富的去表达你到底想要的是什么,把你自己想要的各种参数啊、需求、上下文限制,你把它都说清楚。
现在你可以比较丰富的去表达你到底想要的是什么,把你自己想要的各种参数啊、需求、上下文限制,你把它都说清楚。
这样我就可以帮助你找到更精准的供应商。
这样我就可以帮助你找到更精准的供应商。
因为你有多模态的输入,语音啊,还是图片啊等等,你可以拍一个照片,或者拍一个你自己原来做的DESIGN PACK或者是PDF上传,我就可以去理解,然后更好的匹配供应商。
因为你有多模态的输入,语音啊,还是图片啊等等,你可以拍一个照片,或者拍一个你自己原来做的DESIGN PACK或者是PDF上传,我就可以去理解,然后更好的匹配供应商。
而且原来匹配供应商很多是基于标题啊、关键词啊等等。
而且原来匹配供应商很多是基于标题啊、关键词啊等等。
现在匹配供应商都是寄居于他的商品的全部上下文信息,也包括他上传的所有私有数据库的这些信息。
现在匹配供应商都是寄居于他的商品的全部上下文信息,也包括他上传的所有私有数据库的这些信息。
那些里面更多的是他工厂的能力啊、CERTIFICATE什么用户的USE CASE啊等等,就是做更好的匹配。
那些里面更多的是他工厂的能力啊、CERTIFICATE什么用户的USE CASE啊等等,就是做更好的匹配。
所以因为你给他的结果更好了,所以他愿意更多的进来去搜索跟交互。
所以因为你给他的结果更好了,所以他愿意更多的进来去搜索跟交互。
第二个呢,就是对广告本身我们觉得也有帮助,对广告本身呢一部分你可以理解,就是因为搜索量变多了,供需匹配变大。
第二个呢,就是对广告本身我们觉得也有帮助,对广告本身呢一部分你可以理解,就是因为搜索量变多了,供需匹配变大。
能生产同一个商品,绝对不是全世界只有一个人。
能生产同一个商品,绝对不是全世界只有一个人。
他可能是有非常多,比如说十个、一百个能生产类似产品,给出核心价格的。
他可能是有非常多,比如说十个、一百个能生产类似产品,给出核心价格的。
这个时候呢,我们告诉他这是一条广告,首先他是知道的。
这个时候呢,我们告诉他这是一条广告,首先他是知道的。
第二个呢,这个广告出现它的原因是什么?
第二个呢,这个广告出现它的原因是什么?
它到底匹配了你哪些标准?
它到底匹配了你哪些标准?
所以这个商家会出现在这个广告位上。
所以这个商家会出现在这个广告位上。
这时候的买家也会有意愿去跟这个商家去交流。
这时候的买家也会有意愿去跟这个商家去交流。
就我们自己看到整个今年的,只要从搜索跟广告来讲,也是今年我们整个增长比较快的两个轨道。
就我们自己看到整个今年的,只要从搜索跟广告来讲,也是今年我们整个增长比较快的两个轨道。
嗯,我理解您刚刚提到的这一层的AI,它还是传统AI,就是基于算法的精准推荐。
嗯,我理解您刚刚提到的这一层的AI,它还是传统AI,就是基于算法的精准推荐。
那现在有了新型的生成式AI,就像AXO这样的一个工具。
那现在有了新型的生成式AI,就像AXO这样的一个工具。
因为我昨天就直接说我要订一个硅谷101周边的纪念品,帮我匹配一些供应商。
因为我昨天就直接说我要订一个硅谷101周边的纪念品,帮我匹配一些供应商。
它下面有给我呈现很多的供应商,但是它最终还是有给我选择一两条,包括有发邮件来联系我。
它下面有给我呈现很多的供应商,但是它最终还是有给我选择一两条,包括有发邮件来联系我。
我理解现在我已经可以通过这样的一个 AI 工具直接完成一个需求了。
我理解现在我已经可以通过这样的一个 AI 工具直接完成一个需求了。
当然,比如说我偶尔也会想要去网站上,或者下面很多的呈现里面去找一找有没有设计更有趣的、更好的。
当然,比如说我偶尔也会想要去网站上,或者下面很多的呈现里面去找一找有没有设计更有趣的、更好的。
但整体来看,AI 匹配的需求更精准了,广告位就减少了。
但整体来看,AI 匹配的需求更精准了,广告位就减少了。
对,这个理解肯定是对的。
对,这个理解肯定是对的。
刚才你那个事情可以分两部分,第一部分就是你想找一个周边。
刚才你那个事情可以分两部分,第一部分就是你想找一个周边。
他帮你设计周边这个过程肯定是个 TOKEN base 的商业模式,因为设计的过程其实还不涉及到供需匹配。
他帮你设计周边这个过程肯定是个 TOKEN base 的商业模式,因为设计的过程其实还不涉及到供需匹配。
后面进入到供需匹配过程,你原来可能给你1000个结果,现在给你5个结果。
后面进入到供需匹配过程,你原来可能给你1000个结果,现在给你5个结果。
这个5个结果过程中,如果要做广告,那它的核心跟原来的杠杆啊balance,就是它必须是个更精准的结果,它不能是像原来一样不精准,然后同时给你硬塞广告,这肯定没有意义。
这个5个结果过程中,如果要做广告,那它的核心跟原来的杠杆啊balance,就是它必须是个更精准的结果,它不能是像原来一样不精准,然后同时给你硬塞广告,这肯定没有意义。
现在有一个更大的数据集,其实也验证就是Google,就原来大家对它担心也是说AI OVERVIEW啊,或者这个AI MODE会不会冲击它原来的广告,其实事实上你从它最近这个财报来去看,其实它既做到了用户的停留时长和QUARRY数变多。
现在有一个更大的数据集,其实也验证就是Google,就原来大家对它担心也是说AI OVERVIEW啊,或者这个AI MODE会不会冲击它原来的广告,其实事实上你从它最近这个财报来去看,其实它既做到了用户的停留时长和QUARRY数变多。
同时也做到了他的广告的收入变高,就是因为他的广告更精准,点的人更多,更多的广告主愿意为这条付费,而不像原来,大家反正都是,反正 cpc 都搞一堆,但是点完了之后呢,这个用户的意图啊,或者跟你的匹配的效率很差。
同时也做到了他的广告的收入变高,就是因为他的广告更精准,点的人更多,更多的广告主愿意为这条付费,而不像原来,大家反正都是,反正 cpc 都搞一堆,但是点完了之后呢,这个用户的意图啊,或者跟你的匹配的效率很差。
对广告主来讲就也是一种浪费。
对广告主来讲就也是一种浪费。
嗯。
嗯。
你觉得未来的商业模式会变成什么样?
你觉得未来的商业模式会变成什么样?
因为我觉得这可能是一个短暂的过渡状态,因为现在基于生成式 AI 的技术你匹配给他的东西更加精准了以后,其实如果我们说按结果付费跟这个 ROI 的转换,他肯定是提升的。
因为我觉得这可能是一个短暂的过渡状态,因为现在基于生成式 AI 的技术你匹配给他的东西更加精准了以后,其实如果我们说按结果付费跟这个 ROI 的转换,他肯定是提升的。
那在ROI提升的过程中,大家都是受益者。
那在ROI提升的过程中,大家都是受益者。
比如说阿里、谷歌,甚至是商家都是受益者。
比如说阿里、谷歌,甚至是商家都是受益者。
但是长远来看,我觉得在大家效率都提升的状况下,它是会被慢慢拉平的。
但是长远来看,我觉得在大家效率都提升的状况下,它是会被慢慢拉平的。
然后我们也看到新的AI NATIVE的应用也开始出现了,像EXCEL它其实就是一种未来。
然后我们也看到新的AI NATIVE的应用也开始出现了,像EXCEL它其实就是一种未来。
你觉得整个的商业模式它会变成什么样呢?
你觉得整个的商业模式它会变成什么样呢?
至少互联网这个时代,商业模式大概就四到五种。
至少互联网这个时代,商业模式大概就四到五种。
然后有一些商业模式呢,它也会进入到AI这个时代里边。
然后有一些商业模式呢,它也会进入到AI这个时代里边。
这件事儿的核心的逻辑还是创造什么价值嘛?
这件事儿的核心的逻辑还是创造什么价值嘛?
就是有一些价值,你比如我帮助你做了一个更好的设计,帮助你做了一个更好的对全世界的SURVEY。
就是有一些价值,你比如我帮助你做了一个更好的设计,帮助你做了一个更好的对全世界的SURVEY。
那可能它这个价值的比较好的衡量方式就是TOKEN BASE方式。
那可能它这个价值的比较好的衡量方式就是TOKEN BASE方式。
不过呢,最终大家要衡量的赢的标准就是我单位TOKEN的智力密度更高,或者我单位TOKEN我产生的价值更高。
不过呢,最终大家要衡量的赢的标准就是我单位TOKEN的智力密度更高,或者我单位TOKEN我产生的价值更高。
那这类的服务就会胜出。
那这类的服务就会胜出。
那它还是一个相对来讲是以USAGE BASE的商业模式。
那它还是一个相对来讲是以USAGE BASE的商业模式。
第二个呢,比如拿阿里巴巴COM为例,尤其是PERFORMANCE的广告,从长期来讲,它可能也是一个存在的商业模式,因为你最终也有一个供需匹配的过程,就是有人愿意为了更好的需求让利。
第二个呢,比如拿阿里巴巴COM为例,尤其是PERFORMANCE的广告,从长期来讲,它可能也是一个存在的商业模式,因为你最终也有一个供需匹配的过程,就是有人愿意为了更好的需求让利。
EITHER我是商品上张力,OR是我愿意用广告的方式去给他们做更多的展现。
EITHER我是商品上张力,OR是我愿意用广告的方式去给他们做更多的展现。
这个商业模式可能也会持续成立。
这个商业模式可能也会持续成立。
然后第三个呢,就是基于平台测的所有供应链的服务。
然后第三个呢,就是基于平台测的所有供应链的服务。
你比如说我们提供担保交易的服务,也有一定的TAKE RATE,但这个非常少,可能就一到两个点。
你比如说我们提供担保交易的服务,也有一定的TAKE RATE,但这个非常少,可能就一到两个点。
但这个担保交易的服务,它核心是类似一个保险的服务,当你跟他做了若三次交易。
但这个担保交易的服务,它核心是类似一个保险的服务,当你跟他做了若三次交易。
如果中间出现 dispute,平台要进来去看是谁的问题。
如果中间出现 dispute,平台要进来去看是谁的问题。
首先平台要去给补偿,然后再去追另外一侧的问题。
首先平台要去给补偿,然后再去追另外一侧的问题。
那这个就是平台提供的额外服务,本身这个产品在供应链上。
那这个就是平台提供的额外服务,本身这个产品在供应链上。
无论是在担保交易啊,还是你在做 payment terms,还是在做物流啊等等,它跟原来的商业模式也是一样的,就只不过呢,你把这个 scale 变大了,就全世界30万亿美金的交易额。
无论是在担保交易啊,还是你在做 payment terms,还是在做物流啊等等,它跟原来的商业模式也是一样的,就只不过呢,你把这个 scale 变大了,就全世界30万亿美金的交易额。
那从国际站今天来讲,大概700亿美金,那其实渗透率还非常少,就是让更多的中小企业可以参与到全球的交易里面。
那从国际站今天来讲,大概700亿美金,那其实渗透率还非常少,就是让更多的中小企业可以参与到全球的交易里面。
我们可以给他去提供跟他现在这个世界比更高效的服务,那你就可以带来更多的增量 GDP 和增量价值。
我们可以给他去提供跟他现在这个世界比更高效的服务,那你就可以带来更多的增量 GDP 和增量价值。
所以他的商业模式有一些是现有世界就可以自动延续到 agent 世界,当然也有一些 agent 的世界里边,他基于 usage 的使用可能比 SaaS 的基于坐席的使用,此时此刻就是领先的。
所以他的商业模式有一些是现有世界就可以自动延续到 agent 世界,当然也有一些 agent 的世界里边,他基于 usage 的使用可能比 SaaS 的基于坐席的使用,此时此刻就是领先的。
那可能这种模式未来就会持续超越,或者占更大的份额。
那可能这种模式未来就会持续超越,或者占更大的份额。
嗯,我觉得这个其实整体上来看,就是如何让这个服务跟效率再优化一层,基于现在的新技术。
嗯,我觉得这个其实整体上来看,就是如何让这个服务跟效率再优化一层,基于现在的新技术。
没错。
没错。
那你觉得在这样的一个过程中,A I的核心优势是什么呢?
那你觉得在这样的一个过程中,A I的核心优势是什么呢?
A I比如说X O这个产品,你们做跟基于阿里的背景做,跟一个创业公司做,它最核心的优势有什么不一样?
A I比如说X O这个产品,你们做跟基于阿里的背景做,跟一个创业公司做,它最核心的优势有什么不一样?
我觉得比较好理解的部分呢,就是因为阿里巴巴点com是阿里集团的第一块业务嘛,大概做这件事情有个26年左右的积累。
我觉得比较好理解的部分呢,就是因为阿里巴巴点com是阿里集团的第一块业务嘛,大概做这件事情有个26年左右的积累。
在平台侧,其实每天有上百万、上千万的沟通啊、query 啊、transaction 在发生,这些呢都是 signal,我会帮助你这个系统去完成 reinforcement learning 的过程。
在平台侧,其实每天有上百万、上千万的沟通啊、query 啊、transaction 在发生,这些呢都是 signal,我会帮助你这个系统去完成 reinforcement learning 的过程。
而且因为它可以形成一个闭环,所以在这一方面上,你能完成的事情可能效率会更好。
而且因为它可以形成一个闭环,所以在这一方面上,你能完成的事情可能效率会更好。
啊,另外呢,就是AXO或者是我们整个阿里巴巴DOTCOM这个产品,其实也是背靠阿里集团嘛。
啊,另外呢,就是AXO或者是我们整个阿里巴巴DOTCOM这个产品,其实也是背靠阿里集团嘛。
就我们跟千问有比较多的合作,要确定呢,我们整个对于模型的理解和使用,还是可以保持一定的领先性。
就我们跟千问有比较多的合作,要确定呢,我们整个对于模型的理解和使用,还是可以保持一定的领先性。
同时呢,我们也会加入大量的我们自己对于模型的中期训练和后期训练的过程,也会注入一些数据,进入到早期训练过程,让它领先的壁垒越来越大。
同时呢,我们也会加入大量的我们自己对于模型的中期训练和后期训练的过程,也会注入一些数据,进入到早期训练过程,让它领先的壁垒越来越大。
同时呢,因为有更多的人用,其实这个 AGENTIC的产品也有数据飞轮。
同时呢,因为有更多的人用,其实这个 AGENTIC的产品也有数据飞轮。
有更多的人用它就会记住更多的工作流、更多的工具,在什么情况下可以有更好的表现。
有更多的人用它就会记住更多的工作流、更多的工具,在什么情况下可以有更好的表现。
这样的话,你整个这个产品会进入到下一个飞轮去转的过程。
这样的话,你整个这个产品会进入到下一个飞轮去转的过程。
因为本身我们还是比较聚焦,我觉得不是跟现有的大部分的AI的产品面向同一波客户。
因为本身我们还是比较聚焦,我觉得不是跟现有的大部分的AI的产品面向同一波客户。
当然我们这些客户可能也更挑剔。
当然我们这些客户可能也更挑剔。
从换一个角度来讲呢,可能 budget 他们也更少一些,所以对于 roi 会更敏感,也会迫使我们把我们整个 tokenization,就是我们正好这个 token 经济学。
从换一个角度来讲呢,可能 budget 他们也更少一些,所以对于 roi 会更敏感,也会迫使我们把我们整个 tokenization,就是我们正好这个 token 经济学。
要跟其他人的 token 经济学比起来,我们需要更加激励的是单位 token 的治理密度和单位 token 能产生的价值。
要跟其他人的 token 经济学比起来,我们需要更加激励的是单位 token 的治理密度和单位 token 能产生的价值。
我觉得这也是会不断去推动我们这个系统,符合这个群体,能够对这个前提产生更大价值。
我觉得这也是会不断去推动我们这个系统,符合这个群体,能够对这个前提产生更大价值。
嗯,对,总结一下你们的核心优势就是常年积累的方法论。
嗯,对,总结一下你们的核心优势就是常年积累的方法论。
自家也有研究模型,它可以从预训练阶段就植入这些数据。
自家也有研究模型,它可以从预训练阶段就植入这些数据。
还有本身数据它也是一个壁垒。
还有本身数据它也是一个壁垒。
最后还有一个数据飞轮。
最后还有一个数据飞轮。
我在听到你们这个产品的时候,我觉得跟现在的垂直的这些模型厂商比起来,对于TO B的商家,这一定是一个更好用的产品的。
我在听到你们这个产品的时候,我觉得跟现在的垂直的这些模型厂商比起来,对于TO B的商家,这一定是一个更好用的产品的。
但是据我观察,像亚马逊他们内部也在做类似的事情。
但是据我观察,像亚马逊他们内部也在做类似的事情。
你觉得未来比如说亚马逊它也推出一个B TO B的这种垂直领域的AI应用,会是你们的竞争对手吗?
你觉得未来比如说亚马逊它也推出一个B TO B的这种垂直领域的AI应用,会是你们的竞争对手吗?
对于,就是我们今天想定位的这个产品,它想要解决的问题来讲,我觉得我们自己还是比较有信心。
对于,就是我们今天想定位的这个产品,它想要解决的问题来讲,我觉得我们自己还是比较有信心。
对于中小企业,从设计的产品到自己的 daily operation 的过程。
对于中小企业,从设计的产品到自己的 daily operation 的过程。
但是呢,如果说未来 b to b 会走向 a to a 嘛,就是 agent to agent 不光是买家 agent to 卖家 agent,也包括用户自己,他的多个 agent 可能也是一个协同的过程。
但是呢,如果说未来 b to b 会走向 a to a 嘛,就是 agent to agent 不光是买家 agent to 卖家 agent,也包括用户自己,他的多个 agent 可能也是一个协同的过程。
最终呢,可能胜出的一个方式就是你在一些方向上做的非常好,同时又是一个高频的工具,那你成为一个 master agent 同时这个企业还有很多其他的 agent 的需求,作为 sub agent 的需求,这些 agent 之间可以 talk。
最终呢,可能胜出的一个方式就是你在一些方向上做的非常好,同时又是一个高频的工具,那你成为一个 master agent 同时这个企业还有很多其他的 agent 的需求,作为 sub agent 的需求,这些 agent 之间可以 talk。
可以去协同,共同帮助这个中小企业完成服务。
可以去协同,共同帮助这个中小企业完成服务。
亚马逊能够做的比较好的,你比如说它自己的后台系统,本来就很复杂,agent 之后让它可能更管用一些。
亚马逊能够做的比较好的,你比如说它自己的后台系统,本来就很复杂,agent 之后让它可能更管用一些。
我觉得这个方向它应该是一个比较好的 vertical,它自己也有优势。
我觉得这个方向它应该是一个比较好的 vertical,它自己也有优势。
但如果你要把它泛化到,我其实要经营多平台。
但如果你要把它泛化到,我其实要经营多平台。
我要帮助客户去做一个更广泛的产品设计,并且我要他让他利用全球供应链。
我要帮助客户去做一个更广泛的产品设计,并且我要他让他利用全球供应链。
我觉得这个方向来讲,我们肯定起步比较早,并且在这方面投入的精力也会更多一些,knowhow 也会更多一些。
我觉得这个方向来讲,我们肯定起步比较早,并且在这方面投入的精力也会更多一些,knowhow 也会更多一些。
嗯嗯。
嗯嗯。
如果现在你自己去评估你们做这个产品的几个最核心的要素,跟你评估 EXO 这个产品做得好不好,你核心在抓的点是哪几个?
如果现在你自己去评估你们做这个产品的几个最核心的要素,跟你评估 EXO 这个产品做得好不好,你核心在抓的点是哪几个?
因为它比较本质的问题不是你要消耗多少 TOKEN。
因为它比较本质的问题不是你要消耗多少 TOKEN。
而是你到底能产生多少价值。
而是你到底能产生多少价值。
一个比较显性的一个数据指标,可能就是RETENTION嘛。
一个比较显性的一个数据指标,可能就是RETENTION嘛。
那这个用户持续地用这个产品,帮助做更多的设计、更多的采购,那就是一个比较好的数字信号。
那这个用户持续地用这个产品,帮助做更多的设计、更多的采购,那就是一个比较好的数字信号。
对它其他的日常的这些工具的使用,其实也是一样。
对它其他的日常的这些工具的使用,其实也是一样。
它既有广度上的,我们希望定义有更多人用;另外呢,就是在每一个垂直的工具上,我们要有更多的TASK来去衡量。
它既有广度上的,我们希望定义有更多人用;另外呢,就是在每一个垂直的工具上,我们要有更多的TASK来去衡量。
那这个TASK最后的完成度和用户的采纳度是高的,并且它能持续使用。
那这个TASK最后的完成度和用户的采纳度是高的,并且它能持续使用。
然后另外一个层面就是从经济的角度来讲,我们还希望单位 token 的智力和单位 token 的性价比越来越高,这样这个客户就可以越来越越好的 roi 的方式去使用这个产品。
然后另外一个层面就是从经济的角度来讲,我们还希望单位 token 的智力和单位 token 的性价比越来越高,这样这个客户就可以越来越越好的 roi 的方式去使用这个产品。
我觉得这些都是我们想衡量这件事的成功的标准。
我觉得这些都是我们想衡量这件事的成功的标准。
就是唯一可能不是标准的就是一共用了多少 token 我觉得这个还是一个比较简单的数学,因为一共用了多少 token 你很可能大家努力的方向就是我多让你浪费点 token。
就是唯一可能不是标准的就是一共用了多少 token 我觉得这个还是一个比较简单的数学,因为一共用了多少 token 你很可能大家努力的方向就是我多让你浪费点 token。
对,所以其实核心还是怎么样把这个产品做得好用。
对,所以其实核心还是怎么样把这个产品做得好用。
我们原来呢,这不光这个是对 agent 啊,其实对于整个原来阿里巴巴 dot com 我们也是希望。
我们原来呢,这不光这个是对 agent 啊,其实对于整个原来阿里巴巴 dot com 我们也是希望。
能让跨境B2B就像ONLINE SHOPPING一样简单,就是你做ONLINE SHOPPING,大家都知道是个什么体验嘛。
能让跨境B2B就像ONLINE SHOPPING一样简单,就是你做ONLINE SHOPPING,大家都知道是个什么体验嘛。
但是跨境B2B呢?
但是跨境B2B呢?
可能要细分有28个步骤,就是每个步骤可能跟TO C比起来的都要复杂很多。
可能要细分有28个步骤,就是每个步骤可能跟TO C比起来的都要复杂很多。
从你最开始形成这个IDEA,一直到完成整个交货的过程,因为还有国家跟国家之间、币种之间啊等等这些大的差异吧。
从你最开始形成这个IDEA,一直到完成整个交货的过程,因为还有国家跟国家之间、币种之间啊等等这些大的差异吧。
我们就说呢,谁先付钱,怎么付钱,能够保证你的资金安全等等。
我们就说呢,谁先付钱,怎么付钱,能够保证你的资金安全等等。
这都是在整个这大的28个步骤跟流程里边,我们逐步帮他去做数字化的过程。
这都是在整个这大的28个步骤跟流程里边,我们逐步帮他去做数字化的过程。
嗯,简单来说,其实这个产业整个的产业链,包括你们沉淀的方法论这些步骤。
嗯,简单来说,其实这个产业整个的产业链,包括你们沉淀的方法论这些步骤。
已经非常完善了,就是你们是想把所有从开始到结尾的整个的过程,闭环的流程全部提供给这些商家。
已经非常完善了,就是你们是想把所有从开始到结尾的整个的过程,闭环的流程全部提供给这些商家。
没错。
没错。
嗯,对,最近因为大家在讨论 ai 跟 ai native 也非常多啊。
嗯,对,最近因为大家在讨论 ai 跟 ai native 也非常多啊。
你们现在在招聘中会偏向于什么样的人?
你们现在在招聘中会偏向于什么样的人?
因为有一些是比较好定义和量化的,比如说关于模型的训练,关于infra呀,关于算法呀等等,就是大家对于自己需要的人才都有比较清晰的画像嘛,那那这些人进来之前可能你自己的paper或者你自己的research或者你自己在开源社区里边的贡献就已经能说明很多问题了。
因为有一些是比较好定义和量化的,比如说关于模型的训练,关于infra呀,关于算法呀等等,就是大家对于自己需要的人才都有比较清晰的画像嘛,那那这些人进来之前可能你自己的paper或者你自己的research或者你自己在开源社区里边的贡献就已经能说明很多问题了。
这个时候呢,可能学历还不是最关键的问题。
这个时候呢,可能学历还不是最关键的问题。
但如果你已经能拿得出来比较 SOLID 的这些工作,那其实我们更多的还是基于你这个 SOLID 的工作来去探讨他的面试的过程,可能就跟原来不一样了。
但如果你已经能拿得出来比较 SOLID 的这些工作,那其实我们更多的还是基于你这个 SOLID 的工作来去探讨他的面试的过程,可能就跟原来不一样了。
那面试过程就是你打开这个 PAPER,大家来一起来讨论 PAPER,去看你在这里边真正的原创的思想和贡献可能是什么。
那面试过程就是你打开这个 PAPER,大家来一起来讨论 PAPER,去看你在这里边真正的原创的思想和贡献可能是什么。
然后另外呢,就是对 AI 用得比较充分的这些年轻人吧,这个事情呢,我觉得比较难有一个量化的定义,就是有一些是可以非常 SOLID 的判断。
然后另外呢,就是对 AI 用得比较充分的这些年轻人吧,这个事情呢,我觉得比较难有一个量化的定义,就是有一些是可以非常 SOLID 的判断。
有一些可能更多的是基于他平时对于工具啊,他对这件事情的理解,他对于未来的预判。
有一些可能更多的是基于他平时对于工具啊,他对这件事情的理解,他对于未来的预判。
你像产品经理,我们进来是希望他设计这个产品是一个面向未来六个月模型能力的产品,那就意味着你这个人对于未来六个月模型可能走向的方向和他的能力要有个基础的预判,这样你这个产品在上线的时候是可以最好的去利用当下的这个能力。
你像产品经理,我们进来是希望他设计这个产品是一个面向未来六个月模型能力的产品,那就意味着你这个人对于未来六个月模型可能走向的方向和他的能力要有个基础的预判,这样你这个产品在上线的时候是可以最好的去利用当下的这个能力。
这要求很高啊。
这要求很高啊。
比较高,所以我们就说也是在一个摸索过程嘛。
比较高,所以我们就说也是在一个摸索过程嘛。
然后呢,因为有一些工种慢慢的融合在一起了。
然后呢,因为有一些工种慢慢的融合在一起了。
你比如说,原来产品经理写PRD,然后交互设计师过来画交互,然后技术人员给你做的跟交互设计出来的一模一样。
你比如说,原来产品经理写PRD,然后交互设计师过来画交互,然后技术人员给你做的跟交互设计出来的一模一样。
这事儿就结束了。
这事儿就结束了。
但这里面的问题就在,做出来跟那个交互设计一模一样是不是好的?
但这里面的问题就在,做出来跟那个交互设计一模一样是不是好的?
就很难讲。
就很难讲。
中间就开始有各种各样的掉链子的过程,就是它本身设计的就不合理。
中间就开始有各种各样的掉链子的过程,就是它本身设计的就不合理。
你给它做一个百分之百还原的,可能也是不合理的。
你给它做一个百分之百还原的,可能也是不合理的。
今天呢,可能三个角色就慢慢融合成两个角色,或者融合成一个角色。
今天呢,可能三个角色就慢慢融合成两个角色,或者融合成一个角色。
这个人就要对这个闭环的结果负责任。
这个人就要对这个闭环的结果负责任。
那好处就是呢,你的效率就更高了。
那好处就是呢,你的效率就更高了。
我相信现在engineer编程的模式跟原来肯定有质的差别。
我相信现在engineer编程的模式跟原来肯定有质的差别。
我前两天在一个硅谷创业公司跟他们聊天的时候,外面就比较喧哗,CEO出去看了看,说嗯,Anthropic Down。
我前两天在一个硅谷创业公司跟他们聊天的时候,外面就比较喧哗,CEO出去看了看,说嗯,Anthropic Down。
确实是那天大概Anthropic波动了三个小时,在那三个小时中,硅谷的工程师全部会写代码。
确实是那天大概Anthropic波动了三个小时,在那三个小时中,硅谷的工程师全部会写代码。
也没有人 coding 现在不是去那去写代码嘛,大家其实都是基于上下文去给输入,然后模型生成代码,而且生成的越多,其实你越看不懂,你想做 code review 啊等等也很困难。
也没有人 coding 现在不是去那去写代码嘛,大家其实都是基于上下文去给输入,然后模型生成代码,而且生成的越多,其实你越看不懂,你想做 code review 啊等等也很困难。
这时候呢,突然这个工具不能用了,大家就 panic 但是某一个角度来讲也是,就今天肯定做工程的方式方法跟之前比起来就有很大的差异。
这时候呢,突然这个工具不能用了,大家就 panic 但是某一个角度来讲也是,就今天肯定做工程的方式方法跟之前比起来就有很大的差异。
你现在会要求你的团队用这些 coding agent 吗?
你现在会要求你的团队用这些 coding agent 吗?
我觉得呢,不用要求,大家肯定都在用。
我觉得呢,不用要求,大家肯定都在用。
嗯,或者他们用的时候你是一个什么态度?
嗯,或者他们用的时候你是一个什么态度?
就是你觉得 ok 结果说话。
就是你觉得 ok 结果说话。
还是也会看一看大家是怎么用的。
还是也会看一看大家是怎么用的。
我觉得大家从方向上来讲,肯定没有人反对,这是一个未来的方向。
我觉得大家从方向上来讲,肯定没有人反对,这是一个未来的方向。
无论是硅谷啊,还是中国的这些大厂啊,还是这些创业公司。
无论是硅谷啊,还是中国的这些大厂啊,还是这些创业公司。
只不过呢,可能不同的公司在你的工程的环境里边会有一些差异。
只不过呢,可能不同的公司在你的工程的环境里边会有一些差异。
比如我自己看到的一些和我们自己内部衡量的成功的标准嘛,我可以分享一下。
比如我自己看到的一些和我们自己内部衡量的成功的标准嘛,我可以分享一下。
第一个核心的问题就是你也要给这个工程师设计一个 agent 嘛,最上面可能是个 master agent。
第一个核心的问题就是你也要给这个工程师设计一个 agent 嘛,最上面可能是个 master agent。
这 master agent 的下面你要管理很多 sub agent 有的是写 code 的,有的读文档呢,有做 code review 的,有做 check in 的等等。
这 master agent 的下面你要管理很多 sub agent 有的是写 code 的,有的读文档呢,有做 code review 的,有做 check in 的等等。
已经用到这种程度了。
已经用到这种程度了。
对,那就是你要有这么一套 agent 的 framework 去帮助你的工程师去管理你这些代码。
对,那就是你要有这么一套 agent 的 framework 去帮助你的工程师去管理你这些代码。
然后你要设置 garail 就你这沙箱环境要有,你不要写个代码,本来是个内部用的,然后就开放到外部去了等等,这些都是很基础的问题。
然后你要设置 garail 就你这沙箱环境要有,你不要写个代码,本来是个内部用的,然后就开放到外部去了等等,这些都是很基础的问题。
大家保证在写代码,代码在做 review 还在 check in 的时候,还是要有相对来讲比较高的标准吧。
大家保证在写代码,代码在做 review 还在 check in 的时候,还是要有相对来讲比较高的标准吧。
第二个呢,就是大家平时去做工程的环境,我看到一个公司蛮有意思,它也是个做量化的公司。
第二个呢,就是大家平时去做工程的环境,我看到一个公司蛮有意思,它也是个做量化的公司。
做量化公司里边,本身上线的代码都是模型嘛,各种模型在炒股票。
做量化公司里边,本身上线的代码都是模型嘛,各种模型在炒股票。
几个 researcher 在一个 slack 里边聊,就聊到一定程度了,at 这个 agent 说我们谈完了,你看一下,然后去写代码。
几个 researcher 在一个 slack 里边聊,就聊到一定程度了,at 这个 agent 说我们谈完了,你看一下,然后去写代码。
哎。
哎。
这个方法很有意思。
这个方法很有意思。
然后这 agent 进来就读一下啊,大家想对这个模型怎么去改变,他读完了,我明白了,写个文档。
然后这 agent 进来就读一下啊,大家想对这个模型怎么去改变,他读完了,我明白了,写个文档。
m d,然后去生成一段代码,我生成好了,你们来看一下对不对?
m d,然后去生成一段代码,我生成好了,你们来看一下对不对?
就有可能人去看一下,有可能人不看就commit掉,然后看结果。
就有可能人去看一下,有可能人不看就commit掉,然后看结果。
因为你可以保证一定量的灰度,它不会影响全局嘛?
因为你可以保证一定量的灰度,它不会影响全局嘛?
对于整个工程的环境的改变,其实是一个很重要一部分。
对于整个工程的环境的改变,其实是一个很重要一部分。
这确保你们在这个公司里边是用一个比较适应你们这个工程环境和应用环境里边更好的去写代码环境。
这确保你们在这个公司里边是用一个比较适应你们这个工程环境和应用环境里边更好的去写代码环境。
除了工程以外,我觉得还有很多很重要的方面,就是刚才你提到了一个很好的问题啊,就是我们衡量 ai 的成功与否,可能有几个标准。
除了工程以外,我觉得还有很多很重要的方面,就是刚才你提到了一个很好的问题啊,就是我们衡量 ai 的成功与否,可能有几个标准。
一个肯定不会用的标准,就是代码量是多少。
一个肯定不会用的标准,就是代码量是多少。
你可以生成全世界最多的垃圾代码,不改变任何商业结果,这肯定是大家最不想要的事情。
你可以生成全世界最多的垃圾代码,不改变任何商业结果,这肯定是大家最不想要的事情。
所以我们可能呢,从量化上衡量,包括我们每个季度会有300个IDEA,就是我们已经TRACK了四年,基本上我们人类产生IDEA的瓶颈大概就是ALIBABA.
所以我们可能呢,从量化上衡量,包括我们每个季度会有300个IDEA,就是我们已经TRACK了四年,基本上我们人类产生IDEA的瓶颈大概就是ALIBABA.
COM这些同学们一个季度有300个主意。
COM这些同学们一个季度有300个主意。
当然这个主意是从OKR最开始往下去分解的,我们有目标,然后基于这个目标,我们觉得。
当然这个主意是从OKR最开始往下去分解的,我们有目标,然后基于这个目标,我们觉得。
有哪些事件可以有突破,然后进入到每个季度开始写这些IDEA的文档。
有哪些事件可以有突破,然后进入到每个季度开始写这些IDEA的文档。
在这300个IDEA大概其会有一百五十个上限,还有一百五十个做不过来。
在这300个IDEA大概其会有一百五十个上限,还有一百五十个做不过来。
所以就是按照STACK RANKING去排优先级,这一百五十个上限的IDEA里边可能有五十个是WORK,就没有带来的就是不WORK。
所以就是按照STACK RANKING去排优先级,这一百五十个上限的IDEA里边可能有五十个是WORK,就没有带来的就是不WORK。
所以最终你可能从300个IDEA开始,最后有50个是WORK。
所以最终你可能从300个IDEA开始,最后有50个是WORK。
那我们就希望呢,有AI帮助你实际上上线产生BISIMPACT,产生实际的商业价值和客户价值的数量是不是能变多啊?
那我们就希望呢,有AI帮助你实际上上线产生BISIMPACT,产生实际的商业价值和客户价值的数量是不是能变多啊?
你从50个到100个,那咱们就是百分之百增长。
你从50个到100个,那咱们就是百分之百增长。
你要50个到300个,那就到人类的上限了。
你要50个到300个,那就到人类的上限了。
那我们产生IDEA可能也要有更好的方法,就现在此时此刻,人类还不是上限嘛。
那我们产生IDEA可能也要有更好的方法,就现在此时此刻,人类还不是上限嘛。
我们的IDEA根本没有那么多工程来去实现,这就是一个可能你衡量的一个量化标准。
我们的IDEA根本没有那么多工程来去实现,这就是一个可能你衡量的一个量化标准。
同样呢,还有量化标准,就是你做的这个AI NATIVE的产品。
同样呢,还有量化标准,就是你做的这个AI NATIVE的产品。
如果原来它没有,现在倒有,比如XU和XU WORK,这是一个从零到一的产品,是不是能快速地SCALE变成一个大家普遍共识上的成功?
如果原来它没有,现在倒有,比如XU和XU WORK,这是一个从零到一的产品,是不是能快速地SCALE变成一个大家普遍共识上的成功?
就比如说阿里巴巴COM,其实存在26年了嘛,它有非常多的MATRIX,就是你原来这些MATRIX有没有非线性增长,就是去年涨10,今年你涨20。
就比如说阿里巴巴COM,其实存在26年了嘛,它有非常多的MATRIX,就是你原来这些MATRIX有没有非线性增长,就是去年涨10,今年你涨20。
如果有这个过程,那就说明AI在这个环境里边起作用。
如果有这个过程,那就说明AI在这个环境里边起作用。
有吗?
有吗?
我们今年EBITDA大概增长到百分之十八左右吧,跟去年比还是一个快速增长过程。
我们今年EBITDA大概增长到百分之十八左右吧,跟去年比还是一个快速增长过程。
我觉得这个你还是有非常多的地方要做对,最后ADD UP TOGETHER,你可能还有一个比较好的商业上的增速。
我觉得这个你还是有非常多的地方要做对,最后ADD UP TOGETHER,你可能还有一个比较好的商业上的增速。
另外呢,还有两个相对比较感性的衡量方式。
另外呢,还有两个相对比较感性的衡量方式。
第一个就是当有新的模型的框架出现,你这个组织是感到兴奋还是感到焦虑?
第一个就是当有新的模型的框架出现,你这个组织是感到兴奋还是感到焦虑?
我非常感兴趣,能展开讲一下吗?
我非常感兴趣,能展开讲一下吗?
如果你感到兴奋或者感到焦虑,这两个信号在我们这都是好的,就说明你这个产品跟模型有关。
如果你感到兴奋或者感到焦虑,这两个信号在我们这都是好的,就说明你这个产品跟模型有关。
跟 agent framework 有关,最差的结果就是你没感觉。
跟 agent framework 有关,最差的结果就是你没感觉。
就是外边模型出现速度很快,就像一个高速列车一样。
就是外边模型出现速度很快,就像一个高速列车一样。
但你在边上开个自己的老爷车,就是你无论开的速度最快,边上有个高铁已经从你身边呼啸而过了。
但你在边上开个自己的老爷车,就是你无论开的速度最快,边上有个高铁已经从你身边呼啸而过了。
那你就是再怎么样,你都是赶不上,除非说你自己已经坐上高铁了,在高铁上有一个相对速度,那你至少跟全世界聪明人努力的方向是一样的嘛。
那你就是再怎么样,你都是赶不上,除非说你自己已经坐上高铁了,在高铁上有一个相对速度,那你至少跟全世界聪明人努力的方向是一样的嘛。
所以这个事儿呢,一个基本要求就是你的产品和组织是要构架在AGENT和构架在最新的模型之上的,这样你每次有一个新的模型上来,你的所有产品都会变得更聪明。
所以这个事儿呢,一个基本要求就是你的产品和组织是要构架在AGENT和构架在最新的模型之上的,这样你每次有一个新的模型上来,你的所有产品都会变得更聪明。
把你的所有的流程都会变得更精准,你的努力方向就是跟人类努力方向是在同一个方向上。
把你的所有的流程都会变得更精准,你的努力方向就是跟人类努力方向是在同一个方向上。
那如果反过来就来了一个模型,其实你适配不适配的都无所谓,你的模、你的产品跟原来是一样的,或者你要适配花非常长的时间,那你就不是一个IN NATIVE BUILD在模型上的一个产品。
那如果反过来就来了一个模型,其实你适配不适配的都无所谓,你的模、你的产品跟原来是一样的,或者你要适配花非常长的时间,那你就不是一个IN NATIVE BUILD在模型上的一个产品。
我觉得这是一个比较好的衡量标准。
我觉得这是一个比较好的衡量标准。
当然最好的方式呢,你是不在PANIC那一边,你是在EXCITEMENT这边。
当然最好的方式呢,你是不在PANIC那一边,你是在EXCITEMENT这边。
有一个新模型和新的流程,你的组织和你的业务更兴奋,因为你原来解决不了的问题,你现在可以解决了。
有一个新模型和新的流程,你的组织和你的业务更兴奋,因为你原来解决不了的问题,你现在可以解决了。
基于新的模型。
基于新的模型。
如果你呢很焦虑,那就说明呢,你虽然已经在模型上了,但你是个 rapper,这个 rapper 来一次新的大的迭代,你这个价值就被挤没了,那就是一个不好的情况。
如果你呢很焦虑,那就说明呢,你虽然已经在模型上了,但你是个 rapper,这个 rapper 来一次新的大的迭代,你这个价值就被挤没了,那就是一个不好的情况。
对,可不可以给我们一点故事啊?
对,可不可以给我们一点故事啊?
就是最近让您最兴奋或者焦虑的一次模型更新是什么?
就是最近让您最兴奋或者焦虑的一次模型更新是什么?
嗯,我觉得现在一般都是兴奋居多啊。
嗯,我觉得现在一般都是兴奋居多啊。
过去一段时间,比如第一个就是多模态是一个比较大、比较快的变化。
过去一段时间,比如第一个就是多模态是一个比较大、比较快的变化。
哪次变化?
哪次变化?
NANO BANANA还是。
NANO BANANA还是。
比如NANO BANANA吧,就比如它产生商品的细节,就是我们原来也要产生商品图片,就无论是买家去设计一个产品,还是卖家去发自己的产品,他就是希望有个简单的照片。
比如NANO BANANA吧,就比如它产生商品的细节,就是我们原来也要产生商品图片,就无论是买家去设计一个产品,还是卖家去发自己的产品,他就是希望有个简单的照片。
从白底图开始,我把你放在各种各样的场景下。
从白底图开始,我把你放在各种各样的场景下。
那一个买家可能从IDEA开始,我最后要生成这个DESIGN PACK。
那一个买家可能从IDEA开始,我最后要生成这个DESIGN PACK。
那最终生成模型这个过程,这个DEFENSE MODEL啊,它就不精准,它会经常把尺寸搞错。
那最终生成模型这个过程,这个DEFENSE MODEL啊,它就不精准,它会经常把尺寸搞错。
一个很大的机器放在桌子上,或者一个不是很大的机器显得很大,在厂房里。
一个很大的机器放在桌子上,或者一个不是很大的机器显得很大,在厂房里。
那这个不精准表现呢?
那这个不精准表现呢?
原来你就要花大量的时间上下文去做调试,给它一些PROMPT。
原来你就要花大量的时间上下文去做调试,给它一些PROMPT。
要保证这个东西的产出,尽量要满足人的预期。
要保证这个东西的产出,尽量要满足人的预期。
但现在呢,模型本身能力变强了,其实我们就要相对比较简单的上下文就可以让这个内容生成得非常逼真。
但现在呢,模型本身能力变强了,其实我们就要相对比较简单的上下文就可以让这个内容生成得非常逼真。
但是这个生成过程只是最后一步,前面的所有这些逻辑链条一环扣一环的判断,那个更复杂的过程,那就是我们自己要对模型不断调试过程。
但是这个生成过程只是最后一步,前面的所有这些逻辑链条一环扣一环的判断,那个更复杂的过程,那就是我们自己要对模型不断调试过程。
但你最终产生图片这一刹那,有更好的模型来,你肯定是有更好的、更容易掌控的结果。
但你最终产生图片这一刹那,有更好的模型来,你肯定是有更好的、更容易掌控的结果。
第2个呢就是我们很早就在想要close loop,因为我们今天的模型首先拥有全世界的knowledge。
第2个呢就是我们很早就在想要close loop,因为我们今天的模型首先拥有全世界的knowledge。
其次我们也有最好的全球的供应商的网络,包括我们的所有这些线上的transaction等等这些signal帮助我们去做判断。
其次我们也有最好的全球的供应商的网络,包括我们的所有这些线上的transaction等等这些signal帮助我们去做判断。
next big idea到底是什么?
next big idea到底是什么?
who can make this就谁可能是你最好供应商。
who can make this就谁可能是你最好供应商。
那我们还希望去做你日常经营的过程,因为前面两部分可能占你日常工作的10%、20%,还有80%的是你daily operation。
那我们还希望去做你日常经营的过程,因为前面两部分可能占你日常工作的10%、20%,还有80%的是你daily operation。
但是在没有computer use没有browser use.
但是在没有computer use没有browser use.
没有这种长城上下文的agent的能力出现之前,其实我们要做这件事儿你就很困难。
没有这种长城上下文的agent的能力出现之前,其实我们要做这件事儿你就很困难。
就是也可以弄,但反正每个地方都很别扭,你就要大量的工程去解决每个细节问题。
就是也可以弄,但反正每个地方都很别扭,你就要大量的工程去解决每个细节问题。
但是当然有了这些能力,再加上有很多browser use的这些公司去做这些infrastructure这些基础的能力,那我们在解这条问题的链条上的速度就会变得非常快。
但是当然有了这些能力,再加上有很多browser use的这些公司去做这些infrastructure这些基础的能力,那我们在解这条问题的链条上的速度就会变得非常快。
这就为什么我们春节就开始加班去做x work。
这就为什么我们春节就开始加班去做x work。
你就发现呢,无论是OPEN CLOUD还是CLOUD CO-WORK,证明这个范式在这个环境下是成立的。
你就发现呢,无论是OPEN CLOUD还是CLOUD CO-WORK,证明这个范式在这个环境下是成立的。
它是能够再往前去推进一步的。
它是能够再往前去推进一步的。
那我们在这个基础上就可以快速推进产品,让它对我们这个用户群体可以产生更广泛的应用。
那我们在这个基础上就可以快速推进产品,让它对我们这个用户群体可以产生更广泛的应用。
我觉得至少呢,在我们的大部分CASE下,我觉得还是兴奋为主。
我觉得至少呢,在我们的大部分CASE下,我觉得还是兴奋为主。
我们可能存在两种情况:一种情况就是兴奋。
我们可能存在两种情况:一种情况就是兴奋。
另一种情况就是还没感知。
另一种情况就是还没感知。
有过还没感知。
有过还没感知。
比如说一些特别大的这种模型出来,然后你们完全没有感知的。
比如说一些特别大的这种模型出来,然后你们完全没有感知的。
就是因为我们本身也是一个26年的系统嘛,这26年的不断积累。
就是因为我们本身也是一个26年的系统嘛,这26年的不断积累。
我们现在CEO吴永明同志他最早的代码可能还在我们这个代码库里面,因为它也是一个不断积累的过程,你不断的每个功能去做叠加。
我们现在CEO吴永明同志他最早的代码可能还在我们这个代码库里面,因为它也是一个不断积累的过程,你不断的每个功能去做叠加。
那我们呢,也想让我们整个工程都基于AI NATIVE的系统。
那我们呢,也想让我们整个工程都基于AI NATIVE的系统。
那就意味着你整个系统都要重写,未来的工程师才能大家更AI NATIVE的方式去做这个代码。
那就意味着你整个系统都要重写,未来的工程师才能大家更AI NATIVE的方式去做这个代码。
那这个过程肯定是一个STEP BY STEP的过程,未来一定是做到只要有新的模型,阿里巴巴COM里边的每一个角落理论都应该比原来更好用,而不是说呢不同的团队去适配不同的模型,每次来的时候大家都要再重新研究一遍我这个产品怎么去适配。
那这个过程肯定是一个STEP BY STEP的过程,未来一定是做到只要有新的模型,阿里巴巴COM里边的每一个角落理论都应该比原来更好用,而不是说呢不同的团队去适配不同的模型,每次来的时候大家都要再重新研究一遍我这个产品怎么去适配。
那这个速度肯定是慢的。
那这个速度肯定是慢的。
对,所以在这个时候您选人的标准会发生变化吗?
对,所以在这个时候您选人的标准会发生变化吗?
有一些BASIC的事儿,我觉得可能是一样的。
有一些BASIC的事儿,我觉得可能是一样的。
你比如说你学习能力要足够强,要比较强的开放心态,对你要进入到一个大的组织里边,你本身这些同理心啊等等,我觉得也都是很重要的部分。
你比如说你学习能力要足够强,要比较强的开放心态,对你要进入到一个大的组织里边,你本身这些同理心啊等等,我觉得也都是很重要的部分。
就这些呢,你说AI时代和原来的数字化的时代,可能对人的本色可能要求都是一样,只不过呢,在这个时代对于这一类的工具,我们希望它可以应用得更广泛、更灵活。
就这些呢,你说AI时代和原来的数字化的时代,可能对人的本色可能要求都是一样,只不过呢,在这个时代对于这一类的工具,我们希望它可以应用得更广泛、更灵活。
在垂直在 build 的这个产品的基础上,你肯定是对于 ai 的理解,对于整个大模型相关的 infra 的这些技术的理解越多越好。
在垂直在 build 的这个产品的基础上,你肯定是对于 ai 的理解,对于整个大模型相关的 infra 的这些技术的理解越多越好。
理解的最多的,你可能就直接去 build 跟 ai 相关的产品。
理解的最多的,你可能就直接去 build 跟 ai 相关的产品。
从底层开始去做,从模型训练开始做。
从底层开始去做,从模型训练开始做。
理解可能是对于商业理解和对于技术的理解一半一半的,那你可能比较适合去做产品,因为你要面向3~6个月之后的模型去设计产品。
理解可能是对于商业理解和对于技术的理解一半一半的,那你可能比较适合去做产品,因为你要面向3~6个月之后的模型去设计产品。
就是你要对于全世界至少要走向的方向有一个比较清晰的判断,因为这个 buzzword 很多嘛,出来的新的 idea 很多,你不能看新闻去做决定,接下来哪个事是重要的事情。
就是你要对于全世界至少要走向的方向有一个比较清晰的判断,因为这个 buzzword 很多嘛,出来的新的 idea 很多,你不能看新闻去做决定,接下来哪个事是重要的事情。
就是你自己对这件事情有个更加精确的洞察。
就是你自己对这件事情有个更加精确的洞察。
或者更加独到的观点和判断,可能对你未来会更有帮助。
或者更加独到的观点和判断,可能对你未来会更有帮助。
好,非常精彩,谢谢酷。
好,非常精彩,谢谢酷。
好的,感谢,谢谢。
好的,感谢,谢谢。
好的,那谢谢张阔。
好的,那谢谢张阔。
我觉得在节目的最后,这句话可能也对我们每个人都适用啊,就是在 AI 的时代下,大家个人的感觉是兴奋、焦虑还是没有感觉呢?
我觉得在节目的最后,这句话可能也对我们每个人都适用啊,就是在 AI 的时代下,大家个人的感觉是兴奋、焦虑还是没有感觉呢?
欢迎大家给我们写评论,写留言。
欢迎大家给我们写评论,写留言。
那播客的听众可以通过小宇宙、苹果播客还有 Spotify 来收听我们。
那播客的听众可以通过小宇宙、苹果播客还有 Spotify 来收听我们。
视频的听众可以在 b 站还有 YouTube 上搜索硅谷101播客找到我们。
视频的听众可以在 b 站还有 YouTube 上搜索硅谷101播客找到我们。
当然也可以通过小红书或者是视频号来收听我们的播客。
当然也可以通过小红书或者是视频号来收听我们的播客。
同时如果大家对我们的文字稿感兴趣呢,我们部分节目的文字稿会发表在硅谷101的公众号上。
同时如果大家对我们的文字稿感兴趣呢,我们部分节目的文字稿会发表在硅谷101的公众号上。
我是红军,感谢大家的收听。
我是红军,感谢大家的收听。
关于 Bayt 播客
Bayt 提供中文+原文双语音频和字幕,帮助你打破语言障碍,轻松听懂全球优质播客。