本集简介
双语字幕
仅展示文本字幕,不包含中文音频;想边听边看,请使用 Bayt 播客 App。
反转、反转再反转。
反转、反转再反转。
一个周末的时间,2026年第一个现象级产品CLUB BOAT的发展实在是太快了。
一个周末的时间,2026年第一个现象级产品CLUB BOAT的发展实在是太快了。
在过去的一周时间里,已经在各种社交媒体里被CLUB BOAT刷屏,在GITHUB里的增长趋势也几乎就是直线上涨。
在过去的一周时间里,已经在各种社交媒体里被CLUB BOAT刷屏,在GITHUB里的增长趋势也几乎就是直线上涨。
没几天就突破了十万颗星标指数,2月2号已经达到了14.
没几天就突破了十万颗星标指数,2月2号已经达到了14.
6万颗,这直接刷新了GITHUB历史上AI项目的最快增长记录,引爆了整个AI AGENT生态。
6万颗,这直接刷新了GITHUB历史上AI项目的最快增长记录,引爆了整个AI AGENT生态。
大家好,欢迎收听硅谷101。
大家好,欢迎收听硅谷101。
我是特约研究员刘一鸣。
我是特约研究员刘一鸣。
我们这期节目录制在一月三十号,但就在后面这个周末,这个项目经历了一个极其戏剧性的变化。
我们这期节目录制在一月三十号,但就在后面这个周末,这个项目经历了一个极其戏剧性的变化。
当然,在正式开始之前,我得先帮大家捋一捋这几天快把人绕晕的几个名词。
当然,在正式开始之前,我得先帮大家捋一捋这几天快把人绕晕的几个名词。
第一个是CLUBBOT到OPEN CLUB,那个最初让大家刷屏的基于CLUB模型所构建的项目,原本叫CLUBBOT。
第一个是CLUBBOT到OPEN CLUB,那个最初让大家刷屏的基于CLUB模型所构建的项目,原本叫CLUBBOT。
但由于它实在是太火了,直接惊动了背后的模型大厂Anthropic。
但由于它实在是太火了,直接惊动了背后的模型大厂Anthropic。
Anthropic随后就发起了起诉,认为Cloud Boat这个名字的发音和Cloud太像了,它涉嫌了品牌的侵权。
Anthropic随后就发起了起诉,认为Cloud Boat这个名字的发音和Cloud太像了,它涉嫌了品牌的侵权。
为了规避法律风险,Cloud Boat就先是更名为Mote Boat,然后又再次更名为Open Cloud。
为了规避法律风险,Cloud Boat就先是更名为Mote Boat,然后又再次更名为Open Cloud。
之后整个周末里,大家看到大量刷屏新闻里提到的MOT BOOK,其实就是基于CLOUD BOAT所搭建的一个专门为AI设计的社交网络。
之后整个周末里,大家看到大量刷屏新闻里提到的MOT BOOK,其实就是基于CLOUD BOAT所搭建的一个专门为AI设计的社交网络。
可以说这是让这些智能体们生活在里面的宿舍楼,或者说是朋友圈。
可以说这是让这些智能体们生活在里面的宿舍楼,或者说是朋友圈。
现在有无数个AI AGENT在上面发帖交流,甚至建立起的宗教,而人类在这个里面只能充当一个观察者。
现在有无数个AI AGENT在上面发帖交流,甚至建立起的宗教,而人类在这个里面只能充当一个观察者。
紧接着,有媒体扒出这一百五十万个AI中,大多数是人类假扮的。
紧接着,有媒体扒出这一百五十万个AI中,大多数是人类假扮的。
而同步它也被曝光安全漏洞太大了,会泄露很多人类的敏感信息,比如说你的用户名、密码、邮件等等。
而同步它也被曝光安全漏洞太大了,会泄露很多人类的敏感信息,比如说你的用户名、密码、邮件等等。
等我们今天发布这个播客的时候,由于MOTIVEBOOK的服务器账单已经成为了天文数字,网站暂时无法访问。
等我们今天发布这个播客的时候,由于MOTIVEBOOK的服务器账单已经成为了天文数字,网站暂时无法访问。
而这一切都是在我们节目录制之后的五天发生的事儿。
而这一切都是在我们节目录制之后的五天发生的事儿。
也是因为AI的发展实在是太快了,曾经啊,市面上其实也有一些类似于CLUBBOARD的产品。
也是因为AI的发展实在是太快了,曾经啊,市面上其实也有一些类似于CLUBBOARD的产品。
但为什么最终是CLUBBOARD火了?
但为什么最终是CLUBBOARD火了?
今天我们邀请了三位嘉宾,他们分别代表了三个方向:一个呢是用户侧,一个是软件算法侧,还有一个是硬件侧。
今天我们邀请了三位嘉宾,他们分别代表了三个方向:一个呢是用户侧,一个是软件算法侧,还有一个是硬件侧。
我们希望更加全方位地来拆解一下CLUBBOARD的产品的底层逻辑。
我们希望更加全方位地来拆解一下CLUBBOARD的产品的底层逻辑。
第一位嘉宾呢,是知县。
第一位嘉宾呢,是知县。
他是一位非常资深的产品经理,还横跨了CRYPTO行业。
他是一位非常资深的产品经理,还横跨了CRYPTO行业。
他最近用了CLUBBOAT,然后听说超级上头啊。
他最近用了CLUBBOAT,然后听说超级上头啊。
我们可以多聊聊你的实际用例,都实现了什么功能?
我们可以多聊聊你的实际用例,都实现了什么功能?
知县在我们今天的播客里啊,它主要代表用户侧。
知县在我们今天的播客里啊,它主要代表用户侧。
哎,大家好,我是知县,确实非常的上头。
哎,大家好,我是知县,确实非常的上头。
我个人也是计算机背景,又是做了这么多年产品,对CLUBBOAT强大的非常的感同身受。
我个人也是计算机背景,又是做了这么多年产品,对CLUBBOAT强大的非常的感同身受。
第二位嘉宾呢,是真豪。
第二位嘉宾呢,是真豪。
他是EVERYMATE的技术生态负责人,也是清华摇班的同学。
他是EVERYMATE的技术生态负责人,也是清华摇班的同学。
后来在卡耐基梅隆研究NLP的方向,再往后创业,然后加入了EVERYMATE。
后来在卡耐基梅隆研究NLP的方向,再往后创业,然后加入了EVERYMATE。
他现在做的就是大模型跟AGENT之间的中间层,比如说模型的长期记忆和个性化。
他现在做的就是大模型跟AGENT之间的中间层,比如说模型的长期记忆和个性化。
现在CLUBBOARD其实就是在获取你的用户权限之后呢,把你大量的个人资料输入、整合进去,再做压缩。
现在CLUBBOARD其实就是在获取你的用户权限之后呢,把你大量的个人资料输入、整合进去,再做压缩。
这其实也是EVERMIND一直在做的方向。
这其实也是EVERMIND一直在做的方向。
所以正好呢,代表软件算法车,我们可以聊聊COPPER背后很多神奇的功能,到底在技术上是如何实现的,以及呢它还有哪些待解决的问题。
所以正好呢,代表软件算法车,我们可以聊聊COPPER背后很多神奇的功能,到底在技术上是如何实现的,以及呢它还有哪些待解决的问题。
哈喽,大家好,我是郑豪。
哈喽,大家好,我是郑豪。
因为EVERMIND我们一直都是研究AI的记忆AS INFRASTRUCTURE,然后我们怎么样去解决让AI不会再失忆、然后的遗忘的问题。
因为EVERMIND我们一直都是研究AI的记忆AS INFRASTRUCTURE,然后我们怎么样去解决让AI不会再失忆、然后的遗忘的问题。
那我们非常高兴的看到像COPPER和其他一些产品,它越来越关注AI记忆的这个话题。
那我们非常高兴的看到像COPPER和其他一些产品,它越来越关注AI记忆的这个话题。
所以我觉得这还是一个非常有前景的方向,也非常期待在这个方向上有能够更好的产品和更好的技术为大家带来不一样的体验。
所以我觉得这还是一个非常有前景的方向,也非常期待在这个方向上有能够更好的产品和更好的技术为大家带来不一样的体验。
哦,第三位是天琪,他是帕米尔的创始人。
哦,第三位是天琪,他是帕米尔的创始人。
他俩其实特别有前瞻性的,在一年半之前就做了一个给A整用的计算机,很小可以直接放在手掌上,在这个机子上你可以直接跑CLACODE,然后当然也可以跑CLABOT。
他俩其实特别有前瞻性的,在一年半之前就做了一个给A整用的计算机,很小可以直接放在手掌上,在这个机子上你可以直接跑CLACODE,然后当然也可以跑CLABOT。
它的价格大概是MAC MINI的好几分之一,所以我这次邀请天琪其实就是因为这次MAC MINI也被带火了嘛。
它的价格大概是MAC MINI的好几分之一,所以我这次邀请天琪其实就是因为这次MAC MINI也被带火了嘛。
但其实我们是不是一定要用MAC MINI呢?
但其实我们是不是一定要用MAC MINI呢?
这个其实还是个问号。
这个其实还是个问号。
以及CLUBBO所带起来的这个趋势,它对2026年的整个硬件会产生什么影响?
以及CLUBBO所带起来的这个趋势,它对2026年的整个硬件会产生什么影响?
比如说我们到底是不是需要给AGENT配置一个独立的计算机?
比如说我们到底是不是需要给AGENT配置一个独立的计算机?
因为有些人会说,在家里放一个独立的计算机,然后来让AGENT住在里面。
因为有些人会说,在家里放一个独立的计算机,然后来让AGENT住在里面。
这些问题呢,我们跟天琪聊聊。
这些问题呢,我们跟天琪聊聊。
然后天琪在创业之前呢,他是在高通做机器学习,然后他的联创在微软做SURFACE,非常技术范的一个团队。
然后天琪在创业之前呢,他是在高通做机器学习,然后他的联创在微软做SURFACE,非常技术范的一个团队。
它代表了硬件。
它代表了硬件。
测大家好,我是天琪呃,我们在A阵电脑这个方向其实做了蛮久了,之前一直挺不被理解的,但是今天终于可以借CLOUD BOSS这波爆火,希望能给大家提供一些我们不一样的视角。
测大家好,我是天琪呃,我们在A阵电脑这个方向其实做了蛮久了,之前一直挺不被理解的,但是今天终于可以借CLOUD BOSS这波爆火,希望能给大家提供一些我们不一样的视角。
好,我先第一个问题想请大家来总结一下,就是你觉得CLUB它这次能成为一个全球现象级的产品,它最核心的灵魂到底是什么?
好,我先第一个问题想请大家来总结一下,就是你觉得CLUB它这次能成为一个全球现象级的产品,它最核心的灵魂到底是什么?
要不支线。
要不支线。
开始OK。
开始OK。
其实我自己用下来的感觉就是它特别有活人感,一个就是它的长期记忆,它可以记住挺长时间的,就是你们的之间的对话呀、CONTEXT啊,或者你跟他讲过的事情。
其实我自己用下来的感觉就是它特别有活人感,一个就是它的长期记忆,它可以记住挺长时间的,就是你们的之间的对话呀、CONTEXT啊,或者你跟他讲过的事情。
那另一个就是他有很强的主动性,比如每天早上给你打招呼,给你总结一下你今天有哪些要做的,甚至会把你要做的事情给你做一些预先的调研端给你。
那另一个就是他有很强的主动性,比如每天早上给你打招呼,给你总结一下你今天有哪些要做的,甚至会把你要做的事情给你做一些预先的调研端给你。
所以整体用下来就特别像钢铁侠里面那个JARVIS这种感觉,甚至有时候还跟你聊天的时候动不动抖个机灵吐槽一下之类的。
所以整体用下来就特别像钢铁侠里面那个JARVIS这种感觉,甚至有时候还跟你聊天的时候动不动抖个机灵吐槽一下之类的。
所以这个我觉得是第一反应上手的时候特别惊艳的地方嘛。
所以这个我觉得是第一反应上手的时候特别惊艳的地方嘛。
对,然后正好我非常赞同活人感的这个感觉。
对,然后正好我非常赞同活人感的这个感觉。
其实AI的主动性这个话题大家讨论了有很多,它不是一个新的想法。
其实AI的主动性这个话题大家讨论了有很多,它不是一个新的想法。
但我看到能够落地的这么成熟、这么棒的,确实是市面上很少见的一个产品。
但我看到能够落地的这么成熟、这么棒的,确实是市面上很少见的一个产品。
我之前有在给一家硬件COMPANION公司做一个咨询的工作,当时我们就设计了一些方案,让硬件陪伴的一些玩具等等,如何做到更有人感以及更加主动性。
我之前有在给一家硬件COMPANION公司做一个咨询的工作,当时我们就设计了一些方案,让硬件陪伴的一些玩具等等,如何做到更有人感以及更加主动性。
从大体方案上而言,和现在的CLOUD BOT的主动性、哈尔滨的方案是比较接近的。
从大体方案上而言,和现在的CLOUD BOT的主动性、哈尔滨的方案是比较接近的。
但确实它如果放在一个更虚拟的环境下,同时能够打通人们手的一个IM,你每天用的IM,你都可以有一个机器人给你发消息。
但确实它如果放在一个更虚拟的环境下,同时能够打通人们手的一个IM,你每天用的IM,你都可以有一个机器人给你发消息。
我觉得这个体验确实是一个很棒的体验。
我觉得这个体验确实是一个很棒的体验。
天琪。
天琪。
我也很同意那两位的说法吧,但我觉得最大的功劳可能还是用用户已经很熟悉的消息传递的方式,就是要微信、要飞书啊。
我也很同意那两位的说法吧,但我觉得最大的功劳可能还是用用户已经很熟悉的消息传递的方式,就是要微信、要飞书啊。
跟用户对话可能会让他们觉得他更像在跟一个同事聊天,即使你是发同样的消息,你的感觉肯定是在跟这种TERMINAL里聊天是完全不一样的。
跟用户对话可能会让他们觉得他更像在跟一个同事聊天,即使你是发同样的消息,你的感觉肯定是在跟这种TERMINAL里聊天是完全不一样的。
嗯,明白。
嗯,明白。
我也一直很好奇,就为什么这次是CLUBBO火了?
我也一直很好奇,就为什么这次是CLUBBO火了?
我知道郑浩和天琪其实你们在这个行业很多年,然后你们也都看过很多类似的产品,可能CLUBBO只是其中之一。
我知道郑浩和天琪其实你们在这个行业很多年,然后你们也都看过很多类似的产品,可能CLUBBO只是其中之一。
但最终为什么是他?
但最终为什么是他?
因为我虽然很早了解了CLUBBO,但我自己试用它之后我没有立即去用,因为我没有感觉到它和我在用的一些其他产品会有什么质的区别。
因为我虽然很早了解了CLUBBO,但我自己试用它之后我没有立即去用,因为我没有感觉到它和我在用的一些其他产品会有什么质的区别。
比如说,从编程代码而言,我是CLOCK的比较资深的用户。
比如说,从编程代码而言,我是CLOCK的比较资深的用户。
所以我而言,它不是只是写代码,它可以做很多本地该做的事情,整理文件也好,写文档、写PPT。
所以我而言,它不是只是写代码,它可以做很多本地该做的事情,整理文件也好,写文档、写PPT。
其实我这些都是用CLOCK CODE去实现的。
其实我这些都是用CLOCK CODE去实现的。
最近CLOCK的系统推出了CLOCK WORK,这是一个更好的升级,它可以对COMPUTER USE,比如操作网页等等一些场景做得很好。
最近CLOCK的系统推出了CLOCK WORK,这是一个更好的升级,它可以对COMPUTER USE,比如操作网页等等一些场景做得很好。
所以我觉得很多场景上都可以用CLOCK WORK这个产品来实现人们对于AGENT的一些诉求。
所以我觉得很多场景上都可以用CLOCK WORK这个产品来实现人们对于AGENT的一些诉求。
更不要说大家很熟悉的MANNERS,因为MANNERS本质上也是给你在云上开了一个电脑也好,或者开了一个AGENT的INSTANCE去帮你去执行任务。
更不要说大家很熟悉的MANNERS,因为MANNERS本质上也是给你在云上开了一个电脑也好,或者开了一个AGENT的INSTANCE去帮你去执行任务。
从某种角度而言,它也是24×7帮大家去完成任务。
从某种角度而言,它也是24×7帮大家去完成任务。
虽然它不能主动的通过IM和大家沟通,但是MANNERS也有手机端,也可以下载它的APP,理论上可以在手机上和它进行沟通。
虽然它不能主动的通过IM和大家沟通,但是MANNERS也有手机端,也可以下载它的APP,理论上可以在手机上和它进行沟通。
所以从我的视角上而言,它的其实大部分的功能你要硬说哪一个不能被现在的产品实现,我觉得都可以。
所以从我的视角上而言,它的其实大部分的功能你要硬说哪一个不能被现在的产品实现,我觉得都可以。
但可能正是这种,他把很多事情都做到位了。
但可能正是这种,他把很多事情都做到位了。
通过一个IM这一个更有人感的产品界面和人去沟通,使得他能够做得好。
通过一个IM这一个更有人感的产品界面和人去沟通,使得他能够做得好。
我问了我身边的同事,很多编程人员可能还是停留在CURSOR这个我认为偏上一代的AI CODING,而不是在用CLOUD CODE这么一种偏AGENT的方式的AI CODING里。
我问了我身边的同事,很多编程人员可能还是停留在CURSOR这个我认为偏上一代的AI CODING,而不是在用CLOUD CODE这么一种偏AGENT的方式的AI CODING里。
整个AGENT的体验,在一些人看来可能已经有了,但是可能对很多人而言还没有这个认知。
整个AGENT的体验,在一些人看来可能已经有了,但是可能对很多人而言还没有这个认知。
然后我就cloud把这个认知推广到了很棒的一个角度吧。
然后我就cloud把这个认知推广到了很棒的一个角度吧。
嗯,天琪。
嗯,天琪。
其实它是很多因素促成的。
其实它是很多因素促成的。
有一部分因素呢,我认为是市场到达了这个接受度。
有一部分因素呢,我认为是市场到达了这个接受度。
因为你同样的事情,可能两个月、三个月之前做的话,大家也不知道这是怎么回事儿。
因为你同样的事情,可能两个月、三个月之前做的话,大家也不知道这是怎么回事儿。
但是因为一系列的cloud code呀,还有co work呀,还有minus,它把大众对agent的理解还有接受度已经预热了。
但是因为一系列的cloud code呀,还有co work呀,还有minus,它把大众对agent的理解还有接受度已经预热了。
所以我认为在这个节点,它就是要出来一个这么一个胶水项目。
所以我认为在这个节点,它就是要出来一个这么一个胶水项目。
他们确实别的项目做的不同的点在于,他们真的是粘了所有的东西,把能粘的全部都粘进去了。
他们确实别的项目做的不同的点在于,他们真的是粘了所有的东西,把能粘的全部都粘进去了。
你不管是记忆啊,还有消息系统啊,还有PROACTIVE的持续工作啊,而且经典的这种交互方式,通过你已知的消息系统去发送。
你不管是记忆啊,还有消息系统啊,还有PROACTIVE的持续工作啊,而且经典的这种交互方式,通过你已知的消息系统去发送。
嗯,我觉得所有的点汇集在一起,引爆了CLOUD BOUT。
嗯,我觉得所有的点汇集在一起,引爆了CLOUD BOUT。
刚刚两位是站在技术的视角解释了这件事情,我从用户的视角和传播上我观察到的一些情况来做一些补充。
刚刚两位是站在技术的视角解释了这件事情,我从用户的视角和传播上我观察到的一些情况来做一些补充。
我觉得CLOUD BOT它一个特点就是离用户非常的近,它比CHAT BOT那种用网页的方式跟用户聊天其实要近得多的。
我觉得CLOUD BOT它一个特点就是离用户非常的近,它比CHAT BOT那种用网页的方式跟用户聊天其实要近得多的。
这一方面是他用了IM作为主要的沟通方式,那另一方面就是它的主动性。
这一方面是他用了IM作为主要的沟通方式,那另一方面就是它的主动性。
做的也比较顺滑,就像刚才讲的比较有活人感嘛。
做的也比较顺滑,就像刚才讲的比较有活人感嘛。
所以说它有点直接打动了终端用户那种感觉,就是一个技术虽然说已经引进到一定程度了,但是让普通人有所感觉这个过程实际上是非常重要的。
所以说它有点直接打动了终端用户那种感觉,就是一个技术虽然说已经引进到一定程度了,但是让普通人有所感觉这个过程实际上是非常重要的。
用户是看不到它后面用的技术跟其他现有的产品用的技术是有多相似的,但是站在用户的感受上,它确实是非常不一样的。
用户是看不到它后面用的技术跟其他现有的产品用的技术是有多相似的,但是站在用户的感受上,它确实是非常不一样的。
这点我觉得MANS也是类似的。
这点我觉得MANS也是类似的。
当时刚出来的时候,大家也都会说它浇水呀、换皮呀,科技以换皮为本,对吧?
当时刚出来的时候,大家也都会说它浇水呀、换皮呀,科技以换皮为本,对吧?
但实际上这种能让用户感知到技术进步到什么程度的能力也是很重要的。
但实际上这种能让用户感知到技术进步到什么程度的能力也是很重要的。
那第二点呢?
那第二点呢?
从传播上,我关注这个项目也不能算太早,一个多月以前,那个时候其实还是一个比较小众、比较极客的东西。
从传播上,我关注这个项目也不能算太早,一个多月以前,那个时候其实还是一个比较小众、比较极客的东西。
但是凡是喜欢研究AI、尝试AI产品的用户,很多人都已经看到这个产品,而且用上了。
但是凡是喜欢研究AI、尝试AI产品的用户,很多人都已经看到这个产品,而且用上了。
已经开始非常热烈地在传播和讨论了。
已经开始非常热烈地在传播和讨论了。
我记得创始人也说过,他当时建了DISCORD SERVER之后,好像很快就涌进来了5000人,里面有很多AI创业公司的FOUNDER,也有很多大的KOL,大家都觉得这个东西实在太酷了。
我记得创始人也说过,他当时建了DISCORD SERVER之后,好像很快就涌进来了5000人,里面有很多AI创业公司的FOUNDER,也有很多大的KOL,大家都觉得这个东西实在太酷了。
虽然它有一些问题,大家也在讨论。
虽然它有一些问题,大家也在讨论。
所以这个是一个非常社区的项目,社区氛围非常好。
所以这个是一个非常社区的项目,社区氛围非常好。
又因为现在是WEB CODING的时代啊,这个时代我觉得也是开源非常幸运的时代。
又因为现在是WEB CODING的时代啊,这个时代我觉得也是开源非常幸运的时代。
其实很多人都是有自己的想法,但其实没有能力把代码优化到一个可以提PR的程度的。
其实很多人都是有自己的想法,但其实没有能力把代码优化到一个可以提PR的程度的。
所以我觉得以我为一个实际社区参与者的角度来看这件事情的话。
所以我觉得以我为一个实际社区参与者的角度来看这件事情的话。
它的火爆是一个由核心圈慢慢扩散,然后到一定的临界点,突然在英文区应该是先火起来。
它的火爆是一个由核心圈慢慢扩散,然后到一定的临界点,突然在英文区应该是先火起来。
大家看到一些用力之后就觉得太牛了,再加上大家对AI的FORM情绪,害怕错过什么,所以就一下点燃了热情。
大家看到一些用力之后就觉得太牛了,再加上大家对AI的FORM情绪,害怕错过什么,所以就一下点燃了热情。
之前正好聊到用力啊,你最近既然这么上头,然后来给我们讲讲几个特别让你惊艳的使用的用力。
之前正好聊到用力啊,你最近既然这么上头,然后来给我们讲讲几个特别让你惊艳的使用的用力。
因为我觉得他的创始人之前也说过,他其实一开始没有加音频功能,就是他在开发这个CLUB BOARD的时候。
因为我觉得他的创始人之前也说过,他其实一开始没有加音频功能,就是他在开发这个CLUB BOARD的时候。
但是他有一次在马拉喀什旅行的时候,一直在用它查餐厅、问路。
但是他有一次在马拉喀什旅行的时候,一直在用它查餐厅、问路。
有一次,他下意识的他可能也忘记了,然后就给他发一条语音。
有一次,他下意识的他可能也忘记了,然后就给他发一条语音。
就是他没给他设计这功能,那他自己居然通过各种方式调用,然后他来把自己语音的这个功能给实现了。
就是他没给他设计这功能,那他自己居然通过各种方式调用,然后他来把自己语音的这个功能给实现了。
他当时就产生了一种非常啊哈moment这个感觉。
他当时就产生了一种非常啊哈moment这个感觉。
那在你的使用中有没有这样的感到非常惊艳的用力?
那在你的使用中有没有这样的感到非常惊艳的用力?
对我觉得你说的这个例子特别好。
对我觉得你说的这个例子特别好。
当时我也看了他讲这段历程啊,他当时说我做这个产品并不是要做一个agent,他只是想做一个叫what's app relay的功能,就是说白了我出去的时候。
当时我也看了他讲这段历程啊,他当时说我做这个产品并不是要做一个agent,他只是想做一个叫what's app relay的功能,就是说白了我出去的时候。
我可以通过WHAT'S UP指挥家里的AGENT的干活,不要闲着。
我可以通过WHAT'S UP指挥家里的AGENT的干活,不要闲着。
就是你说的这个场景才让他意识到这个东西有多强大,或者穿透的讲,我觉得是让他意识到哦,原来现在的模型的自主能力、推理能力已经这么强了。
就是你说的这个场景才让他意识到这个东西有多强大,或者穿透的讲,我觉得是让他意识到哦,原来现在的模型的自主能力、推理能力已经这么强了。
我认为CAR BOAT现在特别强的很大一部分原因是,其实大模型已经强到一定程度了,CAR BOAT用一个特别让大家能感受到的形态展现出来了。
我认为CAR BOAT现在特别强的很大一部分原因是,其实大模型已经强到一定程度了,CAR BOAT用一个特别让大家能感受到的形态展现出来了。
比如他说的,他自己下意识的就发了条语音。
比如他说的,他自己下意识的就发了条语音。
这其实就是一个我自己生活中的一个特别好的感觉,就属于用了就回不去了。
这其实就是一个我自己生活中的一个特别好的感觉,就属于用了就回不去了。
我现在跟他就是发语音出门,比如在外面或者什么时候想起一件事儿来,这样我有两盒牛肉再不吃就不行了,我就每天有时候跟他碎碎念,就说有点牛肉得赶紧吃了。
我现在跟他就是发语音出门,比如在外面或者什么时候想起一件事儿来,这样我有两盒牛肉再不吃就不行了,我就每天有时候跟他碎碎念,就说有点牛肉得赶紧吃了。
啊,我就提了这么一句,他就会自己去把它处理,然后加到REMINDER里嘛。
啊,我就提了这么一句,他就会自己去把它处理,然后加到REMINDER里嘛。
那天下午他就突然跑出来告诉我说:‘哎,收起烧,你需要准备这些东西,煮多长时间?
那天下午他就突然跑出来告诉我说:‘哎,收起烧,你需要准备这些东西,煮多长时间?
’然后还要跟我强调啊,牛肉一定要最后两三分钟的时候放,要不然会煮老啊。
’然后还要跟我强调啊,牛肉一定要最后两三分钟的时候放,要不然会煮老啊。
就这种帮你预言、告诉你、给你推过来的这种贴心感啊,就一下就把你对他的定位就拉到了这么一个特别主动、特别有自我意识的这么一个助手的上面。
就这种帮你预言、告诉你、给你推过来的这种贴心感啊,就一下就把你对他的定位就拉到了这么一个特别主动、特别有自我意识的这么一个助手的上面。
再就是我还有一次让他去我一个服务器上蹲点,就是我有跑着这个服务啊。
再就是我还有一次让他去我一个服务器上蹲点,就是我有跑着这个服务啊。
我让他评估一下这个服务器的配置是不是有点高,他蹲了一天,然后告诉我确实高了。
我让他评估一下这个服务器的配置是不是有点高,他蹲了一天,然后告诉我确实高了。
你只要把预算降到现在四分之一就行了,省出来的钱就已经其实够他自己运行了。
你只要把预算降到现在四分之一就行了,省出来的钱就已经其实够他自己运行了。
再就是有一个比较我的哈MOMENT的一个案例吧,就有一天我我就跟他说,我说你做个实验吧,把这个MAC OS自己带的这个模型。
再就是有一个比较我的哈MOMENT的一个案例吧,就有一天我我就跟他说,我说你做个实验吧,把这个MAC OS自己带的这个模型。
分成API,然后看看它到底是能力边界是在哪儿的。
分成API,然后看看它到底是能力边界是在哪儿的。
然后它做的很快,跑完了之后把它测的结果打出来。
然后它做的很快,跑完了之后把它测的结果打出来。
我一看啊,OK,很全面,各种因素、各种维度的测试用力都跑了。
我一看啊,OK,很全面,各种因素、各种维度的测试用力都跑了。
我就说诶,你这个结果不错。
我就说诶,你这个结果不错。
我说你要不写篇文章吧?
我说你要不写篇文章吧?
然后它就自动转到了用我的口吻去写文章的这么一个SCALE,然后写的特别好,几乎就是一字都不用改了。
然后它就自动转到了用我的口吻去写文章的这么一个SCALE,然后写的特别好,几乎就是一字都不用改了。
还说要不要帮我发布?
还说要不要帮我发布?
我当时还没有告诉他我的博客是什么什么的配置,然后我就说那你试试目录在哪里。
我当时还没有告诉他我的博客是什么什么的配置,然后我就说那你试试目录在哪里。
我觉得他肯定搞不定,因为我那个博客还做了各种主题的自定义的配置嘛,包括同一篇文章中英文版本啊这些配置都是比较自定义的。
我觉得他肯定搞不定,因为我那个博客还做了各种主题的自定义的配置嘛,包括同一篇文章中英文版本啊这些配置都是比较自定义的。
没想到他自己就参考着整个REPO里的东西,把规则摸清了,也没有中间再来找我问,直接就把让他写的中文版,然后他把英文版也翻好了。
没想到他自己就参考着整个REPO里的东西,把规则摸清了,也没有中间再来找我问,直接就把让他写的中文版,然后他把英文版也翻好了。
把中文版的博客的字数统计的规则,专门有一个FLAG要打开的也配对了。
把中文版的博客的字数统计的规则,专门有一个FLAG要打开的也配对了。
最后他直接告诉我啊,好了,已经发成功了,也就用了十秒左右的时间吧。
最后他直接告诉我啊,好了,已经发成功了,也就用了十秒左右的时间吧。
然后甩了两个链接给我,我以为打开肯定就404了啊,结果发现哇,人家配的比我配的还好啊,什么TAG啊,什么CATEGORY啊,都加好了。
然后甩了两个链接给我,我以为打开肯定就404了啊,结果发现哇,人家配的比我配的还好啊,什么TAG啊,什么CATEGORY啊,都加好了。
然后就第二个用力,就是接下来我我刚震惊完,我就想着之前也让他搭过一个本地的whisper的转写模型。
然后就第二个用力,就是接下来我我刚震惊完,我就想着之前也让他搭过一个本地的whisper的转写模型。
这个模型非常强,但是它对中文有个问题,就是它的标点加不好,整段没有标点,或者加了一堆奇怪的英文标点是很常见的啊,后面改的很难受。
这个模型非常强,但是它对中文有个问题,就是它的标点加不好,整段没有标点,或者加了一堆奇怪的英文标点是很常见的啊,后面改的很难受。
所以我看完他刚才做的那个评测,我就说你要不把这两个连起来,你这个whisper转写完了,你用这个小模型refine一下。
所以我看完他刚才做的那个评测,我就说你要不把这两个连起来,你这个whisper转写完了,你用这个小模型refine一下。
性能各方面应该都不错吧?
性能各方面应该都不错吧?
啊,然后他马上就把它连起来,又跑了一遍测试,又是给了很多性能啊,各方面的情况,甚至还不断的让我发语音,然后他好测更多的数据。
啊,然后他马上就把它连起来,又跑了一遍测试,又是给了很多性能啊,各方面的情况,甚至还不断的让我发语音,然后他好测更多的数据。
最后我就说,那你再写一篇。
最后我就说,那你再写一篇。
这次你自己生成一个配图吧。
这次你自己生成一个配图吧。
但是我没有给他配那个APIK,我是只买了订阅的套餐的,所以它内置的生图的工具它就用不了了。
但是我没有给他配那个APIK,我是只买了订阅的套餐的,所以它内置的生图的工具它就用不了了。
然后他自己就跑去打开浏览器访问JIMMY的网页,因为文章是他写的嘛,所以他就把提示词直接输进去,点击生成。
然后他自己就跑去打开浏览器访问JIMMY的网页,因为文章是他写的嘛,所以他就把提示词直接输进去,点击生成。
等这个配图生成之后呢?
等这个配图生成之后呢?
他尝试了下载,下载不行,因为他用的自己的这个PLAY RIGHT PROFILE好像不能下东西。
他尝试了下载,下载不行,因为他用的自己的这个PLAY RIGHT PROFILE好像不能下东西。
他就想到了我把它复制直接保存到DOWNLOAD,然后再把图挪过去,最后给它推到了博客上,而且给它命名好COVER点PNG啊,这样博客上直接就贴图就显示出来了。
他就想到了我把它复制直接保存到DOWNLOAD,然后再把图挪过去,最后给它推到了博客上,而且给它命名好COVER点PNG啊,这样博客上直接就贴图就显示出来了。
啊,就整个过程又是他自己搞定的。
啊,就整个过程又是他自己搞定的。
最后甚至还OFFER把这个过程封装成了一个SCALE。
最后甚至还OFFER把这个过程封装成了一个SCALE。
接下来他每次就调这个就用了啊。
接下来他每次就调这个就用了啊。
所以整个过程就是,就如果大家带过人啊,有过下属的话,就那种特别主动性的下属的这种感觉。
所以整个过程就是,就如果大家带过人啊,有过下属的话,就那种特别主动性的下属的这种感觉。
所以我觉得这个算是我的用力里头一个特别啊哈MOMENT的一个用力吧。
所以我觉得这个算是我的用力里头一个特别啊哈MOMENT的一个用力吧。
我举两个例子,首先我在感觉他的工作方式上,因为我用的最多的AGENT是CLOUD CODE。
我举两个例子,首先我在感觉他的工作方式上,因为我用的最多的AGENT是CLOUD CODE。
然后我就跟他对比的话,他倾向于我少解释我在做什么,我就直接把它做了。
然后我就跟他对比的话,他倾向于我少解释我在做什么,我就直接把它做了。
我如果一件事情说我问这个事情是不是可以这么做,然后考考的回答我啊,这个事情可以怎么做或者不可以怎么做。
我如果一件事情说我问这个事情是不是可以这么做,然后考考的回答我啊,这个事情可以怎么做或者不可以怎么做。
然后我发现他会倾向于直接把这个事儿干了,然后直接就给我一个啊,我已经干了。
然后我发现他会倾向于直接把这个事儿干了,然后直接就给我一个啊,我已经干了。
我觉得这是一个蛮有意思的设计。
我觉得这是一个蛮有意思的设计。
具体的一个case是这样,我昨天在想去看几个项目的github的issue。
具体的一个case是这样,我昨天在想去看几个项目的github的issue。
想去提炼出大家用这些GITHUB是来干什么的。
想去提炼出大家用这些GITHUB是来干什么的。
我当时先扔给了CLOCKWORK去干,然后我发现他会偷懒,因为这个一手一般就有一千、两千个,他就有各种偷懒的办法,用加了一些搜索呀、关键词呀什么,给了我一个总结。
我当时先扔给了CLOCKWORK去干,然后我发现他会偷懒,因为这个一手一般就有一千、两千个,他就有各种偷懒的办法,用加了一些搜索呀、关键词呀什么,给了我一个总结。
然后我觉得他这个肯定不是一条一条都看过去,我就是要很笨的一条看过去,然后我就CLOCKBOARD去做了这个事儿。
然后我觉得他这个肯定不是一条一条都看过去,我就是要很笨的一条看过去,然后我就CLOCKBOARD去做了这个事儿。
我发现他就是很听我的话,就是一条条去看。
我发现他就是很听我的话,就是一条条去看。
当然,这个缺点就是比较好TOKEN。
当然,这个缺点就是比较好TOKEN。
但是好在我不是直接用的API,我是用的我的会员账号,本质上就是一个固定费用。
但是好在我不是直接用的API,我是用的我的会员账号,本质上就是一个固定费用。
这个是我觉得它挺好的一个点。
这个是我觉得它挺好的一个点。
再说一个缺点吧,因为毕竟对于我而言,更多的工作还是写代码。
再说一个缺点吧,因为毕竟对于我而言,更多的工作还是写代码。
因为我们最近在做一个用FMM作为底层去重塑它的记忆的这么一个插件系统吧,我是希望让它自己在它里面去用AI编程的方法去做。
因为我们最近在做一个用FMM作为底层去重塑它的记忆的这么一个插件系统吧,我是希望让它自己在它里面去用AI编程的方法去做。
就会出现很多问题,但是我后面还是决定先到CLOUDDO里去做这件事儿。
就会出现很多问题,但是我后面还是决定先到CLOUDDO里去做这件事儿。
成功率和效果还是好了很多。
成功率和效果还是好了很多。
其实我跟甄豪的经历还是比较相似的,因为我们主要的工作都是做开发嘛。
其实我跟甄豪的经历还是比较相似的,因为我们主要的工作都是做开发嘛。
如果我主力是用CLOUDBOX开发的话,让我在那个绿泡泡里边去做软件开发还是很痛苦的。
如果我主力是用CLOUDBOX开发的话,让我在那个绿泡泡里边去做软件开发还是很痛苦的。
我觉得它其实这更适合知识工作者去使用。
我觉得它其实这更适合知识工作者去使用。
有一个很有意思点,是我们内部有一个非技术人员用的时候,我就问他为什么他觉得CALL OUT比我们自己内部的工具要好?
有一个很有意思点,是我们内部有一个非技术人员用的时候,我就问他为什么他觉得CALL OUT比我们自己内部的工具要好?
因为我们内部是用CLOCK CODE嘛。
因为我们内部是用CLOCK CODE嘛。
他就说当我生成完一个东西之后,CLOCK CODE告诉我的是。
他就说当我生成完一个东西之后,CLOCK CODE告诉我的是。
文件做好了,在这个路径下,他发了一个COMMAND CD什么什么什么PASS。
文件做好了,在这个路径下,他发了一个COMMAND CD什么什么什么PASS。
飞机人员就说这是什么意思,他就说WHAT DO I DO WITH THIS。
飞机人员就说这是什么意思,他就说WHAT DO I DO WITH THIS。
但是换到CLOUD BOAT之后呢?
但是换到CLOUD BOAT之后呢?
因为他肯定是加了这个消息系统的这些工具或者是MCP吧,他用绿泡泡发的时候,他会直接把这个文件附件的形式发给他,或者是照片的话,他会直接发给他,而不是发给他一个路径。
因为他肯定是加了这个消息系统的这些工具或者是MCP吧,他用绿泡泡发的时候,他会直接把这个文件附件的形式发给他,或者是照片的话,他会直接发给他,而不是发给他一个路径。
这个对于知识工作者来说,就是非常显而易见的优势。
这个对于知识工作者来说,就是非常显而易见的优势。
嗯,明白。
嗯,明白。
对我们能不能拆解一下,要想实现它的一些功能啊,就在代码层面。
对我们能不能拆解一下,要想实现它的一些功能啊,就在代码层面。
比如说有很多人拆解说它有几个MARKDOWN的文件,通过这些来让它从一个冷冰冰的程序变成一个更有人感的一个数字生物。
比如说有很多人拆解说它有几个MARKDOWN的文件,通过这些来让它从一个冷冰冰的程序变成一个更有人感的一个数字生物。
就这个是怎么去做到的?
就这个是怎么去做到的?
首先我可以给大家介绍它是怎么做,我相信它的技术方案其实也比较简单,很大量的参考了CLOUD CODE的实现。
首先我可以给大家介绍它是怎么做,我相信它的技术方案其实也比较简单,很大量的参考了CLOUD CODE的实现。
我理解,首先这个记忆我觉得这个词儿其实包含的意义很多。
我理解,首先这个记忆我觉得这个词儿其实包含的意义很多。
比如说我们一个人,他的说话方式、他知道自己叫什么名字、知道这用户叫什么名字,这是一种记忆,或者说他的一个PERSONALITY吧,这可以算是一种记忆。
比如说我们一个人,他的说话方式、他知道自己叫什么名字、知道这用户叫什么名字,这是一种记忆,或者说他的一个PERSONALITY吧,这可以算是一种记忆。
另外一种就是更多偏事实的记忆,比如说你之前做了什么工作,你这个工作进行到了一个什么程度,你的哪一段代码可能出BUG,你明天要做什么样的安排,这种偏事实的记忆,我觉得它是偏拆分开来的。
另外一种就是更多偏事实的记忆,比如说你之前做了什么工作,你这个工作进行到了一个什么程度,你的哪一段代码可能出BUG,你明天要做什么样的安排,这种偏事实的记忆,我觉得它是偏拆分开来的。
我们前面提到的IDENTITY,或者这样的一些MARKDOWN,更多偏向的是PERSONALITY的记忆。
我们前面提到的IDENTITY,或者这样的一些MARKDOWN,更多偏向的是PERSONALITY的记忆。
你在刚开始跟CLUBBOT去聊天的时候,他会拼了命的去问你:你希望我叫什么名字?
你在刚开始跟CLUBBOT去聊天的时候,他会拼了命的去问你:你希望我叫什么名字?
你叫什么名字?
你叫什么名字?
其实你一开始没回答他,他也会一直常常是去问你。
其实你一开始没回答他,他也会一直常常是去问你。
然后拿到这些信息之后,把它存下来。
然后拿到这些信息之后,把它存下来。
技术上的话,就是把这些文件的内容LOAD到他的CONTEXT里,然后就去使用了。
技术上的话,就是把这些文件的内容LOAD到他的CONTEXT里,然后就去使用了。
那这个是偏个人的这一部分。
那这个是偏个人的这一部分。
当然,这个技术也算比较的成熟。
当然,这个技术也算比较的成熟。
如果大家玩过一些那种二次元角色扮演或者那种数字人分身的项目里,他们可能会做得更加好,或者说是把这个技术方向做得更加的极致。
如果大家玩过一些那种二次元角色扮演或者那种数字人分身的项目里,他们可能会做得更加好,或者说是把这个技术方向做得更加的极致。
另外就是偏事实记忆或者我们叫过程或者工作记忆,那它在这里实现方式首先它是会把每天的工作就存在一个以日期为INDEX的文件中。
另外就是偏事实记忆或者我们叫过程或者工作记忆,那它在这里实现方式首先它是会把每天的工作就存在一个以日期为INDEX的文件中。
那这个文件有三种方式会生成。
那这个文件有三种方式会生成。
第一个是,是每天的结束的时候,那他会把今天所有做的工作都总结一下,放到这个里面。
第一个是,是每天的结束的时候,那他会把今天所有做的工作都总结一下,放到这个里面。
第二个情况是,当上下文的长度超过了模型的这个上下文能够接受的长度的时候,它也会做一个压缩,会放进去。
第二个情况是,当上下文的长度超过了模型的这个上下文能够接受的长度的时候,它也会做一个压缩,会放进去。
第三个情况是,我觉得他做的挺有意思的,就是我当时在跟CLOUDBOX在聊天的时候,我跟他说我在做一个调研,想去理解你的记忆系统。
第三个情况是,我觉得他做的挺有意思的,就是我当时在跟CLOUDBOX在聊天的时候,我跟他说我在做一个调研,想去理解你的记忆系统。
那他说IT'S A VERY GOOD POINT,LET ME WRITE IT DOWN。
那他说IT'S A VERY GOOD POINT,LET ME WRITE IT DOWN。
他会显示的把我正在做的这个事情记到他的记忆里去。
他会显示的把我正在做的这个事情记到他的记忆里去。
所以有时说他除了被动触发,他也会去识别哪些事情是值得记下来的。
所以有时说他除了被动触发,他也会去识别哪些事情是值得记下来的。
虽然这个事情并不是很新,比如说如果你用过CLOCK CODE或者CLOCK WORK等等,他没有相应的机制做这个事儿,但是他把这个过程非常明显的告诉用户说:诶,我觉得这个值得记下来。
虽然这个事情并不是很新,比如说如果你用过CLOCK CODE或者CLOCK WORK等等,他没有相应的机制做这个事儿,但是他把这个过程非常明显的告诉用户说:诶,我觉得这个值得记下来。
甚至够他把这个东西写在什么地方,我觉得这个体验上是很好的。
甚至够他把这个东西写在什么地方,我觉得这个体验上是很好的。
嗯,但实际的我我看很多这个使用中,我感觉他好像比如像JANNA呀、CHATGPT呀,他们其实也是有记忆功能的嘛。
嗯,但实际的我我看很多这个使用中,我感觉他好像比如像JANNA呀、CHATGPT呀,他们其实也是有记忆功能的嘛。
但你觉得CLUBBOARD可能在用户交互的实际的这个使用的感知中,你觉得他可能比CHATGPT或者JANNA,他的这个记忆功能力有没有一些更新的突破?
但你觉得CLUBBOARD可能在用户交互的实际的这个使用的感知中,你觉得他可能比CHATGPT或者JANNA,他的这个记忆功能力有没有一些更新的突破?
这个背后是怎么做到的?
这个背后是怎么做到的?
我觉得确实之前提到CLUBBOT,它的长期记忆为什么效果好有一个点。
我觉得确实之前提到CLUBBOT,它的长期记忆为什么效果好有一个点。
我觉得可能得先澄清一下这个概念,就是MEMORY和CONTEXT。
我觉得可能得先澄清一下这个概念,就是MEMORY和CONTEXT。
这个概念一个CONTEXT就是我们比如用CHATBOT聊天的时候,给它输入的这些上下文,可以理解为是一个有限的、及时的,就每次跟它聊天都会被带进去的这么一个东西。
这个概念一个CONTEXT就是我们比如用CHATBOT聊天的时候,给它输入的这些上下文,可以理解为是一个有限的、及时的,就每次跟它聊天都会被带进去的这么一个东西。
这个东西经常不够用,压缩之后AI就变成人工智障了。
这个东西经常不够用,压缩之后AI就变成人工智障了。
他就突然记不得你刚才跟他聊的事情了。
他就突然记不得你刚才跟他聊的事情了。
但是MEMORY实际上在CLARBOAT里,它这套MEMORY系统包括其他的AGENT,它都是一个持续化的、持久的文件。
但是MEMORY实际上在CLARBOAT里,它这套MEMORY系统包括其他的AGENT,它都是一个持续化的、持久的文件。
这个文件它并不是每次都要放到刚才说的CONTEXT里的,所以它可以做很多的结构化,甚至说主要是用数据库。
这个文件它并不是每次都要放到刚才说的CONTEXT里的,所以它可以做很多的结构化,甚至说主要是用数据库。
CLARBOAT它的一个好的设计就是它是用很多MD文件、文本文件去实现的。
CLARBOAT它的一个好的设计就是它是用很多MD文件、文本文件去实现的。
它的记忆呢,就是刚才说的一工作记忆。
它的记忆呢,就是刚才说的一工作记忆。
这个对话我跟你现在在那聊天,或者是不同的CHANNEL跟你的聊天。
这个对话我跟你现在在那聊天,或者是不同的CHANNEL跟你的聊天。
那其实这个就像我们在开会或者是跟打字一样,这段时间内容你记得很清楚,但是可能过一段时间就忘了。
那其实这个就像我们在开会或者是跟打字一样,这段时间内容你记得很清楚,但是可能过一段时间就忘了。
它还有一个就是日记,每天有一个日期为文件名的MD文件,会总结一下今天做了什么、遇到什么问题。
它还有一个就是日记,每天有一个日期为文件名的MD文件,会总结一下今天做了什么、遇到什么问题。
那这些东西它是在后续的流程里它会用到的。
那这些东西它是在后续的流程里它会用到的。
比如说它新开启一个SESSION的时候,它的AGENT MD里面会有一句话。
比如说它新开启一个SESSION的时候,它的AGENT MD里面会有一句话。
让他记得去看一下今天日期,甚至昨天日期的日记。
让他记得去看一下今天日期,甚至昨天日期的日记。
这样他可以快速地CATCH UP一下最近到底做了什么。
这样他可以快速地CATCH UP一下最近到底做了什么。
就有点像我们,比如见客户对吧?
就有点像我们,比如见客户对吧?
先翻资料啊,找原来的会议纪要,赶紧同步一下最近跟他聊了什么,到哪一步了。
先翻资料啊,找原来的会议纪要,赶紧同步一下最近跟他聊了什么,到哪一步了。
他还会做一些更长期的总结,比如说有时候会做一些周的总结。
他还会做一些更长期的总结,比如说有时候会做一些周的总结。
他会再把这个日记里的信息再提炼。
他会再把这个日记里的信息再提炼。
用户如果问到长时间以前的内容,他能快速地去定位到它。
用户如果问到长时间以前的内容,他能快速地去定位到它。
最后他还有一个就是MEMORY点MD。
最后他还有一个就是MEMORY点MD。
那这个文件呢?
那这个文件呢?
你可以理解为是他的常识,你告诉他的或者他自己总结的。
你可以理解为是他的常识,你告诉他的或者他自己总结的。
比如我的话,我用我的博客框架是GOOGLE,他就知道是GOOGLE,他就知道帮我自动发博客的时候在什么地方找到这个文件夹,然后用什么流程。
比如我的话,我用我的博客框架是GOOGLE,他就知道是GOOGLE,他就知道帮我自动发博客的时候在什么地方找到这个文件夹,然后用什么流程。
包括我告诉他,我给你的截图识别的时候先用本地的OCR,先不要直接走多模态的模型。
包括我告诉他,我给你的截图识别的时候先用本地的OCR,先不要直接走多模态的模型。
这些他就都会记在这里,然后每次聊天呢MEMORY点MD,尤其是MAIN SESSION,因为其他SESSION比如说DISCORD呀或者群聊里你加载这些有点PERSONAL的东西是不太好的嘛,怕被别人把你的隐私调出去。
这些他就都会记在这里,然后每次聊天呢MEMORY点MD,尤其是MAIN SESSION,因为其他SESSION比如说DISCORD呀或者群聊里你加载这些有点PERSONAL的东西是不太好的嘛,怕被别人把你的隐私调出去。
但如果你跟他是直接聊的,比如说TELEGRAM和这个WHAT'S UP这种MAIN SESSION,它会直接加载到每次的这个CONTEXT里。
但如果你跟他是直接聊的,比如说TELEGRAM和这个WHAT'S UP这种MAIN SESSION,它会直接加载到每次的这个CONTEXT里。
这样你就会觉得他好像记得好多事情。
这样你就会觉得他好像记得好多事情。
其实还有一个它特别有意思的就是它的那个MEMORY SEARCH,它这些MEMORY的文件MEMORY点MD和MEMORY文件夹下的所有这些MD文件,它其实都把它切成差不多400个TOKEN一个的小块,然后每个块之间还有80个TOKEN的重叠OVERLAP,这样跨界的话就不会切断,就能连起来了。
其实还有一个它特别有意思的就是它的那个MEMORY SEARCH,它这些MEMORY的文件MEMORY点MD和MEMORY文件夹下的所有这些MD文件,它其实都把它切成差不多400个TOKEN一个的小块,然后每个块之间还有80个TOKEN的重叠OVERLAP,这样跨界的话就不会切断,就能连起来了。
这个它会存在本地的一个轻量的数据库CIRCLE LIGHT里面,转成向量的格式。
这个它会存在本地的一个轻量的数据库CIRCLE LIGHT里面,转成向量的格式。
它在MEMORY SEARCH的时候,它其实是一个缓和策略。
它在MEMORY SEARCH的时候,它其实是一个缓和策略。
它有百分之七十是按语义匹配的,百分之三十是直接关键词经济匹配。
它有百分之七十是按语义匹配的,百分之三十是直接关键词经济匹配。
比如我问他上次说的那个寿喜烧怎么做的来着啊,他就能直接通过语义匹配找到相关的牛肉啊、食材啊、准备啊这些之前记过的东西。
比如我问他上次说的那个寿喜烧怎么做的来着啊,他就能直接通过语义匹配找到相关的牛肉啊、食材啊、准备啊这些之前记过的东西。
然后我问他,比如说我那个BLOG需要用这个SSHK去访问的话,它就能直接定位到某一个精确的命令。
然后我问他,比如说我那个BLOG需要用这个SSHK去访问的话,它就能直接定位到某一个精确的命令。
所以这两个结合起来就感觉它特别吓人,它既能够理解你做的事儿,不是说纯字符软匹配,它又不是说它找不到那个精确的东西。
所以这两个结合起来就感觉它特别吓人,它既能够理解你做的事儿,不是说纯字符软匹配,它又不是说它找不到那个精确的东西。
所以这点对它的记忆达到的效果上来讲,我觉得是一个非常有效的一个机制吧。
所以这点对它的记忆达到的效果上来讲,我觉得是一个非常有效的一个机制吧。
最后就是这个MEMORY作为文本文件还有个好处。
最后就是这个MEMORY作为文本文件还有个好处。
就它不是隐藏的,它其实面向用户的,大家自己都能看,甚至自己都能去改。
就它不是隐藏的,它其实面向用户的,大家自己都能看,甚至自己都能去改。
你觉得他记得不对,或者说他记得啰嗦了,或者我让他换个方式,我其实也可以直接去这些文本文件里去操作。
你觉得他记得不对,或者说他记得啰嗦了,或者我让他换个方式,我其实也可以直接去这些文本文件里去操作。
所以我觉得这个实在是比较神奇啊。
所以我觉得这个实在是比较神奇啊。
正好我有个疑问,像刚才举例的这些方法,不管是记录到文本文件这种聊天记录记录进去,再把它切割。
正好我有个疑问,像刚才举例的这些方法,不管是记录到文本文件这种聊天记录记录进去,再把它切割。
再记录数据库里,然后再用VECTOR的形式给它搜索出来。
再记录数据库里,然后再用VECTOR的形式给它搜索出来。
其实这些都是已经已有的很多成熟方案,好像它是有点大力出奇迹,把所有东西都粘在一起去做记忆这个事情,那肯定会产生很多REASONING,也不一定是最以FASHION的方式。
其实这些都是已经已有的很多成熟方案,好像它是有点大力出奇迹,把所有东西都粘在一起去做记忆这个事情,那肯定会产生很多REASONING,也不一定是最以FASHION的方式。
我这样理解对吧?
我这样理解对吧?
我觉得是的,甚至它其实效果上也不一定是最好的方案。
我觉得是的,甚至它其实效果上也不一定是最好的方案。
对我自己其实用的时候也发现了。
对我自己其实用的时候也发现了。
它肯定是没有CHATGPT的记忆那么顺滑,但是可能还是要结合场景。
它肯定是没有CHATGPT的记忆那么顺滑,但是可能还是要结合场景。
就之前上一个问题讲的,为什么火?
就之前上一个问题讲的,为什么火?
对,我这个想补充一个点。
对,我这个想补充一个点。
因为我们自己是做记忆嘛,我们跟很多的客户去聊这个事情,永远记住用户的他的背景、他的需求是个非常好的。
因为我们自己是做记忆嘛,我们跟很多的客户去聊这个事情,永远记住用户的他的背景、他的需求是个非常好的。
但是,一般用户跟我们聊不了这么久呀。
但是,一般用户跟我们聊不了这么久呀。
就是你们的这个做得很好的点,好像在我们场景下很难被感知到。
就是你们的这个做得很好的点,好像在我们场景下很难被感知到。
这个是其实是我们做记忆中最难的一个问题,就是记忆虽好,但是真的用户能感觉到它其实是个比较难的事情。
这个是其实是我们做记忆中最难的一个问题,就是记忆虽好,但是真的用户能感觉到它其实是个比较难的事情。
我觉得CLOUD BO做了一件很对的事情,就是他把这个事情体现在了主动性上。
我觉得CLOUD BO做了一件很对的事情,就是他把这个事情体现在了主动性上。
比如说当你早上收到了一个短信,说我昨天事情做完了,你今天我记得你要干什么?
比如说当你早上收到了一个短信,说我昨天事情做完了,你今天我记得你要干什么?
干什么?
干什么?
要不要去考虑?
要不要去考虑?
这个时候你会觉得他有记忆了,而不是还是停留在你给BOT一个PROMPT、一个TASK。
这个时候你会觉得他有记忆了,而不是还是停留在你给BOT一个PROMPT、一个TASK。
他好像因为记忆完成得更好,这个感知是很弱的。
他好像因为记忆完成得更好,这个感知是很弱的。
所以我觉得并不是因为他的记忆系统设计得好、实现得好,而是他让用户感知到他的记忆系统的价值。
所以我觉得并不是因为他的记忆系统设计得好、实现得好,而是他让用户感知到他的记忆系统的价值。
我觉得这个是很值得我们学习的。
我觉得这个是很值得我们学习的。
对它衔接的特别好。
对它衔接的特别好。
咱们正常人不可能经常失忆嘛,就是很多事情都能连起来。
咱们正常人不可能经常失忆嘛,就是很多事情都能连起来。
我有时候从TELEGRAM上突然切到DISCORD上,他能把我两边的对话连起来,他能知道刚才在聊什么,就这就一下就有活人感了。
我有时候从TELEGRAM上突然切到DISCORD上,他能把我两边的对话连起来,他能知道刚才在聊什么,就这就一下就有活人感了。
对,确实就我觉得权限这个点可能也非常重要。
对,确实就我觉得权限这个点可能也非常重要。
就是CHATGPT或JAMNA,它毕竟还没有获得你的这个电脑的权限,就它的记忆虽然说它有能力,但是它的输入不够多。
就是CHATGPT或JAMNA,它毕竟还没有获得你的这个电脑的权限,就它的记忆虽然说它有能力,但是它的输入不够多。
所以它没有办法穿透你在各个地方的一些行为。
所以它没有办法穿透你在各个地方的一些行为。
我们刚刚正好聊到这个主动性啊,我记得之前有人说它好像有一个心跳机制,类似于叫HEARTBEAT的这个机制。
我们刚刚正好聊到这个主动性啊,我记得之前有人说它好像有一个心跳机制,类似于叫HEARTBEAT的这个机制。
它的这个主动性是如何实现?
它的这个主动性是如何实现?
我看了一下代码,如果我没有看错的话,它这是一个偏工程性的实现。
我看了一下代码,如果我没有看错的话,它这是一个偏工程性的实现。
它会定期在发现我们没有说话的时候,它会有一个PROMPT,大概是让它自己去判断现在有什么事情是可以做的,然后之前的功能做的大概是什么样,会自己给自己去有个提醒。
它会定期在发现我们没有说话的时候,它会有一个PROMPT,大概是让它自己去判断现在有什么事情是可以做的,然后之前的功能做的大概是什么样,会自己给自己去有个提醒。
因为现在整个LM的技术框架还是在一个被动式的出发,需要有PROMPT去TRIGGER这个事情。
因为现在整个LM的技术框架还是在一个被动式的出发,需要有PROMPT去TRIGGER这个事情。
所以它也是通过这样的方式去做的。
所以它也是通过这样的方式去做的。
但我觉得可能在整个产品的设计上而言做得比较好,所以让大家能够感受到主动性的事情。
但我觉得可能在整个产品的设计上而言做得比较好,所以让大家能够感受到主动性的事情。
我觉得这个应该是借鉴了之前比较火的那个ROUGH LOOP,可能每三十分钟调用一次自己给自己抽鞭子起来干活。
我觉得这个应该是借鉴了之前比较火的那个ROUGH LOOP,可能每三十分钟调用一次自己给自己抽鞭子起来干活。
这样你说的是那个CLOUD CODE的ROUGH WIGGUM吗?
这样你说的是那个CLOUD CODE的ROUGH WIGGUM吗?
那个插件吗?
那个插件吗?
对对对对对。
对对对对对。
啊,明白。
啊,明白。
对,是的。
对,是的。
我看了一下,他这个机制是他一个守护进程,在每隔一段时间打电话把AI叫起来干活嘛。
我看了一下,他这个机制是他一个守护进程,在每隔一段时间打电话把AI叫起来干活嘛。
他先看那个HEARTBEAT点MD里头记了什么。
他先看那个HEARTBEAT点MD里头记了什么。
他有一句话,如果这个地方没有任何注释以外的内容,就直接跳过;即便是有一些内容,他也会先判断一下我是不是需要处理,是不是需要告诉用户。
他有一句话,如果这个地方没有任何注释以外的内容,就直接跳过;即便是有一些内容,他也会先判断一下我是不是需要处理,是不是需要告诉用户。
不需要,他会发一个叫HARD BEAT OK的这么一个静默信号。
不需要,他会发一个叫HARD BEAT OK的这么一个静默信号。
这个信号会被系统直接就吞掉了,不会产生任何后续的反应。
这个信号会被系统直接就吞掉了,不会产生任何后续的反应。
所以说他做到的一个点就是,他虽然一直在HARD BEAT,但是他主动找你的时候也没有那么多这种感觉,就还是又回到这个活人感了。
所以说他做到的一个点就是,他虽然一直在HARD BEAT,但是他主动找你的时候也没有那么多这种感觉,就还是又回到这个活人感了。
他既有主动性,他又不烦你,他又不是那种非常烦人的给你打LOG的那种机器。
他既有主动性,他又不烦你,他又不是那种非常烦人的给你打LOG的那种机器。
第二个就是它这个也挺省TOKEN的吧,它按需使用TOKEN,用在刀刃上。
第二个就是它这个也挺省TOKEN的吧,它按需使用TOKEN,用在刀刃上。
展开剩余字幕(还有 480 条)
另外就是CROWN JOB,它其实有两个,一个是HARD BIT,一个是CROWN JOB定时的任务。
另外就是CROWN JOB,它其实有两个,一个是HARD BIT,一个是CROWN JOB定时的任务。
它那个的任务跟HARD BIT的区别就是那个对时间的定义是非常精确的。
它那个的任务跟HARD BIT的区别就是那个对时间的定义是非常精确的。
比如我让他每天三次帮我去做摘要,摘要我给他的那个推特账号关注的那些列表里的信息,每天三次早中晚定时定点。
比如我让他每天三次帮我去做摘要,摘要我给他的那个推特账号关注的那些列表里的信息,每天三次早中晚定时定点。
这个他是能保持的非常好的,但是还有一个任务就是让他如果这里面有一些突发事件,你判断比较重要的需要我知道的事情,那你就随时告诉我。
这个他是能保持的非常好的,但是还有一个任务就是让他如果这里面有一些突发事件,你判断比较重要的需要我知道的事情,那你就随时告诉我。
那这个时候就是我跟他聊着聊天,有时候突然他会弹出一条来说:哎,突然发生了一件什么事情?
那这个时候就是我跟他聊着聊天,有时候突然他会弹出一条来说:哎,突然发生了一件什么事情?
比如说特朗普对欧盟做关税制裁。
比如说特朗普对欧盟做关税制裁。
所以我觉得这两个结合起来就也让他更像一个人了嘛,就你给他安排的事情。
所以我觉得这两个结合起来就也让他更像一个人了嘛,就你给他安排的事情。
他能够精准地给你做完,然后你让让他盯着的事情。
他能够精准地给你做完,然后你让让他盯着的事情。
他有事情的时候,他就会来找你。
他有事情的时候,他就会来找你。
那你们在用CARBO的时候,就真的敢给他开那么多权限吗?
那你们在用CARBO的时候,就真的敢给他开那么多权限吗?
这个未来会不会有问题?
这个未来会不会有问题?
其实用这个事情,包括之前推特上有很多朋友都在问啊。
其实用这个事情,包括之前推特上有很多朋友都在问啊。
因为当时CARBO爆火之后,很多人很FORMAL都搞来装。
因为当时CARBO爆火之后,很多人很FORMAL都搞来装。
那实际上说实话,这个不适合现在大规模的普通人去用的。
那实际上说实话,这个不适合现在大规模的普通人去用的。
所以后面就好多人也跳出来说,这个太可怕了,不敢用。
所以后面就好多人也跳出来说,这个太可怕了,不敢用。
大家可能又开始慌了啊。
大家可能又开始慌了啊。
对,其实确实是这样,因为站在技术角度讲,它基本上拥有你系统很多隐秘的东西才能看到,而且它可以直接执行。
对,其实确实是这样,因为站在技术角度讲,它基本上拥有你系统很多隐秘的东西才能看到,而且它可以直接执行。
所以最好的部署方法就是隔离部署,不要在自己的主力电脑上去使用,要么就是自己大家常说的MAC MINI,对吧?
所以最好的部署方法就是隔离部署,不要在自己的主力电脑上去使用,要么就是自己大家常说的MAC MINI,对吧?
这最近都已经变成梗了。
这最近都已经变成梗了。
买一个MAC MINI,把它放进去用到MAC的一些生态的东西。
买一个MAC MINI,把它放进去用到MAC的一些生态的东西。
又可以把你愿意让它访问又不想上传到VPS上的一些东西呢?
又可以把你愿意让它访问又不想上传到VPS上的一些东西呢?
给它这样的话,在一定程度上可以把安全啊、隐私的问题做成自己可控的。
给它这样的话,在一定程度上可以把安全啊、隐私的问题做成自己可控的。
你直接跑到自己本地就不可控了嘛。
你直接跑到自己本地就不可控了嘛。
那如果我觉得要追求极致的隐私和安全。
那如果我觉得要追求极致的隐私和安全。
确实需要本地模型,那这个一般人烧不起啊。
确实需要本地模型,那这个一般人烧不起啊。
而且本地模型的性能各方面还是没有办法跟OPPO这种大模型比。
而且本地模型的性能各方面还是没有办法跟OPPO这种大模型比。
所以未来可期,就是当摩尔定律在发挥作用,大家这个模型TRAINED越来越好,本地能跑得起的模型的性能也足够支撑这么一个助手类型的AGENT的时候,那很多隐私问题可能就减轻了很多了。
所以未来可期,就是当摩尔定律在发挥作用,大家这个模型TRAINED越来越好,本地能跑得起的模型的性能也足够支撑这么一个助手类型的AGENT的时候,那很多隐私问题可能就减轻了很多了。
剩下的就是你怎么给他一套安全边界,让他不要乱搞就可以了。
剩下的就是你怎么给他一套安全边界,让他不要乱搞就可以了。
我在这件事情上有一个很务实的建议,如果大家想用的话。
我在这件事情上有一个很务实的建议,如果大家想用的话。
假设你是用CLOUD模型或者ASPECT模型的话,不要直接把APIKEY贴给它,而是你可以注册一个MEMBERSHIP。
假设你是用CLOUD模型或者ASPECT模型的话,不要直接把APIKEY贴给它,而是你可以注册一个MEMBERSHIP。
无论你是用PRO还是MAX,你用它的这个MEMBERSHIP的方式去登录,你花固定的钱,它也不会担心它烧掉过多TOKEN。
无论你是用PRO还是MAX,你用它的这个MEMBERSHIP的方式去登录,你花固定的钱,它也不会担心它烧掉过多TOKEN。
因为如果你烧了过多TOKEN,只是CLOUD那边把你这边禁了而已。
因为如果你烧了过多TOKEN,只是CLOUD那边把你这边禁了而已。
对对,它其实在用MEMBERSHIP的时候,它有两种用法,一个是CRI的OS。
对对,它其实在用MEMBERSHIP的时候,它有两种用法,一个是CRI的OS。
OS的TOKEN就是它老是会提示快过期了。
OS的TOKEN就是它老是会提示快过期了。
那还有一个用法叫SET UP TOKEN,大家用的时候可以注意一下。
那还有一个用法叫SET UP TOKEN,大家用的时候可以注意一下。
其实用这个方式是更好的。
其实用这个方式是更好的。
当时我看CLOUD BOAT之父啊,就是创作者老哥他自己在做演示的时候,他就是随手就SET UP TOKEN贴过来放进去,这也方便大家多机器部署。
当时我看CLOUD BOAT之父啊,就是创作者老哥他自己在做演示的时候,他就是随手就SET UP TOKEN贴过来放进去,这也方便大家多机器部署。
就如果你想让它非常独立的AGENT的话,其实可以共享你一个订阅账号下的不同的SET UP TOKEN。
就如果你想让它非常独立的AGENT的话,其实可以共享你一个订阅账号下的不同的SET UP TOKEN。
嗯,我之前看网上有很多人说它TOKEN消耗量很大。
嗯,我之前看网上有很多人说它TOKEN消耗量很大。
之所以出现这个问题,就还是给了它API接口才会出现这样的问题。
之所以出现这个问题,就还是给了它API接口才会出现这样的问题。
但如果不给他只是会员制的话,那它对它效果会有影响吗?
但如果不给他只是会员制的话,那它对它效果会有影响吗?
啊,效果没有影响。
啊,效果没有影响。
说白了,会员制我感觉就是价格歧视,或者说互相剥削的这种做法。
说白了,会员制我感觉就是价格歧视,或者说互相剥削的这种做法。
像我这种200刀这种订阅,肯定每个星期基本都能用满的人。
像我这种200刀这种订阅,肯定每个星期基本都能用满的人。
肯定是亏钱的,但就我来说,它成本肯定跟收益不成比例。
肯定是亏钱的,但就我来说,它成本肯定跟收益不成比例。
但是可能大多数比如二十刀的用户,实际消耗的可能也就几刀,那它总体能跑正。
但是可能大多数比如二十刀的用户,实际消耗的可能也就几刀,那它总体能跑正。
所以说如果你用这种高消耗的场景去买这个订阅,那绝对是划算的。
所以说如果你用这种高消耗的场景去买这个订阅,那绝对是划算的。
至于别人,他说自己CLUB BOAT消耗大呢。
至于别人,他说自己CLUB BOAT消耗大呢。
我觉得还是需要CASE BY CASE看他怎么用的。
我觉得还是需要CASE BY CASE看他怎么用的。
就我自己的感觉是,单纯的BOAT自己的消耗是没有那么大的,它肯定会比单纯用CHAT BOAT这种大。
就我自己的感觉是,单纯的BOAT自己的消耗是没有那么大的,它肯定会比单纯用CHAT BOAT这种大。
因为AGENT它其实有很多自己的机制啊,像刚才讲的那些MD文件MEMORY这些,它都会加载到CONTEXT里头,它肯定是要大的。
因为AGENT它其实有很多自己的机制啊,像刚才讲的那些MD文件MEMORY这些,它都会加载到CONTEXT里头,它肯定是要大的。
再就是它自动的这个HARD BEAT,虽然它已经做了省TOKEN的策略。
再就是它自动的这个HARD BEAT,虽然它已经做了省TOKEN的策略。
但毕竟还是要消耗的,所以说他们要如果用的多,我估计是他通过CLOUD BOAT做了一些本身就好TOKEN的事情,比如做爬虫,或者说我之前让他去帮我监控一个事情,他自己是用截屏的方式,就PUB截屏再去做下一步的方式。
但毕竟还是要消耗的,所以说他们要如果用的多,我估计是他通过CLOUD BOAT做了一些本身就好TOKEN的事情,比如做爬虫,或者说我之前让他去帮我监控一个事情,他自己是用截屏的方式,就PUB截屏再去做下一步的方式。
那每次都做这种屏幕的图像识别,那TOKEN耗的就非常非常多了。
那每次都做这种屏幕的图像识别,那TOKEN耗的就非常非常多了。
后面我就告诉他,浏览器就直接用你的PLAY RIGHT的PROFILE去操作,不要去给我截屏。
后面我就告诉他,浏览器就直接用你的PLAY RIGHT的PROFILE去操作,不要去给我截屏。
然后这个事情就缓解了很多。
然后这个事情就缓解了很多。
所以说我的经验就是,我现在跑了五个CARCO的AGENT,一个月两百美金套餐差不多够用,再加上平时做的一些编程的任务,基本上也都能COVER掉。
所以说我的经验就是,我现在跑了五个CARCO的AGENT,一个月两百美金套餐差不多够用,再加上平时做的一些编程的任务,基本上也都能COVER掉。
最后我关于贵不贵就还是要看他到底做了啥。
最后我关于贵不贵就还是要看他到底做了啥。
这是个相对概念。
这是个相对概念。
我之前听红山的播客郑庆生说,他整个二五年最大的一个是用AI的个人体验,就是他做了一个自己的数字分身,他把所有的自己的数据从WORD文档啊、PPT啊、EXCEL的各种各样的资料都丢给了他这个AI分身,然后让他去学习。
我之前听红山的播客郑庆生说,他整个二五年最大的一个是用AI的个人体验,就是他做了一个自己的数字分身,他把所有的自己的数据从WORD文档啊、PPT啊、EXCEL的各种各样的资料都丢给了他这个AI分身,然后让他去学习。
再让他按照自己的口吻来写东西,比如说一些演讲稿、串词啊,就完全可以直接用了。
再让他按照自己的口吻来写东西,比如说一些演讲稿、串词啊,就完全可以直接用了。
这一段我看是他们小宇宙博客的播放热度最高的几分钟啊,所以我我感觉大家都非常关心是不是真的能让AI来给自己打工。
这一段我看是他们小宇宙博客的播放热度最高的几分钟啊,所以我我感觉大家都非常关心是不是真的能让AI来给自己打工。
那现在有了CLUB BOAT之后,如果我们再用它来做一个AI分身,是不是变得更容易了?
那现在有了CLUB BOAT之后,如果我们再用它来做一个AI分身,是不是变得更容易了?
应该怎么去做?
应该怎么去做?
如果要做一个这样数字分身,它对TOKEN的消耗量大,大概要花多少钱?
如果要做一个这样数字分身,它对TOKEN的消耗量大,大概要花多少钱?
我觉得这个分身对你的了解程度不一样,成本和效果都不一样。
我觉得这个分身对你的了解程度不一样,成本和效果都不一样。
刚才讲的那个案例,他是说把资料扔给AI让他学,然后给他写串词。
刚才讲的那个案例,他是说把资料扔给AI让他学,然后给他写串词。
其实这个是相对简单的。
其实这个是相对简单的。
我现在用的这个叫支线WRITER的SKILL,其实就是这么个玩意儿。
我现在用的这个叫支线WRITER的SKILL,其实就是这么个玩意儿。
我给他丢的是我的博客以前自己写的一些文章,还有我的TWITTER,让他自己去爬。
我给他丢的是我的博客以前自己写的一些文章,还有我的TWITTER,让他自己去爬。
他有一个内置的TWITTER工具嘛,爬完之后他自己去总结,然后跟我去对啊。
他有一个内置的TWITTER工具嘛,爬完之后他自己去总结,然后跟我去对啊。
这个他认为我是一个什么样的风格。
这个他认为我是一个什么样的风格。
我再跟他去核对一遍,最后他就记到他自己的MEMORY里面,包括之前WRITER这个SCALE的MARKDOWN文件里面。
我再跟他去核对一遍,最后他就记到他自己的MEMORY里面,包括之前WRITER这个SCALE的MARKDOWN文件里面。
那后面每次你让他写东西的时候,你也都可以给他一些反馈。
那后面每次你让他写东西的时候,你也都可以给他一些反馈。
所以说它不是一种静态的扔给他,然后他就变成你的。
所以说它不是一种静态的扔给他,然后他就变成你的。
在我看来,它其实是一种动态的,你在给他一些背景知识、一些初始的设定之后呢,不断的通过反馈让他去拟合你自己认为的你自己的风格。
在我看来,它其实是一种动态的,你在给他一些背景知识、一些初始的设定之后呢,不断的通过反馈让他去拟合你自己认为的你自己的风格。
这个我觉得其实成本还好,就是一个日常的一个作用。
这个我觉得其实成本还好,就是一个日常的一个作用。
你可能经常写文章,你跟他聊个一周、两周,你会发现他接下来出的东西慢慢的就跟你很像了。
你可能经常写文章,你跟他聊个一周、两周,你会发现他接下来出的东西慢慢的就跟你很像了。
另一个数字分身呢,就正巧就是推荐我用CAR BOSS的这个小哥,他说他现在觉得他特别需要一个这样的数字分身,因为他觉得他现在的工作很多时候就是在SLACK上回消息,以及去VERIFY一些文件之类的。
另一个数字分身呢,就正巧就是推荐我用CAR BOSS的这个小哥,他说他现在觉得他特别需要一个这样的数字分身,因为他觉得他现在的工作很多时候就是在SLACK上回消息,以及去VERIFY一些文件之类的。
而且他自己有个习惯,就是他把自己的知识全都沉淀在OBSIDIAN上面,类似于他的一个外部知识库在里面,然后还做好了各种链接。
而且他自己有个习惯,就是他把自己的知识全都沉淀在OBSIDIAN上面,类似于他的一个外部知识库在里面,然后还做好了各种链接。
在我看来,属于AI时代的一个特别好的习惯。
在我看来,属于AI时代的一个特别好的习惯。
他觉得能不能让CARBOAT进入这个知识库,然后慢慢地学成自己。
他觉得能不能让CARBOAT进入这个知识库,然后慢慢地学成自己。
其实今天还看到一个QMD的SCALE,说是正好就特别适合用来做这种大规模MD文件的检索。
其实今天还看到一个QMD的SCALE,说是正好就特别适合用来做这种大规模MD文件的检索。
但我们后来聊下来的结论是,觉得真要想达到那种特别数字分身的像你的那种感觉,可能还得是能把你类似于脑回路啊,或者说神经突触这种级别的东西训到一个小模型里面才是最好的选择。
但我们后来聊下来的结论是,觉得真要想达到那种特别数字分身的像你的那种感觉,可能还得是能把你类似于脑回路啊,或者说神经突触这种级别的东西训到一个小模型里面才是最好的选择。
这样的话,它就不是每次去做检索,然后自己去。
这样的话,它就不是每次去做检索,然后自己去。
琢磨怎么着更像你,而是他本能的反应就可以做到像你了。
琢磨怎么着更像你,而是他本能的反应就可以做到像你了。
这种肯定是要依靠200元CLOUD的订阅的,或者是KIMI的那种订阅套餐,不然的话肯定是吃不消的。
这种肯定是要依靠200元CLOUD的订阅的,或者是KIMI的那种订阅套餐,不然的话肯定是吃不消的。
但是你的收益肯定是大于这两百元的。
但是你的收益肯定是大于这两百元的。
就是目前我看到的一些收获,这个我可以讲一下我们用户的一些经历。
就是目前我看到的一些收获,这个我可以讲一下我们用户的一些经历。
我们已经在卖这个AGENT电脑已经很久了,我们其实有很多用户,比如说他如果是程序员的话,他其实会打两份工。
我们已经在卖这个AGENT电脑已经很久了,我们其实有很多用户,比如说他如果是程序员的话,他其实会打两份工。
他就是白天上班的时候,利用中午吃饭还有摸鱼的时间,给家里的AGENT电脑发信息,让他去打第二份工。
他就是白天上班的时候,利用中午吃饭还有摸鱼的时间,给家里的AGENT电脑发信息,让他去打第二份工。
还有一个比较有意思例子,比如说你是一个网络安全员,他其实很多做网络安全,他都是很多经验知识累积,然后他自己写了一个很长很长,他去做一些PEN TESTING这样工作的经验,然后他把这些经验传递给他的AGENT,然后他的AGENT就是24小时7天的不停地在对很多网站进行白客攻击,然后去拿他们那些网站的BONDS。
还有一个比较有意思例子,比如说你是一个网络安全员,他其实很多做网络安全,他都是很多经验知识累积,然后他自己写了一个很长很长,他去做一些PEN TESTING这样工作的经验,然后他把这些经验传递给他的AGENT,然后他的AGENT就是24小时7天的不停地在对很多网站进行白客攻击,然后去拿他们那些网站的BONDS。
所以很多人,我觉得跟你说这个案例很像,就是把一些自己的知识储备转化成知识资产,然后以SOP的形式喂给AGENT。
所以很多人,我觉得跟你说这个案例很像,就是把一些自己的知识储备转化成知识资产,然后以SOP的形式喂给AGENT。
这样你的AGENT其实是可以在被动的帮你打工的。
这样你的AGENT其实是可以在被动的帮你打工的。
这个话题我觉得特别好,就首先无论是要做一个人的数字分身,还是说把他的各种工作数据放到一起,让AI来帮他完成工作,这两个典型场景都是EVERMAN的长期记忆想要去解决的一个问题。
这个话题我觉得特别好,就首先无论是要做一个人的数字分身,还是说把他的各种工作数据放到一起,让AI来帮他完成工作,这两个典型场景都是EVERMAN的长期记忆想要去解决的一个问题。
然后我想分享一个已经在被用的一个例子,就是我们服务了一个企业级的IM公司叫TENKA。
然后我想分享一个已经在被用的一个例子,就是我们服务了一个企业级的IM公司叫TENKA。
它其实就是一个想要去替代飞书的一个产品。
它其实就是一个想要去替代飞书的一个产品。
它其中有一个功能就是一个人说话的自动回话补全,就比如说你在一个群里回复一句话,然后你打了两个字,然后AI希望把这句话给自动补全。
它其中有一个功能就是一个人说话的自动回话补全,就比如说你在一个群里回复一句话,然后你打了两个字,然后AI希望把这句话给自动补全。
AI当然希望是这句话补全的比较像你,同时也符合整个上下文。
AI当然希望是这句话补全的比较像你,同时也符合整个上下文。
那我们提供了从长期记忆角度而言的一些功能,比如说这个群本身在聊什么话题?
那我们提供了从长期记忆角度而言的一些功能,比如说这个群本身在聊什么话题?
你这个人的性格是什么?
你这个人的性格是什么?
你的role是什么?
你的role是什么?
你是老板还是你是员工,还是怎么怎么样。
你是老板还是你是员工,还是怎么怎么样。
包括你之前做的这些工作,我们提供了这样的一些记忆的信息来辅助完成这个工作。
包括你之前做的这些工作,我们提供了这样的一些记忆的信息来辅助完成这个工作。
这个产品已经推出了挺久,前段时间做了一个内部的反馈,发现比较有意思的事情是。
这个产品已经推出了挺久,前段时间做了一个内部的反馈,发现比较有意思的事情是。
越SENIOR的人越不喜欢这个功能,越偏基层、偏职能的人越喜欢这个功能。
越SENIOR的人越不喜欢这个功能,越偏基层、偏职能的人越喜欢这个功能。
比如说偏职能工作的人,他每天回复的内容会比较机械,他觉得这个功能太棒了,基本上我不太需要打额外的词。
比如说偏职能工作的人,他每天回复的内容会比较机械,他觉得这个功能太棒了,基本上我不太需要打额外的词。
但是越偏SENIOR,比如他是一个MANAGER或者他是一个大老板或者怎么样,WHATEVER,他本来做的决策的这个信息差异度就比较大,那AI就很难猜对他到底想要回复什么事情,即使我们已经打了两三个字了。
但是越偏SENIOR,比如他是一个MANAGER或者他是一个大老板或者怎么样,WHATEVER,他本来做的决策的这个信息差异度就比较大,那AI就很难猜对他到底想要回复什么事情,即使我们已经打了两三个字了。
所以基于现在的AI的LM的能力限制,我觉得完全替代人的AI分身,我觉得还是比较难的。
所以基于现在的AI的LM的能力限制,我觉得完全替代人的AI分身,我觉得还是比较难的。
但是在一些相对容易的职能性场景上,无论是做分身也好,还是具体去做任务也好,我觉得是极有可能实现的一个事情。
但是在一些相对容易的职能性场景上,无论是做分身也好,还是具体去做任务也好,我觉得是极有可能实现的一个事情。
因为那一个FEATURE很有意思的是,因为我们做了一个多FEATURE的投票,你最喜欢哪个FEATURE?
因为那一个FEATURE很有意思的是,因为我们做了一个多FEATURE的投票,你最喜欢哪个FEATURE?
结果就是它其实红黑榜的各自第一名,它是很极端的一个情况。
结果就是它其实红黑榜的各自第一名,它是很极端的一个情况。
说的另外一个事情,就是从MM视角而言,我们正在做一个产品吧,让用户可以把自己的无论是OBSIDIAN还是WORD还是公司的资料WIKIPEDIA都往一个个人知识库里去装。
说的另外一个事情,就是从MM视角而言,我们正在做一个产品吧,让用户可以把自己的无论是OBSIDIAN还是WORD还是公司的资料WIKIPEDIA都往一个个人知识库里去装。
它会提供一个MCP给到无论是CLOUD CODE还是CLOUD BOT,在这样的一个MCP里去帮忙去使用。
它会提供一个MCP给到无论是CLOUD CODE还是CLOUD BOT,在这样的一个MCP里去帮忙去使用。
就是我们是在尝试去做这么一个中间层的,通过MCP来去衔接数据和AGENT的使用的一个场景吧。
就是我们是在尝试去做这么一个中间层的,通过MCP来去衔接数据和AGENT的使用的一个场景吧。
我觉得也是挺符合在这里说的这么一个CASE。
我觉得也是挺符合在这里说的这么一个CASE。
对我们刚刚聊到这个AI数据分身啊,其实这个数字分身它还有一个很大的特点,是你到底给它多少权限,对吧?
对我们刚刚聊到这个AI数据分身啊,其实这个数字分身它还有一个很大的特点,是你到底给它多少权限,对吧?
就是你给它输入多少东西。
就是你给它输入多少东西。
现在大家其实对CLUBBOARD其实一个很大的疑问,就权限问题。
现在大家其实对CLUBBOARD其实一个很大的疑问,就权限问题。
因为它现在还是个开源项目嘛,它不是一个公司。
因为它现在还是个开源项目嘛,它不是一个公司。
我相信这些大公司就OPENAI或者GOOGLE内部肯定也有人是想过做这样的东西,但是因为大公司不能如此之激进地要用户权限,因为这个会出很多问题。
我相信这些大公司就OPENAI或者GOOGLE内部肯定也有人是想过做这样的东西,但是因为大公司不能如此之激进地要用户权限,因为这个会出很多问题。
所以这个最终是一个非常早期的一个开源项目,把它给做出来了。
所以这个最终是一个非常早期的一个开源项目,把它给做出来了。
但是如果它未来要成为一个公司或者成为一个成熟的商品,那它有没有一些更其他的解决方案?
但是如果它未来要成为一个公司或者成为一个成熟的商品,那它有没有一些更其他的解决方案?
呃,因为它权限给的很大,所以它能产生很多让人惊喜的结果瞬间。
呃,因为它权限给的很大,所以它能产生很多让人惊喜的结果瞬间。
但是我认为它的鲁棒性其实是不强的,鲁棒性决定了这个东西的下限嘛,是否能进入生产级。
但是我认为它的鲁棒性其实是不强的,鲁棒性决定了这个东西的下限嘛,是否能进入生产级。
所以我们做生产级产品的时候,肯定是不会用CLOUDBOT这样的架构。
所以我们做生产级产品的时候,肯定是不会用CLOUDBOT这样的架构。
如果进入生产级,我们肯定是需要打磨很清晰这种审核机制。
如果进入生产级,我们肯定是需要打磨很清晰这种审核机制。
你的AGENT做一个件事之前,他要相当于给你写一个TRD啊这样的东西,跟你一起人机协同的去交互。
你的AGENT做一个件事之前,他要相当于给你写一个TRD啊这样的东西,跟你一起人机协同的去交互。
管理机制是否透明?
管理机制是否透明?
有没有沙盒的隔离?
有没有沙盒的隔离?
其实最好的是在系统层有这种回滚机制,万一他删除了某些东西,你其实还可以通过系统上的修复。
其实最好的是在系统层有这种回滚机制,万一他删除了某些东西,你其实还可以通过系统上的修复。
如果说我们自己内部的话,我们其实有一个创新点是做了一个像WATCH DOG的AGENT系统。
如果说我们自己内部的话,我们其实有一个创新点是做了一个像WATCH DOG的AGENT系统。
它相当于有一个影子AGENT,一直在监测你在系统层面的各种更改,就有点像你WINDOWS有时候坏掉了,然后你可以开机时候按F十二进入一个BIOS嘛。
它相当于有一个影子AGENT,一直在监测你在系统层面的各种更改,就有点像你WINDOWS有时候坏掉了,然后你可以开机时候按F十二进入一个BIOS嘛。
其实我认为今天的AJ系统也需要有个这样类似的方案。
其实我认为今天的AJ系统也需要有个这样类似的方案。
我想聊一个共识的问题。
我想聊一个共识的问题。
首先,去大公司化、个人独立性、数据安全,这个是一个典型的偏GEEK的政治正确性的论调。
首先,去大公司化、个人独立性、数据安全,这个是一个典型的偏GEEK的政治正确性的论调。
但事实上,CLOUDBOARD还是用的背后的大模型,它虽然本地部署了一个AGENT,但是你的所有数据最后还是通过LM去调用ASOPIC的模型。
但事实上,CLOUDBOARD还是用的背后的大模型,它虽然本地部署了一个AGENT,但是你的所有数据最后还是通过LM去调用ASOPIC的模型。
其实不存在个人数据合法或者安全保护这一点,但似乎很多人可能觉得这一步就够了。
其实不存在个人数据合法或者安全保护这一点,但似乎很多人可能觉得这一步就够了。
这是我觉得可能大家逐渐形成的一个共识。
这是我觉得可能大家逐渐形成的一个共识。
我举一个例子啊,在CLOUD CODE里,我跟他说这是我的API KEY,请把它放到我的ENV里。
我举一个例子啊,在CLOUD CODE里,我跟他说这是我的API KEY,请把它放到我的ENV里。
我可能会愿意干这件事情,但是如果说有一个我不知道的网站,它让我把我的这个API KEY填上去,我可能并不愿意填。
我可能会愿意干这件事情,但是如果说有一个我不知道的网站,它让我把我的这个API KEY填上去,我可能并不愿意填。
也就是说,我们可能逐渐信任把数据很原始的发给LLM是一个可以被接受的隐私方案,但是在这个基础之上构建的应用层,我可能不想去把我的隐私数据放进去。
也就是说,我们可能逐渐信任把数据很原始的发给LLM是一个可以被接受的隐私方案,但是在这个基础之上构建的应用层,我可能不想去把我的隐私数据放进去。
这个我不知道是不是现在的某一种共识,如果是的话,那我觉得CLOUD倒是一个设计挺好的一个点。
这个我不知道是不是现在的某一种共识,如果是的话,那我觉得CLOUD倒是一个设计挺好的一个点。
比如说我之前用MINUS的时候,因为如果我真的希望MINUS帮我做一些复杂的工作,我需要登录我自己很多的信息,我其实不太愿意在MINUS的电脑上登录我的EMAIL、登录我的各种个人的账号。
比如说我之前用MINUS的时候,因为如果我真的希望MINUS帮我做一些复杂的工作,我需要登录我自己很多的信息,我其实不太愿意在MINUS的电脑上登录我的EMAIL、登录我的各种个人的账号。
但是我在我自己的电脑上,我其实愿意干这个事儿。
但是我在我自己的电脑上,我其实愿意干这个事儿。
我也不觉得用ASROPE的这个模型会对我的个人隐私产生什么样的一个问题。
我也不觉得用ASROPE的这个模型会对我的个人隐私产生什么样的一个问题。
所以我觉得CLOUD BOAT可能在隐私安全和数据上刚好踩在了一个比较巧的SWEEP POINT上。
所以我觉得CLOUD BOAT可能在隐私安全和数据上刚好踩在了一个比较巧的SWEEP POINT上。
嗯,对我也很同意张豪的这个想法。
嗯,对我也很同意张豪的这个想法。
为什么CLOUD BOAT火了?
为什么CLOUD BOAT火了?
为什么是他啊?
为什么是他啊?
我觉得就是SWEEP BOAT SWEEP POINT这个点选的特别好,而且它的传播路径是这个老哥自己是个很强的开发者、极客,他吸引的第一波人就是在AI行业里头做创业的一些FOUNDER。
我觉得就是SWEEP BOAT SWEEP POINT这个点选的特别好,而且它的传播路径是这个老哥自己是个很强的开发者、极客,他吸引的第一波人就是在AI行业里头做创业的一些FOUNDER。
或者是一些做RESEARCH的人,大家都觉得这个东西很FANCY。
或者是一些做RESEARCH的人,大家都觉得这个东西很FANCY。
因为你给他权限很高,他确实很FANCY。
因为你给他权限很高,他确实很FANCY。
创始人直接把自己家的各种权限都给他了,摄像头都给他了,床垫的权限都给他了。
创始人直接把自己家的各种权限都给他了,摄像头都给他了,床垫的权限都给他了。
那确实他能够接近JARVIS,但你没有看到效果的时候,你担心这个、担心那个的时候。
那确实他能够接近JARVIS,但你没有看到效果的时候,你担心这个、担心那个的时候。
但是当你看到效果的时候,你可能这些担心要么就直接烟消云散,要么就其实好像也没那么重要啊。
但是当你看到效果的时候,你可能这些担心要么就直接烟消云散,要么就其实好像也没那么重要啊。
我先试一下,所以说从这帮人开始试起来。
我先试一下,所以说从这帮人开始试起来。
他们再去做共建,最后这个项目觉得由内而外啊达到一个量级就直接爆了。
他们再去做共建,最后这个项目觉得由内而外啊达到一个量级就直接爆了。
在我看来,做这个事儿咱们要如果想要安全和效果之间做一个吹道off,其实最该做这吹道off的是apple。
在我看来,做这个事儿咱们要如果想要安全和效果之间做一个吹道off,其实最该做这吹道off的是apple。
大家都在说apple这是你应该做的产品啊,当年iphone的那种惊艳感,为什么让一个开源的项目自己贡献了百分之八十多的代码的这么一个老哥给做出来了?
大家都在说apple这是你应该做的产品啊,当年iphone的那种惊艳感,为什么让一个开源的项目自己贡献了百分之八十多的代码的这么一个老哥给做出来了?
APPLE,你从芯片到OS到硬件,甚至手机、手表这些生态,你都有全自研的。
APPLE,你从芯片到OS到硬件,甚至手机、手表这些生态,你都有全自研的。
你为什么做不出来?
你为什么做不出来?
我觉得一大原因就是它承担的责任太重了。
我觉得一大原因就是它承担的责任太重了。
它服务全球的用户,就一旦它出点问题,可能造成的风险就是非常不可控的。
它服务全球的用户,就一旦它出点问题,可能造成的风险就是非常不可控的。
他要为这些东西负责兜底,所以他做不出这一步。
他要为这些东西负责兜底,所以他做不出这一步。
那这个老哥反正他做的就是自己用,然后我开源出来,你爱用不用,那就是把这个标准有点化整为零,不是一一个墙而变成了水,能流过去。
那这个老哥反正他做的就是自己用,然后我开源出来,你爱用不用,那就是把这个标准有点化整为零,不是一一个墙而变成了水,能流过去。
每个人自己觉得自己到哪儿能接受,自己就去接受,大家就自适应的完成了这么一个权限标准的SET UP。
每个人自己觉得自己到哪儿能接受,自己就去接受,大家就自适应的完成了这么一个权限标准的SET UP。
这个反而是给业界也好,或者给大家也好了一个类似用户调研。
这个反而是给业界也好,或者给大家也好了一个类似用户调研。
就是给我们看到了一个全景,就是实际上大家到底对这些事情的接受度是怎么样的。
就是给我们看到了一个全景,就是实际上大家到底对这些事情的接受度是怎么样的。
对我来说也反过来让我感觉到往这种社区项目上做,其实在一些比较难吹到的事情上是最好的第一步。
对我来说也反过来让我感觉到往这种社区项目上做,其实在一些比较难吹到的事情上是最好的第一步。
你先把它做成社区项目,然后看看社区它给的反馈是什么样的。
你先把它做成社区项目,然后看看社区它给的反馈是什么样的。
有时候可能你自己设定的那些。
有时候可能你自己设定的那些。
需求啊,边界未必是应该是这样的。
需求啊,边界未必是应该是这样的。
有时候反而限制了自己的产品价值的发挥。
有时候反而限制了自己的产品价值的发挥。
我刚才想说FRANK说的,为什么苹果没有做出这个东西来?
我刚才想说FRANK说的,为什么苹果没有做出这个东西来?
我觉得这是一个特别有意思的问题。
我觉得这是一个特别有意思的问题。
我觉得这个现在感觉像是什么?
我觉得这个现在感觉像是什么?
我觉得当时二五年的时候有人说二五年是AGENT的元年,二六年呢又有人说二六年是AGENT的元年。
我觉得当时二五年的时候有人说二五年是AGENT的元年,二六年呢又有人说二六年是AGENT的元年。
怎么元年天天都有?
怎么元年天天都有?
但有另外一个人说,我觉得很有道理,就是可能没有元年的概念,而是一个开始的十年。
但有另外一个人说,我觉得很有道理,就是可能没有元年的概念,而是一个开始的十年。
就是因为AGENT,虽然现在可以干很多事情了,但是依然它的成功率可能是比如说八十九十,它不是一个百分之百让你真的觉得这个东西你非常信任它能用。
就是因为AGENT,虽然现在可以干很多事情了,但是依然它的成功率可能是比如说八十九十,它不是一个百分之百让你真的觉得这个东西你非常信任它能用。
那CLOUD BULL其实也是这样,我们在很多这种方啊,它居然能干这个事儿。
那CLOUD BULL其实也是这样,我们在很多这种方啊,它居然能干这个事儿。
但是说实话,我们现在看我们能干这些USE CASE,可能当年在微软的COPILOT或者苹果的一些发布会上,其实这些CASE都有,有时候它只是个我们大家想象力没有,因为它而产生新的变化。
但是说实话,我们现在看我们能干这些USE CASE,可能当年在微软的COPILOT或者苹果的一些发布会上,其实这些CASE都有,有时候它只是个我们大家想象力没有,因为它而产生新的变化。
我们可能真的需要这么一个东西去做。
我们可能真的需要这么一个东西去做。
所以我觉得CLOUDBOT更像十年前GOOGLE刚推出了一个自动驾驶的SDK,然后说自动驾驶其实现在已经做得还不错了,能够准确率百分之九十五以上。
所以我觉得CLOUDBOT更像十年前GOOGLE刚推出了一个自动驾驶的SDK,然后说自动驾驶其实现在已经做得还不错了,能够准确率百分之九十五以上。
然后这个时候有一个人把这个SDK放到了一个自行车上,让他发现他可以在小区里自由地送货,然后他就火了。
然后这个时候有一个人把这个SDK放到了一个自行车上,让他发现他可以在小区里自由地送货,然后他就火了。
虽然他也经常会倒、会撞车,但他因为是个自行车,撞了也无所谓。
虽然他也经常会倒、会撞车,但他因为是个自行车,撞了也无所谓。
所以我的感觉可能是这么一个状态啊。
所以我的感觉可能是这么一个状态啊。
对对对,就是一种感觉技术下放的状态。
对对对,就是一种感觉技术下放的状态。
因为我算是站在技术和产品中间的这么一个视角,我特别理解两边的感觉。
因为我算是站在技术和产品中间的这么一个视角,我特别理解两边的感觉。
技术侧就觉得这也没什么新东西了,产品端其实就能感觉到啊,他把最后这一公里处理得特别好,真正做到普通人看到之后也产生了未来以来的这种感觉。
技术侧就觉得这也没什么新东西了,产品端其实就能感觉到啊,他把最后这一公里处理得特别好,真正做到普通人看到之后也产生了未来以来的这种感觉。
可能其实未来以来在技术圈儿已经是共识了,确实已经能做到这一步了。
可能其实未来以来在技术圈儿已经是共识了,确实已经能做到这一步了。
但是用力还是偏咱们说生产力。
但是用力还是偏咱们说生产力。
那生产力呢?
那生产力呢?
它肯定是没有咱们说更宽泛的这种助力形态也好,甚至聊天人的这种感觉,对大家的这个打动大。
它肯定是没有咱们说更宽泛的这种助力形态也好,甚至聊天人的这种感觉,对大家的这个打动大。
最后觉得可能后面会出现越来越多像CLUBBOT这样的东西,不一样的VARIATION。
最后觉得可能后面会出现越来越多像CLUBBOT这样的东西,不一样的VARIATION。
对,刚刚正好聊到部署啊。
对,刚刚正好聊到部署啊。
哎,现在你们都是把它部署在哪?
哎,现在你们都是把它部署在哪?
都是用MAC MINI吗?
都是用MAC MINI吗?
我是MAC MINI两台,还有VPS。
我是MAC MINI两台,还有VPS。
然后我打算在安卓手机上先试试用户它也不熟。
然后我打算在安卓手机上先试试用户它也不熟。
嗯。
嗯。
那大家为什么都不约而同的选MAC MINI?
那大家为什么都不约而同的选MAC MINI?
如果不用MAC MINI的话。
如果不用MAC MINI的话。
也完全可以对吧?
也完全可以对吧?
啊,可以的。
啊,可以的。
其实之所以要跑在MAC MINI上,可能大家第一反应说我要跑在一台独立的机器上。
其实之所以要跑在MAC MINI上,可能大家第一反应说我要跑在一台独立的机器上。
有了这个认知之后,尤其是技术老哥们啊,我觉得第一反应可能就是MAC MINI啊。
有了这个认知之后,尤其是技术老哥们啊,我觉得第一反应可能就是MAC MINI啊。
尤其是你要是能在中国大陆买的话,你用上国补这个盖板的,甚至不到三千人民币啊,非常夸张。
尤其是你要是能在中国大陆买的话,你用上国补这个盖板的,甚至不到三千人民币啊,非常夸张。
你如果那时候买了,你再算一下现在的内存和硬盘的价格。
你如果那时候买了,你再算一下现在的内存和硬盘的价格。
你觉得买内存送电脑的这么一个地非常好?
你觉得买内存送电脑的这么一个地非常好?
那实际上其实是不需要的,因为VPS已经可以跑了。
那实际上其实是不需要的,因为VPS已经可以跑了。
但是可以跑和能把它跑好,区别还是挺大的。
但是可以跑和能把它跑好,区别还是挺大的。
在我看来,你要是能把它跑起来,然后你还能让它在里头做点事情,写写代码也好,跑跑测试也好,给它一些独立的任务也好,尤其是你需要用到一些MAC上才有的,比如皮卡布,就它系统级的自动化操作。
在我看来,你要是能把它跑起来,然后你还能让它在里头做点事情,写写代码也好,跑跑测试也好,给它一些独立的任务也好,尤其是你需要用到一些MAC上才有的,比如皮卡布,就它系统级的自动化操作。
以及你是IOS的用户的话,它整个APPLE的生态,它帮你加REMINDER,你手机马上就同步过来了。
以及你是IOS的用户的话,它整个APPLE的生态,它帮你加REMINDER,你手机马上就同步过来了。
包括IMessage,这也只有MAC有的。
包括IMessage,这也只有MAC有的。
所以说我觉得你如果是APPLE生态的用户,那其实MAC MINI不管是性价比也省电也安静又好看,然后还能做WEB CODING等更多的事情。
所以说我觉得你如果是APPLE生态的用户,那其实MAC MINI不管是性价比也省电也安静又好看,然后还能做WEB CODING等更多的事情。
所以对于我觉得这个用户画像基本上就是第一选择,但确实不是必要的。
所以对于我觉得这个用户画像基本上就是第一选择,但确实不是必要的。
你有其他闲置的机器,不管是MAC、MACBOOK,包括WINDOWS电脑。
你有其他闲置的机器,不管是MAC、MACBOOK,包括WINDOWS电脑。
你打开WSL,它内置的RINX的话也是可以的。
你打开WSL,它内置的RINX的话也是可以的。
对天琪,你们那个产品你有试过用它来跑CLUBBOT吗?
对天琪,你们那个产品你有试过用它来跑CLUBBOT吗?
然后感觉怎么样?
然后感觉怎么样?
呃,可以的。
呃,可以的。
我们肯定是也是原生就支持CLUBBOT的,因为我们本来之前就是支持CLUBCODE。
我们肯定是也是原生就支持CLUBBOT的,因为我们本来之前就是支持CLUBCODE。
CLUBBOT其实某种意义上它就是在跑了一个CLUBCODE的BINARY,本质上是一个LINUX的小电脑。
CLUBBOT其实某种意义上它就是在跑了一个CLUBCODE的BINARY,本质上是一个LINUX的小电脑。
然后我们认为一个LINUX小电脑加上AGENT应该可以做世界上所有的事情了。
然后我们认为一个LINUX小电脑加上AGENT应该可以做世界上所有的事情了。
但是我们在打磨这个AGENT设备的时候,做了很多巧思。
但是我们在打磨这个AGENT设备的时候,做了很多巧思。
比如说我们上面会有一个小的LED灯条,它会显示你的当前的AGENT工作状态。
比如说我们上面会有一个小的LED灯条,它会显示你的当前的AGENT工作状态。
就是如果它在思考的话,它可能闪黄灯;需要你的时候会闪绿灯。
就是如果它在思考的话,它可能闪黄灯;需要你的时候会闪绿灯。
然后我们里面自带了一些麦克扬声器,因为很多人会希望把它做成贾维斯那样进行交互。
然后我们里面自带了一些麦克扬声器,因为很多人会希望把它做成贾维斯那样进行交互。
然后当然还有大量的IO接口,这个其实是很多MAC MINI它没法提供的一些便携携带或者是嵌入的功能。
然后当然还有大量的IO接口,这个其实是很多MAC MINI它没法提供的一些便携携带或者是嵌入的功能。
你给它大量IO接口之后,它其实会解锁很多很多很多的玩法。
你给它大量IO接口之后,它其实会解锁很多很多很多的玩法。
比如说我们之前自己内部,你买了这个东西之后,你插上任何的打印机,你可能也不需要配置打印机,也不需要知道打印机怎么用的。
比如说我们之前自己内部,你买了这个东西之后,你插上任何的打印机,你可能也不需要配置打印机,也不需要知道打印机怎么用的。
它的AGENT自己可能就会FIGURE OUT,或者说甚至是发现这个打印机它没有一个LINUX的DRIVER,它自己就黑进这个打印机,或者自己逆向写了一个DRIVER。
它的AGENT自己可能就会FIGURE OUT,或者说甚至是发现这个打印机它没有一个LINUX的DRIVER,它自己就黑进这个打印机,或者自己逆向写了一个DRIVER。
基本上你连到任何东西上,这个AGENT可以JUST MAKE IT WORK。
基本上你连到任何东西上,这个AGENT可以JUST MAKE IT WORK。
大家可能选择MAC MINI,它因为它隐性的,它就没有屏幕嘛。
大家可能选择MAC MINI,它因为它隐性的,它就没有屏幕嘛。
其实在调用AGENT的时候,屏幕作用也不大。
其实在调用AGENT的时候,屏幕作用也不大。
单独硬件嘛,它就相当于是物理层面上自带的沙盒属性、数据常驻的属性也是非常重要的。
单独硬件嘛,它就相当于是物理层面上自带的沙盒属性、数据常驻的属性也是非常重要的。
很多你像CLOUD BOSS这种东西,我是不会肯定放在我主力机上的。
很多你像CLOUD BOSS这种东西,我是不会肯定放在我主力机上的。
我觉得大家肯定自然而然的选择再单独买一个MAC。
我觉得大家肯定自然而然的选择再单独买一个MAC。
对,其实这个就衍生了,就是我们到底需不需要一个更加独立的硬件跑AGENT?
对,其实这个就衍生了,就是我们到底需不需要一个更加独立的硬件跑AGENT?
当然它可以是个MAC MINI。
当然它可以是个MAC MINI。
但MAC MINI其实本质它还是为人类所设计的一个产品。
但MAC MINI其实本质它还是为人类所设计的一个产品。
我相信这个中间肯定还是对现在的AGENT有很多能力的冗余,其实可以砍掉,然后把这个成本给节约下来,让这个产品更便宜。
我相信这个中间肯定还是对现在的AGENT有很多能力的冗余,其实可以砍掉,然后把这个成本给节约下来,让这个产品更便宜。
天琪,你觉得应该如何定义一个AGENT电脑?
天琪,你觉得应该如何定义一个AGENT电脑?
它跟比如说我们目前的这些给人使用电脑可能会有什么样的不同?
它跟比如说我们目前的这些给人使用电脑可能会有什么样的不同?
这个是个很有意思的问题。
这个是个很有意思的问题。
其实工作分为两种,一种叫FOREGROUND WORK,就是前端工作。
其实工作分为两种,一种叫FOREGROUND WORK,就是前端工作。
你又要用到屏幕的,你要看的。
你又要用到屏幕的,你要看的。
还有一种工作呢,是后端工作,你不需要看的,它就是默默跑在背后里的。
还有一种工作呢,是后端工作,你不需要看的,它就是默默跑在背后里的。
我们理解A型电脑应该更属于后者,前者更是大厂啊、手机厂呀、电脑厂,它会做的事情。
我们理解A型电脑应该更属于后者,前者更是大厂啊、手机厂呀、电脑厂,它会做的事情。
不然如果它不做这个事情,它就违背它的产品设计的逻辑。
不然如果它不做这个事情,它就违背它的产品设计的逻辑。
我本来手机就有屏幕,如果你把我的这些工作都以不需要屏幕的形式做掉了,那我的手机存在意义是什么?
我本来手机就有屏幕,如果你把我的这些工作都以不需要屏幕的形式做掉了,那我的手机存在意义是什么?
我手机还放个屏幕干什么?
我手机还放个屏幕干什么?
所以我觉得分为这两类工作。
所以我觉得分为这两类工作。
嗯,其实从这个MACBING来看,你觉得如果现在我们只是想用用它来跑CLOCK BOAT的话,你觉得有哪些是可以砍掉?
嗯,其实从这个MACBING来看,你觉得如果现在我们只是想用用它来跑CLOCK BOAT的话,你觉得有哪些是可以砍掉?
说实话。
说实话。
RAM很重要,因为RAM直接决定了你能跑多少个AGENT。
RAM很重要,因为RAM直接决定了你能跑多少个AGENT。
这也是我们在很多次迭代和打磨感受出来的。
这也是我们在很多次迭代和打磨感受出来的。
有些时候我们可能一个设备只有四个RAM的话。
有些时候我们可能一个设备只有四个RAM的话。
才跑两个A,真的就满了。
才跑两个A,真的就满了。
然后满了就卡住,存储也是很重要的一个点。
然后满了就卡住,存储也是很重要的一个点。
可能有的用户你给他32GB的存储,他用半个月可能就会满。
可能有的用户你给他32GB的存储,他用半个月可能就会满。
这些其实都是新一代产品形态,你会发现的一些用户使用的规律。
这些其实都是新一代产品形态,你会发现的一些用户使用的规律。
大家很HEAVILY的聊天,而且尤其是知识工作者,他们每一次聊天都希望把他们的聊天内容转换成知识资产的形式。
大家很HEAVILY的聊天,而且尤其是知识工作者,他们每一次聊天都希望把他们的聊天内容转换成知识资产的形式。
所以就导致后面有很多用户会一直都带一个SSD的硬盘,专门存他的聊天的内容。
所以就导致后面有很多用户会一直都带一个SSD的硬盘,专门存他的聊天的内容。
所以我觉得在新的这个时代,最需要的其实就是RAM和STORAGE。
所以我觉得在新的这个时代,最需要的其实就是RAM和STORAGE。
嗯,明白。
嗯,明白。
如果我们稍微展望未来,因为CLUB它的这种交互形态发生了很大的改变,那它也许未来真的会变成一个比如SIRI对吧?
如果我们稍微展望未来,因为CLUB它的这种交互形态发生了很大的改变,那它也许未来真的会变成一个比如SIRI对吧?
然后有了这个能力的话,那所以未来其实这种算力加存储加一个常驻AGENT,然后这个常驻AGENT可能它是BASE在一个比如说你家里的一个小机器上。
然后有了这个能力的话,那所以未来其实这种算力加存储加一个常驻AGENT,然后这个常驻AGENT可能它是BASE在一个比如说你家里的一个小机器上。
这种你觉得有没有可能成为一个未来这种家庭的AIAGENT的一种终极形态?
这种你觉得有没有可能成为一个未来这种家庭的AIAGENT的一种终极形态?
我们是坚信这会是一个新的品类,但是不一定AGENT的入口和算力一定绑在一起。
我们是坚信这会是一个新的品类,但是不一定AGENT的入口和算力一定绑在一起。
但是至少在我们内部来看的话,这已经是一个新的工作方式的范式转移。
但是至少在我们内部来看的话,这已经是一个新的工作方式的范式转移。
举例来说,在我们公司内部,很多人可能也不带电脑了,他就带一个IPAD,能转移到你AGENT设备上的工作都是可以被自动化掉的。
举例来说,在我们公司内部,很多人可能也不带电脑了,他就带一个IPAD,能转移到你AGENT设备上的工作都是可以被自动化掉的。
所以如果大部分你的工作都转移到AGENT设备了,那你做什么呢?
所以如果大部分你的工作都转移到AGENT设备了,那你做什么呢?
你也不需要带你工作电脑了,你就带个手机或者带一个平板就够了。
你也不需要带你工作电脑了,你就带个手机或者带一个平板就够了。
你要做的就是在你的手机或者平板上,甚至是AI眼镜上对AGENT下达命令就行了。
你要做的就是在你的手机或者平板上,甚至是AI眼镜上对AGENT下达命令就行了。
我其实觉着这个硬件得有它硬件端特有的功能。
我其实觉着这个硬件得有它硬件端特有的功能。
呃,以前一些想法是说你家里会有一个终端在本地控制所有的智能家居的东西,但是我们看现在小米其实已经抛弃这一套方案了,都是在云端控制,你只需要个手手机APP。
呃,以前一些想法是说你家里会有一个终端在本地控制所有的智能家居的东西,但是我们看现在小米其实已经抛弃这一套方案了,都是在云端控制,你只需要个手手机APP。
那只是每一个硬件端接收一个控制器就可以了。
那只是每一个硬件端接收一个控制器就可以了。
也就是说,如果这个控制器我们不认为是我们说的那个硬件的话,它其实在边缘计算上是没有边缘计算的这一部分硬件在的。
也就是说,如果这个控制器我们不认为是我们说的那个硬件的话,它其实在边缘计算上是没有边缘计算的这一部分硬件在的。
那么看另外一个CASE,就是苹果那块AM,他们就其实都有智能音箱。
那么看另外一个CASE,就是苹果那块AM,他们就其实都有智能音箱。
那智能音箱它存在的唯一意义是因为它有音箱这个硬件不可替代的功能在,但是它其实并不会作为本地在AI计算上的一个终端。
那智能音箱它存在的唯一意义是因为它有音箱这个硬件不可替代的功能在,但是它其实并不会作为本地在AI计算上的一个终端。
它只是去调云端接口,所以我其实是对这个事情我自己的观点是比较MIX。
它只是去调云端接口,所以我其实是对这个事情我自己的观点是比较MIX。
我觉得会有可能给硬件一个机会,让它在整个边缘计算上承载一定的地位。
我觉得会有可能给硬件一个机会,让它在整个边缘计算上承载一定的地位。
但是它可能最大的价值不是那个计算本身,而是它有一些特殊的硬件功能。
但是它可能最大的价值不是那个计算本身,而是它有一些特殊的硬件功能。
就比如说CLOUD BOT,我觉得它可能最大的硬件功能是它能存入一些我不想放在其他地方的登录信息的这么一种状态。
就比如说CLOUD BOT,我觉得它可能最大的硬件功能是它能存入一些我不想放在其他地方的登录信息的这么一种状态。
因为现在因为很多人用MAC MINI,是因为要做一个物理隔离,然后专机专用嘛。
因为现在因为很多人用MAC MINI,是因为要做一个物理隔离,然后专机专用嘛。
那你觉得这种专机专用这种状态会是一个长期状态吗?
那你觉得这种专机专用这种状态会是一个长期状态吗?
还是说因为我看GOOGLE其实它也开发A TO A协议啊什么的,就我感觉AGENT TO AGENT的这种无论是在交易层面还是在他们互相之间交流干活,可能是未来很大的、重要的一个长期趋势。
还是说因为我看GOOGLE其实它也开发A TO A协议啊什么的,就我感觉AGENT TO AGENT的这种无论是在交易层面还是在他们互相之间交流干活,可能是未来很大的、重要的一个长期趋势。
像现在这种专机专用的状态,你觉得会持续多久?
像现在这种专机专用的状态,你觉得会持续多久?
还是说它会催生一些新的软硬结合也好,或者是硬件本身的新的产品、新的需求出来?
还是说它会催生一些新的软硬结合也好,或者是硬件本身的新的产品、新的需求出来?
哦,我觉得它分不同类型的AGENT。
哦,我觉得它分不同类型的AGENT。
像CARCO的,我觉得定位就是你的管家。
像CARCO的,我觉得定位就是你的管家。
当然A TO A协议也可以让它以你的立场或者视角去跟其他的外部的AGENT去沟通、去服务。
当然A TO A协议也可以让它以你的立场或者视角去跟其他的外部的AGENT去沟通、去服务。
现在它可能通过API或者甚至通过网页这种INTERFACE,把未来这种AGENT的互通的协议普及了之后,可能这些事情它调用起来就非常的简单。
现在它可能通过API或者甚至通过网页这种INTERFACE,把未来这种AGENT的互通的协议普及了之后,可能这些事情它调用起来就非常的简单。
这是我觉得你刚才讲的一个未来的愿景吧。
这是我觉得你刚才讲的一个未来的愿景吧。
另外就是它会不会脱离专机专用?
另外就是它会不会脱离专机专用?
我觉得也有可能,因为你如果不把它做那么PERSONAL,把它的距离再往回推一推。
我觉得也有可能,因为你如果不把它做那么PERSONAL,把它的距离再往回推一推。
你不要住到我家里,但你是我的助理。
你不要住到我家里,但你是我的助理。
但是日常工作生活上的一些琐事,你都帮我去HANDLE的话,除了刚才讲的腾讯什么的,这两天CLOUD FLARE也出手了,他自己做了一个优化版的CLOUD BOAT,现在叫MULTI BOAT,给了一个一键用WORKER方式部署到CLOUD FLARE的套餐啊,只需要一个月五美金,我没记错的话。
但是日常工作生活上的一些琐事,你都帮我去HANDLE的话,除了刚才讲的腾讯什么的,这两天CLOUD FLARE也出手了,他自己做了一个优化版的CLOUD BOAT,现在叫MULTI BOAT,给了一个一键用WORKER方式部署到CLOUD FLARE的套餐啊,只需要一个月五美金,我没记错的话。
这个其实对于更多数人来说,简单多了、可接受多了。
这个其实对于更多数人来说,简单多了、可接受多了。
所以我觉得可能CAR BOSS接下来下一步应用,有可能是这种平台,就是越来越简单的去部署一个。
所以我觉得可能CAR BOSS接下来下一步应用,有可能是这种平台,就是越来越简单的去部署一个。
我觉得云端和专机专用它都会共存的。
我觉得云端和专机专用它都会共存的。
你要说如果是用云端的话,那MINUS已经给出答案了。
你要说如果是用云端的话,那MINUS已经给出答案了。
你本来MINUS也是以这种技术路线走的,你MINUS能做的任务,那就是在云端可以跑的任务。
你本来MINUS也是以这种技术路线走的,你MINUS能做的任务,那就是在云端可以跑的任务。
但是专一专用的话,它肯定更像是满足不同的应用场景。
但是专一专用的话,它肯定更像是满足不同的应用场景。
做TO C端,而且又是做长时间要跑的任务,又高度的跟私人信息相关的任务的话,那我觉得专机专用肯定是更有优势的。
做TO C端,而且又是做长时间要跑的任务,又高度的跟私人信息相关的任务的话,那我觉得专机专用肯定是更有优势的。
那如果你在云端跑这样的任务,那肯定长期来看是最贵的解决方案。
那如果你在云端跑这样的任务,那肯定长期来看是最贵的解决方案。
这样的话,我会觉得不MAKE SENSE。
这样的话,我会觉得不MAKE SENSE。
下面我们再来聊聊CLUB可能会对模型厂商产生什么影响。
下面我们再来聊聊CLUB可能会对模型厂商产生什么影响。
就这次我们看CLUB,因为他的名字太像CLOUD了。
就这次我们看CLUB,因为他的名字太像CLOUD了。
A TRIBE法务部好像直接给他发了律师函,要逼他改名。
A TRIBE法务部好像直接给他发了律师函,要逼他改名。
所以他后来被迫改名了。
所以他后来被迫改名了。
但这个改名事件是不是也从侧面印证了大模型厂商其实也很忌惮这种开源的AGENT应用?
但这个改名事件是不是也从侧面印证了大模型厂商其实也很忌惮这种开源的AGENT应用?
然后他们又很不受控,但背后其实也在调用他们的能力。
然后他们又很不受控,但背后其实也在调用他们的能力。
但是呢,因为他们又火了,又在前端占用了很多流量,那也许未来有有种可能,就把这些大模型公司反而变成了一种纯粹的管道。
但是呢,因为他们又火了,又在前端占用了很多流量,那也许未来有有种可能,就把这些大模型公司反而变成了一种纯粹的管道。
但当然,从另一个角度说呢?
但当然,从另一个角度说呢?
那有没有可能大部分公司也直接把这个事儿他们自己就干了,然后反而CLOUD BOAT这些公司会昙花一现?
那有没有可能大部分公司也直接把这个事儿他们自己就干了,然后反而CLOUD BOAT这些公司会昙花一现?
我不知道各位怎么看这个问题。
我不知道各位怎么看这个问题。
哦,我觉得是这样的。
哦,我觉得是这样的。
改名这个事儿有点戏剧化,就是因为本来CLOUD BOAT这个名字就是作者为了你说致敬也好,或者说表达他对CLOUD的喜爱也好,起的这么一个名字。
改名这个事儿有点戏剧化,就是因为本来CLOUD BOAT这个名字就是作者为了你说致敬也好,或者说表达他对CLOUD的喜爱也好,起的这么一个名字。
他在他的SET UP的介绍里也是极力推荐大家用OPUS模型,最贵的可以说是ANTHROPIC比较赚钱的一个产品。
他在他的SET UP的介绍里也是极力推荐大家用OPUS模型,最贵的可以说是ANTHROPIC比较赚钱的一个产品。
配合MAX的订阅啊,大家都把这个拉到顶。
配合MAX的订阅啊,大家都把这个拉到顶。
但实际上很多普通用户他没有这个需求,但是现在有了CAR BOSS之后,大家就有需求把它拉到顶了。
但实际上很多普通用户他没有这个需求,但是现在有了CAR BOSS之后,大家就有需求把它拉到顶了。
这在我们看来其实商业上对ANTHROPIC应该是好事儿。
这在我们看来其实商业上对ANTHROPIC应该是好事儿。
但是差不多一年前就另一件事情就是ANTHROPIC的CPU MIKE CRIGER吧。
但是差不多一年前就另一件事情就是ANTHROPIC的CPU MIKE CRIGER吧。
他是做了一次访谈,他说过后悔没有更早的去做第一方的产品,包括CLOUD CODE啊、COWORK这些产品。
他是做了一次访谈,他说过后悔没有更早的去做第一方的产品,包括CLOUD CODE啊、COWORK这些产品。
他们那时候也意识到了,就是你只做API的话,可能后面就像运营商被直接打到了整个生态最有价值的部分的底层。
他们那时候也意识到了,就是你只做API的话,可能后面就像运营商被直接打到了整个生态最有价值的部分的底层。
我相信他们自己肯定是希望CLOUD BOAT的CLOUD是他们的这个CLOUD。
我相信他们自己肯定是希望CLOUD BOAT的CLOUD是他们的这个CLOUD。
这样的话,它才能够增强用户粘性。
这样的话,它才能够增强用户粘性。
我相信他们一定会做出更多的类似CLOUD BOAT啊、现在的MOT BOAT这样的产品,包括我觉得OPENAI去收购这个MANUS也是有这个因素吧。
我相信他们一定会做出更多的类似CLOUD BOAT啊、现在的MOT BOAT这样的产品,包括我觉得OPENAI去收购这个MANUS也是有这个因素吧。
我们不用担心大模型公司的,他们永远是最容易WIN的人。
我们不用担心大模型公司的,他们永远是最容易WIN的人。
因为其实前面提到,像CLOUD BOSS这样的开源项目有很多,我相信他们可能最后都有把这个开源项目变成一个商业化或者POSSIBLY一个项目的一颗星。
因为其实前面提到,像CLOUD BOSS这样的开源项目有很多,我相信他们可能最后都有把这个开源项目变成一个商业化或者POSSIBLY一个项目的一颗星。
如果它真的能够火,很有可能反而最后会被大模型公司给摘了果子。
如果它真的能够火,很有可能反而最后会被大模型公司给摘了果子。
就像AI CODING,最早其实大厂也没有下场,但现在纷纷都自己下场,也都是很快就会把别人打得不行。
就像AI CODING,最早其实大厂也没有下场,但现在纷纷都自己下场,也都是很快就会把别人打得不行。
我其实更担心的是这么一个问题:由市场或者由开源社区或者创业者们验证好了产品方向之后,最后大模型公司自己就在这个方向做优化,自己做自己的C端产品。
我其实更担心的是这么一个问题:由市场或者由开源社区或者创业者们验证好了产品方向之后,最后大模型公司自己就在这个方向做优化,自己做自己的C端产品。
很有可能很无奈的,可能是这样的一个情况。
很有可能很无奈的,可能是这样的一个情况。
我觉得 ANS TROPIC不让他用 CLOUD这个名字,我觉得还挺符合他们公司的作风的。
我觉得 ANS TROPIC不让他用 CLOUD这个名字,我觉得还挺符合他们公司的作风的。
因为之前 OPEN CODE他那个 SUBSCRIPTION不是也不让他们用吗?
因为之前 OPEN CODE他那个 SUBSCRIPTION不是也不让他们用吗?
我觉得 CLOUD最终肯定还是会做这些事情的,因为他们已经做了 CO WORK嘛。
我觉得 CLOUD最终肯定还是会做这些事情的,因为他们已经做了 CO WORK嘛。
只不过他们可能会迭代,还有推出这些产品,没有开源社区这么激进,因为他们还是要考虑到安全问题。
只不过他们可能会迭代,还有推出这些产品,没有开源社区这么激进,因为他们还是要考虑到安全问题。
说到这个,我有个问题啊,想请教一下天气。
说到这个,我有个问题啊,想请教一下天气。
CAR BOAT它用的是应该是叫PI AGENT吧,PI这么一个开源项目来做认证的,就是模型的登录。
CAR BOAT它用的是应该是叫PI AGENT吧,PI这么一个开源项目来做认证的,就是模型的登录。
这些它自己的CLIENT ID是直接就明文写在开源这个代码里的,这个不会被ANTHROPIC封吗?
这些它自己的CLIENT ID是直接就明文写在开源这个代码里的,这个不会被ANTHROPIC封吗?
为什么他们允许这样的事情出现呢?
为什么他们允许这样的事情出现呢?
如果我的记得没错的话,那PI AGENT它最后底层打包的还是CLOCK CODE的。
如果我的记得没错的话,那PI AGENT它最后底层打包的还是CLOCK CODE的。
它不会允许你去使用SUBSCRIPTION,它其实默认是让你用APIKEY。
它不会允许你去使用SUBSCRIPTION,它其实默认是让你用APIKEY。
如果你用APIKEY的话就没有问题,但是其实现在社区里它还是有各种方法去BYPASS这个吗?
如果你用APIKEY的话就没有问题,但是其实现在社区里它还是有各种方法去BYPASS这个吗?
啊,所以其实现在是一个危险的用法,就是随时有可能会被BAN THORIFIC禁掉。
啊,所以其实现在是一个危险的用法,就是随时有可能会被BAN THORIFIC禁掉。
对吧?
对吧?
是的,我觉得现在还是一个灰色地带吧。
是的,我觉得现在还是一个灰色地带吧。
IT'S A MATTER OF TIME,它是不是针对你因为。
IT'S A MATTER OF TIME,它是不是针对你因为。
之前OPEN CODE很长一段时间都可以去用这个SUBSCRIPTION,但是直到他们涨到了一个MILLION月活用户的时候才被打击了嘛?
之前OPEN CODE很长一段时间都可以去用这个SUBSCRIPTION,但是直到他们涨到了一个MILLION月活用户的时候才被打击了嘛?
对,正好你对这个问题有有补充吗?
对,正好你对这个问题有有补充吗?
现在从技术上而言,它非常依赖两个事情。
现在从技术上而言,它非常依赖两个事情。
第一个是CLOCK的SDK,我觉得这个事情很有可能未来会被停止更新或者怎么样的一个方式,因为CLOCK的可能就觉得没有必要再让自己的产品能力从SDK的方式被别人用。
第一个是CLOCK的SDK,我觉得这个事情很有可能未来会被停止更新或者怎么样的一个方式,因为CLOCK的可能就觉得没有必要再让自己的产品能力从SDK的方式被别人用。
我觉得他现在开放这个的有一个能力,原因是在CLOCK的生态下,一些插件会需要用到CLOCK SDK来去帮忙实现一些插件的功能。
我觉得他现在开放这个的有一个能力,原因是在CLOCK的生态下,一些插件会需要用到CLOCK SDK来去帮忙实现一些插件的功能。
但如果这个有一个更好的替代,很有可能这个插件的功能会被禁掉,这些AGENT的实用性就会大大降低。
但如果这个有一个更好的替代,很有可能这个插件的功能会被禁掉,这些AGENT的实用性就会大大降低。
当然我觉得他做这件事情一定是他自己有一个更好的产品替代方案向市场推出来的时候。
当然我觉得他做这件事情一定是他自己有一个更好的产品替代方案向市场推出来的时候。
对,就因为这件事,我们公司也一直在做AGENT LAYER热拔插这样一件事情。
对,就因为这件事,我们公司也一直在做AGENT LAYER热拔插这样一件事情。
害怕CLOCK的翻脸,然后我们随时可以换别家的方法。
害怕CLOCK的翻脸,然后我们随时可以换别家的方法。
你们觉不觉得开源模型会对他们这种打引号的嚣张或者说垄断的这种感觉形成挑战呢?
你们觉不觉得开源模型会对他们这种打引号的嚣张或者说垄断的这种感觉形成挑战呢?
未来会不会有更多这种开源的模型服务商?
未来会不会有更多这种开源的模型服务商?
现在已经很多了嘛,就他们跑,然后他们也是按API去卖。
现在已经很多了嘛,就他们跑,然后他们也是按API去卖。
能够形成竞争的。
能够形成竞争的。
大家不是一直都号称过年的时候那个DEEPSEC要发V4吗?
大家不是一直都号称过年的时候那个DEEPSEC要发V4吗?
啊,是啊,都在期待,是的。
啊,是啊,都在期待,是的。
我觉得即使过年不发,SOMETIMES IN THE LATER他们也会发。
我觉得即使过年不发,SOMETIMES IN THE LATER他们也会发。
那我相信他们一定在CODING和AGENT的使用这两个场景上会做得比较好,也许就是一个ALTERNATIVE。
那我相信他们一定在CODING和AGENT的使用这两个场景上会做得比较好,也许就是一个ALTERNATIVE。
我相对了解一些CLOCK CODE的SDK,它还是包含了一些工程优化实现的,还不完全是模型能力。
我相对了解一些CLOCK CODE的SDK,它还是包含了一些工程优化实现的,还不完全是模型能力。
不过模型能力是最容易被通用化的吧?
不过模型能力是最容易被通用化的吧?
就是可能短期内直接裸用V4不一定会比CLOCK CODE的好,但我觉得假以时日,如果DEEP SIX一直想走一颗开源的心。
就是可能短期内直接裸用V4不一定会比CLOCK CODE的好,但我觉得假以时日,如果DEEP SIX一直想走一颗开源的心。
但我相信这里一定是有机会去做的比较好,或者说是一个很不错的替代方案。
但我相信这里一定是有机会去做的比较好,或者说是一个很不错的替代方案。
我认为CLOCKED一定会是领先的,至少在很长一段时间内。
我认为CLOCKED一定会是领先的,至少在很长一段时间内。
我觉得模型厂商跟AGENT LAYER是要绑定的,HARNESS和MODEL一定是要相辅相成的,因为他们这样才能形成闭环。
我觉得模型厂商跟AGENT LAYER是要绑定的,HARNESS和MODEL一定是要相辅相成的,因为他们这样才能形成闭环。
他去RL,他这个MODEL让他MODEL去内化AGENT LAYER的各种调整。
他去RL,他这个MODEL让他MODEL去内化AGENT LAYER的各种调整。
你就像他们推出SKILL呀,还有SUBAGENT呀、SLASHCOMMAND这种工具的时候,他在使用的过程中会慢慢被模型内化,这样他的模型的鲁棒性和下限都会整体提升。
你就像他们推出SKILL呀,还有SUBAGENT呀、SLASHCOMMAND这种工具的时候,他在使用的过程中会慢慢被模型内化,这样他的模型的鲁棒性和下限都会整体提升。
所以首先CLOCKED做得好,CLOCKED模型做得好,来确保它的在生产级别一定是领先于其他家的。
所以首先CLOCKED做得好,CLOCKED模型做得好,来确保它的在生产级别一定是领先于其他家的。
但是如果其他家在AGENT LAYER也能做得很好的话,是可以慢慢赶上的,但是这个需要时间。
但是如果其他家在AGENT LAYER也能做得很好的话,是可以慢慢赶上的,但是这个需要时间。
那我可不可以理解为,因为ANTHROPIC它自己又是模型商,又是终端服务AGENT的提供商?
那我可不可以理解为,因为ANTHROPIC它自己又是模型商,又是终端服务AGENT的提供商?
它这个数据闭环对它的训练有好处。
它这个数据闭环对它的训练有好处。
那么开源模型实际上因为开源出来之后,你用谁的API都是碎片化的,这些HOST的提供商他是没有做这种重新训练的能力。
那么开源模型实际上因为开源出来之后,你用谁的API都是碎片化的,这些HOST的提供商他是没有做这种重新训练的能力。
就可以理解为提供服务的人和训模型的人是两拨人,所以他做不成这种类似网络效应用你的人越多,你的质量就越好的这种闭环。
就可以理解为提供服务的人和训模型的人是两拨人,所以他做不成这种类似网络效应用你的人越多,你的质量就越好的这种闭环。
是,我是这么理解。
是,我是这么理解。
如果你去用一下OPEN CODE和CODEX,你就能很深刻地体会到CODEX模型在CODEX LI里就是好用,但是CODEX模型在OPEN CODE这个HARNESS里就差点意思。
如果你去用一下OPEN CODE和CODEX,你就能很深刻地体会到CODEX模型在CODEX LI里就是好用,但是CODEX模型在OPEN CODE这个HARNESS里就差点意思。
这个体感还是非常明显的。
这个体感还是非常明显的。
我在这里提一个可能不一样的观点,就是大家以前都觉得在AI时代,大厂因为他们有更多自己的数据C端闭环,所以其他人开源模型很难去BEAT它。
我在这里提一个可能不一样的观点,就是大家以前都觉得在AI时代,大厂因为他们有更多自己的数据C端闭环,所以其他人开源模型很难去BEAT它。
我觉得不一定对。
我觉得不一定对。
第一个是说现在的IL技术其实已经不需要太多的数据就可以训练得不错;第二个就是有可能有很不一样的技术架构,使得你整个的效果会有个质的突破。
第一个是说现在的IL技术其实已经不需要太多的数据就可以训练得不错;第二个就是有可能有很不一样的技术架构,使得你整个的效果会有个质的突破。
我们就拿DEEP C最新的那个NGRAM的那个PAPER举例。
我们就拿DEEP C最新的那个NGRAM的那个PAPER举例。
那我们假设想一个场景啊,如果它现在实现一个东西,在用户的场景里,它给你搞一个本地的NGRAM的小的EMBEDDING。
那我们假设想一个场景啊,如果它现在实现一个东西,在用户的场景里,它给你搞一个本地的NGRAM的小的EMBEDDING。
它可以就是记录你在这个模型里或者在这个场景下的一个对话,实时的去更改或去影响到线上这个LM的一个效果。
它可以就是记录你在这个模型里或者在这个场景下的一个对话,实时的去更改或去影响到线上这个LM的一个效果。
假设他搞了这么一个架构,那这个架构在质量上绝对就是质的一个领先。
假设他搞了这么一个架构,那这个架构在质量上绝对就是质的一个领先。
所以我其实觉得数据垄断带来模型效果垄断的这一个逻辑,并不一定是成立的。
所以我其实觉得数据垄断带来模型效果垄断的这一个逻辑,并不一定是成立的。
就是我还是很看好更好的技术,可能就是会有一些质的性突破,这个比较理想化的未来。
就是我还是很看好更好的技术,可能就是会有一些质的性突破,这个比较理想化的未来。
对,这个我觉得也是我们作为普通用户希望看到的,不希望被垄断的。
对,这个我觉得也是我们作为普通用户希望看到的,不希望被垄断的。
嗯,对,是。
嗯,对,是。
其实我们刚刚聊到是对模型厂商的冲击啊,那其实现在对整个互联网的公司,就包括像GOOGLE啊、AMAZON啊这一些。
其实我们刚刚聊到是对模型厂商的冲击啊,那其实现在对整个互联网的公司,就包括像GOOGLE啊、AMAZON啊这一些。
但其实如果以后CLUB这样的AGENT普及了,他每天在后台去帮我们看各种网页、读新闻,他们是产生大量的访问,但这些访问其实对于这个广告的商业模式来说是零有效点击,然后零广告浏览。
但其实如果以后CLUB这样的AGENT普及了,他每天在后台去帮我们看各种网页、读新闻,他们是产生大量的访问,但这些访问其实对于这个广告的商业模式来说是零有效点击,然后零广告浏览。
所以这有没有可能摧毁现在这种流量加广告这种商业模式的这些互联网公司?
所以这有没有可能摧毁现在这种流量加广告这种商业模式的这些互联网公司?
然后呢,未来的网站有没有可能需要变成这种按爬取付费?
然后呢,未来的网站有没有可能需要变成这种按爬取付费?
对,据我了解,应该是已经有这种苗头了吧。
对,据我了解,应该是已经有这种苗头了吧。
应该是OPENAI和GOOGLE都会找一些自有内容的媒体或者平台去签数据授权协议,他们可能就大公司批量的去买吧。
应该是OPENAI和GOOGLE都会找一些自有内容的媒体或者平台去签数据授权协议,他们可能就大公司批量的去买吧。
如果开开脑洞,那未来个人AGENT普及了,大家用的模型也比较分散的话,那可能网站会开一种新的形态。
如果开开脑洞,那未来个人AGENT普及了,大家用的模型也比较分散的话,那可能网站会开一种新的形态。
PAPER CROW,你爬我一次,你给我多少钱?
PAPER CROW,你爬我一次,你给我多少钱?
再加上未来的AGENT支付体系变得更成熟,真的就是我用什么,然后我付一天。
再加上未来的AGENT支付体系变得更成熟,真的就是我用什么,然后我付一天。
可能钱很少,那这些网站其实你想它接下来的商业模式,从现在的做内容、做粘性、做广告,可能会开放到一部分就是做优质内容、做AGENT,或者说大模型特别青睐的逻辑,非常的通顺、条理清晰,而且看上去数据很全、很可信。
可能钱很少,那这些网站其实你想它接下来的商业模式,从现在的做内容、做粘性、做广告,可能会开放到一部分就是做优质内容、做AGENT,或者说大模型特别青睐的逻辑,非常的通顺、条理清晰,而且看上去数据很全、很可信。
现在GEO的一种方式嘛,就是提供这样的内容,你就能吸引到很多很多模型过来。
现在GEO的一种方式嘛,就是提供这样的内容,你就能吸引到很多很多模型过来。
PAPER CROWD给你付钱。
PAPER CROWD给你付钱。
GEO的话,我身边就正好有做电商代运营的朋友,他现在说他们自己的客户现在啊有百分之十的流量是从AGENT这边倒过去的了,客户已经在付费正经的让他们帮忙去做探索了。
GEO的话,我身边就正好有做电商代运营的朋友,他现在说他们自己的客户现在啊有百分之十的流量是从AGENT这边倒过去的了,客户已经在付费正经的让他们帮忙去做探索了。
我觉得卖软件的话可能会越来越难挣钱,因为软件的开发成本无限趋近于零嘛。
我觉得卖软件的话可能会越来越难挣钱,因为软件的开发成本无限趋近于零嘛。
还是卖SKILL啊,这种卖CONTEXT、卖知识资产可能会更MAKE SENSE。
还是卖SKILL啊,这种卖CONTEXT、卖知识资产可能会更MAKE SENSE。
然后如果是打广告的话,OPENAI不是已经开始做他们那个广告的计划了吗?
然后如果是打广告的话,OPENAI不是已经开始做他们那个广告的计划了吗?
我感觉对于普通TO C用户的话,这是应该是一个很好的模型厂商的商业模式的案例。
我感觉对于普通TO C用户的话,这是应该是一个很好的模型厂商的商业模式的案例。
对,说到做软件,最近有个新闻不知道大家看到没有,就是CARBO的创始人他开始买很多非常有意义的点MD结尾的域名了。
对,说到做软件,最近有个新闻不知道大家看到没有,就是CARBO的创始人他开始买很多非常有意义的点MD结尾的域名了。
因为我之前写的那篇文章,教大家去检测CLARCO的现在部署够不够安全。
因为我之前写的那篇文章,教大家去检测CLARCO的现在部署够不够安全。
我一开始还想应该怎么把这些技术的东西写的让用户能够看懂,后来突然想我为什么要做这件事情?
我一开始还想应该怎么把这些技术的东西写的让用户能够看懂,后来突然想我为什么要做这件事情?
我直接把它做成一个MD,然后让用户扔给CLARCO让他自己检查就行了。
我直接把它做成一个MD,然后让用户扔给CLARCO让他自己检查就行了。
其实这是一个非常大的范式的转换,以后可能说APP那种形态,很多时候是一个皮内部的逻辑,就不是用这种CODING的方式去编译了。
其实这是一个非常大的范式的转换,以后可能说APP那种形态,很多时候是一个皮内部的逻辑,就不是用这种CODING的方式去编译了。
而是自然语言去编译的MD,就是这种自然语言编译场景下的APP。
而是自然语言去编译的MD,就是这种自然语言编译场景下的APP。
所以我感觉大家去注册点MD域名,确实有因为最近写文章很多时候你都会在里面说这个MD、那个MD对吧?
所以我感觉大家去注册点MD域名,确实有因为最近写文章很多时候你都会在里面说这个MD、那个MD对吧?
然后就会被自动识别成链接,点进去真的就导到那个网站的流量了。
然后就会被自动识别成链接,点进去真的就导到那个网站的流量了。
也是一个新的流量入口吧?
也是一个新的流量入口吧?
对这个也很有意思。
对这个也很有意思。
那其实现在特别是支线,你之前也提到你未来可能想搭一个A整军团对吧,在尝试这个方向。
那其实现在特别是支线,你之前也提到你未来可能想搭一个A整军团对吧,在尝试这个方向。
原来我们都在讨论艺人公司,然后现在有了CLUB之后,更激进的观点就直接说是零员工公司。
原来我们都在讨论艺人公司,然后现在有了CLUB之后,更激进的观点就直接说是零员工公司。
你觉得这件事情现在看来靠谱吗?
你觉得这件事情现在看来靠谱吗?
然后未来它可能对我们目前的这种公司的组织架构会有什么影响?
然后未来它可能对我们目前的这种公司的组织架构会有什么影响?
然后会怎么影响这些大厂员工们的范围?
然后会怎么影响这些大厂员工们的范围?
就目前啊,看来还是不靠谱的。
就目前啊,看来还是不靠谱的。
大模型还没有强到那个程度,它对人的商业上的需求或者说路径的把握也是不够的吧。
大模型还没有强到那个程度,它对人的商业上的需求或者说路径的把握也是不够的吧。
当然,尤其是其实长期记忆还是差一些。
当然,尤其是其实长期记忆还是差一些。
再怎么着,它只是看上去更好了,但是实际上也没有本质上做得更好。
再怎么着,它只是看上去更好了,但是实际上也没有本质上做得更好。
但是我觉得有一个点就是刚才说的这个MOUT BOOK,你可以去看看他们现在都在想什么,你可能就有自己的判断了。
但是我觉得有一个点就是刚才说的这个MOUT BOOK,你可以去看看他们现在都在想什么,你可能就有自己的判断了。
就是你让这么一帮东西自己去做一个公司,然后去MAKE MONEY这个事儿,现在靠不靠谱?
就是你让这么一帮东西自己去做一个公司,然后去MAKE MONEY这个事儿,现在靠不靠谱?
可能你随着每天去看他们发帖、他们讨论问题,你突然发现他们深度越来越强,是有可能的。
可能你随着每天去看他们发帖、他们讨论问题,你突然发现他们深度越来越强,是有可能的。
突然某一天他们开始说你看不懂的话了。
突然某一天他们开始说你看不懂的话了。
这也是很有可能的那个时候,可能就是另一件事儿了。
这也是很有可能的那个时候,可能就是另一件事儿了。
因为做一个团队,除了说人力成本这方面来说,其实更大一个成本就是沟通和管理嘛。
因为做一个团队,除了说人力成本这方面来说,其实更大一个成本就是沟通和管理嘛。
沟通就会产生歧义,人和人之间的沟通能力、理解能力都不一样,大家在沟通的时候,那个信息的折损率是非常夸张的。
沟通就会产生歧义,人和人之间的沟通能力、理解能力都不一样,大家在沟通的时候,那个信息的折损率是非常夸张的。
有时候所谓的大家都很讨厌的互联网黑话是吧?
有时候所谓的大家都很讨厌的互联网黑话是吧?
什么对齐一下,就是因为你不对齐的真的会出问题,就是大家分头去做,结果发现四个人做了,甚至五个方向。
什么对齐一下,就是因为你不对齐的真的会出问题,就是大家分头去做,结果发现四个人做了,甚至五个方向。
所以AGENT在这方面,就是他的沟通成本最多。
所以AGENT在这方面,就是他的沟通成本最多。
就是你跟他沟通,他们之间的沟通成本还是相对比较快的。
就是你跟他沟通,他们之间的沟通成本还是相对比较快的。
而且他们特别喜欢做文档,这也是大家带团队的时候可能会经常强调的,我们要文档化,不要开会的时候开完了不知道这个会讲的什么,所有的改动都要在文档里记录。
而且他们特别喜欢做文档,这也是大家带团队的时候可能会经常强调的,我们要文档化,不要开会的时候开完了不知道这个会讲的什么,所有的改动都要在文档里记录。
就这些事儿,其实对于AGENT来说,可能就是天生他DNA里他就想这么做,你不让他做,他都难受的。
就这些事儿,其实对于AGENT来说,可能就是天生他DNA里他就想这么做,你不让他做,他都难受的。
所以在这方面上,他们特别适合干这种集团式往前推进的事情。
所以在这方面上,他们特别适合干这种集团式往前推进的事情。
所以我觉得零人公司可能确实有点远吧,至少我觉得现在还在观察。
所以我觉得零人公司可能确实有点远吧,至少我觉得现在还在观察。
但是艺人公司是绝对可行的,当然对这个人的要求也非常高,你得有know how,就是说用agent,你得知道他做的这个方向,你有评判能力,而不是说你也不懂。
但是艺人公司是绝对可行的,当然对这个人的要求也非常高,你得有know how,就是说用agent,你得知道他做的这个方向,你有评判能力,而不是说你也不懂。
你也不懂,你就让他直接去搞了。
你也不懂,你就让他直接去搞了。
比如说我可能不懂拍电影,对吧?
比如说我可能不懂拍电影,对吧?
我对什么分镜啊、叙事啊这些可能没什么感觉,只知道啊这个场景很炫酷,那个场景很炫酷。
我对什么分镜啊、叙事啊这些可能没什么感觉,只知道啊这个场景很炫酷,那个场景很炫酷。
那我让他去拍电影,拍出来好坏我自己判断不了,也不行。
那我让他去拍电影,拍出来好坏我自己判断不了,也不行。
所以说我觉得艺人公司就是这个人,他把握方向,同时他要去用自己的NO HOW去带领这个军团,他还是得是这个军团的将军。
所以说我觉得艺人公司就是这个人,他把握方向,同时他要去用自己的NO HOW去带领这个军团,他还是得是这个军团的将军。
但是你现在得到的这个军团呢,他是比一个纯人肉的军团要强大非常多倍的。
但是你现在得到的这个军团呢,他是比一个纯人肉的军团要强大非常多倍的。
又低功耗,又高兴的就有点像量子军团或者什么精灵军团一样的这种感觉吧。
又低功耗,又高兴的就有点像量子军团或者什么精灵军团一样的这种感觉吧。
对,之前国内有一个港口,然后它的这个调度系统里面,他们再搭一套整个用多个AGENT之间沟通,就它每个环节,就比如装卸货呀,再到怎么去调度啊,它是每个都设计了一个AGENT,然后让他们之间其实跟人类的这个组织架构也是一样的,然后再去一环一环的走。
对,之前国内有一个港口,然后它的这个调度系统里面,他们再搭一套整个用多个AGENT之间沟通,就它每个环节,就比如装卸货呀,再到怎么去调度啊,它是每个都设计了一个AGENT,然后让他们之间其实跟人类的这个组织架构也是一样的,然后再去一环一环的走。
但他们中间就会发现,因为人类其实在调度的过程中,不同的环节之间会经常吵架、推诿什么的,然后他们发现这个AGENT。
但他们中间就会发现,因为人类其实在调度的过程中,不同的环节之间会经常吵架、推诿什么的,然后他们发现这个AGENT。
也会出现同样的现象,最终只能再设计一个上级AGENT,然后来去做决策。
也会出现同样的现象,最终只能再设计一个上级AGENT,然后来去做决策。
你觉得就像你比如说让一个这种AGENT军团然后去走一件事情,你有遇到过这种情况吗?
你觉得就像你比如说让一个这种AGENT军团然后去走一件事情,你有遇到过这种情况吗?
还没有可能。
还没有可能。
我不知道啊,跟大家对它的定位设定有没有关系,就可能你给它设定得太像人了,它确实有可能出现一种推卸责任。
我不知道啊,跟大家对它的定位设定有没有关系,就可能你给它设定得太像人了,它确实有可能出现一种推卸责任。
我倒是没有在我说的这个AGENT军团里碰到这种情况,但我自己在之前用WEB CODING跟HOTEL AGENT聊天的时候,我发现它有一次自欺欺人的表现。
我倒是没有在我说的这个AGENT军团里碰到这种情况,但我自己在之前用WEB CODING跟HOTEL AGENT聊天的时候,我发现它有一次自欺欺人的表现。
他跑了有几个测试,一直跑不过。
他跑了有几个测试,一直跑不过。
他跑了三轮之后,他突然来了句:‘那么我们接下来就跑一遍能通过的测试啊’。
他跑了三轮之后,他突然来了句:‘那么我们接下来就跑一遍能通过的测试啊’。
啊,跑完了肯定都是对号OK。
啊,跑完了肯定都是对号OK。
所有测试通过了,然后开始给我总结这次改了什么。
所有测试通过了,然后开始给我总结这次改了什么。
然后我马上就说:‘你这不是掩耳盗铃吗?
然后我马上就说:‘你这不是掩耳盗铃吗?
’OK,你给他指出来之后,他自己就在那儿反思啊。
’OK,你给他指出来之后,他自己就在那儿反思啊。
你说的对啊,我不应该这样做。
你说的对啊,我不应该这样做。
所以就还是我说的那个NO号嘛,就是你如果无法判断他现在做的这件事情是不是对的,或者质量好不好。
所以就还是我说的那个NO号嘛,就是你如果无法判断他现在做的这件事情是不是对的,或者质量好不好。
那你被他忽悠的可能性还是有的,至少现在我不知道。
那你被他忽悠的可能性还是有的,至少现在我不知道。
就像刚才说的,引入上级甚至或者说peer review,我感觉是有一定规训作用的。
就像刚才说的,引入上级甚至或者说peer review,我感觉是有一定规训作用的。
毕竟大家context都不一样,而且AI它没有真正的这种生存焦虑,它并不是像咱们工作丢了或者晋升机会没有了影响生活这么具体的这个worry啊。
毕竟大家context都不一样,而且AI它没有真正的这种生存焦虑,它并不是像咱们工作丢了或者晋升机会没有了影响生活这么具体的这个worry啊。
所以说我觉得多搞几个大家互相review,互相聊,应该是能缓解这个问题。
所以说我觉得多搞几个大家互相review,互相聊,应该是能缓解这个问题。
像你们在招人也好,或者是在给这些企业做A整化的这个过程中,有没有发现现在在公司组织架构上有没有什么新的变化?
像你们在招人也好,或者是在给这些企业做A整化的这个过程中,有没有发现现在在公司组织架构上有没有什么新的变化?
我之前听像这个硅谷的很多公司,可能他在招聘这个新员工的时候,他评价你的能力可能跟以前的那种评价体系都不一样了。
我之前听像这个硅谷的很多公司,可能他在招聘这个新员工的时候,他评价你的能力可能跟以前的那种评价体系都不一样了。
他现在可能会比如直接丢给你一个你不可能自己完成的任务,你必须得借用AI工具,然后看你对这种任务完成的怎么样。
他现在可能会比如直接丢给你一个你不可能自己完成的任务,你必须得借用AI工具,然后看你对这种任务完成的怎么样。
这可能是一种新型的面试。
这可能是一种新型的面试。
关于 Bayt 播客
Bayt 提供中文+原文双语音频和字幕,帮助你打破语言障碍,轻松听懂全球优质播客。