·
“ #Anthropic 和 #OpenAI 的日志里肯定保存着所有人的访问密钥、API 密钥和持有者令牌。” 如今的人工智能技术栈漏洞远比人们意识到的要多得多。 #IronClaw 解决了这个问题,因为“密钥永远不会接触 LLM”。 @ilblackdragon 联合创始人 @NEARProtocol 正在开发私有 AI 基础设施,其中“模型提供商和硬件提供商实际上都无法访问您用于 #AI 推理的内容”。 换句话说,“没有任何一方能够单独解密你的数据”。https://x.com/Bankless/status/2036518654909821158?s=20
0:00
人们在使用时没有意识到的一件事是
0:03
Entropic OpenAI,或者更糟的是,你使用其他东西
0:07
进行推理时,Open Cloud 实际上也会发送你所有的秘密
0:11
到那些服务。
0:12
是的。
0:13
所以在 Entropic 和 OpenAI 的日志中某处,
0:15
他们拥有每个人的访问密钥、API 密钥,
0:20
以及用于访问你的 Gmail、Notion 的承载令牌
0:25
和你的——
0:25
我们竟然在做这种事情,真的很疯狂。
0:29
是的。
0:30
首先,我不知道如何解决这个问题。
0:32
密钥绝不会进入 LMM。
0:33
所以即使你用这些集中式提供商,
0:37
虽然不应该,但至少密钥不会
0:39
进入任何 LMM。
0:41
所以这是我们希望做到的,
0:43
这是唯一必须首先做到的事情。
0:45
是的,是的。
0:46
但 Neerai 过去一年一直在努力开发的,
0:50
实际上是如何实现私密 AI?
0:53
也就是说,我们如何提供一种 AI,
0:58
让模型提供商、硬件提供商
1:00
都无法访问你用 AI 推理的内容?
1:05
所以我们有 Neerai Cloud,这是推理云。
1:08
你可以使用开源权重模型。
1:10
它运行在安全环境中。
1:12
它实际上使用——这也就是我
1:14
一开始提到的——
1:15
你会使用我们的多方计算网络,
1:18
这是 Neer 的一部分,用于加密
1:21
解密、备份以及所有内部机制。
1:25
这让你确信,
1:29
没有任何单一方可以解密你的数据。
1:32
没有人可以访问它。
1:35
你需要把所有多方计算网络
1:37
有效地全部集结起来才能访问。
1:40
所以——
1:40
好,那么你的意思是说,
1:43
你提供一种服务,配合
1:46
Iron Claw,类似于保密云
1:50
环境来运行 LMM 实例?
1:53
当然,你得运行开源权重模型。
1:55
但也许一些中国模型
1:57
是最好的,比如 Kimmy 或者类似的,
1:59
或者一些 DeepSeek——
2:00
是的,我们有 Quimmy、Quen、DeepSeek。
2:04
最新的热门我们也会加进去。
2:07
我们还有 OpenAI RSS。
2:10
所以,你可以在它们之间选择。
2:12
现代媒体一团糟。
2:13
每个平台都有偏见,但并不是所有新闻消费者
2:16
都意识到他们所接收平台的偏见。
2:18
这就是为什么当我想知道真相时,
2:20
我会去 Polymarket,世界上最公正的新闻平台。
2:23
从 polymarket.com 获取你的信号。
·
·
0:00
托比·卢卡对我来说非常有趣,因为他是你最喜欢的创始人,
0:03
最喜欢的创始人。
0:04
所以你欣赏的每个人,当你问他们欣赏谁时,他们都会提到托比
0:08
。
0:08
他们喜欢他的原因是他对每件事都有独立思考,
0:11
独立思考。
0:11
因此他拥有一系列彼此不相关的信念,
0:15
这意味着当你和他对话时,你无法预测
0:18
他对你的问题或陈述的回应会是什么。
0:21
我们谈了四个小时。
0:24
录音前我们先聊了半小时。
0:26
接着录了三个小时。
0:27
然后我们去了某个地方,录完后又聊了三十分钟。
0:32
我不停地说话。
0:32
我说,伙计,我得赶飞机了。
0:33
那晚我要和查理·罗斯吃晚饭。
0:36
我得飞过去。
0:37
我说我们本来可以继续聊。
0:38
他真让我大开眼界。
0:40
他说的一件事,我觉得你们观众会感兴趣,就是他
0:43
相信。
0:43
我记得他在节目里说过,我们将回顾
0:46
2026年作为这样一年,
0:48
那一年全球所有生意都处于抢夺之中。
0:51
人工智能正全面来袭。
0:54
每一个行业都必须被重新构想,你会回头看,
0:57
那一年你本应该明白,
1:00
你可以
1:01
用人工智能原生版重建所有现有业务。
1:04
很有趣。
1:05
Finn,如果你想让 AI 处理你的客户支持,访问 Finn.ai,
1:10
第一
1:10
客户服务 AI 助理。
·
0:00
AI和加密过去一年里确实让大家都很失望
0:03
因为
0:04
代理人们炒高又抛售,但这仍然显然是
0:09
最有意义的领域。
0:09
真的第一次感觉你可以让一个SOAR创始人
0:12
创造一个
0:13
价值一千万到一亿美元ARR的产品。是的。你没见过这种情况。
0:18
我们没有,我们没有,
0:20
但这也正好。真的,完美适合
0:23
这些,
0:24
比如MediDao,SOAR。我觉得还有一种代币化股权的平台,
0:27
这些平台上的
0:29
创始人不适合风险投资支持。也许,有可能,但大多数时候,
0:33
他们不适合风险投资支持。
0:33
就是一个人,变化太快。所有这些东西。
0:36
他们不需要筹集大量资金。
0:37
这真的看起来是,
0:41
资金形成一直是加密的杀手级应用。
0:44
我的意思是,
0:44
我知道我们一直在说这样的话,但有时候事情
0:48
需要时间,
0:49
这真的感觉是加密的巨大机会。
·
人工智能正变得更加全球化、更加多模态,并日益深入地融入各行各业。 #ai
0:00
[音乐]
0:04
奥利维亚,欢迎。
0:05
>> 谢谢邀请我。
0:06
>> 这一年中最令人激动的时刻,
0:08
就是顶级100报告今天发布了,我想。
0:11
是这样吗?>> 是的。
0:12
>> 这是三年来的第六期。
0:15
跟我们说说什么没变,什么变了,
0:18
你有多兴奋,报告有什么新动向?
0:20
>> 是的,很多方面变化很大,
0:23
自从我们2023年首次发布这份名单以来,增长惊人。
0:25
另一方面,从宏观层面看,我们仍然处于非常早期阶段。
0:28
ChatGPT是迄今为止最大的全球AI产品,
0:32
但全球只有10%的人口每周活跃使用它。
0:36
所以未来还有很大发展空间。
0:41
我认为过去六个月可能是我最喜欢、最激动的时刻,
0:41
因为见证了许多变化。
0:43
其中之一是消费者竞争真正加剧了。
0:47
当然有ChatGPT,还有Gemini和Claude都在加倍下注,
0:51
针对它们各自的消费级和准专业用户。
0:54
我觉得我们开始看到这些平台可能随着时间累积优势。
0:59
这让谁获取最多用户成为一个特别重要且有趣的问题。
1:03
相关的是,这次我们首次纳入了非AI原生但已主导AI的产品,
1:06
例如Canva、Notion和Free Pick。
1:08
Notion甚至宣布他们现在认为一半的新ARR
1:12
来自于AI优先的功能,非常酷。
1:14
最后,我们看到AI在网站或应用提示框之外大幅扩展了,
1:17
例如新出现的各种浏览器,
1:20
像DIA、Comet、Atlas。
1:22
Claude也进入了Excel、PowerPoint和Chrome。
1:25
还有桌面应用如Cursor、Whisper Flow、Granola。
1:29
AI的使用方式呈现出令人兴奋的爆发式增长。
1:32
真是太令人兴奋了。
1:36
这里内容很多要说。
1:39
先从大型基础模型说起吧。
1:43
你能谈谈你认为Gemini和Claude各自的专长领域吗?
1:45
当然,还有ChatGPT,
1:48
因为这更像是一个整体上扬的故事,
1:53
而不是这些模型互相替代。
1:56
是的,我同意。
1:58
尽管上周发生了一些戏剧性事件,
1:59
例如Katy Perry在Twitter上站队品牌之间的争论,
2:00
这事我之前从没料到,
2:02
但从根本上看,ChatGPT仍是明显的赢家。
2:04
在网页端,它的用户是Gemini的2.7倍。
2:07
移动端则是Gemini的2.5倍。
2:08
尽管Twitter上的技术争论频繁,
2:11
ChatGPT网页端用户几乎是Claude的30倍,
2:13
移动端更是Claude的80倍。
2:14
我们看到Sam Altman当时的推文,
2:17
是在超级碗广告大战时期。
2:21
就是那个德州推文。
2:24
是的,他说,德州使用免费版本ChatGPT的人比Claude的全球用户还多,
2:27
这是真的。
2:29
不过,我认为我们看到的趋势是,
2:33
“分歧”也许不是准确词汇,
2:37
但用户使用的产品种类和用途都在扩展,
2:41
市场份额略有变化。
2:45
Claude特别加倍押注准专业用户,
2:47
推出了协同办公、Claude代码,
2:49
以及与Excel、PowerPoint集成。
2:51
如果你看看Claude和ChatGPT的应用商店,
2:52
它们各自都有200多个应用,
2:56
但交集只有11%。
2:58
Claude专注于高端数据源、研究工具、科学和金融数据,
3:00
而ChatGPT更专注消费市场,旅行、营养、消费金融等。
3:04
Gemini则在自己的小领域耕耘,
3:06
主要通过创意工具获得用户和收入增长。
3:10
活跃用户和付费用户几乎与YO3、Nano Banana One、Nano Banana Pro、Nano Banana Two的发布节奏完全同步。
3:13
它们也在准专业用户领域稍作尝试,
3:15
把AI整合到Gmail、Sheets、Calendar中,
3:19
但这些都是现有产品的升级,
3:21
而非全新体验。
3:23
- 我们不如深入聊聊应用商店动态,
3:25
这真是太有趣了。
3:28
你能说说ChatGPT的应用目录的利好吗?
3:30
- 当然可以。
3:32
我看到ChatGPT采取的策略,Sam本人也在Twitter说过,
3:34
就是他们要做“人人皆可用的AI”,
3:37
意味着他们想吸引所有消费者,
3:39
并通过不同方式赚钱。
3:41
Claude则明确了只通过订阅模式盈利,
3:44
这对能付费的用户和企业很好,
3:46
但不是所有人都适合。
3:50
你也能从它们倾向于有偿的高价值订阅插件看出来,
3:52
这些插件多是专业的数据和服务工具。
3:53
- 类似实验室工具。
3:55
- 是的,比如PitchBook,投资人、科学家、数学家会用的工具。
3:58
ChatGPT则更像Google的方式,
4:02
构建普通人愿意用的产品。
4:06
可能转化成订阅用户比例较低,
4:11
但他们能通过广告赚钱,
4:13
也可能通过交易抽成。
4:15
比如如果他们成为预订旅行或各种长尾消费的入口,
4:17
按理说能从中分成,至少是其引流部分。
4:20
所以这就是ChatGPT应用商店的牛市逻辑,
4:22
数据里还没显现,
4:25
但未来一两年会更明显。
4:26
- 真有趣,你刚才谈到报告里“复合优势”的观点,
4:28
也就是上下文效应的累积,
4:30
能详细说说这个概念吗?
4:32
你用什么指标作衡量,比如会话时长、会话次数,
4:34
还是输入数据量,或者其他?
4:37
- 这是个很激动人心的问题,
4:39
因为到目前为止,像ChatGPT、Claude、Gemini、Perplexity这些横向大模型,
4:40
我们一直活在一个上下文和记忆能被轻易导出的世界。
4:43
Claude最近还针对这个做了广告活动。
4:45
但我认为锁定效应会越来越强,
4:48
而且其实这很可能有利于那些更横向、更广泛的工具,比如ChatGPT,
4:50
原因有几方面。
4:54
第一,ChatGPT已经开始开发能让用户通过平台与他人互动的产品,
4:56
比如群聊,想象如果有个更成功的ChatGPT群聊版本,
4:57
你的所有朋友都在上面,
4:58
那当你想离开ChatGPT时,
5:00
你得说服他们都换到另一个产品去。
5:04
- 正是如此。
5:08
第二点,我觉得也类似苹果和谷歌的比较,
5:10
当这些应用商店成熟后,开发者很可能会将时间和精力集中在那些用户最多、
5:12
或者在某些情况下最愿意付费的平台上,
5:15
对于很多消费工具来说,决定因素往往是用户数量。
5:18
这也进一步利好ChatGPT。
5:20
今年我最期待的一点是,Sam Altman暗示的ChatGPT身份验证层,
5:23
也就是说你可以用ChatGPT账号登录,
5:26
携带你的记忆和令牌,
5:30
其他产品就能借此变得更强大、更贴心。
5:35
如果成真,你会希望自己的核心身份存留ChatGPT,
5:37
这样它可以帮助提升你使用其他工具的体验。
5:40
- 这是超级聪明的策略,
5:41
依托它们拥有9亿用户注册的优势,
5:44
第三方开发者理想状况下不用自己支付推理费用,
5:47
用户把推理能力带着走,
5:50
开发者受益,
5:52
ChatGPT获得锁定,
5:53
用户获得个性化,
5:56
一切完美配合。
5:58
- 是的,我完全同意。
6:00
唯一让我存疑的是,
6:02
这点可能对锁定效应正反两面都有影响,
6:04
就是你的工作场景,
6:06
你签的企业合同。
6:07
比如,从某种角度讲,
6:10
如果我公司工作用的是ChatGPT,
6:13
那我学会用它就有优势。
6:17
we've kind of lived in a world where the context
6:20
and the memory is somewhat easily exportable.
6:22
Like Claude ran a campaign around this recently.
6:25
But I think there's gonna be increasing lock-in
6:28
and I do think that probably actually benefits
6:30
the broader, more horizontal tools like Chatsheet BT
6:33
for a few reasons.
6:35
So I think one, we've already seen Chatsheet BT focus on
6:39
or start to build out products where you interact
6:42
with other people on them through the platform.
6:44
So the group chats, like imagine if you,
6:46
if there's an even more successful version
6:48
of Chatsheet BT group chats
6:50
and all of your friends are on there,
6:51
then if you wanted to turn from Chatsheet BT,
6:53
you'd also have to convince them all to go through another product.
6:56
- Exactly.
6:57
I would say the second one is kind of also
7:00
like an Apple Google comparison in that
7:02
as these app stores emerge, it is likely that developers
7:05
might start to concentrate their time and effort
7:08
in who they build for in the most sophisticated way,
7:12
who they ship to first, depending on who has the most users
7:16
or maybe in some cases who's the most willing to pay,
7:19
but for a lot of these consumer tools,
7:20
it'll be who has the most users.
7:22
So I think that also benefits Chatsheet BT.
7:25
And then the other thing probably that I'm most excited
7:27
for this year that Sam Altman had kind of hinted at
7:31
is this like authentication with Chatsheet BT layer.
7:34
So essentially you'd be able to log in
7:36
with your Chatsheet BT account
7:37
and take like your memory and your tokens with you.
7:42
And then that other product would be able to kind of borrow
7:45
those things to be even more powerful and helpful for you.
7:48
And if that's the case, then you're wanting
7:50
to have more of your core identity live on Chatsheet BT
7:54
because then it can lend it to these other tools
7:57
that are even better for you.
7:58
- It's so smart and it really plays to their advantages
8:01
in that they have signups for 900 million people.
8:05
And then the third party developer ideally
8:07
would not want to pay for the inference.
8:09
So the user can bring their inference capacity with them.
8:12
There's an advantage for the developer.
8:13
Chatsheet BT gets the lock in.
8:15
The user gets the benefit of personalization
8:17
and it all kind of works.
8:18
- Yes, I totally agree.
8:19
The one question mark I still have on this
8:21
that I think could play both positive and negative
8:24
in terms of increasing lock in for the consumer product
8:27
is what your work goes with,
8:30
like what your enterprise contract is.
8:33
So for example, in some ways, it's good for me
8:36
if we, if my company uses Chatsheet BT for work
8:40
because then I know how to use the product.
8:42
作为普通消费者,他们可能尝试过
8:44
一两款人工智能产品。
8:45
所以他们更可能觉得习惯
8:47
并继续使用他们已经用过的东西。
8:49
另一方面,有些人可能不想将身份
8:53
和记忆混合在个人和工作使用场景中。
8:56
- 说得对。
8:57
- 所以我很感兴趣。
8:58
我觉得OpenAI最近有暗示,
9:00
但我很想知道如何划分记忆
9:04
在你自己内部的不同角色之间,
9:08
使用这些产品。
9:09
- 不要混淆角色。
9:11
- 对,就是这样。
9:12
- 好吧,换个话题,
9:14
先聊聊Gemini。
9:15
你知道,我在想Google早期AI产品的整体感觉,
9:18
比如Bard,他们永远甩不掉的包袱。
9:21
- 那些时刻很出名。
9:24
- 现在我们看到像Nana Banana这样的产品,
9:25
甚至这个名字“Nana Banana”
9:27
完美体现了Google的进步。
9:30
- 是的。
9:32
- 看起来他们对多模态非常重视。
9:33
- 嗯。
9:34
- 你怎么看他们的策略?
9:35
- 我挺佩服的。
9:36
我觉得他们在某些方面确实犹豫了,
9:38
这种犹豫恰恰符合预期。
9:40
将AI融入核心功能有风险,
9:44
可能会损害自家产品,或者很多人
9:47
已经用了这些工具十多年,
9:51
转换成本比较高。
9:53
他们不想在AI突然出现时吓到用户,
9:56
这我能理解。
10:00
但他们做得非常好的,是这些新创意产品,
10:04
基本上是DeepMind团队驱动的模型,
10:06
我觉得他们整体很棒。
10:09
- 我觉得Notebook LM实际上是首次展现,
10:11
是消费者AI音频领域的真正创新。
10:15
现在又有了图像和视频模型。
10:18
所以这样的大公司,
10:20
他们必须克服自身桎梏,
10:23
实际开始创新。
10:27
看起来他们正在这样做,但你曾在Google工作,
10:31
所以我很好奇你的看法。
10:32
- 很开心你提到Notebook,
10:35
因为Notebook在公司算是个无人争夺的空白地带,
10:38
这避免了十位副总裁争抢资源。
10:40
因此,Notebook的进展非常快。
10:41
他们刚推出了视频生成功能,
10:44
可以很直观地展示你的工作区内容,挺酷的。
10:47
相比之下,像Sheets和Docs这些现有产品,
10:48
有太多过去积累的惯性和势头,
10:50
还有管理层的各种压力,
10:53
他们很难做超出最显而易见的增量改进。
10:54
- 是的,我同意。
10:56
接下来几年会怎样,我们拭目以待。
10:59
我感觉他们会竭力保住这些产品,
11:01
因为不想失去用户群,但正如你说,
11:04
他们已经锁定了众多企业用户,
11:08
短期内可能不必做太多变化,
11:10
也能跟上步伐。
11:13
- 这次谈话隐含的一个点是,
11:14
我们西方体验并讨论很多AI,
11:16
说说全球AI发展趋势吧。
11:18
我看到里面有几个令人惊讶的点。
11:21
- 我们扩大了报告的研究范围,
11:23
结果非常有趣和好玩。
11:25
两个显而易见的与世界其他地方不同的是,
11:26
俄罗斯和中国。
11:28
大家都知道,中国许多AI产品被审查或禁用。
11:31
因此几乎所有的使用,
11:33
他们在ChatGPT、Bard和Gemini的综合使用量上最低,
11:35
只有15%。
11:39
他们主要用的是字节跳动出品的Dall·E,DeepSeek,
11:41
Quinn,Kimi这些模型。
11:43
让我有些惊讶的是,俄罗斯的情况其实很相似,
11:46
他们也有自己的平行AI生态系统,
11:47
这是出于必须,因为制裁等因素,
11:50
阻止他们使用所有美国工具。
11:54
我们看到像GigaChat和Yandex,
11:57
这些俄罗斯本土产品,往往由国家相关公司打造,
11:59
使用量很大,还有DeepSeek。
12:02
DeepSeek在俄罗斯市场仅次于中国,
12:05
排名第二。
12:07
如果你看各国采纳数据,
12:10
是的,某些国家对Claude用得更多,
12:12
有的国家对Gemini用得更多,
12:14
但两个最大异常是俄罗斯和中国,
12:15
他们是巨大市场,
12:18
值得持续关注。
12:21
- 很有趣的是,俄罗斯和中国
12:22
都因使用限制和文化偏好成为例外,
12:25
还有其他国家有地理特定趋势吗?
12:29
还是说这是一种全球AI行为模式?
12:33
- 说到模型开发,
12:34
专有模型开发可让你部署专属AI产品,
12:38
大部分研究来自美国和中国,
12:40
俄罗斯可能也有些贡献。
12:43
其他地方也在见证本土生态出现。
12:46
韩国有几款本土产品,
12:48
比如Neighbor和Cookal,
12:51
做出了不错的语言模型界面。
12:52
印度是我特别关注的另一市场,
12:56
因为那里人口众多,
12:59
可以支持独立大型企业专注印度市场。
13:01
印度的另一特色是语言多样,
13:03
各种语言不全被语言模型和语音产品支持,
13:06
导致主语言用户体验相对较差,
13:08
比如使用类似ChatGPT的产品时。
13:10
目前尚未见大量变种,
13:12
但我不惊讶未来可能有更多创业者,
13:14
甚至美国创业者,针对印度市场做AI。
13:15
另外一点,我们首次制作了个热力图,
13:18
显示哪些国家人均采纳AI最多和最少。
13:21
我们看了十大大型语言模型产品,
13:24
包括网页版和移动端,看看数据如何。
13:25
新加坡排名第一。
13:28
- 太疯狂了。 - 是的。
13:30
紧随其后的是香港、阿联酋、韩国。
13:34
美国排名第20,
13:37
不算特别低,也不算特别高。
13:39
俄罗斯和中国排得很后,排名50之后。
13:43
数据中蕴含许多有趣故事。
13:45
先说这前五名,
13:48
新加坡、韩国、香港,
13:50
劳动力结构高度技术化,白领比例高,技能丰富。
13:52
美国有大量岗位AI还未涉足,
13:55
比如零售、运输等领域。
13:57
另外,关于AI的文化认知多样性极大。
14:01
如果你在美国,
14:02
可能对AI的持续焦虑和质疑感受深刻——
14:04
- 是的,我就打算问你这个问题。
14:07
- 及AI对艺术家的负面影响等,
14:11
这些因素使得人们是否接受AI犹豫不决。
14:14
- 是的。
14:15
去年Edelman全球媒体公司做了项大调查,
14:18
美国的AI信任度较低,约32%,
14:22
而排名靠前的多数国家信任度达50%、60%、70%。
14:25
这也拖累了美国的发展速度,
14:28
尽管最大产品都来自美国,
14:31
人均使用率却不及其他投入更多的市场。
14:35
- 完全正确。
14:39
我读到中国对AI的好感度高达80%。
14:41
- 是的。 - 80%的人持正面看法。
14:44
我知道阿联酋和新加坡,
14:48
他们文化上更倾向技术乐观主义。
14:49
- 是的,确实如此。
14:50
看到一些小国的人均采纳率很有趣。
14:54
在美国,大约有三分之一的人每月活跃使用ChatGPT。
14:56
欧洲一些国家,甚至东欧,
14:59
虽样本较小,人均使用率可达45%到60%。
15:04
他们接受得较快。
15:06
- 是的,非常有意思。
15:09
我关注的是AI应用的全谱系,
15:11
从最实用的,
15:14
几乎是谷歌搜索替代品,
15:17
are very like tech first white collar high skill.
15:20
And the US has a giant chunk of jobs
15:23
where AI hasn't really touched them yet,
15:25
like retail and transportation and some of these other things.
15:29
I think also the cultural norms around AI
15:33
are shockingly diverse.
15:36
If you're in the US, you have probably internalized this
15:39
ongoing angst and questioning around--
15:41
- Yeah, I was going to ask you about this 100%.
15:44
- Or AI is terrible for artists
15:47
or all of these other things that make people pick up
15:50
or not pick up AI. - Yes.
15:51
- There was actually a big survey last year
15:54
from Edelman, the global media company.
15:57
And the US had a fairly low rate of trust in AI.
15:59
It was like 32% and most of these other countries
16:02
that are high on the list are like 50, 60, 70%.
16:06
So that I think has also held the US back
16:08
despite the fact that we are where the biggest products come from
16:12
are per capita usage is lower than a lot of these other markets
16:14
that have maybe smaller populations
16:16
but have embraced it more.
16:19
- I think that's exactly right.
16:20
Now I was reading that in China,
16:22
the sort of favorability views on AI are 80%.
16:25
- Yeah. - 80% hold a favorable view.
16:27
And I know UAE and Singapore,
16:29
I think they've sort of culturally wired to be tech optimistic.
16:34
- Yes. - Which is an advantage.
16:35
- Yes, yes, definitely.
16:37
It's interesting to see some of these smaller countries
16:39
like the per capita adoption rate.
16:42
Like in the US, it's around probably a third of people
16:45
are monthly active users of something like a Chachi BT.
16:49
In some, even some of like the European countries
16:52
or Eastern Europe, it's like 50, 45, 60% on smaller bases.
16:58
But they've kind of embraced it more quickly than we have here.
17:02
- Yeah, really interesting.
17:03
You know, one thing that I'm sort of watching
17:05
and I'm interested in is as you look at the spectrum of AI
17:07
from the most functional,
17:09
almost like a Google search replacement
17:11
对于最具文化性、创意性和个性化的,
17:14
我们应该看到各国之间更多的差异化。
17:17
因为显然文化方面,
17:18
印度拍摄的电影
17:19
与中国或美国拍摄的电影截然不同。
17:21
- 是的。
17:23
- 那他们使用创意工具的方式为何不不同呢?
17:25
- 是的,老实说这也是
17:27
我们开始在这份报告中考虑地理细分的部分原因,
17:30
因为在生成式AI的前两年半,
17:33
三年中,
17:35
绝大多数消费者可能只在使用
17:38
一个产品,现在这种情况已有很大扩展。
17:41
我认为我们将看到更多
17:43
针对特定市场的工具。
17:45
如果它们占领了足够的市场份额,
17:48
比如一些俄罗斯或中国公司,
17:51
它们实际上可以进入全球榜单,
17:53
前提是市场规模足够大。
17:55
说说创意工具的发展,
17:58
你认为这有多少反映了文化、
18:00
是文化驱动的,
18:02
我们何时会跨越那个门槛?
18:04
- 创意工具的趋势令人着迷。
18:07
显然,首个大型生成式AI产品
18:10
实际上是mid-journey,早于Chachi PC发布。
18:13
- 确实,是这样的。
18:14
- 在我们榜单的最初几期,
18:16
创意工具占据主导地位。
18:19
我以前说过,
18:21
创意工具受益于
18:24
早期模型的幻觉效应,
18:27
因为它们生成的内容往往更令人惊喜、美丽或原创。
18:30
因此,一度只有这些创意工具
18:32
在消费者AI中真正奏效。
18:35
现在情况变化很大。
18:36
创意工具仍是榜单的重要部分,
18:39
但作为独立业务的大型创意工具类型已经改变。
18:41
最大的变化是
18:45
我们看到独立的图像生成器越来越少。
18:47
许多这类工作,
18:51
如果制作基本的图像,
18:52
比如表情包、基础营销图像或信息图,
18:55
像Chachi BT和Gemini的核心模型
18:59
现在对此类任务都很擅长。
19:02
因此榜单上仍出现的产品,
19:05
如I-U gram或mid-journey,
19:07
要么是美学主张很强烈,
19:10
要么具有更复杂的工作流程,
19:13
这是Chachi BT类工具无法提供的。
19:16
相比之下,音乐、语音、视频
19:21
似乎是模型最大的公司投入较少的领域。
19:26
所以我们看到像Suno做音乐,
19:28
和11 labs做语音的玩家,
19:31
完全脱颖而出,
19:33
进入榜单前二十、十五名,
19:37
并且长时间保持位置。
19:40
同时还有社区和大量企业客户的复合锁定效应。
19:43
视频领域我有最多疑问。
19:45
OpenAI通过Sora在投资,
19:46
当然谷歌也在用Vio,
19:50
但中国模型非常出色,
19:54
因为它们可以训练任何数据。
19:57
Sea Dance 2可能是最佳例证,
19:59
在某些方面远超美国公司目前的水平。
20:01
我认为这将有利于像Korea这样的平台,
20:03
可以在一个地方使用所有模型,
20:08
因为我姐姐Justine写过相关文章。
20:10
视频的发展趋势显示,
20:14
不太可能出现一个统治所有的单一模型。
20:18
因此你需要能够在模型间切换。
20:21
- 这对大多数模型领域都适用,
20:25
聊天模型、创意模型,甚至代码模型,
20:26
它们都有自己的专业方向。
20:29
你知道,人们会讨论opus的易用性
20:32
和codecs的准确率。
20:35
这是权衡取舍,
20:38
你得选择针对不同问题使用不同工具。
20:40
- 绝对如此。
20:43
- Sora对我来说非常有趣,
20:45
因为它既代表了模型的一大进步,
20:47
也是一个关于社交的雄心勃勃的实验。
20:50
在Sora早期的数据里,
20:51
创作人数百分比显著,
20:54
比之前高出10倍。
20:57
你如何评价
20:59
Sora的社交努力与模型努力?
21:00
你怎么看它的未来?
21:03
- Sora非常吸引人。
21:05
这是一个早期非常有趣的实验,
21:08
它教会了我们许多东西,
21:09
不仅是关于创意工具,
21:12
更重要的是关于AI时代的消费者社交可能是什么样。
21:14
从数据来看,它发布时反响巨大,
21:15
曾连续20天登顶美国App Store,
21:19
这很难做到。
21:22
这意味着你每天大约需要
21:24
15万次下载才能排名第一。
21:27
这下载量很高。
21:29
它实际上比Chachi BT更快达到一百万用户。
21:31
这是个巨大发布。
21:33
事实上,我认为很多人低估了
21:34
它依然有大量活跃用户。
21:36
Sensor Tower数据显示日活有三百万,
21:37
这相当不错。
21:38
Sora的新下载量有所下降,
21:40
可能是因为,
21:42
它11月下载峰值达六百万次每月,
21:45
现在大约一百五十万。
21:46
我认为Sora的成功关键是
21:48
它是个非常好的视频模型。
21:52
它创新并引入了“戏份”(cameos)概念,
21:54
即真实人物
21:57
可以授权自己的形象给Sora,
21:59
让自己和别人生成自己的视频。
22:02
很多人早期制作朋友的搞笑视频。
22:03
杰克·保罗因率先投入Sora
22:05
一炮而红。
22:07
你能看到大量疯狂的杰克·保罗视频,
22:11
我们写过报道。
22:14
是的。
22:15
老实说,他做得很好。
22:17
是的,是的。
22:19
我认为Sora的问题是
22:21
内容可以导出,
22:24
用户会分享到TikTok,
22:25
或Instagram Reels,
22:27
或YouTube,
22:29
在那里它要和人类最佳内容竞争。
22:30
所以整体内容流体验更优,
22:31
因为你看到的是人类和Sora的双重最佳,
22:34
而非仅仅是Sora的最佳。
22:35
我认为我们还没见过纯AI内容的社交产品成功。
22:36
情感投入在某些方面降低了。
22:37
我想我们会看到类似的例子,
22:38
Sora仍有显著使用量,
22:42
作为创意工具带来收入,
22:45
但作为社交应用没那么成功。
22:47
对。
22:49
我不知道是否会有大型AI原生社交网络,
22:50
但目前还看不到它的模样。
22:54
会很有趣。
22:57
我们经常讨论,
22:59
每个社交产品都有自己的身份玩法。
23:00
是的。
23:05
Instagram上的是最火的,
23:07
在X上是最有趣的,
23:11
而在Sora上,涌现的身份玩法是成为最有趣的人。
23:14
是的。
23:18
我觉得这也是内容难以跨界的原因之一,
23:20
因为两者评判“有趣”和“优秀”的标准完全不同。
23:21
同意。
23:23
如果让我想象他们可能找到的细分领域,
23:24
他们现在与迪士尼等大媒体公司达成了多项协议。
23:28
如果Sora是制作
23:30
授权的粉丝视频的唯一平台,
23:31
呈现受欢迎的角色和娱乐人物,
23:32
那将非常有趣。
23:35
完全正确。
23:35
但这还很早,
23:38
我们还在观察它的发展。
23:39
还很早。
23:41
我知道。
23:42
我们可以这么说。
23:43
是的。
23:44
我们谈话时必须提到代理,
23:46
OpenClaw, Manis, Genspar, Moldbook。
23:49
给我们概述一下
23:50
过去60天代理领域发生了什么
23:51
报告告诉了我们什么?
23:53
我说过去,
23:55
甚至过去六个月,
23:57
更准确说是报告中最近两个月,
23:59
是我见过最有趣的时期。
24:02
OpenClaw实际上,正如你将看到的,
24:06
没有上榜,因为它在二月爆发。
24:08
而我们的数据截止到一月。
24:09
但我们提取了二月的数据,
24:10
如果符合条件,
24:12
它会排名我们网络榜单第30名,
24:13
这是一个相当大的首次亮相。
24:14
We can say that.
24:15
Yeah.
24:16
We can't have this conversation without talking about agents,
24:18
open claw, manis, genspar, moldbook.
24:22
Give us an overview of what has happened
24:24
in the last 60 days in the world of agents
24:26
and what does a report tell us?
24:27
I think this is mostly why I say the last,
24:29
you know, even six months,
24:31
but actually even two months of this report
24:33
have been like the most interesting
24:35
that I think we've seen.
24:36
So open claw actually, as you'll see,
24:39
is not on our rankings because it blew up in February.
24:42
Our data ends in January.
24:43
But we did pull the data for February.
24:46
And if it had been eligible,
24:48
it would have been number 30 on our web list,
24:50
which is a pretty big debut.
24:53
我认为关于Open Claw真正有趣的地方
24:55
是它的使用量在技术社区中持续加速增长
24:58
。
24:59
所以现在,我觉得它是第一名,
25:01
GitHub历史上的明星项目。
25:02
它超过了React,也超过了Linux。
25:04
哇,真是非常非常有趣。
25:05
是的。
25:06
非常令人印象深刻。
25:08
但就整体新用户而言,
25:11
增长有点停滞。
25:12
我们查看了一下“开始使用”
25:15
或注册页面的访问情况。
25:16
从二月初开始,这个数据几乎周周持平,
25:20
我认为这表明,
25:21
它是一个了不起的技术产品,
25:24
但还没有完全扩散到非技术人群,
25:27
也就是更广泛的人群。
25:28
他们被OpenAI收购了。
25:32
所以如果要我猜测,
25:33
或者说我希望看到OpenAI做的是
25:35
将Open Claw产品化,
25:37
变成主流消费者可用的东西。
25:39
我也觉得Open Claw架构背后的理念
25:43
激发了许多其他创业者。
25:46
我们每天会听到多少创业者pitch,
25:49
他们都说,
25:51
“我想成为这个领域的Open Claw。”
25:53
完全正确。Open Claw让我意识到这是可能的。
25:54
是的。
25:55
所以我认为Open Claw本身
25:58
会继续成功,成为巨大产品。
25:59
我猜我们会看到更多
26:01
针对不同用例的Open Claw垂直版本。
26:03
是的,这太有趣了,
26:05
因为Open Claw之所以这么有效,
26:07
是因为它可以跨所有模型,
26:09
向各个方向运作。
26:10
我有点好奇,如果它只提供单一模型,
26:11
是否会削弱Open Claw的价值,
26:13
这样它就成了Labs的对立面。
26:16
完全正确。
26:19
他们目前依然保持多模型,
26:21
至少我使用时是这样。
26:24
后续趋势如何我们拭目以待。
26:25
我认为保持多模型使用是明智的。
26:27
是的。
26:28
Manus是面向消费者级的Open Claw,
26:29
还是你如何区分这个团队?
26:31
是的,有人会这么说。
26:33
我实际上认为,
26:35
Manus进入了我们的网络榜单,
26:36
并且在榜单期间被Meta以超过20亿美元收购。
26:38
增长非常惊人。
26:39
他们从零达到1亿、2亿ARR,
26:42
用了大约六到九个月左右,
26:46
这在业内属于顶尖水平。
26:48
我认为Manus成功的原因是,
26:49
它是首个能够相当自主操作,
26:52
跨产品和平台的消费级智能代理。
26:55
你可以连接邮箱,它能浏览网页。
26:59
它能做幻灯片,也能做表格。
27:02
我早期花了很多时间试用,
27:04
比如一年前的ChatGPT操作助手
27:07
或谷歌的Project Mariner。
27:10
它们没有一个可靠。
27:13
Manus在代理的可靠性和易用性上是突破性的。
27:17
我觉得它被收购非常有意义,
27:19
显示了未来的发展方向。
27:23
当人人具备这代理能力时,
27:25
你可能会想,如果它基于核心底层模型,
27:27
作为一个通用产品,
27:30
它其实更适合由Meta或谷歌这类大公司分发,
27:33
而非独立创业公司。
27:35
如果你做的是垂直领域产品,情况就不同了,
27:39
但谷歌如今有资源做出Manus这样的产品,
27:43
创业公司很难竞争。
27:45
大公司确实有很多优先事项,
27:48
不会做到每个领域都一流,
27:52
但这也是我对超广泛的消费者AI应用更为谨慎的原因,
27:55
因为大公司覆盖面广,
27:59
他们本身就有IT批准和企业合同的优势。
28:00
- 对,对,有趣的是我们跨过了
28:02
这样一个文化门槛,
28:06
Manus在产品广度上曾被视为不太明显的赌注。
28:10
现在看起来,他们像是生活在未来。
28:12
- 是的,完全正确。
28:13
他们显然是一个了不起的工程团队,
28:16
产品质量领先市场三到六个月,
28:18
这很难做到,尤其面对成千上万的自由研发者竞争。
28:19
- 完全同意。
28:22
让我们通过这个话题引入
28:26
关于其他水平AI产品的讨论,
28:28
以及那些超越网页界面的应用。
28:30
- 是的。
28:32
- 你意思是?
28:34
- 是的,这是个巨大主题。
28:37
我每天接触的AI产品中,
28:39
很多其实是桌面应用,
28:43
比如Granola、语音转写工具、Cloud Co-work之类。
28:45
这对我们报告来说是个方法论问题,
28:47
因为我们能很好地追踪网站访问,
28:48
也能很好追踪首次下载桌面应用,
28:49
和移动端使用情况,
28:52
但不能太精准地追踪桌面端使用量。
28:55
我认为随着AI产品愈发复杂,
28:57
在专门应用里运行,
28:59
许多会基于桌面,
29:00
因为能与文件交互,也更随时可用。
29:01
这趋势会越来越显著。
29:03
所以后续我们得想办法并行追踪,
29:06
依靠网页、移动端使用量,
29:09
以及收入排名,
29:10
这将是明智的做法。
29:10
因为像Cursor这类,
29:12
一些收入最高的消费级准专业AI应用,
29:15
网页端使用很少,
29:17
大部分都在专用应用内。
29:19
- 是的,非常有趣。
29:22
这也说明OpenAI发布Atlas,
29:25
Anthropic发布Co-work,
29:29
反映了他们的优先级所在。
29:31
- 是的,完全同意。
29:33
AI浏览器本身就是一个有趣的话题。
29:34
我觉得我们仍处于早中期阶段,
29:37
还不知道它会如何发展。
29:40
AI原生浏览器的理念正确,
29:43
如果AI能一直在线,随时可用,
29:45
在你花大量时间浏览的地方,
29:48
这是个好机会。
29:50
Perplexity Comment实际上率先做到了这点。
29:51
- 是个很棒的产品。
29:53
- 是的。
29:56
有趣的是,
29:59
Comment和Atlas下载页面访问量高峰比较,
30:02
Comment是Atlas的五倍,
30:05
这很惊人,因为ChatGPT用户量庞大。
30:07
- 是的,我也觉得如此。
30:09
- 我们看到Comment和Atlas都有忠实用户,
30:12
但对于普通用户来说,
30:13
更换浏览器的成本不低,
30:16
因为你已有固定工作流程,
30:19
自然会打开那个浏览器。
30:20
所以不仅要功能相当,
30:22
AI浏览器必须有一两项杀手级功能,
30:26
且容易被普通人设置和使用。
30:27
我觉得这还没完全实现。
30:28
- 真的很有趣,
30:30
六个月前Sam在一个播客中说,
30:35
有人问他,
30:38
最让你惊讶的是什么?
30:40
他说,是世界变化没想象中大。
30:43
如果看人们大规模使用ChatGPT的趋势,
30:47
仍主要用于作业和类似Google的查询,
30:51
以及一些陪伴功能,
30:54
从某种意义上说,像浏览器那样,
30:56
可以引导用户走不同路径。
30:59
你怎么看普通人今天如何使用AI?
31:00
- 我有几点想法。
31:00
首先,我觉得青少女
31:03
是观察消费端动态的最佳来源。
31:06
- 你没教我这一点,是的。
31:09
- 他们是最大消费成果的早期拥护者,
31:11
不久前Pew研究有个报告,
31:15
专门研究青少年如何使用AI。
31:16
- And I think what we've seen is like
31:18
comment and Atlas still have very dedicated,
31:22
excited user bases,
31:24
but for the average consumer,
31:26
the switching cost of a browser is non-trivial,
31:29
just because like you have workflows set up,
31:32
you naturally just open this one app.
31:35
And so it not only has to be like feature parity,
31:37
there has to be one or two features of the AI browser
31:40
that are really killer and that are easy enough
31:43
for the average person to set up and access.
31:45
And I don't think that we've seen that quite yet.
31:48
- You know, it's really interesting
31:49
because Sam said, I think six months ago in a pod,
31:51
you know, somebody was asking him,
31:53
what has surprised you the most?
31:54
And he said, it's that the world hasn't changed more.
31:57
And if you look at the trends around
31:58
how people are using Chachi BT at scale,
32:00
it's still, you know, homework and Google like queries
32:03
and a little bit of companionship,
32:05
in a sense, something like a browser
32:07
that gives you an opportunity
32:08
to point the user in a different direction.
32:10
What's your view on how the average person
32:12
is using AI today?
32:13
- Yeah, I think a couple of things.
32:17
So one, I feel like teenage girls
32:19
are like the best source of what is happening in consumer--
32:22
- You haven't taught me this, yes.
32:23
- What will be happening in consumer?
32:24
If you look at all of the biggest consumer outcomes,
32:26
like they were the early adopters of all of these products.
32:30
And so there was actually a Pew Research Study
32:32
fairly recently on how teenagers are using AI.
32:35
现在终于,我觉得这是第一次,
32:38
超过一半的人承认
32:40
使用它来做作业。
32:41
所以真实数字可能是99.99%,
32:44
但其中一些人不想惹父母生气。
32:46
- 嗯哼。
32:48
- 38%现在将它用作创作工具。
32:51
比如编辑图片、编辑视频,
32:53
生成图片和视频。
32:55
然后这有一个稍微增长的长尾趋势,
32:58
但我认为最终会成为最大行为之一。
33:02
16%用它进行轻松聊天,
33:05
不是强烈的陪伴产品,
33:08
而是找个人聊聊天。
33:10
然后12%用它做情感支持
33:13
和提供建议。
33:14
我认为所有这些用例最终都会趋近于
33:17
大约100%。
33:21
这些行为可能是目前
33:23
产品服务较少,但未来会被满足的,
33:26
无论是在聊天机器人上,还是
33:27
独立产品上。
33:30
另一个我关注的大事是
33:34
代理。
33:35
我觉得基本上-- - 我们的少女会用代理。
33:39
来吧。 - 情况是这样的。
33:40
我认为代理类似于1990年,
33:44
互联网公司被称为点com公司,
33:47
或者点com成了科技公司的标识。
33:49
- 对。
33:51
- 我觉得代理也会是这样。
33:53
最终每个科技公司
33:55
都会是点com公司。
33:56
我觉得每个AI公司
33:58
以及每个科技公司都会成为代理公司,
34:02
因为模型的发展趋势就是如此。
34:05
如果你能给用户
34:07
提供结果,
34:10
而不仅仅是输入,这作为软件产品更有吸引力。
34:12
所以是的,我认为13岁女孩会用代理,
34:15
但她们不会把它们当作代理。
34:18
但我觉得这会解锁AI在其他消费领域的许多用例,
34:21
比如财务、
34:24
医疗、旅行规划、复杂的趋势购物,
34:29
在有代理之前,数据太多,
34:32
你必须自己去搜集、可靠执行,
34:35
跨系统操作几乎不可能。
34:38
现在这变得可能了。
34:39
所以我认为接下来几个月
34:40
这些其他用例会爆发式增长。
34:43
- 你觉得这要多久才能完成?
34:45
我是说,12个月内大家都会用自己的OpenAI?
34:47
还是五年后?
34:48
这是什么错误的思维模型?
34:49
当我们六个月后在下一个Top 100大会讨论时,
34:50
世界会是什么样子?
34:52
- 我感觉每次我预测的事情
34:55
都比预期发生得快,
34:57
我认为我们每天都能看到这一点,
34:59
创业公司成长速度前所未有。
35:03
但文化变革
35:04
和文化接受速度会比技术变革慢。
35:08
因此我们会持续看到
35:11
这波早期浪潮,通常是技术人员,
35:13
有时非技术人员做先锋,
35:17
六个月后其他人跟进。
35:19
一个我非常兴奋的例子是
35:23
语音,我们谈了很多。
35:26
- 确实谈了很多。
35:28
- 在我看来,这是信息量最大、
35:30
质量最高的媒体形式之一。
35:34
你每日所做的很多事情,
35:36
实际上是基于你说的话上下游运作。
35:38
我觉得过去六个月,第一次见到工程师,
35:41
现在其他技术人员开始用语音输入。
35:46
现在很多公司会议
35:48
几乎成了录音并用AI转录的常态。
35:51
不管是语音输入,
35:55
还是会回答问题或帮你办事的语音助手,
35:58
我觉得接下来六到九个月
36:01
会普及到普通消费者。
36:03
- 真是非常有趣。
36:05
讲到最后,你能聊聊记忆吗?
36:07
- 好的。
36:10
- 你怎么看记忆的发展?
36:12
- 我们之前提过,现在
36:14
记忆功能有点突兀,
36:15
特别是Claude和ChatGPT这方面做得很好。
36:19
就连谷歌的Gemini也推出了“个人智能”,
36:20
它能从文档、邮箱等获取你的信息,
36:24
用AI服务你所有应用。
36:24
正如我说的,目前可能稍微让人不适应,
36:25
因为很多人跟AI谈论生活工作各方面,
36:29
有时AI可能会无意中
36:31
触及它知道你的信息,
36:35
试图更好帮助你,但在错误场景下。
36:36
所以这方面还有很多基础设施工作要做,
36:38
就是如何在各种场景里区分“你是谁”。
36:42
一旦解决,
36:45
我认为记忆会成为
36:48
AI产品的核心优势之一。
36:50
无论是它们自身的记忆,或ChatGPT借用记忆,
36:54
两年后你开始用的产品,
36:55
如果不感觉它了解你,
36:58
那你会觉得它有缺陷。
37:00
产品的上手体验,
37:03
几年后应该是不再存在的概念。
37:05
我认为记忆功能能实现这一点。
37:07
我个人的体会是,我每天都和多款AI交流,
37:11
它们的互动方式和价值,
37:13
在使用两三个月后提升了很多,
37:17
比刚开始用时好太多。
37:19
- 太不可思议了。
37:24
好吧,我不知道未来如何,
37:27
但它会奇妙又奇怪。
37:30
我很期待。
37:31
- Bolivia,非常感谢你。
37:34
今天能聊聊,
37:38
还有这份报告,真的很开心。
37:39
有什么最后想说的吗?
37:40
- 没有,我只是很期待大家读这报告。
37:44
里面有很多有趣的数据,
37:46
六个月后肯定会完全不同。
37:48
到时候我们再见。
37:50
- 非常激动人心。
37:53
告诉我们你的想法,
37:55
谢谢收看。
37:56
- 谢谢。
37:57
(欢快音乐)
37:58
I'm excited for it, yes.
38:00
- Bolivia, thank you so much.
38:01
It was super fun to actually have this conversation today
38:04
and go through the report.
38:05
Any closing comments?
38:06
- No, I'm just excited for people to read it.
38:08
There's a lot of interesting data in there next time
38:10
and I'm sure it will look wildly different six months from now.
38:13
So we'll be back then.
38:14
- Really exciting.
38:15
Well, tell us what you think
38:16
and thanks for checking us out.
38:17
- Thank you.
38:23
(upbeat music)
·
·
Andrej Karpathy 谈基于不可信工作者池的自动搜索:
“我那些将不可信工作者池(融入自动搜索)的设计,实际上有点像区块链。
只不过这里没有区块,而是提交(commits),这些提交可以相互构建,并包含你在改进代码时所做的更改。
所谓的工作量证明,本质上就是通过大量实验来找出有效的提交。”
分布式且无许可的自动搜索 ~= 有用工作量证明这一理念,目前仍停留在高层次的直觉层面,但至少可以说它极具吸引力。
有人需要进一步深入研究。关于尚缺的内容,请参阅 QT。 #ai #加密货币 #区块链
https://x.com/_weidai/status/2035236632161656969?s=20
0:00
我认为一个问题是,如果你有一堆节点
0:03
可以进行并行处理,那么你很容易让多个自动研究者
0:06
通过一个公共系统交流什么的。当时我更感兴趣的是
0:09
如何在互联网中有一群不可信的工作者。
0:11
举个例子,在自动研究中,你只是想
0:14
找到那段能训练模型达到非常低验证损失的代码。
0:18
如果有人给你一个候选提交,你很容易验证该提交是否正确。
0:22
很好。比如,有人可能声称他们那段代码优化得更好,
0:26
能给你更好的性能。你可以很容易地检验,
0:29
但可能需要大量工作去检查。不过基本上,
0:32
他们依然可能会撒谎等等。
0:34
所以你基本上面对的是类似的问题,
0:37
其实我设计的含不可信工作者池的系统,
0:40
看起来有点像区块链,因为你不是用区块,
0:43
而是用提交,提交可以相互建立,
0:45
包含你不断改进代码的变更。
0:47
工作量证明基本是做大量试验以找到有效提交。
0:51
那很难。而奖励就是登上排行榜,现在
0:55
没有任何金钱奖励。
0:57
不过我不想把这个比喻推得太远,
1:01
但它本质上有这个问题:
1:03
搜索需要大量计算,但验证候选方案是否优秀很便宜,
1:07
因为你只需训练一次。
1:10
有人可能试了10000次,但你只需要
1:13
验证他们产出的方案有效,
1:16
因为那其他的9990次都失败了。
1:19
总之,长话短说,
1:22
你得设计一个系统,让不可信池的工作者可以
1:25
与可信池工作者协作进行验证。
1:26
整个过程是异步的,可以工作,
1:31
从安全角度来说也安全,
1:33
因为如果有人发任意代码给你执行,那很危险。
1:37
但从根本上说,这是完全可能的。
加载中...
转发此帖子?
与您的关注者分享。
回复