热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Dwarkesh Patel
这真的很有趣。目标是尝试预测来自之前买卖订单簿的价格,提前一分钟。
当然,我非常简单的线性模型显然无法成功预测真实市场中中间价格的轨迹。
但这个练习帮助我对开始理解数TB市场数据所需的特征工程有了一些直觉。

Hudson River Trading14 小时前
我们邀请了 @dwarkesh_sp 来探讨量化交易中的一个基础问题:从市场数据中构建预测信号需要什么?
我们很高兴向他展示在 HRT 工作的乐趣所在——以及为什么在 Marc 的话中,“这让很多非常聪明的人花费了多年的时间。”
191.86K
《重要问题》第5章:
为什么细菌相对简单,而真核生物却产生了我们周围所有奇妙的复杂性?
真核生物的体积和基因组大小通常大约是细菌的1000倍。当然,它们还产生了内部分隔、多细胞性、性别等许多其他特征。
这里有一个微妙的错误理论:这一切都与表面积与体积比有关。真核生物在线粒体中产生能量(线粒体的数量与细胞体积成比例)。原核生物在细胞膜表面产生能量(因为它们没有像线粒体那样的内部细胞器来产生和储存驱动生命的质子梯度)。表面积(即细菌的能量生产)与半径的平方成比例,而体积(即能量消耗)与半径的立方成比例。因此,细菌无法变得那么大,因此也无法产生大量的复杂性。
但我们知道,膜可以以各种奇怪的方式折叠,以增加表面积/体积比。我们也知道细菌可以在内部创建液泡(它们可以在其中储存质子梯度)。为什么细菌没有利用这些技巧来攀登复杂性的阶梯?
尼克·莱恩解释说,真核生物的关键优势在于线粒体基因组与细菌基因组是不同的(当然是由于吞噬了线粒体的细菌祖先的内共生事件)。
出于某种我不完全理解的原因,电子传递链中驱动呼吸的氧化还原反应需要超局部控制。你需要相关基因在现场。线粒体已经有自己的内部基因组和核糖体来调节它们的工作。
如果一个细菌细胞变得更大,它需要在膜附近存储相关基因的副本。但细菌没有办法对基因组进行特定的逐块切割。因此,它们需要在整个膜上复制整个基因组很多很多次。同时还需要存储许多副本的核糖体和其他基础设施。这显然是不切实际的。
尼克还解释说,随着时间的推移,大多数原始线粒体基因漂移到了细胞核,因为在细胞核中保留单一副本更有效。只有那些在局部绝对必要的基因才保留在线粒体中。这种漂移的确切机制,以及它如何导致核膜和单独线性染色体的进化,最好留给书中去探讨。
向尼克·莱恩提问:
- 为什么线粒体是唯一需要在现场拥有自己基因组的细胞器?其他细胞器是否也会受益于局部控制,但没有这种独特的内共生历史,因而不太可能拥有自己的基因组?还是说克雷布斯循环如此复杂和脆弱,以至于你需要在现场对扰动做出反应?
- 为什么没有更多的内共生事件?


Dwarkesh Patel2025年9月26日
尼克·莱恩关于第一批细胞如何进化的理论:
他在这里的主要论点是,生命与地球的地球化学是连续的。
也就是说,细胞的许多主要特征——膜、酶、通过质子梯度获取能量——源自地球上的自发过程。
但是,你不能让这些特征在不同的地方零散进化。你需要一个地方来容纳所有这些过程,这样才能产生第一个细胞。
顺便提一下,重要的背景是,所有生命都源自一个共同的祖先——LUCA(最后的共同祖先)。
那么,什么样的候选环境可以产生LUCA呢?它需要两个主要特征:
- 有一个连续的碳和能量流动(在某种意义上,所有生命都是碳和能量的流动,但你需要一些地球化学来维持这种不平衡,才能让第一个细胞利用它)。
- 一些能够浓缩和催化导致有机物反应的东西(也就是细胞和酶的无机等价物)。
这排除了许多旧理论:一个温暖的池塘,里面有氨和盐,以及偶尔的闪电并不能驱动连续的流动,也不能在细胞状体积中浓缩早期有机物以推动反应。
尼克认为碱性海底热泉是这个挑战的独特适配,同时也帮助解释了所有生命最终使用的许多偶然生物化学,因为我们有共同的遗传。
好吧,让我们深入探讨:为了提供背景,基本上尼克在这里试图解释你如何自发地得到逆克雷布斯循环的早期版本。逆克雷布斯循环吸收H2和CO2,生成有机分子,这些分子是脂肪酸、蛋白质和糖的前体。
另一个重要的背景:所有生命都依赖质子梯度。用氧气(或厌氧呼吸中的其他氧化剂)燃烧食物会将H+离子泵过膜,就像填充水坝。这些离子通过ATP合成酶——一个分子涡轮——流回,利用流动将磷酸附加到ADP上,生成ATP。你的身体只含有60克ATP,但ATP→ADP→ATP循环是如此迅速,以至于你每天处理的ATP量相当于你的体重。
附带说明:如果溶液是酸性的,意味着其中有很多H+离子。如果它是碱性的(也就是碱性),则意味着其中有很多OH-离子。
那么在这些碱性热泉中发生了什么?这个图景有三个方面:热泉内部、热泉壁和热泉的海洋侧。
在热泉内部,你有富含铁的岩石基本上在生锈,这释放出H2和OH-进入流经的水流(也就是使水变得碱性/碱性)。
热泉壁由催化矿物如FeS构成,并且有很多微小的孔将内部与外部连接起来。
而海洋侧则有大量溶解的CO2——早期地球基本上是一个巨大的海洋,但也有很多火山释放出大量CO2。海洋也相当酸性,因为CO2在水中溶解时会变成碳酸。
在这些热泉内部的微小孔中,H2与CO2反应形成简单的有机物,如甲醛(CH2O)和甲醇(CH3OH),这一反应是由热泉壁中的FeS催化的。
基础化学:可以随意跳过这一段——我只是想包括它,因为我花了一些精力重新学习涉及的高中化学。而且理解这一点是相当令人满意的。为什么你需要内部的H2侧是碱性的?为什么你需要外部的CO2侧是酸性的?我的理解是,在碱性溶液中,H2 -> H+是有利的,因为OH-(定义上使溶液碱性)确实想与H+反应生成H2O。但现在你有一些中间的H+存在,可以参与其他反应。在海洋侧,水越酸,边际上添加的CO2转化为碳酸的可能性就越小(因为周围已经有很多了),而是可用于反应。
现在你在这些微小孔中积累了早期有机物,你可以启动这个正反馈循环,这些早期有机物作为前体或酶来制造越来越多生命所需的分子。你构建氨基酸(成为其他反应的酶),脂肪酸(自发形成膜,因为它们有疏水性头部和亲水性尾部),糖,肽,最终是DNA和RNA。克劳德说明:
这个早期原始细胞不需要自己生成质子梯度,而是可以利用地球化学的不平衡,这是一个巨大的好处:
“甲烷菌几乎将98%的能量预算用于通过甲烷生成来产生质子梯度,而仅有2%用于生产新的有机物。借助自然的质子梯度和漏膜,不需要那种过多的能量消耗。可用的能量是完全相同的,但开销至少减少了40倍,这是一个非常可观的优势。”
除了在这些热泉中自发存在的H+梯度外,一些原始细胞还开始排出Na+离子。由于没有自然梯度,这为开发非多孔膜(以及膜上的蛋白质泵出质子)创造了动力。一旦你开发出这样的膜,你就可以离开这个壁腔,像真正的细胞一样漂浮。
这是否意味着遗传仅在这一点上开始?因为在此之前,我想你在孔中有选择,但你没有办法传递特征。这些有机物和代谢的积累是在所有孔中独立发生的。
然而,到这一点时你已经有了DNA和RNA。那么这些遗传信息在遗传之前做了什么?我想只是组织信息以促进更多有机物的积累?
这是否意味着有数百万个原始细胞之间没有共享的血统,每个细胞都发展出自己独特的所有基本生物化学?LUCA恰好是一个拥有DNA、RNA和ATP合成酶的细胞,但这三者都可能是基于哪个原始细胞首先逃出角落而大相径庭?
然而,这三种构建块在所有生命中被认为是独特的精心设计?或者这是否意味着进化无法有效改善其基础。就像反向传播可以找到最佳网络来映射一个函数,但不能同时重新布线你正在训练的GPU。无论如何,一旦你有了这个原始细胞,它就可以“感染”整个海底的相邻热泉系统。
这个理论解释的偶然生物化学:
- 为什么所有生命都依赖质子梯度
- 为什么所有碳固定途径,无论是在细菌、古菌还是真核生物中,都使用乙酰辅酶A作为切入点。它在这些热泉中在FeS的催化下自发形成。基本上所有生命仍然使用这种分子来储存能量和构建其他分子。
- 为什么许多参与能量代谢(特别是克雷布斯循环)的酶仍然使用FeS矿物作为其骨架
- 为什么古菌和细菌(真核生物的两个不同王国)分开——显然这与它们如何产生质子梯度有关,但老实说,相关的生物化学我没能理解。尽管这种分叉被认为可以解释为什么所有生命共享DNA、RNA和ATP合成酶,但没有其他东西:既没有细胞膜,也没有DNA复制酶,也没有排泄泵。显然,所有这些东西都与古菌和细菌在这个分叉事件中做出的不同选择有关。
对尼克的问题:
- 我想这个理论与泛种论不兼容,对吧?
- 这个碱性热泉理论是否暗示生命在宇宙中可能非常稀有或非常丰富?在某种意义上,它暗示它应该是稀有的。这只是一个非常特定类型的热泉,具有合适的pH梯度、孔径和耐久性。但在另一个意义上,它只是一个随机的热泉。理论上,宇宙中可能有成千上万类似的地质结构,也可以驱动碳和能量在微小膜之间的流动。
- ATP合成酶不是超级复杂吗?为什么第一个原始细胞有ATP合成酶,但几乎没有其他同样复杂的东西?
- 在没有遗传的进化之前,所有这些复杂性是如何积累的?所有这些孔只是独立地建立自己独特的有机物微观世界?我想这些早期构建块可能在没有完全形成膜的情况下从一个孔漂浮到另一个孔?DNA加酶从一个孔漂浮到另一个孔,并启动更多反应?尼克·莱恩认为这可能吗?如果不是,这是否暗示一旦LUCA能够突破,就有许多其他同样可行的构建块替代方案?
感谢我的书友们提供非常有用和有趣的讨论:@vinayramasesh, @shae_mcl, @coen_armstrong, @Oskarlso, @_sholtodouglas




169.05K
为什么 @RichardSSutton 认为 LLMs 违背了痛苦的教训:

Dwarkesh Patel2025年9月27日
.@RichardSSutton,强化学习的父亲,并不认为LLM是苦涩教训的产物。
我对Richard观点的钢铁人设:我们需要一些新的架构来实现持续(在职)学习。
如果我们有持续学习,我们就不需要一个特殊的训练阶段——代理可以随时学习——就像所有人类,实际上,也像所有动物一样。
这一新范式将使我们当前的LLM方法变得过时。
我尽力表达了LLM将作为这种体验学习发生的基础的观点。一些火花飞溅。
0:00:00 – LLM是死胡同吗?
0:13:51 – 人类进行模仿学习吗?
0:23:57 – 经验时代
0:34:25 – 当前架构在分布外的泛化能力差
0:42:17 – AI领域的惊喜
0:47:28 – 苦涩教训在AGI之后仍然适用吗?
0:54:35 – AI的继承
62.33K
热门
排行
收藏