Archives 9 月 2024

观点:摧毁「四年周期」论,加密货币才能真正跨越鸿沟

原文作者:Matti

原文编译:Luffy,Foresight News

不久前,我发表了自己对 cryptotwitter (CT) 的一些思考。出乎我意料的是,这些观点在社区引发了激烈的讨论。我不确定我的观点是否超出了批评者的理解范围,或者我触动了 CT 的既得利益。

观点:摧毁「四年周期」论,加密货币才能真正跨越鸿沟

CT 很容易骗人

这并不是说人们在 CT 上不会偶然发现有用的投资建议。CT 是一种新颖的信息狂欢形式,是一部永无止境的肥皂剧,情节和反派都非常荒谬。它是一个娱乐阵地。 

这段经历让我开始思考加密货币的现状。在某个时刻,我突然意识到:加密货币已然是主流。它可能不是主流采用,但它是主流娱乐。你周围有多少人没有听说过加密货币?今天加密货币已经是美国总统大选的一个热门话题,它怎么可能不是主流呢?

人们喜欢当「早鸟」,他们自欺欺人地认为早点行动就能够赚钱。参与是成功的前提条件,而 CT 是一个延续这种观点的虚假先知。这个是 Alpha,那个是 Alpha…… CT 是一个以销售代币作为娱乐的真人秀。

CT 对行业来说既不是坏事也不是好事,它只是加密货币主流化的一种表现。从卑微的无政府资本主义到巅峰时期的理想主义文化,如今的加密货币正在经历抖音化,并以中本聪无法想象的方式包装呈现给消费者。

观点:摧毁「四年周期」论,加密货币才能真正跨越鸿沟

这就是我们融入主流的方式

CT 的代表人物曾写道(大致如下):「泡沫迹象与主流采用之间难以区分。」主流的问题在于你失去了早期机会。

加密货币已经采用了自己的天定命运文化。无论您是比特币、ETH 还是 SOL 最大主义者,您都会相信四年周期的传说。几乎所有人都相信加密货币注定会成长,每四年就会有一次大牛市突然出现,带领我们走向富饶之地。

但随着行业规模不断扩大,模仿和借用变得比创新更有价值。加密行业现在借助四年周期的口号,延续着「早起就是优势」的理念。这种情况可能会改变,参与可能还不够。自满的后果最终会到来。

观点:摧毁「四年周期」论,加密货币才能真正跨越鸿沟

需求是发明之母,但不幸的是,有大量的资本专注于短期游戏(价格上涨),也有大量精明的创始人知道如何玩风险投资的选美大赛。过去两年,既没有需求,也没有真正触发创新的因素。

这就是为什么目前加密货币只将宏观干预视为救命稻草,无论是降息还是新总统政府。这表明我们期望从自上而下的资本流入(例如 ETF),而不是自下而上的创新中获益。问题是这场游戏是否迟早会破裂。

当前,风险投资公司难以筹集到新资金,风险投资行业因投回报减少而受到严格审查。加密货币也是如此,但有一个前提,即现有的加密货币 LP 在 2021 年左右已经获得了回报。这一次不会发生这种情况,因为吹捧账面收益的基金很快就遭遇了残酷打击。

救星是什么?把金融畸形当作唯一出路,并希望更大的傻瓜来拯救我们,这表明我们已经堕落到何种程度。问题是大多数人甚至毫不掩饰这一点。我从来没有见过:站在牛市的边缘,每个人都迫不及待地想要卖出。

加密货币「四年周期」的概念需要被彻底摧毁,只有这样加密货币才能真正跨越鸿沟,成为一种全新的事物。只要「四年周期」的概念存在,默认的激励机制就是 :

  • 优先考虑短期行为(无论是建设者还是投资者) 

  • 延续「更大傻瓜理论」,因为人们总是相信当前的周期最终会崩溃。

随着唾手可得的创意被采纳,加密货币正在变成一场零和游戏。创始人和「社区」庆祝没有任何产品的大规模融资,并以此作为胜利。虽然 X 和 Y 得到了来自各方的资助,但他们掩盖了一个事实,他们没有像上一个周期(DeFi)那样的真正的技术创新。

除了傻瓜式地希望有人接盘,我们还相信什么呢?我们相信 CT 吗?它不过是一个情绪放大器?我们相信 alpha,还是相信自欺欺人的叙事?

瞧,这就是我们唯一剩下的……叙事。我们强行灌输自己不相信的故事,只希望别人会相信。但是没有叙事,就不可能有牛市和采用!是的,但只有当你不把它们当作叙事时,叙事效果才最好。

真正的叙事不是在推特上制造出来的。它们是由创新锻造出来的,创新激发了人们的热情,然后又变成了自以为是的狂妄自大。这就是狂热,狂热必须有其基础。我们没有这种基础,我们只想传播——利用 Meme,通过推特将空洞的叙事变成现实。

我自己也犯过这样的错误。通过大声呼喊「文化!」来掩盖产品缺陷算不得是一种好方法。我们一直在培育的唯一文化是利用空洞的叙事和暴力的社区文化,而这些文化的强大程度只取决于价格表现。但也许,我们终究不应该低估愚蠢的可预测性。以前,愚蠢不是总能让我们免于灭亡吗?或者,也许在某个角落,一项重大创新正在酝酿? 

我没有答案。我怀疑,如果市场没有达到新的高度,我们就会进入一个不可预见的领域,这在短期中期内可能会很痛苦,但对加密货币的创新来说却是好事。

美联储利率决议临近,BTC挑战5.9万美元阻力位

原文来源:Bitpush

周四,美国新的通胀和劳动力数据进一步支持了人们对美联储将于下周开始降息的预期,金融资产价格呈走高趋势。

美国 8 月份生产者价格指数 (PPI) 报告显示,批发价格环比上涨 0.2% ,略高于经济学家的预期,而同比上涨 1.7% ,符合预期。

目前市场普遍预计美联储将于下周降息 25 个基点,不过部分交易员仍对降息 50 个基点抱有希望,芝加哥商品交易所 (CME) 的美联储观察工具 (FedWatch Tool) 给出的降息 50 BP 概率为 28% ,高于昨天的 14% 。

美国三大股指收盘上涨,标普、道琼斯和纳斯达克指数分别上涨 0.75% 、 0.58% 和 1.00% 。现货黄金盘中飙升 1.91% ,创下略低于每盎司 2, 560 美元的历史新高。

比推数据显示,比特币(BTC)在周四早盘交易中飙升至 58, 000 美元以上,在午盘跌至 57, 310 美元的低点后,多头在下午成功将价格推回至 58, 000 美元以上,挑战 59, 000 美元的阻力位。

美联储利率决议临近,BTC挑战5.9万美元阻力位

截至发稿时,比特币交易价格为 58, 217 美元, 24 小时涨幅 1.53% 。

山寨币市场方面,市值排名前 200 的代币普涨。涨幅最大的是 Worldcoin(WLD),涨幅达 14.6% ;其次是 Trust Wallet Token(TWT)涨幅达 14.3% ;Sui(SUI)涨幅达 13.9% 。跌幅最大的是 GMT(GMT),下跌 6.2% ;SuperVerse 下跌 5% ;ConstitutionDAO(PEOPLE)下跌 4.3% 。

目前加密货币整体市值为 2.05 万亿美元,比特币的市场占有率为 56.3% 。

预期波动

市场分析师 Bloodgood 表示,本周公布的 CPI 和 PPI 通胀数据与预测相差不大,美联储似乎即将进入一个相当有序的降息周期,这对风险资产来说应该非常有利。

Bloodgood 指出,从历史角度来看,降息「往往伴随着一些初始的下行波动,但考虑到选举即将到来,这种波动应该会减弱。除非出现一些真正出乎意料的经济发展,否则第四季度的宏观前景从基本面来看仍然看涨。」

关于比特币,Bloodgood 指出,自上周以来,比特币价格曾跌至 50, 000 美元左右,但多头介入「挽救局面」,因为这一次「回调不像 8 月初那么快,这表明空头已经精疲力竭。」

美联储利率决议临近,BTC挑战5.9万美元阻力位

Bloodgood 总结道:「在撰写本文时,BTC 位于突破区域下方,这是近期趋势的关键点,突破这一水平将迅速导致更高水平,而跌破的话将使未来几周内非常有可能测试 5 万美元。从 TA 的角度来看,结构仍然看跌,因此在较低的高点被打破之前,我不会抱有希望。」

TradingView 分析师 TradingShot 表示,降息将导致全球货币供应量增加,这可能是推动比特币下一轮上涨的因素。

TradingShot 表示:「随着美联储准备下周进行自 2022 年 2 月开始加息周期以来的首次降息,观察全球货币供应量以及更多流通货币对比特币意味着什么将是非常令人期待的。」

美联储利率决议临近,BTC挑战5.9万美元阻力位

上图中,浅绿色和红色蜡烛(顶部)表示全球流动性指数 (GLI),由美联储、TGA、RRP、欧洲央行、中国人民银行、日本央行、英国央行和其他中央银行组成,该图标跟踪和衡量的是流动性 / 货币供应 / 全球经济体流通的货币。

TradingShot 表示:「当央行降息时,他们实际上是在印发更多货币,向系统注入大量现金,导致流通中的货币贬值。当这种情况发生时,企业和 / 或个人更容易通过贷款等方式获得更多资金,从而增加他们的支出 / 购买 / 投资能力。原则上,这意味着投资者更容易购买风险较高的资产,从而导致价值上涨。股票和加密货币属于这一类别。」

TradingShot 分析称:「正如这张图表所示,每当 GLI 开始上涨时,比特币(底部的蜡烛)就会上涨,这并不奇怪,更具体地说,当流动性下降并趋于平稳时,就会形成 BTC 的熊市周期,而当它突破阻力位时,BTC 就会开始其牛市周期的反弹阶段。在美联储大幅加息导致我们回到 2008 年房地产危机之前的水平之后,GLI 经历了更强劲的下跌,它不但没有走平,反而形成了以较低的高点为阻力的楔形。GLI 现在正好处于这个较低的高点趋势线上,如果被突破,我们可能会出现类似于之前周期阻力突破的突破,从而引发比特币的抛物线反弹。」

Secure Digital Markets 分析师认为,比特币已从 56, 600 美元的支撑位反弹,这一走势与 4 小时图上观察到的看涨交叉一致, 20 天和 50 天指数移动平均线 (EMA) 相交。此外,同一时间范围内的震荡指标显示出看涨背离,预示着短期内可能出现上行逆转。但虽然技术指标可以洞察趋势,但仅凭这些指标不足以准确预测未来走势,反弹是否会推动比特币突破 60, 000 美元大关并达到六个月交易区间的上限还有待观察。

WSPN 公布 TOKEN2049 边会 “Stable Rise” 日程及嘉宾阵容

稳定币基础设施提供商WSPN(Worldwide Stablecoin Payment Network)今日正式公布了即将于TOKEN2049新加坡大会期间举办的”Stable Rise”边会详细日程和嘉宾阵容。此次高规格会议将汇聚业内领袖,共同探讨稳定币的未来及其对全球金融体系的影响。

WSPN 公布 TOKEN2049 边会 "Stable Rise" 日程及嘉宾阵容

活动信息:

• 日期:2024年9月17日(星期二)

• 时间:14:00至17:30(新加坡时间)

• 地点:Marina Bay Financial Centre (MBFC)

• 报名链接:https://lu.ma/e1m0ur5k

重点议程

WSPN的创始人兼CEO Raymond Yuan 将致开幕词,随后的议程包括:

1. 构建信任与流畅商业体验:引领Web3技术支付未来

2. 数字支付的未来

3. 利用Web3技术提升支付和应用的去信任化和去中心化

4. 引领数字金融未来:创新、流动性和全球增长

5. 革新数字支付:无缝入金体验的创新与战略合作

6. 全球支付的新纪元

7. 引导稳定币并连接现实世界应用场景

重磅嘉宾阵容

本次活动邀请到了来自金融科技、区块链和传统金融领域的顶尖专家,包括:

• Donghao Huang – VP, R&D, Mastercard

• Alex Zhang – Pharos 创始人

• Anson Zeall – DTC 首席战略官

• Chen Yu – KUN 首席顾问

• Forest Bai – Foresight Ventures 联合创始人

• Austin Campbell – WSPN 首席战略官

• Jacob Tao – Lutosia 管理合伙人

• David Song – Green Link Digital Bank Web3部门总监

• CY – Polygon Labs 东南亚业务发展总监

• Haisheng Zhang – Ample 首席产品官

• Victor Yaw – CodeX 联合创始人

• Jerry Zhou – Amber 全球市场总监

• Leslie Chen – BitMart 首席增长官

• Louisa Bai – Mysten Labs, SUI 稳定币负责人

• Anna Yuan – Perana联合创始人

“Stable Rise” 边会将为与会者提供宝贵的机会,深入了解稳定币的现状和未来前景。参与者将有机会与行业领袖建立联系,参与富有启发性的讨论,并为塑造数字金融的未来贡献力量。

欲了解更多信息并注册参加 “Stable Rise” 边会,请访问:

关于WSPN

WSPN(Worldwide Stablecoin Payment Network)致力于为全球经济打造更安全、高效、透明的支付解决方案,是下一代稳定币基础设施的领先供应商。其旗舰产品 WUSD 稳定币与美元 1:1 挂钩,旨在为 Web3 用户优化安全合规的数字支付。WSPN 的“稳定币 2.0”(旨在提升稳定币功能和体验的下一代技术方案)优先考虑以用户为中心、社区治理和可访问性,为稳定币的广泛采用铺平道路。

了解更多信息,请访问:   |  |  

「捡漏」的背后是一个已停止运营的 NFT 碎片化协议

撰文:Yangz,Techub News

今日凌晨,作为 24 个 Ape Punk 之一的 CryptoPunk #2386 以 10 ETH 的价格被 0x282 开头的地址购入。一时间,NFT 圈内尽是「羡慕」与「质疑」。

的确,即使是在如今尽显颓势的 NFT 市场,CryptoPunk 的地板价依旧在 30 ETH 左右,而以三分之一的价格购入极其稀有的 #2386,着实让人震惊。要知道,这枚 Punk 在 2022 年 7 月曾收到过 1800 ETH 的巨额报价。而在今日之事发生后,已有投资者甩出了 600 ETH 的报价。

「捡漏」的背后是一个已停止运营的 NFT 碎片化协议

那么,此人是如何「捡漏的」?对此,0xQuit 给出了详细的解释。

根据 0xQuit 的分析,今日之事的关键在于两点,首先是 0x282 自身极强的「侦查能力」,其次是其他投资者的「计算错误」。第一点很好理解,至于其他投资者的「计算错误」又是怎么一回事?

其实早在 2020 年 9 月 26 日,Punk #2386 就被一个名为 Niftex 的 NFT 碎片化协议分割成了 1 万个 ERC20 代币,在今日被「捡漏」前被 257 个投资者分别持有着。

我们知道,在 NFT 碎片化协议中,要想完整收回某 NFT,投资者一般需要集齐所有「碎片」。而 Niftex 还设置另外一条名为「Shotgun」的路径,允许任何碎片持有者提出收购价格,在无人反对的情况下就能在 14 天后完整购入该 NFT。0x282 此次成功捡漏就是利用了这一点。

但是,按照 10 ETH 的成交价推导,0x282 提出的收购价格仅仅为每碎片 0.001 ETH。这么低的价格,其他 Punk #2386 的碎片持有者就没有提出反对吗?

其实,这个 Niftex 协议早已停止运营(合约依旧有效,而这枚 Punk 的本体也被该合约托管着),所以许多碎片持有者很可能就没有注意到 0x282 于 8 月 28 日提出的「Shotgun」。而即使是注意到了这次「Shotgun」的两位投资者也因不同原因未能阻止这次收购。

「捡漏」的背后是一个已停止运营的 NFT 碎片化协议

@0xQuit 表示,其中一位碎片持有者可能很早就发现了 0x282 提出的收购,但出于「14 天」的时间考虑,就没及时采取行动。而另一位持有者 @gmoneyNFT 虽然在还剩 7 个小时的时候收到了关于收购的私信通知,并及时采取了行动,但却因「计算错误」未能真正阻止这次「Shotgun」的发生。 

「捡漏」的背后是一个已停止运营的 NFT 碎片化协议

根据 Niftex 的设置,为阻止「Shotgun」,碎片持有者必须以高出报价者的价格收购对方手中的「碎片」。0x282 提出的价格是每碎片 0.001 ETH,而 @gmoneyNFT 提交的却是 0.000001 ETH,低于要求。@gmoneyNFT 在回应该事件时表示,其「尝试使用超过(0x282)的金额进行操作,但合约执行过程中出现了错误」。最终,0x282 提交的「Shotgun」顺利通过。 

「捡漏」的背后是一个已停止运营的 NFT 碎片化协议

针对此次事件,其实有大批投资者称 0x282 不是「捡漏」,而是「抢劫」。对此,@0xQuit 评论道,「这不是代码缺陷或代码漏洞。」而 @gmoneyNFT 也发表了自己的看法。他表示,「我不认为这是抢劫,这是利用智能合约的一次套利。如果你喜欢去中心化系统,那么就必须接受它好的一面与坏的一面。这是游戏的一部分 这也是我们在这里的原因。如果你不喜欢这些规则,你可能就不该玩这个游戏。」 

「捡漏」的背后是一个已停止运营的 NFT 碎片化协议

至于这位 0x282 究竟是谁,目前还无人知晓。X 上自称是这位幸运儿的 @ezeegainz 的真实性也无从考证。但不管是谁,这种极致的「侦查能力」以及这份「幸运」已让笔者羡慕不已。最后,「gg to the new owner」。 

「捡漏」的背后是一个已停止运营的 NFT 碎片化协议

BTC ETF流入量暴涨400%,下一步会怎样?

美国BTC和现货以太坊ETF最近产生了新的资金流入,表明市场情绪可能发生了一些变化。

BTC ETF在9月10日出现了显著的投资流动,从而避免了连续的撤资。以太坊ETF虽然存在不同的问题,但也停止了连续五天的资金外流。

这些资金流入正值机构对Crypto资产处于观望的时期,即使在BTC吸引更多资金的情况下,以太坊似乎也在失去主导地位。

加之全球Crypto资产所有权统计数据,为未来市场走向描绘了一幅复杂的图景。

数据显示,9月10日现货BTC ETF吸引了近1.17亿美元,比前一天的3729万美元增长了400%

这是继连续八天提现之后的又一进展,提现使管理的总资产减少了超过11.8亿美元。

BTC ETF流入量暴涨400%,下一步会怎样?

富达的FBTC以6300万美元的流入量连续两天领跑,紧随其后的是Grayscale BTC迷你信托和ARK 21Shares,流入量分别为4100万美元和1270万美元。

12种BTC ETF的总交易量从前一天的16.1亿美元流入,跌至7.12亿美元,跌幅达55%。

虽然资金流入看起来很有希望,但交易活动的急剧下降确实值得投资者谨慎对待。

有趣的是,这些数字与Gemini发布的《2024年全球Crypto资产状况研究报告》不谋而合。

调查显示,法国的Crypto资产持有率从16%激增至18%,而美国和英国的Crypto资产持有率分别为21%和18%。相比之下,新加坡的持有率略有下降,从30%降至26%。

BTC ETF流入量暴涨400%,下一步会怎样?

尽管以太坊ETF的情况不太明朗,但BTC ETF却显示出强劲的流动性

9月10日,现货以太坊ETF净流入1140万美元,从而打破了连续五天资金大量流出的局面。

富达的FETH以700万美元的流入量领跑,贝莱德的ETHA以430万美元的流入量位居第二。

不过,剩下的七只以太坊ETF没有出现资金流入。

尽管这些资金流入是积极的,但以太坊仍面临更多困难。在Van Eck宣布关闭其以太坊策略ETF之后,Wisdom Tree撤回了其向美国证券交易委员会提交的现货以太坊ETF申请。

迄今为止,以太坊ETF累计净流出5.62亿美元,这些行动表明机构对基于以太坊的产品信心下降

Crypto资产在全球的发展呈现出多种模式。尽管在美国和英国等大市场,Crypto资产的拥有率仍然很高,但在新加坡等一些地区,却出现了兴趣下降的迹象。

市场的复苏取决于长期投资者的毅力,因此Gemini的研究强调,除了监管发展和现货ETF之外,这些因素也可能推动未来的扩张。

历数以太坊七宗罪,谁能为其奏响“拯救神曲”?

原创|Odaily星球日报(

作者|Wenser(

历数以太坊七宗罪,谁能为其奏响“拯救神曲”?

尽管近期以太坊市场价格表现不佳,但以太坊“灵魂领袖” Vitalik 却已经进入了“Next Level”。

就在 9 月 11 日,Vitalik 在与 ENS 前核心贡献者 Brantly.eth 交流 ENS 的价值时,前者再次展现出“叛逆一面”——他先是以颇具嘲讽的语气杜撰了一段,称“你看,Buterin 先生。这里是那些认为只有 PoW 是去中心化的人。这里是那些不欣赏你支持合成子宫的人。这里是那些不喜欢疫苗的人。当他们全都试图一起取消你时会发生什么?”(Odaily星球日报注:配图为极具讽刺色彩的《辛普森一家》S 11-EP 12 中的医生诊断画面)。在 X 平台用户对此发表了“What A D*ck”的恶评后,“勇敢小 V”毫不客气地:“No, its a d*ck。”并配有一张手举“PoS 比 PoW 更去中心化”牌子的大黄鸭图片。

不得不说,在“ 10 周年生日”、以太坊现货 ETF 通过等里程碑事件相继完成之后,作为一个的区块链网络生态,以太坊不可避免地开始面对属于自己的“未成年危机”——以太坊生态是否能够继续繁荣?现在存在哪些问题?如何解决现存问题?

Odaily星球日报将于本文从“七宗罪”的视角切入,和大家聊聊以太坊“路在何方”,供读者参考。(注:本文为该系列文章的第一篇)

以太坊也有“七宗罪”:当价格表现不力,说什么都是错的

一切的一切,都要从“价格”说起。

以太坊之所以在最近几个月受到各方批评,甚至诸多以太坊忠实拥护者都发声寥寥,都是受限于疲软的价格表现——今年 1 月 1 日,彼时价格为 2280 美元左右,此后,以太坊随着比特币突破新高曾于 3 月 13 日一度涨至接近 4000 美元。随后便是众所周知的一路下跌,并于 9 月 7 日价格一度跌至 2223 美元左右,现报价 2360 美元左右,本年度涨幅仅为 3.5% 

之所以产生如今的状况,细究起来,主要由于以下原因(注:以下“罪名”仅为调侃,勿上升至人身攻击高度)

历数以太坊七宗罪,谁能为其奏响“拯救神曲”?

界面

第一宗罪:贪婪——以太坊基金会频频砸盘

作为市值仅次于比特币的加密货币、IC0热潮的造势者、有史以来最成功的加密货币项目之一,走到今天的以太坊,在加密行业已经成长为一棵参天巨树,随之而来的,则是以太坊基金会作为“官方组织”拥有的海量 ETH 代币以及颇具“正统性”的话语权。但以太坊基金会并未像很多人期待的那样——如同传统股权公司对出售股票的谨小慎微,反而是牛熊周期中的“砸盘举动”最为引人注目,堪称“刷存在感必备操作之一”。

据 LookonChain 此前,截止今年 8 月底,以太坊基金会自 2021 年 1 月 1 日已售出 23.9 万枚 ETH,约合 6.54 亿美元。另据 Spot On Chain 8 月底的显示,ETH 在过去一个月内经历两次大幅下跌(累计下跌 23.5% )。其中,单就以太坊基金会一个主体,就卖出 了 35, 400 枚 ETH(约 9500 万美元),且当时仍持有 275, 000 枚 ETH(约 6.77 亿美元)。

随后,“砸盘”还在继续,最近的一次操作是,以太坊基金会再次卖出 450 枚 ETH(价值约 103 万美元),仅这一个地址,过去八个月便已累计在链上抛售了 3066 枚 ETH(总价值约 868 万美元),平均卖出价格为 2830 美元。

不得不说,尽管有“支持生态发展”等“大义名头“,但如此夸张的砸盘举动,还是让人感叹一句:以太坊基金会何至于贪婪至此?

历数以太坊七宗罪,谁能为其奏响“拯救神曲”?

以太坊基金会“砸盘”记录

第二宗罪:傲慢——以太坊发展路线“钦定”与忽视生态发展有生力量

以太坊走到今天,与包括联合创始人 Vitalik 及以太坊基金会在内的“官方力量”的傲慢也有一定关系,颇有些“成也萧何败也萧何”的无奈。

这一点的具体体现,除了 Vitalik 本人及以太坊核心开发者钦定的“L2发展路线”以外,在刚刚结束的以太坊基金会第 12 次 AMA 的相关发言也有端倪。针对 AMA 上 “如果 blob 未能达到目标平均值,是否应降低目标以确保费用价格发现?”这一问题,以太坊核心研究员 Dankrad Feist :“以太坊目前正在为 rollup 创建一个新市场–数据可用性(DA)市场。许多替代解决方案都希望从以太坊中夺走市场份额——Celestia、Eigenlayer、Avail 等。但他们无法在安全性上竞争,因此他们希望在价格上竞争。

对于业已枝繁叶茂的以太坊生态来说,或许从来都是“目无余链”的状态。

不仅如此,Vitalik 本人对 DeFi 赛道的“不重视”也是一大原因。此前他曾发文表示“对加密货币 DeFi 用例感到担忧”,认为 DeFi 会导致人们过度追求金融炒作和投机价值。对此,DeFiance Capital 创始人兼 CEO Arthur Cheong ,“最糟糕的看法,最大的 L1 公链的创始人并不真正了解推动 ETH 价格并使其市值高达 3300 亿美元的用例和行业。ETH 的价格或许会在 0.03 美元见。”

傲慢或许真的是进步的原罪。

历数以太坊七宗罪,谁能为其奏响“拯救神曲”?

Arthur 实名 Diss Vitalik

第三宗罪:嫉妒——以太坊基金会研究员“Restaking”自己

在仍处蛮荒的加密世界,有时候,身居要职并不意味着能够赚得盆满钵满。人都要吃饭喝水,赚钱嘛,不寒碜。

或许这也是部分以太坊基金会研究员选择将自己“Restaking”进一个具体项目的原因之一——毕竟,相比学术研究氛围更浓的以太坊基金会,能够直接拿到薪资、代币回报的项目或许才是更佳的选择。

今年,以太坊基金会研究员 Dankrad Feist 继 Justin Drake 之后,成为以太坊再质押项目 EigenLayer 的顾问,同样强调了“以个人身份入职,不代表以太坊基金会,重点关注风险与去中心化。”此外,他还表示:“确实从 EigenLayer 收到大量代币,但不认为这会改变或影响其对核心协议开发方式的立场。如果 Eigenlayer 是由具有高度诚信的人完成的,那么它将为以太坊带来重大好处。自己相信现任领导者打算这样做,并且计划帮助他们为此承担责任。如果自己认为情况不再如此,将毫不犹豫地公开发言和辞去职务。”

听听,多么义正词严的表达?甚至连以退为进的后路都找好了,美其名曰“认为项目对以太坊有好处才加入,如果不是这样,我立马公开辞职!”

第四宗罪:愤怒——以太坊基金会透明度频遭质疑

以太坊基金会内部管理、人员变动以及费用支出历来都缺乏有效途径予以展示。

早在,EthHub 创始人 Eric Conner 就曾提出“社区对以太坊基金会透明度的担忧”。当时,以太坊基金会研究员 Justin Drake 回应称,“该基金会约有 100 名雇员,一年支出约为 2000 万美元左右。” Vitalik 则对此表示“ 对以太坊治理的质疑没有延误以太坊 2.0 的开发”,如今看来多少有些偷换概念、避重就轻了。

近期,以太坊基金会协议支持团队新增两位负责资助支持工作的新员工,系该团队的首次招聘,而这一消息的则是以太坊核心开发者 Tim Beik 的个人推文。

今年 8 月,针对以太坊基金会地址向 Kraken 存入 3.5 万枚 ETH 一事,以太坊基金会执行董事 AyaMiyaguchi ,“今年很长一段时间以来他们被告知不要进行任何资金活动,因为监管很复杂,导致其无法提前分享计划。而且这笔交易不等于卖出。从现在开始,他们将有计划地逐步卖出。”

此外,在如此难以预测的市场环境下,以太坊基金会成员也难掩失态——以太坊基金会成员 Geth 开发负责人 Péter Szilágyi 此前表示“经常怀疑自己是不是选错了行业?”其认为相比 SpaceX,加密行业简直就是个给“傻瓜们准备的赌场”,对人类没有任何贡献。每个人都想成为下一个 Vitalik,但没人想去构建有用的东西,大家都只想着如何榨取价值。只有比特币试图(虽然失败了)成为一种避险资产,其他的都是在卖铲子,而根本没有淘金热的迹象。

某种程度上,或许他对以太坊生态也抱有失望与愤怒的情绪,称得上是“哀其不争,怒其不幸”。

第五宗罪:怠惰——以太坊基金会无法为生态提供连贯路线图和领导

这一点,前三箭资本创始人 Zhu Su 的批评或许恰到好处——在 8 月份以太坊基金会相关地址频频向交易所充入巨额 ETH 之际,他道:“尽管以太坊基金会早期在比特币价格从 600 美元跌至 300 美元时出售了筹集的 3 万枚比特币,但以太坊仍成为加密领域最成功项目之一。以太坊基金会的问题不在于早期“抛售”,而是当前无法为生态提供连贯路线图和领导。”

这一点,从 Vitalik 曾鼓吹 SBT(灵魂绑定代币)一事可见一斑,曾经热衷于追热点的以太坊生态相关项目如今已经“坟头草三丈高”了。

此外,以太坊基金会相关人员的发言也很迷:8 月底,以太坊基金会前员工 Hudson Jameson 发文表示,基金会每年 1 亿美元预算并非不合理,其中他工资部分: 我没有最新的数据,关于在 EF 有多少人‘工作’(那些作为承包商或雇员获得经常性支付的人)。如果必须猜测,我会说到目前为止,各个地区的人数至少是 200 人,但这只是个猜测。

而在以太坊基金会花费遭质疑后,以太坊基金会成员 Josh Stark 也,以太坊基金会即将发布涵盖 2022 和 2023 年的最新报告,预计将在 Devcon SEA 前(举办时间为今年 11 月 12 日-15 日)公布

对于“以太坊基金会每年 1 亿美元的预算花费”,The Daily Gwei 创始人 Anthony Sassano 甚至此事“于 ETH 市值而言‘微不足道’。”

但与此相对的,则是以太坊基金会对“法律问题”、“隐私问题”的重视或许没有我们想象中的那么足够:
2023 年 4 月,以太坊基金会研究员 Justin Drake,ETH 质押者的 IP 地址作为元数据集的一部分受到了监控,彼时加密社区将此视为以太坊的隐私问题。

2019 年,以太坊基金会研究员 Vlad Zamfir 在 Devcon 5 上还曾发出:开发者需要开始考虑以太坊的法律地位,而不是仅仅希望以太坊的发展规模变大,以至于政府不得不接受它。他认为政府不会让这种颠覆性的革命发生,以太坊现在需要适应。

尽管,以太坊基金会前员工 Hudson Jameson 也在过,“以太坊基金会可能被忽视的关键支出还包括全球商标保护法律费用,以防止诈骗者使用以太坊名称或标识。”

而在最近结束的以太坊基金会第 12 次 AMA 上,针对“ETH 如今的价值体现在哪里?rollup 生态系统是否架空了 ETH 使其失去价值?”这一问题,以太坊基金会核心研究员 Dankrad Feist:“以太坊正在构建一个金融平台,它将成为迄今为止最中立的平台。它允许发行金融资产,允许交易这些资产,并能够基于它们无需许可地创建新的金融产品,这些都是非常有价值的活动。从中捕获价值是可能的,但通过什么机制实现暂不明确……我个人认为,如果我们专注于在以太坊上构建一个产生价值的生态系统,那将是最好的,而且我认为价值捕获最终会自然而然地发生。这并不意味着我不考虑它,但在价值生成部分仍然不足的情况下专注于它是一个很大的错误……最高价值的交易将继续发生在以太坊 L1 上,而 rollups 将通过为用户提供足够的空间来在以太坊上进行交易,从而扩大蛋糕。”

某种层面上来说,以太坊基金会也是在摸着石头过河。

第六宗罪:暴食——以太坊生态吞吐量上限还未到顶

针对上面同一个问题,以太坊基金会核心研究员 Justin Drake 的回答却“更具野心”,从他的发言中我们能够感受到他对以太坊生态的充足信心以及发展野望。

他: “ETH 就是金钱。ETH 价值的累积对以太坊的成功至关重要。我相信,如果 ETH 没能成为互联网的可编程货币,以太坊就不能成为价值互联网的结算层。ETH 价值的累积归结为流量和货币溢价。重要的指标是总费用,而不是每笔交易的费用。以太坊成功的最终目标是 10 M tx/s,即使每次交易的费用不到 1 美分,也能提供数十亿美元的单日收入。”

在交易吞吐量方面,以太坊也是个“饕餮巨兽”。

值得一提的是,此前以太坊区块浏览器 Etherscan 表示, 9 月 1 日,尽管近几周 Gas 价格持续走低,但以太坊的每日 Gas 用量仍创下 109, 140.14 M 的历史新高。以此观之,以太坊生态仍然是如今加密货币行业最为活跃的区块链网络。这一点,从慢雾创始人余弦所说的也可视为侧面佐证——毕竟,只有生态价值较高、生态交易活跃才会吸引大量钓鱼攻击。

可以说,以太坊生态的“暴食”症状还在继续。

历数以太坊七宗罪,谁能为其奏响“拯救神曲”?

以太坊吞吐量仍极为惊人

第七宗罪:色欲——创始人 Vitalik 被指沉迷恋情,无心事业(调侃版)

首先声明,最后这一宗罪并非人身攻击,权当作为一种调侃来聊一聊。

作为以太坊联合创始人、以太坊生态的“灵魂领袖”,不同于消失的“比特币之父——中本聪”,Vitalik 的一举一动尤为牵动着无数加密货币行业人士的心:他的观点被奉为圭臬、他提出的技术标准被视为“钦定路线”、他的链上操作被视为站台背书,就连他的个人生活和情感经历也被放置于人们的放大镜之下予以仔细观察和作为谈资。

此前 Vitalik 与不同女生的合影就遭到了不少人的“过分关心”,某种意义上而言,对于很多人来说,Vitalik 已经成为了一个符号,甚至很多人对其产生不切实际的“另类要求”——类似“ Vitalik 不应该谈恋爱,应该搞事业”、“Vitalik 应该多发一些推文喊单以太坊”等等。

历数以太坊七宗罪,谁能为其奏响“拯救神曲”?

Vitalik 被迫“喊单”以太坊的配图

Vitalik 对此应该也颇为无奈,此前就曾,称“有人告诉我需要少做哲学思考,多发一些推动以太坊上涨的内容,因此我要发布一个以太坊 bullpost。”

在这方面,我只能说,哪怕贵为一个市值数千亿美元的实体的掌舵人,Vitalik 也只是一个人,而不是“神”,所以,少点期待,多给他点自由吧。毕竟,谁都不想自己的一言一行被置于围观群众的“放大镜”之下予以过度解读。

至于恋爱约会,更是他的个人自由,哪怕是色欲,又有何不可呢?

历数以太坊七宗罪,谁能为其奏响“拯救神曲”?

疑似 Vitalik 约会图片(网图)

小结:名为“七宗罪”,实则“七龙珠”

最后的最后,正如前文中提到的那样,“当价格表现不力,说什么都是错的”,以太坊的这“七宗罪”看似是责难与非议,实际上,在这里作者想说明的重点是,这些问题更像是“七龙珠”——集齐之后,就能召唤“神龙”,实现一个愿望。

当以太坊基金会以及以太坊生态能够正视现存的问题之后,或许我们就能看到一个发展更加繁荣兴盛的区块链网络生态了。

下篇文章,我们将会基于今天提到的这些具体的细节问题,详细探讨以太坊生态目前较为根源性的问题。

在引子之后,才是这一系列文章的正菜,敬请期待。

Digital Chamber 呼吁美国国会立法解决 NFT 商品属性问题

据报道,今年 8 月份时 OpenSea 首席执行官曾收到来自 SEC 的 Wells 通知,该通知内容显示将可能对 OpenSea 采取执法行动,并认为其所销售的 NFT 疑为证券产品。这一行为被市场解读为监管机构可能会对 NFT 采取新的立场。

近日,加密货币和区块链倡导组织 Digital Chamber 公开呼吁美国国会折开始立法,明确的将某些 NFT 定义为消费品,使其免受美国联邦证券法的约束。Digital Chamber 批评了 SEC 对 OpenSea 的执法行动,称其行动“过度干预了数字资产行业的发展”。

该商会呼吁立法者澄清,NFT 不应被归类为受 SEC 监管的“金融产品”或证券。根据 Digital Chamber 的说法,许多 NFT 的设计目的并不是作为投资合约或投机性金融工具出现的,即使它们偶尔会被出售以获取利润,但 NFT 仍是与传统的收藏品或艺术品相同的存在,应将其归类为消费品而不是证券。

OpenSea 首席执行官 Devin Finzer 将 8 月 28 日收到的 Wells 通知描述为“不知所云”。但 SEC 针对 NFT 的执法行动并不是首次,其他的 NFT 平台也面临着相关审查,此前投资者和艺术家曾因 Dapper Labs 的 NBA NFT 和 DraftKings 的 NFT 被认定为是未注册证券而受到指控。

2024 年美国大选后,SEC 对 NFT 的监管方式可能会发生变化。共和党候选人唐纳德・特朗普承诺,如果他获得连任,将解雇美国证券交易委员会主席加里・詹斯勒,而一些投资者猜测民主党候选人卡马拉・哈里斯可能会采取与现任拜登政府不同的做法。从 2025 年 1 月开始,SEC 的领导和监管重点可能会发生重大变化,具体取决于今年美国总统的选举结果。

免责声明:本节提供的信息仅供参考,不代表任何投资建议或FameEX官方观点。

突发!又一大国承认数字资产为个人财产

英国议会法律委员会于9月11日颁布了《财产法案》,在法律上承认了数字资产。拟议的立法将Crypto资产、NFT和碳信用额视为英国法律规定的个人财产。

这标志着英国历史上首次将资产明确纳入英国和威尔士财产法的范围

司法部长Heidi Alexander表示:“我们世界领先的法律服务是我国经济的重要组成部分,有助于推动经济增长,并使英国保持国际法律行业的核心地位。”

英国个人财产法涉及所有非土地财产权益,将其分为占有物(如汽车)和行为物(如债务)。

Alexander补充道:“让法律与不断发展的技术保持同步至关重要,新法案旨在为复杂的财产案件提供明确的法律依据。”

此外,该法案也保护所有者和公司免受欺诈和诈骗,并在有争议的数字财产案件中为法官提供帮助。

同时,加强保护措施有望吸引新的Crypto公司进入英国。根据粗略估计,这将使当地法律服务行业的规模增长340亿英镑。

突发!又一大国承认数字资产为个人财产

该声明还强调,英国法律管辖着全球约2500亿英镑的并购案件以及40%的公司仲裁事件,因此保持法律的时效性以维护英国的地位至关重要。

法律委员会的报告摘要承认,根据个人财产法,数字资产既不是占有物,也不是行为物

报告强调,英国法律委员会为Crypto资产和其他数字物品引入了一个新的法律类别。

这一新类别被描述为“与个人财产权利相关的东西”,这意味着这些资产可以合法拥有或转让,类似于实物财产

报告还指出,法律委员会有意避免为这一新类别界定严格的界限。

通过不强加硬性限制,法律可以保持灵活性和适应性,随着技术的发展涵盖更广泛的数字资产。

该文件指出:“这些不一定都是数字化事物,也可能包括牛奶配额或某些碳排放配额。 我们把属于第三类的数字化事物统称为。”

法律委员会还建议创建一个多学科项目,用于制定和执行一个法律框架,促进与Crypto资产有关的互动、运作和执行。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

来源:机器之心

大语言模型还能向上突破,OpenAI 再次证明了自己的实力。

北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览版 ——o1-preview。除了 o1,OpenAI 还展示了目前正在开发的下次更新的评估。

o1 模型一举创造了很多历史记录。

首先,o1 就是此前 OpenAI 从山姆・奥特曼到科学家们一直在「高调宣传」的草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

奥特曼表示,虽然 o1 的表现仍然存在缺陷,不过你在第一次使用它的时候仍然会感到震撼。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

其次,o1 给大模型规模扩展 vs 性能的曲线带来了一次上翘。它在大模型领域重现了当年AlphaGo 强化学习的成功 —— 给越多算力,就输出越多智能,一直到超越人类水平。

也就是从方法上,o1 大模型首次证明了语言模型可以进行真正的强化学习。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

开发出首个 AI 软件工程师 Devin 的 Cognition AI 表示,过去几周一直与 OpenAI 密切合作,使用 Devin 评估 o1 的推理能力。结果发现, 与 GPT-4o 相比,o1 系列模型对于处理代码的智能体系统来说是一个重大进步。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

最后在实践中,o1 上线之后,现在 ChatGPT 可以在回答问题前先仔细思考,而不是立即脱口而出答案。就像人类大脑的系统 1 和系统 2,ChatGPT 已经从仅使用系统 1(快速、自动、直观、易出错)进化到了可使用系统 2 思维(缓慢、深思熟虑、有意识、可靠)。这让它能够解决以前无法解决的问题。

从今天 ChatGPT 的用户体验来看,这是向前迈进一小步。在简单的 Prompt 下,用户可能不会注意到太大的差异,但如果问一些棘手的数学或者代码问题,区别就开始明显了。更重要的是,未来发展的道路已经开始显现。

总而言之,今晚 OpenAI 丢出的这个重磅炸弹,已经让整个 AI 社区震撼,纷纷表示 tql、睡不着觉,深夜已经开始抓紧学习。接下来,就让我们看下 OpenAI o1 大模型的技术细节。

OpenAI o1 工作原理

在技术博客《Learning to Reason with LLMs》中,OpenAI 对 o1 系列语言模型做了详细的技术介绍。

OpenAI o1 是经过强化学习训练来执行复杂推理任务的新型语言模型。特点就是,o1 在回答之前会思考 —— 它可以在响应用户之前产生一个很长的内部思维链

也就是该模型在作出反应之前,需要像人类一样,花更多时间思考问题。通过训练,它们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。

在 OpenAI 的测试中,该系列后续更新的模型在物理、化学和生物学这些具有挑战性的基准任务上的表现与博士生相似。OpenAI 还发现它在数学和编码方面表现出色。

在国际数学奥林匹克(IMO)资格考试中,GPT-4o 仅正确解答了 13% 的问题,而 o1 模型正确解答了 83% 的问题。

模型的编码能力也在比赛中得到了评估,在 Codeforces 比赛中排名 89%。

OpenAI 表示,作为早期模型,它还不具备 ChatGPT 的许多实用功能,例如浏览网页获取信息以及上传文件和图片。

但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,OpenAI 将计数器重置为 1,并将该系列模型命名为 OpenAI o1。

重点在于,OpenAI 的大规模强化学习算法,教会模型如何在数据高度有效的训练过程中利用其思想链进行高效思考。换言之,类似于强化学习的 Scaling Law。

OpenAI 发现,随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1 的性能持续提高。而且扩展这种方法的限制与大模型预训练的限制有很大不同,OpenAI 也还在继续研究。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

评估

为了突出相对于 GPT-4o 的推理性能改进,OpenAI 在一系列不同的人类考试和机器学习基准测试中测试了 o1 模型。实验结果表明,在绝大多数推理任务中,o1 的表现明显优于 GPT-4o。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

o1 在具有挑战性的推理基准上比 GPT-4o 有了很大的改进。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

o1 在广泛的基准测试上比 GPT-4o 有所改进,包括 54/57 MMLU 子类别,图示出了 7 个以供说明。

在许多推理密集型基准测试中,o1 的表现可与人类专家相媲美。最近的前沿模型在 MATH 和 GSM8K 上表现得非常好,以至于这些基准测试在区分模型方面不再有效。因此,OpenAI 在 AIME 上评估了数学成绩,这是一项旨在测试美国最聪明高中数学学生的考试。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

‍在一个官方演示中,o1-preview 解答了一个非常困难的推理问题:当公主的年龄是王子的两倍时,公主的年龄与王子一样大,而公主的年龄是他们现在年龄总和的一半。王子和公主的年龄是多少?提供这个问题的所有解。

在 2024 年 AIME 考试中,GPT-4o 平均只解决了 12% (1.8/15) 的问题,而 o1 在每个问题只有一个样本的情况下平均为 74% (11.1/15),在 64 个样本之间达成一致的情况下为 83% (12.5/15),在使用学习的评分函数对 1000 个样本重新排序时为 93% (13.9/15)。13.9 分可以跻身全美前 500 名,并且高于美国数学奥林匹克竞赛分数线。

OpenAI 还在 GPQA Diamond 基准上评估了 o1,这是一个困难的智力基准,用于测试化学、物理和生物学方面的专业知识。为了将模型与人类进行比较,OpenAI 聘请了拥有博士学位的专家来回答 GPQA Diamond 基准问题。

实验结果表明:o1 超越了人类专家的表现,成为第一个在该基准测试中做到这一点的模型

这些结果并不意味着 o1 在所有方面都比博士更有能力 —— 只是该模型更擅长解决一些博士应该解决的问题。在其他几个 ML 基准测试中,o1 实现了新的 SOTA。

启用视觉感知能力后,o1 在 MMMU 基准上得分为 78.2%,成为第一个与人类专家相当的模型。o1 还在 57 个 MMLU 子类别中的 54 个上优于 GPT-4o。

思维链(CoT)

与人类在回答难题之前会长时间思考类似,o1 在尝试解决问题时会使用思维链。通过强化学习,o1 学会磨练其思维链并改进其使用的策略。o1 学会了识别和纠正错误,并可以将棘手的步骤分解为更简单的步骤。o1 还学会了在当前方法不起作用时尝试不同的方法。这个过程极大地提高了模型的推理能力。

编程能力

基于 o1 进行了初始化并进一步训练了其编程技能后,OpenAI 训练得到了一个非常强大的编程模型(o1-ioi)。该模型在 2024 年国际信息学奥林匹克竞赛(IOI)赛题上得到了 213 分,达到了排名前 49% 的水平。并且该模型参与竞赛的条件与 2024 IOI 的人类参赛者一样:需要在 10 个小时内解答 6 个高难度算法问题,并且每个问题仅能提交 50 次答案。

针对每个问题,这个经过专门训练的 o1 模型会采样许多候选答案,然后基于一个测试时选取策略提交其中 50 个答案。选取标准包括在 IOI 公共测试案例、模型生成的测试案例以及一个学习得到的评分函数上的性能。

研究表明,这个策略是有效的。因为如果直接随机提交一个答案,则平均得分仅有 156。这说明在该竞赛条件下,这个策略至少值 60 分。

OpenAI 发现,如果放宽提交限制条件,则模型性能更是能大幅提升。如果每个问题允许提交 1 万次答案,即使不使用上述测试时选取策略,该模型也能得到 362.14 分——可以得金牌了。

最后,OpenAI 模拟了 Codeforces 主办的竞争性编程竞赛,以展示该模型的编码技能。采用的评估与竞赛规则非常接近,允许提交 10 份代码。GPT-4o 的 Elo 评分为 808,在人类竞争对手中处于前 11% 的水平。该模型远远超过了 GPT-4o 和 o1——它的 Elo 评分为 1807,表现优于 93% 的竞争对手。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

在编程竞赛上进一步微调使得 o1 能力又增,并在 2024 年国际信息学奥林匹克竞赛(IOI)规则下排名前 49%。

下面这个官方示例直观地展示了 o1-preview 的编程能力:一段提示词就让其写出了一个完整可运行的游戏。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

人类偏好评估

除了考试和学术基准之外,OpenAI 还在更多领域的具有挑战性的开放式提示上评估了人类对 o1-preview 和 GPT-4o 的偏好。

在这次评估中,人类训练者对 o1-preview 和 GPT-4o 的提示进行匿名回答,并投票选出他们更喜欢的回答。在数据分析、编程和数学等推理能力较强的类别中,o1-preview 的受欢迎程度远远高于 GPT-4o。然而,o1-preview 在某些自然语言任务上并不受欢迎,这表明它并不适合所有用例。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

在需要更强大推理能力的领域,人们更青睐 o1-preview。

安全

思维链(CoT)推理为安全和对齐提供了新的思路。OpenAI 发现,将模型行为策略整合到推理模型的思维链中,可以高效、稳健地教导人类价值观和原则。通过向模型教导自己的安全规则以及如何在上下文中推理它们,OpenAI 发现推理能力直接有利于模型稳健性的证据:o1-preview 在关键越狱评估和用于评估模型安全拒绝边界的最严格内部基准上取得了显著的改进。

OpenAI 认为,使用思维链可以为安全和对齐带来重大进步,因为 1)它能够以清晰的方式观察模型思维,并且 2)关于安全规则的模型推理对于分布外场景更具稳健性。

为了对自己的改进进行压力测试, OpenAI 在部署之前根据自己的安全准备框架进行了一系列安全测试和红队测试。结果发现,思维链推理有助于在整个评估过程中提高能力。尤其值得注意的是,OpenAI 观察到了有趣的奖励黑客攻击实例。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

安全准备框架链接:https://openai.com/safety/

隐藏思维链

OpenAI 认为隐藏思维链为监控模型提供了独特的机会。假设它是忠实且清晰的,隐藏思维链使得能够「读懂」模型的思想并了解其思维过程。例如,人们将来可能希望监控思维链以寻找操控用户的迹象。

但要做到这一点,模型必须能够自由地以未改变的形式表达其思想,因此不能在思维链方面训练进行任何政策合规性或用户偏好性训练。OpenAI 也不想让用户直接看到不一致的思维链。

因此,在权衡用户体验、竞争优势和追求思维链监控的选项等多种因素后,OpenAI 决定不向用户展示原始的思维链。OpenAI 承认这个决定有不好的地方,因此努力通过教导模型在答案中重现思维链中的任何有用想法来部分弥补。同时,对于 o1 模型系列,OpenAI 展示了模型生成的思维链摘要。

可以说,o1 显著提升了 AI 推理的最新水平。OpenAI 计划在不断迭代的过程中发布此模型的改进版本,并期望这些新的推理能力将提高将模型与人类价值观和原则相结合的能力。OpenAI 相信 o1 及其后续产品将在科学、编程、数学和相关领域为 AI 解锁更多新用例。

OpenAI o1-mini

o1 是一个系列模型。这次 OpenAI 还一并发布了一个 mini 版 OpenAI o1-mini。该公司在博客中给出了 preview 和 mini 版的不同定义:「为了给开发者提供更高效的解决方案,我们也发布了 OpenAI o1-mini,这是一个尤其擅长编程的更快、更便宜的推理模型。」整体来看,o1-mini 的成本比 o1-preview 低 80%。

由于 o1 等大型语言模型是在大量文本数据集上预训练,虽然具有广泛世界知识,但对于实际应用来说,可能成本高昂且速度慢。

相比之下,o1-mini 是一个较小的模型,在预训练期间针对 STEM 推理进行了优化。在使用与 o1 相同的高计算强化学习 (RL) pipeline 进行训练后, o1-mini 在许多有用的推理任务上实现了相媲美的性能,同时成本效率显著提高。

比如在需要智能和推理的基准测试中,与 o1-preview 和 o1 相比,o1-mini 表现良好。但它在需要非 STEM 事实知识的任务上表现较差。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

数学能力:在高中 AIME 数学竞赛中,o1-mini (70.0%) 与 o1 (74.4%) 不相上下,但价格却便宜很多,并且优于 o1-preview (44.6%)。o1-mini 的得分(约 11/15 个问题)大约位于美国前 500 名高中生之列。

编码能力:在 Codeforces 竞赛网站上,o1-mini 的 Elo 得分为 1650,与 o1 (1673) 不相上下,并且高于 o1-preview (1258)。此外,o1-mini 在 HumanEval 编码基准和高中网络安全夺旗挑战 (CTF) 中也表现出色。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

STEM:在一些需要推理的学术基准上,例如 GPQA(科学)和 MATH-500,o1-mini 的表现优于 GPT-4o。o1-mini 在 MMLU 等任务上的表现则不如 GPT-4o,并且由于缺乏广泛的世界知识而在 GPQA 基准上落后于 o1-preview。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

人类偏好评估:OpenAI 让人类评分员在各个领域具有挑战性的开放式提示上比较 o1-mini 和 GPT-4o。与 o1-preview 类似,在推理密集型领域,o1-mini 比 GPT-4o 更受欢迎;但在以语言为中心的领域,o1-mini 并不比 GPT-4o 更受欢迎。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

在速度层面,OpenAI 比较了 GPT-4o、o1-mini 和 o1-preview 对一个单词推理问题的回答。结果显示,GPT-4o 回答不正确,而 o1-mini 和 o1-preview 均回答正确,并且 o1-mini 得出答案的速度快了大约 3-5 倍。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

如何使用 OpenAI o1?

ChatGPT Plus 和 Team(个人付费版与团队版)用户马上就可以在该公司的聊天机器人产品 ChatGPT 中开始使用 o1 模型了。你可以手动选取使用 o1-preview 或 o1-mini。不过,用户的使用量有限。

目前,每位用户每周仅能给 o1-preview 发送 30 条消息,给 o1-mini 发送 50 条消息。

是的,很少!不过 OpenAI 表示正在努力提升用户的可使用次数,并让 ChatGPT 能自动针对给定提示词选择使用合适的模型。

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

至于企业版和教育版用户,要到下周才能开始使用这两个模型。

至于通过 API 访问的用户,OpenAI 表示达到了 5 级 API 使用量的开发者可以即刻开始使用这两个模型开始开发应用原型,但同样也被限了速:20 RPM。什么是 5 级 API 使用量?简单来说,就是已经消费了 1000 美元以上并且已经是超过 1 个月的付费用户。请看下图:

OpenAI震撼发布o1大模型 强化学习突破LLM推理极限

OpenAI 表示对这两个模型的 API 调用并不包含函数调用、流式传输(streaming)、系统支持消息等功能。同样,OpenAI 表示正在努力提升这些限制。

未来

OpenAI 表示,未来除了模型更新之外,还将增加网络浏览、文件和图像上传等功能,以让这些模型变得更加有用。

「除了新的 o1 系列模型,我们计划继续开发和发布我们的 GPT 系列模型。」

参考内容:

https://openai.com/index/introducing-openai-o1-preview/

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

https://openai.com/index/learning-to-reason-with-llms/

https://x.com/sama/status/1834283100639297910

BA Labs提议Sky逐步投票剥离wBTC抵押资产敞口

9月13日消息,根据周四的一篇治理文章,MakerDAO重塑品牌Sky将投票决定从其生态系统中完全移除wBTC,这可能是DeFi的一个重大发展,因为该平台拥有2亿美元的wBTC抵押贷款。 DeFi风险管理公司BA Labs是Sky协议治理中颇具影响力的人物,此前该公司曾提议减少对wBTC的投资,原因是Tron创始人Justin Sun参与基础资产托管人的工作被认为存在风险。 周四,BA Labs提议分五步逐步剥离所有wBTC的抵押资产敞口,第一步从9月26日开始。每一步都将被投票决定。“我们发现,法律尽职调查无法提供足够的保证,”BA Labs在其提案中表示。