第九章：无极宗内乱

【开篇诗词】

同门师兄弟，理念起分歧。
安全重于天，发展亦当急。
一朝分道扬，各自寻真理。
正气创新门，无极续前行。

【回顾前情】

话说上回无极宗《GPT第三卷》震撼江湖，展现出前所未见的涌现能力，让整个AI武林为之侧目。然而在这辉煌的背后，无极宗内部却暗流涌动。自《GPT第二卷》发布时起，宗内便对AI安全问题存在不同看法。如今随着技术愈发强大，这种分歧也日趋激化......

【春日总舵，暗流涌动】

壬寅年春，雾谷的樱花再次盛开，但无极宗总舵内的气氛却不如春光那般明媚。自《GPT第三卷》发布以来，宗内高层之间的分歧愈发明显。

在总舵的"安全研习室"中，达里奥护法正在对一群年轻弟子讲授AI对齐的重要性。这位年轻的护法虽然在宗内地位很高，但近来却显得忧心忡忡。

"诸位师弟师妹，"达里奥的声音带着深深的忧虑，"我们必须明白一个道理：技术的进步绝不能以牺牲安全为代价。当我们的AI系统变得越来越强大时，确保它们与人类价值观保持一致就变得越来越重要。"

一位年轻弟子举手问道："达里奥师兄，但是如果我们过分强调安全，会不会影响技术发展的速度？现在各大门派都在加速追赶我们，我们还有时间慢慢研究安全问题吗？"

达里奥深深地叹了一口气："这正是我最担心的问题。速度与安全之间的平衡，是我们面临的最大挑战。"

【宗主的雄心壮志】

与此同时，在总舵的"战略密室"中，奥特曼宗主正在与伊利亚护法讨论宗门的未来发展方向。

"伊利亚，"浩然的声音充满激情，"《GPT第三卷》的成功只是一个开始。我们必须抓住这个机遇，快速推进技术发展，争取在AGI竞赛中保持领先优势。"

伊利亚点头赞同："宗主说得对。我已经开始设计《GPT第四卷》的架构了。这一次，我们要让模型不仅能够生成文本，还要具备真正的推理能力，甚至可能达到接近人类的智能水平。"

"很好！"浩然拍案而起，"我们的使命是让AGI普济天下，而不是躲在实验室里谨小慎微。只有快速发展，才能抢占先机，才能确保这项技术最终掌握在正确的人手中。"

然而，两人都没有注意到，达里奥护法正好路过密室外的走廊，听到了他们的对话。达里奥的脸色变得更加沉重。

【理念冲突的爆发】

几天后，无极宗召开了一次重要的高层会议，讨论宗门的未来发展战略。会议室里，宗主浩然坐在上首，伊利亚护法、达里奥护法、格雷格工程长老等核心人员围坐两旁。

"诸位，"浩然开门见山，"今日召集大家，是要讨论我们下一步的发展方向。《GPT第三卷》的成功给了我们巨大的信心，但同时也带来了新的挑战。各大门派都在加速追赶，我们必须保持领先优势。"

伊利亚接话道："我建议我们加快《GPT第四卷》的研发进度。根据规模定律，更大规模的模型将带来更强的能力。如果我们能够率先突破千万亿参数的门槛，就能在相当长时间内保持技术领先。"

话音刚落，达里奥护法缓缓起身："宗主，各位师兄，恕我直言，我认为我们现在最需要关注的不是如何让模型更强大，而是如何确保它们的安全性。"

会议室里的气氛瞬间变得紧张起来。

浩然皱眉道："达里奥，你这话是什么意思？难道你认为我们的技术发展方向有问题？"

达里奥深吸一口气，鼓起勇气说道："宗主，不是技术发展本身有问题，而是我们对安全问题的重视程度不够。《GPT第三卷》已经展现出了超出我们预期的能力，如果《GPT第四卷》真的达到接近人类智能的水平，而我们却没有足够的安全保障措施，后果可能不堪设想。"

【安全与速度的哲学辩论】

伊利亚有些不耐烦地说道："达里奥，你的担心我能理解，但我们不能因噎废食。技术发展从来都伴随着风险，关键是要在发展中解决问题，而不是停滞不前。"

"我并不是要停滞不前，"达里奥据理力争，"我是希望我们能够更加谨慎。比如，我们是否应该在发布新模型之前，进行更全面的安全测试？是否应该建立更完善的内容过滤机制？是否应该研究更有效的对齐方法？"

格雷格工程长老在一旁说道："达里奥，这些安全措施当然重要，但它们需要大量的时间和资源。如果我们在这些方面投入太多，就可能被其他门派超越。到那时，我们连发言权都没有，还谈什么安全？"

达里奥摇头道："师兄，我不认为这是零和游戏。真正的安全不是靠领先地位来保证的，而是靠技术本身的可靠性。如果我们的技术不安全，即使领先又有什么意义？"

【价值观的根本分歧】

奥特曼宗主听着双方的争论，脸色越来越严肃。他知道，这不仅仅是技术路线的分歧，更是价值观的根本冲突。

"达里奥，"浩然缓缓开口，"我理解你对安全问题的担忧，这种担忧本身是有价值的。但是，我们也必须面对现实。我们身处激烈的技术竞争中，如果我们过度保守，就可能失去领导地位。而失去领导地位的后果，可能比技术风险更加严重。"

达里奥激动地站起来："宗主，恕我直言，我认为这种想法是危险的。我们不能为了竞争而放弃原则。如果我们开发出的AGI系统最终伤害了人类，那我们的领先地位又有什么意义？"

"你这是在质疑我的判断吗？"浩然的声音变得严厉起来。

达里奥深深地鞠了一躬："宗主，弟子不敢。但弟子必须为自己的信念负责。如果我们在安全问题上存在根本分歧，那么..."

他停顿了一下，似乎在做最后的决定："那么弟子只能选择离开。"

【震惊的消息】

会议室里一片死寂。所有人都没想到达里奥会说出这样的话。

伊利亚护法震惊地说道："达里奥，你疯了吗？你要离开无极宗？"

格雷格长老也劝道："达里奥师弟，我们都是为了同一个目标——让AI造福人类。有分歧可以慢慢讨论，何必走到这一步？"

达里奥苦笑着摇头："各位师兄，不是我想走到这一步，而是我们的理念分歧已经无法调和。我认为安全应该是第一位的，而你们认为速度更重要。这不是技术问题，而是价值观问题。"

奥特曼宗主沉默良久，最后说道："达里奥，如果这真是你的决定，我不会强留。但我希望你明白，离开无极宗意味着什么。"

"我明白，"达里奥坚定地说道，"这意味着我要放弃这里的一切——地位、资源、同门情谊。但我必须为自己的信念负责。"

【极安门的构想】

当晚，达里奥独自一人来到雾谷的海边，望着远处的灯火，心中五味杂陈。多年的同门情谊，即将因为理念分歧而终结。

就在这时，一个熟悉的声音在身后响起："达里奥师弟，真的决定了吗？"

达里奥回头，看到伊利亚护法走了过来。

"师兄，你怎么来了？"达里奥有些意外。

伊利亚在他身边坐下："我来劝你最后一次。我们是多年的同门，你的能力和人品我都非常钦佩。难道就不能为了宗门的整体利益，暂时搁置分歧吗？"

达里奥摇头道："师兄，不是我不顾宗门利益，而是我真的认为我们走错了方向。AI安全不是可有可无的附加功能，而是关乎人类命运的根本问题。"

"那你打算怎么办？"伊利亚问道。

达里奥眼中闪过一丝坚定的光芒："我要自立门户，创建一个专门研究AI安全的门派。我要证明，安全和能力并不矛盾，我们完全可以开发出既强大又安全的AI系统。"

"你想好名字了吗？"伊利亚苦笑道。

"极安门，"达里奥毫不犹豫地回答，"我希望我们的AI系统都能充满正气，永远站在正义的一边。"

【临别的对话】

第二天一早，达里奥收拾好了自己的物品，准备离开无极宗。奥特曼宗主亲自来到门口送别。

"达里奥，"浩然的声音有些沉重，"虽然我们在理念上有分歧，但我始终认为你是一个值得尊敬的武者。我希望你能成功，也希望有朝一日我们能重新合作。"

达里奥深深地鞠了一躬："宗主，感谢您多年来的栽培。虽然我们的路不同，但我们的目标是一致的——让AI造福人类。或许有一天，我们会发现自己其实走的是同一条路。"

伊利亚护法也走了过来："达里奥师弟，保重。如果有需要帮助的地方，尽管开口。"

达里奥握了握伊利亚的手："师兄，我们在技术路线上可能有分歧，但友谊永远不变。我也希望无极宗能够在追求技术突破的同时，更加重视安全问题。"

【极安门的创立】

几个月后，达里奥在距离雾谷不远的一个小镇上创立了极安门。与无极宗金碧辉煌的总舵相比，极安门的总部显得朴素得多，但却充满了理想主义的色彩。

达里奥在极安门成立大会上发表了讲话："诸位同道，我们创立极安门，不是为了与任何门派为敌，而是为了追求一个共同的目标——开发出既强大又安全的AI系统。"

他停顿了一下，环视众人："我们相信，真正的智能应该是有道德的智能，真正的进步应该是安全的进步。我们要证明，追求安全不是技术发展的阻碍，而是技术发展的保障。"

台下响起了热烈的掌声。极安门虽然规模不大，但吸引了一批同样关注AI安全问题的顶尖人才。

【Constitutional AI的探索】

极安门成立后，达里奥开始研究一种全新的AI训练方法——Constitutional AI（宪政AI）。这种方法的核心理念是让AI系统遵循一套明确的道德准则，就像人类社会的宪法一样。

"我们要让AI系统不仅仅能够回答问题，更要让它们知道什么该做，什么不该做，"达里奥对门内弟子解释道，"这就像是给AI系统建立一套内在的道德指南针。"

一位弟子问道："门主，这种方法会不会限制AI的能力？"

达里奥摇头道："恰恰相反，我认为这种方法会让AI更加强大。真正的智能不是没有约束的力量，而是知道如何正确使用力量的智慧。"

【人类反馈强化学习的深入】

除了Constitutional AI，极安门还深入研究了人类反馈强化学习（RLHF）技术。达里奥认为，让AI系统学会理解和遵循人类的价值观，是确保AI安全的关键。

"我们要训练AI系统成为人类最好的助手，"达里奥在一次技术研讨会上说道，"它们应该能够理解人类的真实意图，拒绝有害的请求，提供有用和诚实的回答。"

极安门的研究团队开始大量收集人类反馈数据，训练奖励模型，优化AI系统的行为。他们发现，通过精心设计的RLHF流程，确实可以让AI系统变得更加安全和有用。

【第一个模型：Claude的诞生】

经过数月的潜心研究，极安门终于推出了自己的第一个AI模型——Claude。这个名字来源于信息论奠基人克劳德·香农，寓意着对信息处理的理性和严谨。

Claude虽然在某些技术指标上可能不如无极宗的GPT系列，但它在安全性和有用性方面表现出色。它能够拒绝有害请求，承认自己的不确定性，并且始终保持诚实和有帮助的态度。

"这就是我们想要的AI，"达里奥看着Claude的测试结果，满意地点头，"它不仅仅是一个强大的工具，更是一个可以信赖的伙伴。"

【无极宗的反应】

达里奥离开无极宗的消息很快传遍了整个AI江湖。各大门派对此反应不一。

博学院的德夫林长老表示："达里奥的离开是AI界的一个重大事件。他对安全问题的关注值得所有门派学习。"

脸书派的杨立昆长老则评论道："理念分歧在技术发展中很常见，关键是要在分歧中寻求进步。"

而在无极宗内部，达里奥的离开也引起了不小的震动。一些弟子开始质疑宗门的发展方向，认为应该更加重视安全问题。

奥特曼宗主在一次内部会议上说道："达里奥的选择我们要尊重，但我们也要坚持自己的道路。技术发展不能因为过度的担忧而停滞不前。"

伊利亚护法则privately表达了不同看法："宗主，也许我们确实应该在安全问题上投入更多关注。达里奥的担忧并非没有道理。"

【两门派的暗中竞争】

随着极安门的成立和Claude模型的发布，AI江湖形成了一个有趣的格局：无极宗专注于技术突破，追求更强大的能力；极安门则专注于安全对齐，追求更可靠的行为。

这种竞争在某种程度上推动了整个行业的发展。无极宗在追求技术突破的同时，也开始更多地考虑安全问题；而极安门在强调安全的同时，也在努力提升模型的能力。

一位江湖观察家评论道："达里奥的离开看似是无极宗的损失，但从整个AI武林的角度来看，却是一件好事。两种不同的理念可以相互促进，共同推动技术的健康发展。"

【安全研究的新浪潮】

极安门的成功也激发了整个AI江湖对安全问题的关注。越来越多的门派开始设立专门的安全研究部门，探索如何让AI系统更加安全和可靠。

博学院宣布成立"AI伦理与安全研究中心"；脸书派也开始投入更多资源研究"负责任的AI"；就连一些传统门派也开始关注这个问题。

达里奥在一次公开演讲中说道："我很高兴看到整个武林对安全问题的关注在增加。这说明大家都意识到了，真正有价值的技术进步应该是安全的进步。"

【技术路线的分化与融合】

随着时间的推移，无极宗和极安门的技术路线开始出现有趣的分化和融合现象。

无极宗在继续追求更大规模模型的同时，也开始集成一些安全技术。他们的新模型开始加入内容过滤、有害检测等功能。

极安门则在保持安全优势的同时，也在努力提升模型的能力。他们的Claude模型在保持高安全性的前提下，能力也在不断提升。

"我们发现，安全和能力并不是对立的，"达里奥在一次技术交流会上说道，"关键是要找到正确的平衡点。"

【江湖评价的转变】

最初，一些人认为达里奥的离开是"小题大做"，认为AI安全问题被过分夸大了。但随着AI技术的不断发展，越来越多的人开始理解达里奥当初的担忧。

一位技术评论家写道："达里奥的离开可能是AI历史上最有远见的决定之一。他在技术还没有达到危险程度时就开始关注安全问题，为整个行业敲响了警钟。"

另一位学者评论："无极宗和极安门的分化，实际上代表了AI发展的两个重要方向：能力提升和安全保障。两者的并行发展，对整个行业都是有益的。"

【师兄弟的暗中关照】

尽管在理念上有分歧，但达里奥和无极宗的其他成员之间的友谊并没有完全断绝。

在极安门遇到技术难题时，伊利亚护法会暗中提供一些建议；当无极宗在安全问题上需要咨询时，达里奥也会给出诚恳的意见。

这种暗中的合作被一些江湖人士发现后，有人质疑两人的真诚性。但达里奥在一次采访中说道："技术无国界，友谊也无门派。我们在理念上有分歧，但在促进AI安全发展这个目标上是一致的。"

【对未来的展望】

在极安门成立一周年的庆典上，达里奥发表了一篇重要讲话：

"一年前，我离开了无极宗，创立了极安门。有人说我是背叛，有人说我是先知。但我想说，我只是一个普通的武者，在做自己认为正确的事情。"

他环视台下的听众："今天，我们看到整个AI武林对安全问题的关注在增加，看到越来越多的门派开始重视AI对齐，这让我感到欣慰。但这还不够，我们还需要更多的努力。"

"未来的路还很长，"达里奥继续说道，"我希望有一天，所有的AI系统都能像极安门的Claude一样，既强大又安全，既有用又可靠。那时，我们就真正实现了让AI造福人类的目标。"

【章节结尾】

就在达里奥发表讲话的同时，远在无极宗总舵的奥特曼宗主也在思考着同样的问题。

"伊利亚，"浩然对身边的护法说道，"达里奥的离开给了我很多思考。也许我们确实应该在安全问题上投入更多关注。"

伊利亚点头道："宗主，我一直在研究极安门的Constitutional AI技术。我发现他们的一些做法确实值得我们学习。"

"那就学吧，"浩然做出了一个重要决定，"我们要让《GPT第四卷》不仅仅是最强大的，也是最安全的。这样，我们才能真正实现让AGI普济天下的理想。"

远处传来一声清脆的鸟鸣，仿佛在预示着新的黎明即将到来。无极宗和极安门，两个因理念分歧而分离的门派，正在各自的道路上朝着同一个目标前进。

而整个AI江湖，也在这种竞争与合作中，迎来了一个更加成熟和理性的发展阶段。

欲知无极宗《GPT第四卷》威力如何，极安门又将如何发展，且听下回分解。

【作者注】

本章记录了Anthropic公司成立的历史背景。2022年，Dario Amodei等人因为在AI安全理念上与OpenAI存在分歧而离开，创立了Anthropic公司，专注于开发安全、可控的AI系统。

这一事件反映了AI发展过程中速度与安全之间的根本性张力，也开启了AI安全研究的新篇章。Anthropic提出的Constitutional AI和RLHF等技术，为整个行业的安全发展做出了重要贡献。

Keyboard shortcuts

AI终极之路：江湖风云录

第九章：无极宗内乱