RichChat

A blog for tech enthusiasts

RichChat

前言

近日,OpenAI突然发布了他们的AI浏览器Atlas,这个消息瞬间点燃了整个科技圈。当ChatGPT的缔造者决定进军浏览器市场时,所有人都意识到:AI浏览器这条赛道,已经从”未来趋势”变成了”当下战场”。

这让我想起应该写一下最近两个月深度使用AI浏览器的经历。作为一个重度互联网用户,浏览器几乎是我每天使用时间最长的软件。从最早的IE到Firefox,再到如今的Chrome,浏览器的进化一直在改变着我们与互联网交互的方式。而在2025年,AI的深度介入正在重新定义”浏览器”这个概念。

在OpenAI发布Atlas之前,我已经深度体验了两款AI浏览器产品:Perplexity推出的Comet浏览器和Google在Chrome中集成的Gemini助手。作为一个使用Chrome多年的老用户,我惊讶地发现Comet几乎让我产生了更换默认浏览器的冲动。恰逢Atlas发布掀起新一轮关注,今天就来分享一下我的使用体验和思考。

阅读全文 »

还在担心 AI 进展停滞吗?Artificial Analysis 刚发布的2025年第三季度AI状况报告给出了明确答案:“任何关于进展停滞的说法都被严重夸大了” 。

报告的总体基调是,AI 不仅没有停歇,反而在以“比以往更快的速度”进化 。从 “AI 代理”(Agents) 成为实验室的新焦点 ,到视频、语音技术的全面爆发 ,整个行业的竞争正在全方位加剧,没有出现任何垄断或“明确的赢家” 。

下面为你提炼这份重磅报告中最值得关注的核心趋势与事实:

📈 2025年第三季度的五大核心趋势

  1. “AI 代理” (Agents) 成为焦点:AI 实验室正日益关注“代理能力”,即模型能更长时间地自主使用工具、执行多步骤的复杂工作流。
  2. 开源模型加速发布:开源模型的发布速度达到历史新高。OpenAI 也发布了自 GPT-2 以来的首个开源权重模型。
  3. 原生语音到语音 (STS) 技术成熟:原生的“语音到语音”转换技术已达到生产可用的水平,推动了更高效的语音代理(Voice Agents)发展。
  4. 全模态竞争加剧:在语言、图像、视频和语音等所有模态上,各大实验室在智能、效率和速度方面的竞争都在加剧 。
  5. 图像编辑与视频生成成为主流:图像编辑质量显著提升,视频生成技术也日益普及 。
    阅读全文 »

引言:一个让我困惑的回答

几个月前,我翻译了一篇Stratechery关于Sam Altman的深度访谈。当时给我留下最深刻印象的,是Altman对一个假设性问题的回答。

访谈者问:**”五年后什么会更有价值:是一个拥有十亿日活跃用户、不需要做客户获取的目标网站,还是最顶尖的模型?”**

Altman的回答毫不犹豫:”那个拥有十亿用户的网站。

这个答案当时让我颇感意外。因为在我的认知里,OpenAI这样的顶级AI实验室,其核心愿景应该是AGI(通用人工智能)。事实上,OpenAI官网上的使命声明也清楚地写着:”Our mission is to ensure that artificial general intelligence—AI systems that are generally smarter than humans—benefits all of humanity.“(我们的使命是确保通用人工智能,即比人类更聪明的AI系统,造福全人类。)

那么,一个致力于实现AGI的组织,为什么会认为用户规模比技术领先更重要?这个疑问一直萦绕在我心头。直到最近看到The Information发布了一篇深度报道《OpenAI Readies Itself for Its Facebook Era》(OpenAI准备迎接它的Facebook时代),我感觉这可能部分能协助理解OpenAI这个转变背后的逻辑,以及它所引发的内部争议…

阅读全文 »

在曼哈顿的一个屋顶酒吧里,AI创业公司Anthropic的员工们正与大约150名量化研究员(俗称“宽客”)相谈甚欢。他们的目的只有一个:说服这些华尔街的精英们,将他们的才华投入到构建通用人工智能(AGI)的宏伟事业中。

这并非个例。根据科技招聘专家的数据,过去12-18个月内,专门寻求量化金融背景人才的AI和软件公司数量增长了40-50%。但这并非单向的挖角,而是一场深刻的双向奔赴,一个关于“跨界者”正在重新定义游戏规则的时代故事。

第一幕:从华尔街到硅谷的“淘金热”

为什么AI巨头会对宽客们如此青睐??答案在于其核心技能的高度重叠。

  • 极致的速度追求:对于不熟悉量化交易的读者来说,可以想象一个争分夺秒的战场。在高频交易中,百万分之一秒的延迟都可能导致巨大的损失。因此,宽客们必须将代码和基础设施优化到极致。这种对底层效率和延迟的苛刻追求,与AI领域优化大型语言模型(LLM)推理速度、降低用户等待时间的需求,在技术上异曲同工;
  • 严谨的研究方法:宽客的本质工作是从充满噪音的海量市场数据中,通过复杂的统计建模识别微弱但有效的盈利信号(Alpha)。这与AI研究的核心挑战如出一辙 - 都是在海量、非结构化的数据中训练模型学习有用的模式。无论是从股价波动中预测市场走向,还是从文本数据中理解语言规律,底层的数学原理和方法论都存在深度重叠;
    阅读全文 »

从预告到落地

今年8月,我写过《手腕上的私人健康专家:谷歌发布基于Gemini的Fitbit AI教练》,当时Google在Made by Google发布会上首次展示了这款由Gemini驱动的个人健康教练,描绘了一个令人激动的愿景:让普通人也能拥有像世界顶级运动员那样的全天候健康专家团队。

两个多月过去,这个产品终于从概念走向现实。从10月28日开始,Google正式向美国符合条件的Android Fitbit Premium用户开放公开预览版,iOS用户也将在不久后获得访问权限。作为一直在关注AI健康可穿戴方向的从业者,这次我们聚焦于这款产品的实际功能、技术架构和真实使用场景 - 当AI健康教练真正运行在你的手腕上时,它能做什么?又是如何做到的?

当健康建议变得具体可行

在进入功能细节之前,我们需要理解一个核心问题:为什么我们需要AI健康教练?

传统健康管理有一个致命缺陷:碎片化且难以个性化。你的医生给你建议”多运动、注意睡眠”,但不告诉你具体该怎么做;你下载的健身app提供通用计划,但不知道你昨晚睡眠不好、今天不适合高强度训练;你的智能手表/手环收集了海量数据,但只是展示数字,不解释这些数字背后的意义。

最终结果是:你拥有大量数据,却依然不知道该做什么。

Google的解决方案是让AI成为连接数据和行动的智能桥梁。Fitbit健康教练不只是另一个功能,而是对整个产品体验的重新设计 - 从被动记录到主动指导,从数据展示到洞察分析,从通用建议到个性化方案。

阅读全文 »

刚看到市场研究机构Counterpoint的最新数据:2025年苹果将以19.4%市场份额干掉三星,重回全球手机销量第一。

上次坐这个位置还是2011年,那年乔布斯刚去世。

但我觉得,有意思的不是苹果赢了,而是它怎么赢的

1. 疫情买手机的那批人,现在该换了

还记得2020-2021年疫情期间吗?居家办公、上网课等等使得全家人都在换手机。

那批设备用到现在正好3-4年,电池不行了,系统也卡了。苹果踩中的就是这个时间点,而iPhone 17发布的时机,刚好赶上这波换机潮爆发。

从数据来看:在美国和中国这两个最关键的市场,iPhone 17都实现了双位数增长。甚至在中国,10月份的销量同比暴涨了37%。

更绝的是,过去两年多卖出去3.58亿台二手iPhone。

这些用二手机的人,很多是第一次用iOS,等他们想升级的时候,猜猜会买什么?

阅读全文 »

在过去的这一年里,AI 圈子似乎达成了一种昂贵的共识:只有一种“硬通货”值得追逐,那就是 NVIDIA 的 GPU。无论是 OpenAI、Meta 还是那一长串的独角兽名单,实际上都在给黄仁勋打工。

但就在这周,Google 甩出了一枚重磅炸弹:全球最强模型Gemini 3 Pro

这不仅是一个在LMArena(大模型竞技场)首破 1500 分、登顶全球最强的模型,更重要的是它的“出生证明”:它是业界首个完全不依赖 NVIDIA 芯片,纯粹由 Google 自研 TPU 集群训练出来的超大规模模型。

这意味着,Google 正在用实际行动打破那个“没有 H100 就做不出顶级 AI”的魔咒。

阅读全文 »

历史总是惊人地相似

2022年12月,当ChatGPT横空出世时,Google内部拉响了”Code Red”警报。这个搜索巨头突然意识到,一个成立仅七年的初创公司可能正在颠覆它赖以生存的核心业务。Sundar Pichai紧急召集各部门负责人,要求全力应对这个前所未有的威胁。

三年后的2025年,历史完成了一个完美的轮回 - 这次轮到Sam Altman向OpenAI全体员工发出”Code Red”备忘录。就在ChatGPT即将迎来三周岁生日之际,这位曾经的挑战者如今感受到了当年Google同样的紧迫感:被追赶,甚至可能被超越。

这个历史的镜像揭示了AI竞争的残酷:在这个领域,三年就足以让攻守易位,让王者变成焦虑者。

什么是”Code Red”?

在OpenAI的内部文化中,存在着三级警报系统:黄色、橙色和红色,分别对应不同级别的紧急程度。值得注意的是,在此次宣布”Code Red”之前,OpenAI已经启动过”Code Orange”来应对ChatGPT的改进问题。而现在升级到最高级别的红色警戒,意味着Altman认为当前的竞争态势已经到了生死存亡的关键时刻。

根据《华尔街日报》和《The Information》的报道,Altman在备忘录中明确要求团队全力聚焦于改善ChatGPT的”日常使用体验”,包括提升个性化功能、加快响应速度、提高可靠性,以及扩展问答能力的广度。为了集中资源,OpenAI决定推迟多个原本已经公布的计划,包括广告整合、AI购物助手、以及备受期待的个人助理产品ChatGPT Pulse。

Google Gemini 3:改变游戏规则的对手

那么,是什么让OpenAI如此紧张?答案是Google上个月发布的Gemini 3。

在我的个人使用体验中,Gemini最近的表现确实令人印象深刻,从最近的数据表现来看甚至可以说是势不可挡。Gemini 3 Pro在多项行业基准测试中超越了OpenAI的GPT系列和Anthropic的Claude系列,首次从技术能力上夺得了AI模型的”智商第一”宝座。而且也从用户层面获得了大量好评,例如Salesforce CEO Marc Benioff在试用后公开表示:”我用了ChatGPT三年,但在Gemini 3上体验了两小时后,我不打算回去了。这个飞跃太疯狂了。”连Altman本人也在X平台上祝贺Google,承认Gemini 3 Pro”看起来是一个很棒的模型”。

阅读全文 »

译者注

作为一名长期关注AI技术落地的从业者,我在实际工作中见证了AI在软件研发领域带来的显著提效。最新这篇来自a16z的文章系统性地梳理了AI软件开发的整个生态,专门整理翻译一下供参考。

对照文中提到的场景,从我个人实际经验中也已经看到了下面这些方面的实际应用:

  • 老代码迁移(Legacy Code Migration)是其中一个令人印象深刻的应用场景,AI能够理解老旧代码的逻辑并协助迁移到新的技术栈,大大降低了技术债务的偿还成本;
  • 在快速原型和Demo构建方面,我看到越来越多产品经理背景的朋友开始直接使用AI工具来验证自己的产品想法,这在过去是不可想象的。传统上,产品经理需要依赖工程师才能将想法变成可交互的原型,而现在他们可以自己动手,这极大地加快了产品迭代的速度;
  • AI在生成和维护文档、测试用例方面的能力同样令人瞩目。技术文档和测试用例的编写一直是开发过程中耗时但必要的工作,而现在AI不仅能够基于代码自动生成高质量的文档和测试用例,还能在代码变更时同步更新,甚至同时生成测试脚本,以及智能地识别潜在的边缘案例,提升测试覆盖率;

我之前写过的一篇文章《AI 时代的新法则:2 个产品经理配 1 个工程师?》,其中我探讨了未来团队的角色组合 - 我认为随着AI工具的成熟,团队将需要更多的”通才”或”T型人才”,他们不仅要懂产品,还要能够利用AI工具快速实现想法。而在另一篇最近的文章《美图的AI转型蓝图》中,美图在其AI转型过程中也在强调”人人都是多面手”的理念,鼓励每个团队成员掌握多种技能,并善用AI工具来提升工作效率。

这种转变不仅仅是工具层面的升级,更是组织架构和人才能力模型的重构。当产品经理可以自己构建Demo,当工程师可以借助AI处理更高层次的架构设计,团队的协作方式和价值创造模式都将发生根本性的变化。a16z这篇文章所描绘的万亿美元市场,本质上是对整个软件开发范式转变的量化估算。

阅读全文 »

当流量来源悄然改变

根据最新Adobe发布的2025年9月一组数据:美国零售网站来自AI来源的流量同比激增了1,100%。而且,这些通过ChatGPT、Claude、Perplexity等AI工具进入网站的访问者,表现出了比传统渠道更高的商业价值:参与度提升12%,转化率提高5%。

这意味着什么?当你的潜在客户在ChatGPT里询问”适合敏感肌的护肤品推荐”或”性价比高的露营装备”时,如果AI看不到你的网站内容,你就彻底失去了这个客户。不是排名靠后,而是压根不存在。

而我最近用一个免费工具测试了几位朋友的网站后发现:大部分网站并没有为这个新时代做好准备。

80%的企业存在严重可见性缺陷

Adobe刚刚推出了一款名为LLM Optimizer的产品,根据其发现:80%的企业网站存在严重的内容可见性缺陷,导致AI无法访问关键的产品信息或评论。这不是技术问题,而是一个时代错位的问题:我们的网站优化策略还停留在为Google、百度这样的传统搜索引擎服务的时代,而AI代理的内容抓取方式完全不同。

阅读全文 »
0%