通用人工智能报

Memene
通用人工智能报的封面
摘要

2025-09-11晨报:Fellou CE浏览器在任务执行中表现优异,成功率达72%。腾讯发布CodeBuddy Code,支持微信登录,简化编程流程,提升效率。金融智能创新大赛展示AI应用实力,微软Excel引入COPILOT函数,增强数据处理能力,Sebastian Raschka分享LLM架构对比视频。

  • Sam Altman谈AI规则重构

  • OpenAI ChatGPT 支持MCP工具

  • 1

    Fellou CE浏览器:智能助手突出表现

V

通用人工智障

Sep 11, 2025

Sam Altman 谈 AI 未来五年:规则重构与行动指南

2025 年 5 月 20 日的对话中,Sam Altman 提出 AI 发展将突破技术层面,直接重构商业和社会规则。 “ChatGPT 不是终点,我们真正要做的是让它变成你的智能操作系统” ,这句话揭示了 AI 将从工具演变为基础设施的本质转变。软件行业首当其冲,当 AI 能即时生成应用时,传统 SaaS 公司的价值主张面临挑战。

组织形态将出现颠覆性变化。Altman 预测“10 人公司赚 10 亿美金”的模式即将普及,AI 工具使小团队具备超大产能。软件开发、客服等岗位的工作方式已被改写,效率提升带来管理新课题。关键在于 “成功的秘诀不是人少,而是责任清晰、工具得力、执行有效” ,这种新型组织架构正在从硅谷幻想变为现实。

人类工作价值标准面临重新定义。当 AI 能完成大部分知识工作时,情感连接和判断力成为稀缺资源。Altman 指出“我一生中学到最重要的东西,是那些在我身上投入过情感的人”,暗示人际互动类工作将增值。在此基础上,电力资源可能成为 AI 发展的终极瓶颈,能源主权决定技术普及程度,这需要政府与企业共同建立新的资源分配机制。

这场对话的核心启示在于:未来竞争优势不在于掌握 AI 技术,而在于理解并适应 AI 重构的新规则体系。从软件交付方式到组织形态,从价值创造到资源分配,每个领域都在经历根本性变革。Altman 的预测不仅描绘了技术前景,更为个人和企业提供了明确的行动坐标系。

ChatGPT 开发者模式迎来 MCP 工具全面支持

OpenAI 宣布为 ChatGPT 的开发者模式全面集成 MCP(Model Context Protocol)工具 ,开发者现在可以通过创建连接器实现写入操作,而不仅限于搜索和获取功能。这意味着开发者能够直接更新 Jira 工单、触发 Zapier 工作流,甚至组合多个连接器完成复杂自动化任务。

Victor M 在社交平台展示了首张由 FLUX 生成的图像(通过 MCP 工具在开发者模式下实现),标志着开源社区在 AI 应用层的新探索。

01Fellou CE 浏览器:打破工具束缚的智能生产力助手

Fellou CE 浏览器在 Halluminate's Web Bench benchmark 测试中表现出色,特别是在登录、填表等高难度的“写入”任务上取得 72%成功率,显著优于 Manus(60%)和 OpenAI(59%)。这款产品重新定义了浏览器作为智能助手的角色, Fellou 让每个人都能拥有跨领域创造的超能力 ,其设计理念突破了传统工具的局限。

该浏览器的核心创新在于构建了三个连续体体验:交互连续实现自然语言指令的无缝响应,任务连续支持目标导向的自动化流程,记忆连续整合了用户的各类数字痕迹。 你的浏览器缓存、AI 会话记录、行动信息曾是彼此孤立的记忆孤岛 ,而 Fellou CE 通过统一记忆层解决了这一问题。两大免费功能 Deep Search 和 Visual Report 进一步降低了高效工具的使用门槛。

实际应用中,Fellou CE 展现出三大核心能力:跨应用自主执行复杂任务、多

模态
内容自由转换、动态工作流智能编排。从旅行规划到投资报告生成,用户只需提供高层目标,系统就能自动分解并执行子任务。

产品路线图显示,未来将扩展语音交互和移动端支持,持续优化人机协作体验。这款产品的出现反映了数字生产力工具的进化方向:不再是简单的功能叠加,而是通过深度的人机协作重新定义工作方式。 我们正身处一个充满悖论的时代 ,当信息过载成为常态,能够整合碎片、简化流程的工具将释放用户的创造力,让专注和效率回归到核心工作本身。

02腾讯推出命令行编程工具 CodeBuddy Code,支持微信登录

腾讯近日发布了 CodeBuddy Code,这是一款基于命令行的 AI 编程工具。用户可以通过自然语言指令让工具自动完成代码生成、依赖安装、测试运行和调试等一系列开发任务。 “你在命令行里面用最自然的语言告诉它你要干啥,它就会自动帮你完成后续的一系列动作” ,这大大简化了开发流程。

CodeBuddy Code 支持微信登录,分为国内和国际两个版本,主要区别在于使用的 AI 模型不同。国内版本目前支持 DeepSeek v3 模型,未来将增加更多模型选择。安装过程简单,只需通过 npm 安装即可使用。 “安装好以后,打开你的终端,运行下面这行命令就能安装上了” ,降低了使用门槛。

在实际测试中,CodeBuddy Code 表现出了较高的工作效率。一个图片处理服务的开发任务仅用 15 分钟就完成了,包括生成代码、搭建服务和功能测试。工具还能理解复杂需求,如批量生成不同姿势的图片或设计带有公司 logo 的周边产品。 “5 种不同的姿势,非常完美,整个过程我就说了一句话” ,展示了其强大的自动化能力。

虽然工具在稳定性方面还有提升空间,偶尔会出现理解

偏差
的情况,但整体表现已经相当出色。作为腾讯在编程 Agent 领域的新尝试,CodeBuddy Code 展现了 AI 辅助开发的潜力,为开发者提供了一种全新的工作方式。

03金融智能创新大赛展现中国 AI 应用实力

AFAC2025 金融智能创新大赛成为观察中国 AI 应用进展的重要窗口。11 支获奖团队的项目覆盖反洗钱、信贷风控、票据中介识别等核心金融场景,技术方案兼具前沿性与实用性。 “在这场竞赛中,中国跑在了前列” ,评委 Roselake Ventures 合伙人阳靳光的评价点明了中国团队在落地速度上的优势。

徐周明父子的“反洗钱 3.0”方案颇具代表性。通过

联邦学习
区块链
结合,实现去中心化数据处理,既解决隐私保护难题,又规避传统聚合节点的单点风险。这种技术已在香港金融机构试点,其国际化经验与本土化落地的结合,折射出中国创业者的独特路径。

跨界融合成为另一显著特征。光通科技用自研 2Tbit/s 光模块搭建金融信息高速公路;岙邗科技将卫星遥感引入信贷风控,使台风灾害赔付周期从数月缩短至数小时;图盾科技则凭借图计算技术,将风险识别率从行业平均 10%提升至 50%以上。 “我们的技术在百万级数据集上 2 秒内挖掘出 5 个节点的时序模式” ,负责人秦宏超的案例展示了技术突破对效率的颠覆性提升。

大赛也呈现出多元包容性。大三学生李天一的团队开发手语实时转文字应用,虽与金融关联较弱,却体现了 AI 的社会价值。评委们不仅提供技术指导,更帮助团队对接资本与市场,如建议遥感数据采用“存算分离”模式规避合规风险。

这场赛事已超越单纯竞赛,成为连接技术、资本与产业的平台。从海外人才“归巢”创业,到硬科技项目对接长三角资源,AFAC 正推动中国 AI 应用从实验室加速走向真实场景。正如评委所言,这种集中爆发并非偶然——政策支持、市场需求与技术积累共同构成了中国 AI 应用的独特土壤。

04Excel 引入 COPILOT 函数:AI 直接嵌入表格处理数据

微软近日为 Excel 引入全新的 COPILOT 函数,将 AI 能力直接嵌入电子表格。用户只需输入自然语言指令,AI 就能自动完成数据整理、内容生成、情感分析等复杂任务。 “这将永远改变数据分析。让 Excel 再次伟大” ,一位网友如此评价这一功能。

传统数据处理往往需要手动编写公式或借助外部工具,而 COPILOT 函数彻底改变了这一流程。例如要汇总机场代码,用户只需输入需求,AI 就会自动生成清晰列表。该函数还能与 IF、SWITCH 等现有 Excel 公式协作,无需改变表格结构即可添加 AI 功能。

使用方式非常简单:在单元格输入=COPILOT(提示语, 【数据范围】)即可。比如=Copilot("Classify this feedback", D4:D18)能自动将用户反馈按情感分类。微软特别强调隐私保护,承诺个人数据仅用于生成结果,不会用于训练模型。

目前该功能每 10 分钟限 100 次调用,每小时不超过 300 次。微软表示正在改进大数组支持、模型性能等功能,未来还会增加联网能力和日期格式处理。YouTube 博主 Kevin Stratvert 的教程展示了如何用 COPILOT 快速完成饼干类型描述、用户情绪分析等实际任务。 “Copilot 可能会返回类似以下的结果” ,文章用一个咖啡机反馈案例展示了 AI 如何分分钟完成人工需要数小时的工作。从头脑风暴到数据摘要,从分类整理到表格生成,COPILOT 正在重新定义电子表格的使用方式。对于经常处理数据的职场人士来说,这无疑是一个重大效率提升工具。

05Sebastian Raschka 发布大型语言模型架构对比视频讲座

Sebastian Raschka 近日将其关于 11 种大型语言模型(LLM)架构 的对比文章升级为视频讲座形式,内容涵盖 DeepSeek V3/R1、OLMo 2、Gemma 3 等主流模型。他在社交媒体透露,视频已同步上传至 YouTube 并添加章节标记,方便观众按需学习。

网友 @uripont 称赞该视频将成为与 @karpathy 作品齐名的「必看内容」,Sebastian 则补充说明其 GitHub 仓库已包含 GPT-2、Llama 3 等模型的从零实现代码。当被问及架构设计空间问题时,他回应称当前视频已覆盖

注意力机制
变体、归一化层选择等核心组件。

06北大张铭实验室:从顶会论文到百亿企业的孵化器

今年夏天,北大张铭教授团队与 DeepSeek 合作的原生稀疏注意力模型(NSA)斩获 ACL2025 最佳论文,这是该实验室十年内第二次获此殊荣。2014 年,他们已在 ICML 上实现中国大陆学者最佳论文零的突破,那篇奠基性论文至今被引用逾 400 次。 “科研突破就是“尖顶破天”,创业也需要同样的逻辑” ,张铭这样概括她的培养理念。

这间实验室走出了多位学术与商业双栖人才。ICML2014 最佳论文一作唐建现为加拿大 Mila 研究院终身教授,同时创办 AI 制药公司;安克创新创始人阳萌大二就进入实验室,如今身价数百亿;天眼查创始人柳超、Alluxio 创始人李浩源等均从这里起步。实验室毕业生创办的企业总估值已超千亿,2023 年成立的北大-安克大模型联合实验室更实现了产学研闭环。

张铭将科研培养延伸到中学阶段,通过“英才计划”带领高中生参与实际研究。学生覃义方高中入组,大四已有两篇 CCF A 类一作论文;孙工博高中时期即获得有“小诺贝尔奖”之称的 ISEF 大奖。 “是在全球可能就是几个人在那突破,去刺破未知的空间” ,她这样描述博士研究的本质。

作为 Google Scholar 被引超 2.3 万次的学者,张铭主持的《科技创新与创业》课程已坚持十余年,系统化训练学生的科研思维和创业能力。她认为批判性思维和敢为人先的魄力具有普适价值,这种理念使实验室同时成为学术突破的发源地和商业领袖的摇篮。从理论创新到产业落地,再到青少年培养,张铭团队构建了完整的人才成长生态。

07Meta Superintelligence Labs 推出语言自博弈技术

Meta Superintelligence Labs 最新推出了一项名为 语言自博弈 的技术,该技术能够实现 无数据训练 ,为人工智能领域带来了新的突破。这一创新方法通过让模型自我对弈来提升性能,避免了传统训练中对大量标注数据的依赖。

与此同时,关于 Meta 公司名称的讨论也引发了关注。有人调侃道,既然 Facebook 押注元宇宙时改名为 Meta,现在押注超级智能(superintelligence),或许应该改名为 Super。

08豆包 Seedream 4.0 图像模型深度评测:精准编辑与推理能力解析

豆包 Seedream 4.0 是一款定位为“生成与编辑一体化”的图像模型,与 Gemini Nano Banana 具有相似功能。测试显示,它在精准指令编辑和特征保持方面表现优异。 “无论是角色外形还是画面细节,都能比较稳定地延续下来,尤其在跨风格场景里,角色不容易“变脸” 。例如,根据头像生成身体并保持面部特征,或按要求添加咖啡、更换背景等操作都能准确完成。

在推理能力方面,Seedream 4.0 对模糊需求的理解显著提升。 “对模糊的创意描述能自动补充分镜元素,和之前「词对图」的堆砌相比更有整体感” 。测试中,模型能根据指令打开餐盒、插入吸管、添加番茄酱,甚至调整发型和鞋子,展现出强大的语义理解和场景构建能力。

与 Gemini Nano Banana 的对比显示,两者在多图融合、2D 转 3D 等功能上各有千秋。Seedream 4.0 在图像编辑和控制方面表现接近,但 Nano Banana 在面部细节保持上略胜一筹。不过,Seedream 4.0 在中文支持和使用体验上更符合国内用户需求,提供了更便捷的操作入口和免费使用选项。

总体而言,Seedream 4.0 已具备与国际先进模型竞争的实力,尤其在中文场景下的实用性和易用性优势明显。对于需要高效图像编辑和创意实现的用户来说,它是一个值得尝试的选择。

09AI 专家探讨通用人工智能时代的识别标准

在 AI 领域的最新讨论中,Peter H. Diamandis 提出了一个引人深思的观点:随着 AI 承担更多劳动,传统的「996」工作文化可能会逐渐消失。与此同时,Jeff Clune 和 Dan Roy 就如何识别通用人工智能(AGI)展开了深入对话。Clune 认为,一个能通过高质量

图灵测试
的模型将标志着技术的巨大飞跃,而 Roy 则对识别标准提出了更具体的疑问。这场讨论揭示了 AI 发展中的关键问题:我们如何定义和识别真正的智能突破。

10大模型在 PyTorch 算子编写中的表现与挑战

大模型(LLMs)在编写正确的

PyTorch
算子方面取得了显著进展,通过了 53%的正确性测试,并成功覆盖了所有边缘情况。部分生成的内核在实际应用中展现出 1.2 倍的性能提升,甚至在 nanoGPT 项目中实现了收敛。然而,尽管这些进展令人鼓舞,目前尚未观察到 10 倍的速度提升,性能加速效果仍有待进一步优化。

BackendBench 评估工具的出现,为开发者提供了一个可调试的后端环境,使得生成的内核更易于检查和分享。这一工具的开发,标志着大模型在代码生成领域的应用又向前迈进了一步。

11上海交大开源端侧 Agent 工具链 MobiAgent,性能超越 GPT-5

上海交通大学 IPADS 实验室近日开源了名为 MobiAgent 的移动端智能体全栈工具链。这套框架首次完整开放了从数据收集、模型训练到手机部署的全流程,使普通开发者也能构建专属 AI 助手。 “从收集手机操作轨迹数据开始,到训练出一个能听懂自然语言指令、帮你处理日常事务的专属 Agent,再到最终将它部署在自己的手机上,现在,人人都能上手 DIY。” MobiAgent 采用“三人小组”架构:Planner 负责任务拆解,Decider 决定操作步骤,Grounder 执行具体点击。这种分工设计使 7B 规模的模型在国内 Top20App 测试中,任务完成度超越 GPT-5 和 Gemini2.5Pro 等闭源大模型。

团队还开发了独特的“潜记忆加速器”AgentRR,通过记录操作轨迹实现动作复用,将高频任务性能提升 2-3 倍。为准确评估模型能力,团队创建了 MobiFlow 评测基准,覆盖社交、购物、外卖等主流应用场景。

测试显示,MobiAgent 在复杂任务中表现突出,且能正确终止任务,而 GPT-5 在 11 个 App 上出现了无限循环问题。 “MobiAgent 的出现,不仅在性能上树立了新的标杆,更重要的是,它通过开源整个技术栈,极大地降低了定制化、私有化移动智能体的门槛。” 该项目的开源意味着移动端 AI 助手开发门槛大幅降低,普通用户也能训练个性化 Agent。随着技术普及,“能动口就不动手”的智能交互方式或将很快成为现实。

12智能体管理者的三大核心能力

微软 Copilot Studio 高级产品营销经理杰克·罗博坦指出,未来员工的核心竞争力将转向智能体管理能力。 “未来简历价值的评估,将不再局限于个人经验与技能,更重要的是你构建智能体的专业能力” 。这种能力包含三大核心要素:战略性组建团队、清晰化沟通管理、智能化任务分派。

组建智能体团队需从具体业务场景切入。用户可通过 Microsoft 365 Copilot 创建问答型智能体,例如让智能体分析市场研究报告并提炼关键结论。罗博坦强调:“智能体必须聚焦具体业务痛点,始终紧扣实施动因与价值产出”。在委派环节,需根据任务性质配置人机协作比例——重复性工作可高度自动化,战略决策则需保留人工监督。

管理智能体的关键在于持续优化。 “智能体将逐字执行指令,这还能有效完善管理者的沟通精确度” 。通过设定明确目标、提供执行背景、指定数据来源和定义结果标准,管理者能提升智能体效能。绩效评估需关注实际业务价值,如成本降低、收益创造等指标,最终实现智能体经验的规模化复制。

这一方法论适用于各层级员工,标志着职场能力评估体系的根本转变。随着人机混合团队成为常态,智能体管理能力或将决定个人与企业的竞争力边界。