通用人工智能报
2025-09-11晨报:Fellou CE浏览器在任务执行中表现优异,成功率达72%。腾讯发布CodeBuddy Code,支持微信登录,简化编程流程,提升效率。金融智能创新大赛展示AI应用实力,微软Excel引入COPILOT函数,增强数据处理能力,Sebastian Raschka分享LLM架构对比视频。
Sam Altman谈AI规则重构
OpenAI ChatGPT 支持MCP工具
- 1
Fellou CE浏览器:智能助手突出表现
通用人工智障
Sep 11, 2025
Sam Altman 谈 AI 未来五年:规则重构与行动指南
2025 年 5 月 20 日的对话中,Sam Altman 提出 AI 发展将突破技术层面,直接重构商业和社会规则。 “ChatGPT 不是终点,我们真正要做的是让它变成你的智能操作系统” ,这句话揭示了 AI 将从工具演变为基础设施的本质转变。软件行业首当其冲,当 AI 能即时生成应用时,传统 SaaS 公司的价值主张面临挑战。
组织形态将出现颠覆性变化。Altman 预测“10 人公司赚 10 亿美金”的模式即将普及,AI 工具使小团队具备超大产能。软件开发、客服等岗位的工作方式已被改写,效率提升带来管理新课题。关键在于 “成功的秘诀不是人少,而是责任清晰、工具得力、执行有效” ,这种新型组织架构正在从硅谷幻想变为现实。
人类工作价值标准面临重新定义。当 AI 能完成大部分知识工作时,情感连接和判断力成为稀缺资源。Altman 指出“我一生中学到最重要的东西,是那些在我身上投入过情感的人”,暗示人际互动类工作将增值。在此基础上,电力资源可能成为 AI 发展的终极瓶颈,能源主权决定技术普及程度,这需要政府与企业共同建立新的资源分配机制。
这场对话的核心启示在于:未来竞争优势不在于掌握 AI 技术,而在于理解并适应 AI 重构的新规则体系。从软件交付方式到组织形态,从价值创造到资源分配,每个领域都在经历根本性变革。Altman 的预测不仅描绘了技术前景,更为个人和企业提供了明确的行动坐标系。
ChatGPT 开发者模式迎来 MCP 工具全面支持
OpenAI 宣布为 ChatGPT 的开发者模式全面集成 MCP(Model Context Protocol)工具 ,开发者现在可以通过创建连接器实现写入操作,而不仅限于搜索和获取功能。这意味着开发者能够直接更新 Jira 工单、触发 Zapier 工作流,甚至组合多个连接器完成复杂自动化任务。
Victor M 在社交平台展示了首张由 FLUX 生成的图像(通过 MCP 工具在开发者模式下实现),标志着开源社区在 AI 应用层的新探索。
01Fellou CE 浏览器:打破工具束缚的智能生产力助手
Fellou CE 浏览器在 Halluminate's Web Bench benchmark 测试中表现出色,特别是在登录、填表等高难度的“写入”任务上取得 72%成功率,显著优于 Manus(60%)和 OpenAI(59%)。这款产品重新定义了浏览器作为智能助手的角色, Fellou 让每个人都能拥有跨领域创造的超能力 ,其设计理念突破了传统工具的局限。
该浏览器的核心创新在于构建了三个连续体体验:交互连续实现自然语言指令的无缝响应,任务连续支持目标导向的自动化流程,记忆连续整合了用户的各类数字痕迹。 你的浏览器缓存、AI 会话记录、行动信息曾是彼此孤立的记忆孤岛 ,而 Fellou CE 通过统一记忆层解决了这一问题。两大免费功能 Deep Search 和 Visual Report 进一步降低了高效工具的使用门槛。
实际应用中,Fellou CE 展现出三大核心能力:跨应用自主执行复杂任务、多
产品路线图显示,未来将扩展语音交互和移动端支持,持续优化人机协作体验。这款产品的出现反映了数字生产力工具的进化方向:不再是简单的功能叠加,而是通过深度的人机协作重新定义工作方式。 我们正身处一个充满悖论的时代 ,当信息过载成为常态,能够整合碎片、简化流程的工具将释放用户的创造力,让专注和效率回归到核心工作本身。
02腾讯推出命令行编程工具 CodeBuddy Code,支持微信登录
腾讯近日发布了 CodeBuddy Code,这是一款基于命令行的 AI 编程工具。用户可以通过自然语言指令让工具自动完成代码生成、依赖安装、测试运行和调试等一系列开发任务。 “你在命令行里面用最自然的语言告诉它你要干啥,它就会自动帮你完成后续的一系列动作” ,这大大简化了开发流程。
CodeBuddy Code 支持微信登录,分为国内和国际两个版本,主要区别在于使用的 AI 模型不同。国内版本目前支持 DeepSeek v3 模型,未来将增加更多模型选择。安装过程简单,只需通过 npm 安装即可使用。 “安装好以后,打开你的终端,运行下面这行命令就能安装上了” ,降低了使用门槛。
在实际测试中,CodeBuddy Code 表现出了较高的工作效率。一个图片处理服务的开发任务仅用 15 分钟就完成了,包括生成代码、搭建服务和功能测试。工具还能理解复杂需求,如批量生成不同姿势的图片或设计带有公司 logo 的周边产品。 “5 种不同的姿势,非常完美,整个过程我就说了一句话” ,展示了其强大的自动化能力。
虽然工具在稳定性方面还有提升空间,偶尔会出现理解
03金融智能创新大赛展现中国 AI 应用实力
AFAC2025 金融智能创新大赛成为观察中国 AI 应用进展的重要窗口。11 支获奖团队的项目覆盖反洗钱、信贷风控、票据中介识别等核心金融场景,技术方案兼具前沿性与实用性。 “在这场竞赛中,中国跑在了前列” ,评委 Roselake Ventures 合伙人阳靳光的评价点明了中国团队在落地速度上的优势。
徐周明父子的“反洗钱 3.0”方案颇具代表性。通过
跨界融合成为另一显著特征。光通科技用自研 2Tbit/s 光模块搭建金融信息高速公路;岙邗科技将卫星遥感引入信贷风控,使台风灾害赔付周期从数月缩短至数小时;图盾科技则凭借图计算技术,将风险识别率从行业平均 10%提升至 50%以上。 “我们的技术在百万级数据集上 2 秒内挖掘出 5 个节点的时序模式” ,负责人秦宏超的案例展示了技术突破对效率的颠覆性提升。
大赛也呈现出多元包容性。大三学生李天一的团队开发手语实时转文字应用,虽与金融关联较弱,却体现了 AI 的社会价值。评委们不仅提供技术指导,更帮助团队对接资本与市场,如建议遥感数据采用“存算分离”模式规避合规风险。
这场赛事已超越单纯竞赛,成为连接技术、资本与产业的平台。从海外人才“归巢”创业,到硬科技项目对接长三角资源,AFAC 正推动中国 AI 应用从实验室加速走向真实场景。正如评委所言,这种集中爆发并非偶然——政策支持、市场需求与技术积累共同构成了中国 AI 应用的独特土壤。
04Excel 引入 COPILOT 函数:AI 直接嵌入表格处理数据
微软近日为 Excel 引入全新的 COPILOT 函数,将 AI 能力直接嵌入电子表格。用户只需输入自然语言指令,AI 就能自动完成数据整理、内容生成、情感分析等复杂任务。 “这将永远改变数据分析。让 Excel 再次伟大” ,一位网友如此评价这一功能。
传统数据处理往往需要手动编写公式或借助外部工具,而 COPILOT 函数彻底改变了这一流程。例如要汇总机场代码,用户只需输入需求,AI 就会自动生成清晰列表。该函数还能与 IF、SWITCH 等现有 Excel 公式协作,无需改变表格结构即可添加 AI 功能。
使用方式非常简单:在单元格输入=COPILOT(提示语, 【数据范围】)即可。比如=Copilot("Classify this feedback", D4:D18)能自动将用户反馈按情感分类。微软特别强调隐私保护,承诺个人数据仅用于生成结果,不会用于训练模型。
目前该功能每 10 分钟限 100 次调用,每小时不超过 300 次。微软表示正在改进大数组支持、模型性能等功能,未来还会增加联网能力和日期格式处理。YouTube 博主 Kevin Stratvert 的教程展示了如何用 COPILOT 快速完成饼干类型描述、用户情绪分析等实际任务。 “Copilot 可能会返回类似以下的结果” ,文章用一个咖啡机反馈案例展示了 AI 如何分分钟完成人工需要数小时的工作。从头脑风暴到数据摘要,从分类整理到表格生成,COPILOT 正在重新定义电子表格的使用方式。对于经常处理数据的职场人士来说,这无疑是一个重大效率提升工具。
05Sebastian Raschka 发布大型语言模型架构对比视频讲座
Sebastian Raschka 近日将其关于 11 种大型语言模型(LLM)架构 的对比文章升级为视频讲座形式,内容涵盖 DeepSeek V3/R1、OLMo 2、Gemma 3 等主流模型。他在社交媒体透露,视频已同步上传至 YouTube 并添加章节标记,方便观众按需学习。
网友 @uripont 称赞该视频将成为与 @karpathy 作品齐名的「必看内容」,Sebastian 则补充说明其 GitHub 仓库已包含 GPT-2、Llama 3 等模型的从零实现代码。当被问及架构设计空间问题时,他回应称当前视频已覆盖
06北大张铭实验室:从顶会论文到百亿企业的孵化器
今年夏天,北大张铭教授团队与 DeepSeek 合作的原生稀疏注意力模型(NSA)斩获 ACL2025 最佳论文,这是该实验室十年内第二次获此殊荣。2014 年,他们已在 ICML 上实现中国大陆学者最佳论文零的突破,那篇奠基性论文至今被引用逾 400 次。 “科研突破就是“尖顶破天”,创业也需要同样的逻辑” ,张铭这样概括她的培养理念。
这间实验室走出了多位学术与商业双栖人才。ICML2014 最佳论文一作唐建现为加拿大 Mila 研究院终身教授,同时创办 AI 制药公司;安克创新创始人阳萌大二就进入实验室,如今身价数百亿;天眼查创始人柳超、Alluxio 创始人李浩源等均从这里起步。实验室毕业生创办的企业总估值已超千亿,2023 年成立的北大-安克大模型联合实验室更实现了产学研闭环。
张铭将科研培养延伸到中学阶段,通过“英才计划”带领高中生参与实际研究。学生覃义方高中入组,大四已有两篇 CCF A 类一作论文;孙工博高中时期即获得有“小诺贝尔奖”之称的 ISEF 大奖。 “是在全球可能就是几个人在那突破,去刺破未知的空间” ,她这样描述博士研究的本质。
作为 Google Scholar 被引超 2.3 万次的学者,张铭主持的《科技创新与创业》课程已坚持十余年,系统化训练学生的科研思维和创业能力。她认为批判性思维和敢为人先的魄力具有普适价值,这种理念使实验室同时成为学术突破的发源地和商业领袖的摇篮。从理论创新到产业落地,再到青少年培养,张铭团队构建了完整的人才成长生态。
07Meta Superintelligence Labs 推出语言自博弈技术
Meta Superintelligence Labs 最新推出了一项名为 语言自博弈 的技术,该技术能够实现 无数据训练 ,为人工智能领域带来了新的突破。这一创新方法通过让模型自我对弈来提升性能,避免了传统训练中对大量标注数据的依赖。
与此同时,关于 Meta 公司名称的讨论也引发了关注。有人调侃道,既然 Facebook 押注元宇宙时改名为 Meta,现在押注超级智能(superintelligence),或许应该改名为 Super。
08豆包 Seedream 4.0 图像模型深度评测:精准编辑与推理能力解析
豆包 Seedream 4.0 是一款定位为“生成与编辑一体化”的图像模型,与 Gemini Nano Banana 具有相似功能。测试显示,它在精准指令编辑和特征保持方面表现优异。 “无论是角色外形还是画面细节,都能比较稳定地延续下来,尤其在跨风格场景里,角色不容易“变脸” 。例如,根据头像生成身体并保持面部特征,或按要求添加咖啡、更换背景等操作都能准确完成。
在推理能力方面,Seedream 4.0 对模糊需求的理解显著提升。 “对模糊的创意描述能自动补充分镜元素,和之前「词对图」的堆砌相比更有整体感” 。测试中,模型能根据指令打开餐盒、插入吸管、添加番茄酱,甚至调整发型和鞋子,展现出强大的语义理解和场景构建能力。
与 Gemini Nano Banana 的对比显示,两者在多图融合、2D 转 3D 等功能上各有千秋。Seedream 4.0 在图像编辑和控制方面表现接近,但 Nano Banana 在面部细节保持上略胜一筹。不过,Seedream 4.0 在中文支持和使用体验上更符合国内用户需求,提供了更便捷的操作入口和免费使用选项。
总体而言,Seedream 4.0 已具备与国际先进模型竞争的实力,尤其在中文场景下的实用性和易用性优势明显。对于需要高效图像编辑和创意实现的用户来说,它是一个值得尝试的选择。
09AI 专家探讨通用人工智能时代的识别标准
在 AI 领域的最新讨论中,Peter H. Diamandis 提出了一个引人深思的观点:随着 AI 承担更多劳动,传统的「996」工作文化可能会逐渐消失。与此同时,Jeff Clune 和 Dan Roy 就如何识别通用人工智能(AGI)展开了深入对话。Clune 认为,一个能通过高质量
10大模型在 PyTorch 算子编写中的表现与挑战
大模型(LLMs)在编写正确的
BackendBench 评估工具的出现,为开发者提供了一个可调试的后端环境,使得生成的内核更易于检查和分享。这一工具的开发,标志着大模型在代码生成领域的应用又向前迈进了一步。
11上海交大开源端侧 Agent 工具链 MobiAgent,性能超越 GPT-5
上海交通大学 IPADS 实验室近日开源了名为 MobiAgent 的移动端智能体全栈工具链。这套框架首次完整开放了从数据收集、模型训练到手机部署的全流程,使普通开发者也能构建专属 AI 助手。 “从收集手机操作轨迹数据开始,到训练出一个能听懂自然语言指令、帮你处理日常事务的专属 Agent,再到最终将它部署在自己的手机上,现在,人人都能上手 DIY。” MobiAgent 采用“三人小组”架构:Planner 负责任务拆解,Decider 决定操作步骤,Grounder 执行具体点击。这种分工设计使 7B 规模的模型在国内 Top20App 测试中,任务完成度超越 GPT-5 和 Gemini2.5Pro 等闭源大模型。
团队还开发了独特的“潜记忆加速器”AgentRR,通过记录操作轨迹实现动作复用,将高频任务性能提升 2-3 倍。为准确评估模型能力,团队创建了 MobiFlow 评测基准,覆盖社交、购物、外卖等主流应用场景。
测试显示,MobiAgent 在复杂任务中表现突出,且能正确终止任务,而 GPT-5 在 11 个 App 上出现了无限循环问题。 “MobiAgent 的出现,不仅在性能上树立了新的标杆,更重要的是,它通过开源整个技术栈,极大地降低了定制化、私有化移动智能体的门槛。” 该项目的开源意味着移动端 AI 助手开发门槛大幅降低,普通用户也能训练个性化 Agent。随着技术普及,“能动口就不动手”的智能交互方式或将很快成为现实。
12智能体管理者的三大核心能力
微软 Copilot Studio 高级产品营销经理杰克·罗博坦指出,未来员工的核心竞争力将转向智能体管理能力。 “未来简历价值的评估,将不再局限于个人经验与技能,更重要的是你构建智能体的专业能力” 。这种能力包含三大核心要素:战略性组建团队、清晰化沟通管理、智能化任务分派。
组建智能体团队需从具体业务场景切入。用户可通过 Microsoft 365 Copilot 创建问答型智能体,例如让智能体分析市场研究报告并提炼关键结论。罗博坦强调:“智能体必须聚焦具体业务痛点,始终紧扣实施动因与价值产出”。在委派环节,需根据任务性质配置人机协作比例——重复性工作可高度自动化,战略决策则需保留人工监督。
管理智能体的关键在于持续优化。 “智能体将逐字执行指令,这还能有效完善管理者的沟通精确度” 。通过设定明确目标、提供执行背景、指定数据来源和定义结果标准,管理者能提升智能体效能。绩效评估需关注实际业务价值,如成本降低、收益创造等指标,最终实现智能体经验的规模化复制。
这一方法论适用于各层级员工,标志着职场能力评估体系的根本转变。随着人机混合团队成为常态,智能体管理能力或将决定个人与企业的竞争力边界。