
SERVICE PHONE
363050.com发布时间:2025-07-29 15:23:47 点击量:
哈希游戏,哈希博彩平台,比特币哈希游戏,区块链博彩,去中心化博彩平台,可验证公平平台,首存送88U,虚拟币哈希娱乐
|黄文涛 阎贵成 程似骐 崔世峰 贺菊颖 黎韬扬 刘双锋 刘永旭 庞佳军 陶亦然 王在存 许琳 许光坦 杨艾莉 叶乐 应瑛 于芳博 袁清慧 赵然 朱玥
500页深度报告,40万字深度解析,以全球化视野系统解码全球人工智能产业最新发展脉络。本文是报告第三章:人工智能应用发展趋势及展望 上篇。
我们正处在一个关键的转折点,从移动互联网时代迈向一个由人工智能定义的全新时代。本次转型的核心并非简单的功能迭代,而是一场深刻的架构和战略革命,其颠覆性可与从桌面到移动的转变相提并论。在PC和移动互联网时代,诞生了一系列世界级的爆款应用:如PC端的微软Office、谷歌搜索、Youtube、Photoshop等;移动端的Facebook、Uber、Google Map、抖音、微信、淘宝等。每一次技术变革带来的是软件范式的重构,全新的交互体验,以及大量新的爆款应用的诞生。本章我们将梳理C端AI应用的发展,探寻下一个世界级应用的诞生。
对于投资者而言,理解这一范式转移的本质,是构建未来十年投资框架的基石。本节将深入解构其技术基础,并探讨衡量成功的标准如何随之演变。从移动优先到AI优先:解构架构的转变。当前最关键的概念区分在于“AI赋能(AI-enabled)”与“AI原生(AI-native)”。在移动优先时代,AI通常被视为一个附加功能,通过云端API“嫁接”到传统应用架构上。然而,AI原生应用则从根本上颠覆了这一模式,它们将AI作为其架构的核心与基石,彻底改变了产品的核心能力与用户体验。
软件开发的范式演进:从代码到提示词。参考Andrej Karpathy提出的软件进化框架,它将软件开发划分为三个时代:
软件1.0 (Software 1.0) = 代码 (Code):这是传统的软件开发模式,程序员使用Python、Java等语言编写明确的指令来构建程序。其逻辑是基于规则和人工编程的 。
软件2.0 (Software 2.0) = 权重 (Weights):随着机器学习的兴起,开发模式转变为通过在大型数据集上训练神经网络来“编程”。程序的行为不再由显式代码决定,而是由模型学习到的“权重”决定。例如,图像识别模型就是通过学习数百万张图片的权重参数来实现其功能的 。
软件3.0 (Software 3.0) = 提示词 (Prompts):这是由大模型开启的最新范式。现在,开发者可以通过自然语言“提示词”来对一个预训练好的庞大模型进行编程。正如Karpathy所言,“最热门的新编程语言是英语” 。LLM本身就像一个可编程的神经网络,通过精心设计的指令和示例来引导其完成特定任务 。
核心差别:传统移动应用是为特定平台(如iOS或Android)构建的,其核心逻辑是预设的、基于规则的,尽管它们可以调用设备硬件,但其本身不具备智能。AI赋能应用只是将AI作为一项附加功能。相比之下,AI原生应用从一开始就将LLM作为其最基本的组成部分,这意味着从用户界面(UI)到数据处理的整个架构,都是为最大化AI能力而优化的。这种“内置智能”确保了决策、个性化和自适应响应能够无缝集成在应用的核心逻辑中。
而AI原生软件将LLM视为一种新型的操作系统(OS)。在这个模型中,LLM不仅仅是一个可调用的API,还是整个计算生态的中心。它拥有自己的“内核空间”(模型本身)和“用户空间”(提示词),并能通过外部工具和API与外部世界交互。我们目前正处于这个新OS的“大型机与分时共享时代”, 通过网络流式传输进行交互,访问云端昂贵的、集中式的计算资源。
为什么我们要在介绍应用之前先谈架构范式的转变,架构差异对于应用层到底有何影响?
1)首要的影响是大幅降低构建应用的门槛(但需要注意维护门槛没有降低)。简单来说,AI Coding Assistant/Vibe Coding大幅降低从0构建MVP(Most Viable Product)的难度,更重要的是创意/思路而非编程的过程。开发者不再需要从零开始构建复杂的逻辑,而是可以专注于定义目标和约束条件(类似于产品经理的角色),让LLM负责具体的执行路径,考虑到产品经理中仅有约5%具备比较熟练的编程技能,将这部分调动起来可以显著降低沟通成本,AI应用的开发周期有望缩短。
2)改变交互形式,从搜索、推荐进一步拓展至多步骤决策&执行。过去信息的交互主要就是搜索/推荐信息流,而现在AI可以代表用户完成复杂、多步骤任务决策或执行。例如,用户在旅游平台不再需要手动搜索航班和酒店,规划行程,而可以直接唤起AI助手 “帮我预订下周末去东京性价比最高的旅行方案”这样的指令,然后自主地浏览网站、比较价格、完成预订。这种从被动响应到主动执行的转变,是其核心价值的跃迁。与搜索到推荐的逻辑类似,均进一步降低用户的交互成本,
3)简化UI。过去一些功能庞大的应用习惯于All-in-One的设计,随着业务扩张,应用交互界面逐渐臃肿,不论是To B的SAP/Salesforce,还是To C的支付宝美团等,交互和功能界面都越发复杂,对于新用户的学习成本较高。而LLM即OS将语言用户界面(LUI)推向前台,聊天框成为新操作系统的终端,用户通过对话直接与系统的核心进行交互。尤其是对于To B软件而言,比起重构软件设计,在不大幅修改后端代码的情况下调整UI降低交互门槛可以迅速追赶与新兴App的差距。
目前AI应用的渗透率如何:当前相当于PC互联网 2003-04年水平。我们进一步的问题是理论上AI原生应用将对移动互联网/软件生态产生重大变革,我们目前身处这一周期的什么阶段对于产业趋势研判至关重要。
结合Pew Research的样本调查,截至2025Q1,至少34%的美国成年人已经使用过ChatGPT,考虑到2022年11月ChatGPT发布,大约相当于美国PC互联网 2003-04年的渗透率水平,也就是说,ChatGPT仅用 26个月就大致达到了PC互联网10年的渗透率水平。
根据Questmobile,目前国内AI 原生App 的整体月活约为 2.72 亿,低于移动垂类应用 TOP 10 中的任何一个。整体AI 原生App 月活虽仅为移动 App 的 1/5,但 2025 年同比增速呈爆发式扩张。其中 2 月单月环比暴涨 85.5%,主要原因受益于1 月底 DeepSeek-R1的推出。DeepSeek在短短 4 周内 MAU 破 1.9 亿,大量第三方 App 接入 DeepSeek API,当月就有 20+ 款工具把 DeepSeek 设为默认模型,带动全行业放量规模扩张,这个供给侧冲击把AI原生 App 从早期攀升曲线直接推入大众市场,预计 2025 年下半季度增速会继续收敛,预计有望在下半年突破3亿,对应全网用户约21%渗透率。
从Sensor Tower统计的应用内购收入来看,AI应用占据整体应用(剔除游戏)比例约1.73%。而如果从AI应用的下载量来看,2024年AI应用下载量达14亿次,占据全球所有应用下载量约1.0%,可以看出AI应用的付费能力/转化效率明显高于传统应用。
海外AI应用类型分类:Chatbot及图片/视频类商业化占比最大,其余垂直赛道尚处于孵化阶段。当前,AI应用市场正经历着爆炸性增长,各行各业都在快速尝试通过引入AI功能优化商业模式,目前看内容创作工具商业化进度最快,例如Sensor Tower统计的收入结构中,摄影及美颜相机类、AI生图App占AI整体商业化42%,而Chatbot、陪伴、通用助手类App商业化占比约26%,剩余主要是垂类AI应用,例如语言学习、植物养护助手、营养师助手、翻译助手、AI音乐、写作助手、数理解题等。
AI应用分类:我们可以将当前市场上的AI应用大致归为以下几类:①通用AI助手(General AI Assistants):如ChatGPT,这类横向平台旨在服务广泛的用户查询需求,成为大众接触AI的主要入口。②垂直领域智能体(Vertical-Specific Agents):针对特定行业深度优化的AI工具,例如服务于法律行业的Harvey,以及应用于医疗诊断、金融欺诈检测等领域的专用模型。③创意与开发辅助工具(Creative Co-pilots):专注于内容创作的AI,包括文本、代码、图像和视频的生成,典型代表有Midjourney和GitHub Copilot。④企业工作流自动化(Enterprise Workflow Automation):深度集成于企业内部流程,用于自动化任务、分析数据和提升运营效率的系统。
C端AI 应用渗透率显著高于B端(以美国为例)。根据U.S. Census Bureau,美国企业目前采用AI相关技术例如机器学习、NLP、虚拟代理、语音识别等的比例达9.2%,低于上文提到的C端~34%渗透率水平。按规模划分,大型企业(250人及以上)采用率最高,截至6月底的采用率达12.5%,较假期前顶峰14.9%略有回调,但仍然明显高于中小企业的群组水平。注意到,2024年9月后大型企业的AI采用率与中小企业逐步拉开差距,反映前期大量PoC项目开始转向部署,对应SaaS层Snowflake、Datadog等企业披露AI/ML收入开始占据相对显著的比例(MSD)。
全球AI流量排名:上图为Similarweb的全球AI网页端流量排名,第一的ChatGPT月度访问量达54亿次,远远领先了其他竞争对手。ChatGPT已形成明显的用户规模优势,占据行业主导地位。排名第二和第三分别为Bing和Canva,但与ChatGPT差距仍较为显著。排名前10的还有DeepL、Deepseek、Character AI等。
ChatGPT引领AI应用收入高增长。公开数据显示(,ChatGPT 在 2024 年创收约27亿美元,约占 OpenAI 当年总营收的 75%,付费用户已突破1000万,OpenAI目前的毛利率约为 40%,低于云软件平均水平的 74% 左右,但随着推理效率的升级,其利润率有望提升。快速缓存等新基础设施和架构改进持续降低每个代币的成本。该公司预计,到 2029 年,利润率将升至将近 70%。 展望未来,OpenAI有望实现其2025年 127亿美元的年化营收目标,并维持其长期预测,即到2029年营收达到1250亿美元,到2030年营收达到1740亿美元。该公司预计到2030年,月活跃用户将达到30亿,日活跃用户将达到9亿。预计到2029年,免费用户的盈利每年将达到250亿美元,可能通过购物整合、广告等。该公司将继续探索其他盈利途径,包括AI芯片和机器人技术。
根据IDC报告,2023年下半年开始,面向大模型训练和推理的GenAI IaaS市场从无到有,实现了爆发式增长,下半年规模达到32.2亿元。这标志着生成式AI的需求已成为市场增长的核心引擎。2024年GenAI持续高速增长,上半年同比增长203.6%,下半年同比增长165.2%,市场占比在下半年首次超过70%,显示出市场需求进一步向生成式AI集中。与此同时,传统的非生成式AI IaaS(如用于渲染、传统机器学习等)市场规模出现同比缩减,表明企业的算力投资和资源正在快速向生成式AI领域倾斜。
2023年之前,GPU IaaS的需求相对分散。主要来自几个领域:①传统AI:用于计算机视觉、自然语言处理等模型的训练和推理。②科学计算:高校和研究机构用于物理模拟、基因测序等。③图形渲染:用于影视特效、建筑设计等。④游戏/云游戏:提供云端游戏服务。 这些需求虽然也在增长,但没有出现单一的杀手级应用。
2023年至今:生成式AI (GenAI) 成为需求的绝对主导力量,导致市场需求结构急剧倾斜。
训练需求爆发:从2023年开始,中国“百模大战”引爆了对超大规模GPU集群进行大模型(LLM)训练的需求。这种需求追求极致的算力、高速的互联(如NVLink, RoCE)和长周期的稳定运行,成为市场最“重”的部分。
推理需求崛起:随着大模型完成训练并投入应用,从2024年下半年到2025年,市场需求重心开始向推理 (Inference) 端倾斜。推理需求呈现出高并发、低延迟、碎片化的特点,对GPU的利用率和性价比提出了更高要求。IDC数据显示,2024年下半年,GenAI IaaS的市场占比已超过70%,并且这一趋势仍在强化。
传统需求被挤压:在生成式AI的虹吸效应下,其他AI应用(如传统CV、NLP)的IaaS市场规模甚至出现了同比萎缩,表明企业的算力预算和资源正战略性地转移到生成式AI上。
市场格局方面,竞争从比拼GPU规模/成本演化至算力、平台、生态综合竞争。1)华为云强势崛起:凭借其“云+芯”的独特优势,华为云通过昇腾算力服务快速抢占市场份额,尤其是在政企和国企市场。2)运营商云异军突起:中国电信(天翼云)、中国移动(移动云)等运营商凭借其国家级的算力网络布局(“东数西算”)和国资背景,在算力基础设施建设上投入巨大,成为市场中不可忽视的新势力。
竞争焦点转移:竞争不再仅仅是GPU资源和价格的竞争,而是演变为“算力+平台+生态”的综合竞争。谁能提供更稳定、更多元的算力,拥有更好用的AI开发平台,并构建起更繁荣的大模型生态(吸引更多模型开发者和应用),谁就能在未来的竞争中占据优势。IDC数据显示,阿里云、华为云和火山引擎(Volcengine)在2024年的AI IaaS市场中位列前三,市场集中度依然很高,但追赶者势头凶猛。
介绍完C端AI应用的范式转移和主要渗透情况,接下来我们将逐个分析目前主要C端应用的发展情况,包括AI搜索、AI营销、AI虚拟陪伴等。
从关键词检索到大型语言模型(LLM)驱动的生成式搜索的转变,正在永久性地改变用户行为,催生了“零点击经济”(Zero-Click Economy),对传统以流量为基础的商业模式构成了生存威胁。以谷歌为代表的现有巨头采取了防御性姿态,通过将生成式AI整合进现有产品(如AI Overview、AI Mode)来维持其市场主导地位。与此同时,新的市场进入者和内容平台,如抖音和知乎,正利用其独特的专有数据和多模态交互能力,对传统搜索格局发起挑战。
传统搜索引擎系统架构 = 网页爬虫 + 构建索引 + 排序(召回、粗排、精排、重排) + UI(搜索结果页)。传统搜索技术的核心是关键词匹配,这种方式常常无法准确捕捉用户的真实意图,导致搜索体验不佳,用户需要通过多次尝试和浏览大量无关链接才能找到所需信息。语义搜索的出现是理解用户意图的关键第一步。它利用自然语言处理(NLP)和机器学习技术,不再仅仅匹配字面词汇,而是深入理解查询背后的语境和含义,从而显著提升搜索结果的相关性。
以GPT系列为代表的大型语言模型的发布,标志着搜索领域的根本性转折点。搜索的功能从仅仅检索已存在的信息,演变为能够生成全新的、经过综合处理的答案。这彻底改变了搜索引擎的核心价值主张,从一个信息目录转变为一个知识伙伴。
AI搜索架构:检索增强生成(Retrieval-Augmented Generation, RAG)。该框架结合了两种核心能力:一个检索模型(通常利用语义搜索和向量嵌入技术,从海量数据中快速找到与用户查询最相关的文本片段或文档)和一个生成模型(即LLM,负责将检索到的信息进行理解、综合,并生成一段通顺、连贯的回答)。RAG架构的至关重要之处在于,它将LLM的生成能力“锚定”在真实、有时效性的外部知识上,从而有效缓解了大型模型固有的“幻觉”问题,即编造事实的倾向。参考Meta GR-24模型,构建索引 + 排序(召回、粗排、精排、重排)是LLM改造的核心环节。据Google官方,Google于2019年10月启用BERT模型进行检索(排序的过程)。
索引+排序环节目前业界主要采用三种技术路径:(1)在模型预训练阶段即融入检索机制,使LLM具备原生的检索能力;(2) 通过轻量化的微调(fine-tuning)来提升LLM利用检索结果的效率;(3)利用LLM的零样本(zero-shot)能力,在生成阶段通过精心设计的提示词(prompt)直接引导模型整合外部信息。这三种路径反映了不同平台在技术投入深度和实现复杂度上的战略选择。
Google的应对:谷歌通过将其最新的Gemini模型深度整合到搜索服务中,在搜索结果顶部直接提供由AI生成的摘要,即“AI Overviews” 。这是一个典型的防御性举措,旨在通过将生成式体验吸纳进其庞大的生态系统内部,来应对外部挑战并维护其市场霸主地位。其技术亮点包括处理复杂查询的多步骤推理能力和多模态特性。
生成式AI正在解锁全新的搜索用例,通过提供更相关、更具上下文感知能力的答案,极大地提升了用户体验。这种效用上的阶跃式变化正在提升“信息检索”这一行为本身的价值,推动用户在更广泛的场景(如购物、研究、生产力任务)中进行更频繁、更深入的互动。目前,大多数用户仍处于探索使用生成式AI工具进行生产力和研究的早期阶段,但随着可靠性和实用性的持续提升,预计其应用将扩展到更广泛的人群。
例如,当用户输入一个复杂的查询,如“为有孩子的家庭规划一次为期三天的旧金山最佳旅行路线,需包含小众景点和当地美食”,传统的搜索引擎会返回一系列博客文章、旅游指南和论坛链接,用户需要自行筛选和整合信息来制定行程。而借助AI Overviews,搜索引擎现在可以直接在结果页面提供一个结构化的、逐日安排的行程,将顶级景点、小众宝藏和当地餐饮推荐清晰地整合在一起,以一种易于阅读的格式直接满足用户的意图。
商业化方面,我们看到AI搜索并没有蚕食传统搜索的市场规模,而是贡献更多的增量市场。我们认为AI对搜索市场的侵蚀被夸大了,根据Semrush披露,AI Chatbot如ChatGPT的query长度平均为23个单词,而搜索query的平均长度一般在4个单词左右。另外,在搜索意图上,只有 30% 的 ChatGPT 提示属于导航、信息、商业和交易等类别(搜索引擎更容易做商业化)。这反映AI推动搜索市场扩大,虽然OpenAI的ChatGPT绝对流量规模更大,但其中大多数query与搜索结合难度高,线%左右,因此对应搜索市场份额仅有Google的2.2%,Perplexity则为0.1%。我们确实看到AI搜索迅速增长,但Google的AI Overview/Google Lens/Circle to Search也在快速渗透,虽然Google很难在AI搜索市场维持80~90%的份额,但增量市场上Google仍可以依托搜索引擎的技术和渠道优势维持地位(不至于完全错失AI搜索的机会)。
早期数据显示AI Overview对于搜索市场更多贡献增量而非瓜分存量。就AI Overview而言,在美国/印度市场,使用AI Overview后,用户体验改善带来10%额外搜索需求(以search query计算)。结合Sensor Tower数据,用户下载ChatGPT后,尽管ChatGPT用量时长在2025年4月同比大幅增长~98%,但这批用户在Google等搜索引擎的时长并未显著下降,仅轻微下降,反映大部分时长/用量的增长都是净新增,至少并非来自存量搜索引擎用量的流失,这与Google披露的AI Overview趋势相互匹配。
因此,我们认为,搜索本质是个效率工具,比拼的是更快更准确的匹配信息需求,尽管用户的行为反馈路径相比于推荐引擎更慢。Google过去二十多年不断推动用户从文字搜索,拓展至到复杂语句匹配,图片/视频搜索等,搜索引擎也在不断扩大用户心智,过去Google高管曾反复提及,目前搜索引擎能满足用户需求的比例仍然相对较低,还有大量需求无法被搜索引擎满足。搜索在解决信息匹配方面效率强于社交、电商等垂类平台,仍然有望受益于技术进步带来的用户心智增强。
结构上,我们需要对比AI搜索与传统搜索的差异。大体上,AI搜索通过改变产品交互形态(从搜索框下方展示8-10个网页链接,转换为AI摘要+附带链接),从而大幅改变用户行为习惯,例如过去以点击网页,尤其是前三个网页为主,转向阅读摘要,若问题解决则迅速离开或转向下一个问题,因此搜索结构中点击率大幅下降,零点击率及转向下一次搜索的比例则有所提升。
Google 2025年I/O大会提到AI Overview实际上提升了用户~10%的搜索请求,根据SEO机构的研究,Google AIO发布后首个关键词的点击率平均下降34.5%,而所有关键词的平均点击率下降约15.5%,其中非品牌关键词点击率下降约20.0%,品牌关键词点击率提升18.7%。
将以上数据代入用户搜索行为模型,用户搜索不仅仅是一个简单的单次概率问题,而是一个典型的序列概率模型(简化的马尔可夫链模型)。用户在搜索后的行为会进入一个循环,直到他们“点击”或“放弃”(Nothing),这两个是收敛状态。我们假设用户的行为习惯在每一次连续的搜索中保持不变。也就是说,在第二次、第三次搜索后,用户选择“点击”、“什么都不做”或“再次搜索”的概率与第一次是相同的。
一个会话中最终发生点击的总概率P(Total Click)是以上所有可能性的总和,这构成了一个无穷几何级数:
引入AI Overview后,第三方研究机构观察到用户点击率下降约15.5%,但总搜索次数提升10%(Google官方数据),因此我们代入数据以反向推测单次搜索概率模型的变化。对于美国用户而言,
尽管CTR下降15.5%,但带动搜索次数提升,综合考虑后实际点击数量下降幅度相对可控,在3-4%区间。这实质上对广告漏斗模型产生冲击,Top funnel的流量下降,但导入的流量意图更明确,转化率有所提升。目前渠道反馈,在AI Overview内的广告CTR提升~25%,即从16%提升到20%,CPC提升8-12%,ROAS提升20-30%。管理层在业绩会指出AI Overview与此前传统搜索的商业化效率基本一致。
Perplexity AI:Perplexity AI是由前OpenAI与谷歌工程师Aravind Srinivas等团队于近年开发的对话式AI搜索引擎,其核心功能是通过多模型集成架构(如GPT-4、Claude 3、Mistral Large等) 实现自然语言交互与实时网络搜索的深度融合,支持用户以日常对话形式提出查询,系统通过语义理解+实时网页抓取生成结构化答案,并自动附权威来源引用链接,同时提供双模式搜索:快速搜索(简洁答案,响应速度1秒)以及专业搜索(深度追问,主动澄清模糊需求)。应用主要覆盖学术研究、商业决策及创意生产,支持文件解析(PDF/PPT摘要)、内部知识库集成及团队协作空间,成为挑战传统搜索引擎的AI原生信息获取范式代表。
夸克:夸克AI搜索是由阿里巴巴集团推出的新一代智能搜索引擎,其以“深度思考引擎”技术为核心,用户可通过文字、语音或图像提问,系统在毫秒级响应内调用教育、健康、办公等垂类工具生成结构化答案,并凭借零广告设计与跨终端协同(手机/PC无缝流转),在5月达到1.5亿MAU,连续三月位居全球AI产品MAU榜前三,成为重塑AI搜索市场格局的强大力量。
百度AI搜索:目前百度在搜索框下方自动嵌入信息摘要卡片,帮助用户快速过滤信息,完成路径规划。但目前百度AI提供的摘要并未与地图、酒店、餐饮等模块集成,导致用户实际上无法完成从行程规划到预定酒店、餐馆等。截至2025年4月,百度35%的搜索中包含AI生成回答,大部分是AI生成摘要。
抖音AI搜索:抖音的AI搜索属于独立页面,类似于单独Chatbot,提问后全网搜索+抖音生态内容调取,与百度类似,缺乏一站式执行/决策能力(与本地生活模块尚未集成),但优势在于附带生态内容,可以辅助用户决策。
长期以来,传统营销活动受制于几大核心效率瓶颈,这些瓶颈限制了其投资回报率(ROI)和战略灵活性:
1)目标客群定位模糊:无论是电视、报纸等传统大众媒体,还是早期的数字广告,大多依赖宽泛的人口统计学数据进行受众划分。这种“广撒网”的策略导致大量广告预算被浪费在非潜在客户身上,信息传递也因缺乏个性化而效果大打折扣。
2)营销效果归因与衡量困难:准确衡量营销活动的效果并精确归因转化,一直是营销人员面临的核心挑战。根据《2025中国广告主营销趋势调查报告》,营销效果难以测量和ROI难以提升,至今仍是广告主面临的前两大挑战。这使得预算优化和证明营销部门的商业价值变得异常困难。
3)内容创作成本高昂且速度缓慢:从商业摄影、广告文案撰写到视频制作,传统的内容生产流程不仅成本高昂、耗时漫长,而且难以根据不同渠道、地域和用户偏好进行规模化的个性化定制。
4)“反应式”而非“预测式”的战略局限:传统营销模式严重依赖历史数据,这使其在面对瞬息万变的市场环境和消费者行为时显得力不从心。例如,突发的宏观事件(如疫情)能在一夜之间颠覆消费模式,而依赖过去经验的企业则难以快速适应。
5)运营孤岛化:在传统组织架构中,市场、销售和客户服务等部门常常各自为战。市场部门引来的线索可能销售团队无法有效转化,而客服部门处理的投诉本可能通过更优的前端引导来避免。这种脱节导致了客户旅程的断裂和商业机会的流失。
1)规模化个性化体验:AI算法能够处理和分析海量的用户数据,包括行为数据、交易记录和实时互动信息,从而构建动态的、颗粒度至个人级别的用户画像。这使得企业能够大规模地提供定制化的信息、产品推荐和互动体验,显著提升用户参与度和转化率。
2)预测性分析与前瞻性决策:机器学习模型将营销从“事后复盘”推向“事前预测”。通过预测未来市场趋势、消费者购买行为、客户流失风险和潜在客户(Leads)的质量,AI帮助企业更科学地分配资源、优化库存管理,并采取前瞻性的干预措施。
3)全链路自动化与效率提升:AI技术能够自动执行大量重复性、耗时性的任务。这包括CRM系统中的数据录入和邮件跟进 ,全天候响应的客服聊天机器人 ,以及自动生成SEO文章、广告文案、图片和视频等营销素材。
4)实时优化与ROI最大化:AI使得营销活动的实时监控和动态调整成为可能。系统可以根据实时的广告表现数据,自动调整预算分配、优化广告创意和出价策略,从而最大化投资回报率。
针对传统营销一系列缺点,海内外巨头纷纷推出AI+营销的新产品:1)美国及全球领导者(平台型巨头):①Adobe:凭借其在创意软件(Creative Cloud)和客户体验管理(Experience Cloud)领域的绝对领导地位,Adobe将自家的生成式AI模型 Firefly 深度整合到其产品矩阵中。这构建了一个从内容创作、编辑、管理到个性化分发和效果分析的强大闭环生态系统。②Salesforce:作为CRM领域的巨头,Salesforce通过其AI平台 Einstein 和新推出的 Agentforce,将AI能力无缝嵌入到销售、服务和营销的各个环节。其战略核心是利用AI实现销售流程自动化、提供预测性洞察,并以结果为导向的AI代理来革新客户服务。③Figma:作为设计领域的颠覆者,Figma正大举投资AI,其 Figma Make 功能旨在将自然语言提示直接转化为可用的设计原型,极大地缩短了从创意到产品的路径。Figma的战略是利用AI巩固其在产品开发流程中的核心地位,并吸引更多非设计专业人士使用其平台。
2)中国的AI营销生态:①阿里巴巴:依托其强大的电商和云计算基础,阿里巴巴的AI战略深度服务于其商业闭环。核心产品包括阿里云AI平台(PAI)和模型服务百炼(ModelStudio),自研的通义(Qwen)系列大模型,以及面向商家的AI设计工具PicCopilot(万相台)和智能客服机器人阿里小蜜(AliMe)。②百度:作为一家将“AI-First”作为核心战略的公司,百度的AI能力围绕其基础大模型文心(ERNIE)构建。文心大模型不仅驱动着其核心的搜索引擎,还支撑着百度智能云以及包括百度地图、文心智能体平台在内的庞大应用生态。③腾讯:作为社交和游戏领域的霸主,腾讯将其混元(Hunyuan)大模型整合到微信、腾讯云等核心业务中。其营销解决方案TencentMarketingSolution和面向零售、时尚等行业的AI工具(如虚拟试衣),充分利用了其庞大的用户触点和社交数据。
一个核心的观察是,AI+营销领域的竞争护城河正在从“拥有最先进的算法”转向“拥有最佳的工作流整合能力和最丰富的专有数据”。尽管OpenAI等公司的前沿模型性能强大,但开源模型的快速发展正在使基础AI能力逐渐商品化。真正的、可持续的竞争优势,正由Adobe、Salesforce、阿里巴巴等平台型公司所建立。它们不仅提供AI功能,更是将AI无缝嵌入到客户既有的、不可或缺的核心工作流程中(如创意设计、客户管理、电商运营)。这种深度整合创造了一个强大的“数据飞轮”:平台利用其核心业务中积累的海量专有数据来微调模型,使其在特定任务上表现更优;而用户在平台内使用这些AI功能又会产生新的、独特的交互数据,进一步反哺和优化模型。这形成了一个正向循环,创造了极高的用户粘性和难以被新进入者复制的壁垒。
AI有望深度赋能营销行业,为行业带来新的发展机遇。人类与AI的三种交互方式——Copilot、Embedding和Agent——在交互模式、任务执行及自主性层面存在显著差异,我们认为Agent或将引领CRM行业发展:
1) Copilot:需用户提供明确指令(Prompt),通过实时交互辅助完成任务,如编程助手或销售策略生成工具。其核心价值在于提升人类效率,但决策权仍由人类掌握,适用于标准化程度高的场景。2)Embedding(嵌入式模式):AI作为后台系统集成到现有流程中,如搜索引擎推荐算法或CRM系统自动化规则。用户感知不到AI存在,仅通过结果优化体验,强调技术对现有业务的增强而非颠覆。3)Agent(智能体模式):具备自主决策与多任务执行能力,可独立规划并调用工具链完成任务,如自动处理客户咨询或供应链优化。其核心特征是“数字劳动力”,能突破人类能力边界,代表AI交互的终极形态,我们认为,Agent通过重构人机协作范式与商业模式,正推动CRM行业从“功能竞争”转向“数字劳动力竞争”,未来Agent或将成为CRM工具的重要变革以及未来趋势,有望带来行业的“效率革命”以及商业模式革新。
以Service Agent为例,其对传统客服市场的降本增效及行业定价模式的重构,反映了AI技术对商业逻辑的颠覆性影响:Service Agent通过自然语言处理(NLP)与知识图谱技术,实现客户咨询的自动化响应。这种效率跃升源于AI代理的边际成本趋近于零,支持7×24小时服务且无需额外人力投入。以Salesforce Service Agent每次1-2美金对话收费计算,相对于传统客服环节(年成本5万美金左右)单次对线%左右。传统订阅制(如按席位收费)逐渐被结果导向型定价(OBP)取代。如Salesforce Agentforce按对线/次),如ServiceNow采用“价值抽成”模式,保留客户增量价值的10%作为收益。这种模式将软件价值与业务成果绑定。
我们认为,AI Agent时代,头部CRM企业凭借其核心生态、数据、客户等优势有望强者恒强,市场份额集中度或进一步提升。AI Agent时代CRM行业正从“功能竞争”转向“生态+数据+AI”三维竞争。Salesforce凭借技术整合能力、行业专精度及生态协同优势,有望在未来三年内将市场份额持续提升,巩固其全球CRM市场绝对领导者地位。
AI广告——快手外循环信息流广告有望受益。AI对快手广告业务的带动,主要是影响外循环信息流广告:日均使用时长:AI有助于机器自动理解视频内容+打更细致的标签,用户刷视频更加匹配与沉浸,有望提升单用户时长。25-26年市场一致预期的时长稳定在129-130min左右,我们假设AI对时长有5-10%的带动效果,即25-26年,单用户使用时长有望达到135min、143min。eCPM:AI算法提升推荐精准度,广告用户的ROI提升,广告平台有提升广告单价的空间。目前快手的eCPM为15-16元/千次展示,假设AI对广告单价有5-10%的带动,25-26年eCPM有望提升到16.3元、17.6元。
Meta应用AI改造业务的主要方向仍然是推荐系统,其次是提升用户互动/内容生态。1)就推荐系统而言,目前Meta主要路线是将LLM改造以适用于视频推荐,未来目标是利用单一模型为Meta所有视频生态提供系统支持,目前在线%。因此增收逻辑 = 推荐系统更个性化 → 用户体验更好 → 用户时长提升 → 广告库存增加/广告点击率提升 → 广告收入提升。2)就内容生态而言,Meta主要引入聊天助理/信息流助手,提升用户交互体验,例如避免跳转Google搜索就可以在站内获取更多信息,并避免翻阅历史聊天记录查询过往信息。这一逻辑增收不明显,更多是提升用户体验。
推荐系统分为索引/召回/粗排/精排/重排,Meta提出的策略主要优化了特征处理(索引阶段)并间接影响后续的召回排序。1)索引是将视频打标签以匹配用户标签/兴趣。2)系统基于用户特征和项目特征的初步匹配,快速生成一个较大的候选集。特征抽取的质量直接影响到召回的效率和效果。3)粗排阶段会使用较为简单的模型和特征交互来缩小候选集的规模,去除明显不相关的项目。(算力需求少)4)精排阶段使用更为复杂的模型,如深度学习模型,来进行精确的排序。(算力需求大);5)重排阶段考虑更多的业务规则和策略,比如多样性和新颖性的保证。
Meta的GR-24预计能带来流量侧~9.4%的增长(相比于没有AI的流量),此前的AI算法提升幅度大致在6~7%。流量增长意味着广告收入增长,按4年计算ROIC大约为22%(AI Capex包含了部分Ad Tech的投入,实际LLM+推荐系统的ROIC更高)。此外,尚未被合理估计的是点击率/互动率提升(本轮AI算法提升~18.6%,可能带动广告转化率提升)。
Meta 2Q24 Earning Call Note:2Q24引入Facebook全屏视频,并采用统一模型推荐所有APP的视频信息流,用户互动(CTR、时长提升幅度已经超过过去从CPU向GPU过渡带来的提升)。
国内AI行业渗透率目前大约在5~10%。广告主的AI采用主要集中于内容生成,例如《2025中国广告主营销趋势调查报告》提到“54%的广告主每周使用AI工具”,是AI内容占比提升的基础。广告主们首先将AI作为提高生产力的工具,用于生成文案、图片等基础素材,这自然会推高AI生成内容在整体营销素材中的比例。在一些关键渠道,AI内容的占比已有明确数据支撑。以百度为例,其移动搜索结果2025年4月中已有35%包含AI生成的内容,这一比例在年初时还仅为22%,显示出极快的增长速度 。这表明,在头部平台的推动下,用户接触到的信息正被AI深刻地重塑。
未来AI工具有望拓展至广告投放,用户分析等。广告主对AI的最高期待集中在“广告智能投放与优化效率”、“用户洞察与数据分析”以及“产品创新”上。这些场景都与内容紧密相关——无论是优化投放所需的创意素材,还是基于用户洞察生成的个性化信息,都将进一步加速AI内容的生产和应用。
这种从“当前应用”到“未来期待”的转变,揭示了AI营销正从“辅助工具”向“核心决策引擎”演进的清晰路径。秒针系统的数据直观地展示了这一供需缺口:目前,仅有12%的广告主将AI用于广告智能投放和优化,但高达43%的广告主期待AI在此环节发挥更大作用;类似地,当前仅27%的广告主使用AI进行用户洞察与数据分析,而41%的广告主将其列为未来的核心期望。这种巨大的期望差,正是AI Agent等更高级AI应用形态的广阔市场空间。
AI Agent的崛起,有望将营销从“人机协同”推向“自主决策”,直接回应广告主对效率和效果的核心诉求。这一趋势将深刻影响不同规模企业的AI采纳节奏。根据亿欧智库的预测,大型企业(KA客户)将继续引领AI营销的渗透。其AI Agent的渗透率预计将从2024年的5%增长至2028年的25%。相比之下,中小企业(SMB)的渗透率虽然起步较低(从2024年的2%增长至2028年的15%),但增长同样迅速。值得注意的是,大型企业凭借其更高的付费能力和更复杂的业务场景,预计将贡献约79%的业务收入,成为AI营销服务商的核心价值来源。
更重要的是,AI Agent的普及正在对传统的软件即服务(SaaS)模式进行价值重构。当AI不再仅仅是生成内容的辅助工具,而是能够直接优化广告投放、提升转化率的自主系统时,其商业模式也必然从“按席位收费”转向“为结果付费”。亿欧智库的分析框架指出,这轮变革的核心在于:
定价模式颠覆:以Salesforce的Agentforce和Intercom为代表,按AI成功处理的对话或解决的问题数量收费的“效果付费”模式正成为主流。这直接将软件供应商的收入与广告主的营销ROI紧密绑定。
商业模式转型:软件供应商的角色从工具提供方,转变为深度参与客户业务流程、共担风险、共享收益的“业务合作伙伴”。
竞争格局重构:护城河不再是单一的功能点,而是由“数据飞轮、业务场景和原子化能力”共同构筑的生态系统。拥有海量数据和深度工作流整合能力的平台型公司将建立更强的竞争壁垒。
综上所述,AI在营销领域的渗透率提升,不仅体现在市场规模的扩大和内容生成占比的提高,更深层次的变革在于其应用场景的深化和商业模式的颠覆。从简单的内容生成工具,到能够自主执行复杂任务并为结果负责的AI Agent,这一演进路径预示着一个更加智能、高效且价值驱动的营销新时代的到来。
AI+销售/营销中长期有望成长为数千亿级别市场。根据艾瑞咨询,到2030年,中国AI广告营销业务的市场规模预计将达到1278亿元,复合年增长率为10%。其中,2023年,中国广告营销市场总规模高达1.31万亿元。同年,AI广告营销业务规模为656亿元,这意味着AI在整体营销开支中的渗透率仅为约5%。亿欧智库的数据进一步印证了这一点,其预测AI Agent在大型企业中的渗透率将从2024年的5%快速增长至2028年的25%,中小企业则从2%增长至15%。考虑到整体市场的巨大体量,渗透率每提升一个百分点,都意味着超过百亿人民币的市场增量。
进一步考虑AI在营销SaaS领域的空间。根据弗若斯特沙利文,仅营销及销售SaaS解决方案这一细分领域,其潜在市场规模(TAM)预计将从2022年的人民币1.55万亿元增长至2027年的人民币4.25万亿元 。然而,2022年的实际渗透率仅为1.3%,预计到2027年也仅增长至1.8%。因此2030年前后AI+销售/营销市场有望达到2000亿级别。
AI陪伴专注于利用人工智能技术,通过模拟人类情感交流的方式,为用户提供情感支持、心理疏导和社交互动,主要体现在通过虚拟角色实现的个性化对话与陪伴。一方面,AI虚拟陪伴应用允许用户与根据个人偏好定制或预设的AI角色交流,如名人、动漫、游戏角色,通过文字、声音等多模态交互方式营造沉浸式体验。另一方面,AI实体陪伴产品为用户提供独有的触感和实体属性,结合其丰富的情绪价值和社交价值,能够更好满足用户的精神需求和实用需求。
AI陪伴市场作为新兴赛道,市场空间广阔、增速迅猛。据Ark Invest,2023年全球AI陪伴市场规模约为3000万美元,2030年全球AI陪伴市场规模有望激增至700亿-1500亿美元,增速高达2300-5000倍,2024-2030年复合增速超200%。
AI陪伴目标用户广泛,同时满足儿童和成年人需求。1)对于儿童而言:不仅可以提供情感陪伴,还可以延伸至口语锻炼、知识科普等教育场景,提供沉浸式、个性化的教育体验。而且教学内容持续迭代更新,伴随儿童成长。2)对于成年人而言:为情绪价值付费。据《DT商业观察》发布的《2023青年消费调研》,有近一半的受访青年认为好的商品或服务能够为自己提供情绪价值,有41.6%的受访青年表示支出更多是因为自己在今年产生了新的爱好。24年以来IP谷子消费高景气,也恰好反映用户对精神消费的高需求。
AI陪伴付费周期长、付费意愿强,是当前大模型最佳落地场景之一。从技术的角度看,目前大模型还存在一定的幻觉问题,但AI陪伴场景的容错率较高,与大模型的技术现状相匹配。因为用户主要为AI带来的情绪价值付费,而非AI输出结果的准确性。从商业模式的角度看,AI陪伴不是一锤子买卖,通常可以采取软件订阅、持续付费解锁新陪伴场景等商业模式,用户生命周期更长,客单价也更高。
AI情感陪伴行业发展主要经历了两个阶段。1)2018-2022年,AI陪伴行业进入萌芽期:情感计算领域在技术研发中取得的突破性进展,成为自然语言理解发展历程里的重大里程碑,为AI情感陪伴奠定了技术基础;2022年百度输入法正式推出中国首批情感陪伴AI博主林开开和叶悠悠,AI虚拟陪伴产品开始进入市场视野。2)2023年后,AI陪伴行业进入快速发展期:随着生成式AI技术日益成熟,以及以Jellycat、泡泡玛特为代表的情绪价值消费品全球出圈,AI陪伴产品呈现百花齐放的场景,成为最先实现商业化的C端AI应用赛道之一。AI虚拟陪伴的交互方式陆续从文字向语音、视频拓展;AI实体陪伴则在最基础的语言交互基础上,拓展性格养成、触感反馈、体温变化等新玩法。
AI虚拟陪伴产品落地快、需求广泛,用户规模在C端原生应用中仅次于AI助手。从网页版访问量看,24年1月全球头部产品Character AI的网页版访问量达1.8亿,仅次于ChatGPT、New Bing、Gemini的16.1、13.6、3.3亿,彼时AI视频Runway、AI搜索Perplexity等其他垂类产品的月访问量仍不足5000万。25年6月的访问量数据中,Character AI和Janitor AI分别以2.1亿和1.2亿位列全球第7和第14,访问量高于Character AI的主要是使用场景更广泛、C端落地最早的AI助手。从App月活看,25年6月Character AI和Talkie AI的月活分别为3335万和3065万,在全球AI应用App中位列前10。
AI虚拟陪伴用户黏性高,使用时长表现突出。根据非凡产研统计的25年3月全球AI应用网站访问量Top30,前五名除ChatGPT外,其余四款产品均为AI虚拟陪伴产品,包括Janitor AI、Character AI、SpicyChat AI和CrushOn AI,其中Janitor AI和Character AI的月均单人访问时长达到了386分钟、362分钟,排名前二。我们认为这与AI虚拟陪伴产品的属性相关。其他AI助手、AI搜索、AI视频垂类应用主要是AI效率工具,用户追求通过高效的自然语言交互快速解决问题。而AI虚拟陪伴则属于休闲娱乐产品,用户与虚拟人物共同解锁一个又一个新场景,产品属性更倾向于短剧、长视频、网文等内容平台,这类平台的用户时长通常较长。
AI虚拟陪伴的主要功能都是与AI虚拟角色进行交互,部分产品增加了抽卡环节。我们梳理Character AI、Talkie、星野、猫箱和Linky五款头部AI陪伴产品。它们主要功能都是与AI虚拟角色(支持自定义角色)进行交互,其中Linky仅支持文字交互,星野、Talkie、猫箱和Character AI则支持文字和语音交互,Character AI在文字交互基础上还新增图生视频功能。同时,星野、Linky和Talkie均增加抽卡环节,每张卡牌对应特定的虚拟角色和故事情节,仅供抽到的用户体验。抽卡环节提供类似抽盲盒的紧张感和未知感,进一步丰富体验。
我们认为这类产品本质上与抖音、哔哩哔哩、快手等UGC内容平台类似,用户通过丰富的角色矩阵和故事情节获得陪伴感。而不同点在于:1)AI陪伴应用中的内容由AI生成,可延展性、随机性更大,形成千人千面的故事情节;2)AI陪伴应用的交互性更强,用户通过文字、语音甚至视频的形式与内容进行交互,而且可以决定故事情节的发展。
而与微信、探探、ChatGPT等聊天应用相比,AI虚拟陪伴应用在一定程度上更好地解决用户情感陪伴以及奇幻情景联想的需求,从而增强用户的使用粘性。1)情感陪伴方面:AI虚拟陪伴的智能体可实时响应、性格多样,相比于工具属性较强的ChatGPT,能反馈个性更加鲜明的回复,能一定程度上满足用户倾诉、寻求情绪反馈乃至猎奇的需求;且相比于微信、探探等真人社交应用,用户使用AI虚拟陪伴时,不必担心情感宣泄给对方造成的负担或对自身线)奇幻情景联想方面:AI虚拟陪伴能一定程度满足用户对虚构人物、虚构场景的幻想。智能体设定方面,可设定为历史名人、影视文学作品人物、动物乃至虚构生物;虚构场景方面,用户的话题可设定在历代王朝、鬼屋乃至影视文学作品内等。基于真人社交的微信、探探等,这方面体验较少。
进一步对比上述五款AI陪伴产品,它们在功能、角色、付费点上存在部分差异。
1)从角色上看,星野/Talkie的角色最为丰富。这两款产品既提供斗罗大陆系列、民国系列等设定好的IP角色,也支持用户自行创建角色。且用户创作门槛低,首先设定角色的名称、简介、开场白、背景、声音等基本要素,然后通过自然语言描述人设、性格和回复风格,即可完成创作。目前星野/Talkie上已拥有超1000万个可供交互的角色。Character中的IP角色较多,包括明星、动漫、游戏等;猫箱和Linky的角色则主要由用户自定义。
2)从付费点上看,星野、Talkie和Linky在会员订阅的基础上,还需要付费抽卡,进一步提升客单价。各产品均推出会员订阅模式,国内和海外产品的价格分别约为20元/月和10美元/月。这三款产品普遍每3-5轮对话就拥有一次抽卡机会,用户可以选择抽卡解锁稀缺场景,价格2元/次(海外产品2美元/次)。
其中头部产品星野/Talkie的前身是Glow。Glow为基于大模型的AI聊天应用,由国内人工智能创业公司MiniMax在22年11月推出,为用户提供情感陪伴、满足虚构情景想象的体验。据甲子光年,Glow上线万用户。Glow的基本玩法与目前的AI虚拟陪伴应用基本一致。用户在应用中创建AI机器人“智能体”,智能体将基于用户描述的性格、人设、头像及选定的音色等,与用户开展实时沟通、互动;也可输入“参考名人”,智能体将具备特定名人的有关知识储备。据体验,创建的“托尼斯塔克”智能体有《复仇者联盟》系列的知识储备,具备较强代入感。
星野/Talkie在先发优势的基础上,通过更丰富的角色储备和高频的功能更新,维持在全球范围内的领先地位。目前这款产品的独特亮点在于:1)用户社区生态:星光榜和钻石榜将智能体、用户进行排名。通过星野市集功能,用户可自行创作角色星念卡进行售卖,既增加平台上的故事场景和角色供给,也能帮助用户通过自己的创作能力变现。2)内容储备:FM专栏玩法丰富,包括外语电台、治愈电台、恋爱电波等内容类型。用户选定智能体和情景主题,AI将自动生成文本,生成音频,并实时试听调整效果。3)创新玩法:Talkie创新推出“专属时间”功能,在特定时间内,AI虚拟人物采用特殊的语气、表述与用户交互,具体包括恋爱、说笑、陪伴、哄睡等类型。
近期恺英网络旗下AI陪伴应用《EVE》发布,预计年内正式上线。《EVE》是国内创业公司自然选择研发的3D AI陪伴游戏,此前恺英全资子公司完成对AI公司Tyrell AI Limited(自然选择的海外控制主体)的投资协议签署,恺英累计持股比例将超过16%,后续也将参与自然选择AI产品在国内的部分运营。
与其他AI陪伴应用不同,《EVE》着力于构建一种长期且深度的情感连接虚拟关系,用户固定与一位AI男友或一位AI闺蜜互动。它依托情感对话大模型Vibe和记忆大模型Echo,使AI能够精准理解语义上下文、识别用户情绪、生成具有人格连续性的回应,并持续构建个性化动态记忆。从用户测评看,AI虚拟人物会依据用户所处的时间、地点、环境、日程与事件背景,实现与用户生活同步的陪伴行为,包括主动开启话题、主动提供关心、为用户点奶茶等。
从Character AI的技术进展看,音视频虚拟陪伴的效果有望持续快速提升。25年6月Character.AI发布新模型TalkingMachines,是一个音频驱动的实时视频生成模型,只要输入一张人物图+一段语音,就能让角色像 Facetime里的数字人一样“开口说线个核心模块组成:视频生成模块的基础模型来自阿里通义WAN2.1的14B参数视频扩散模型,输入图像、音频和文本后,模型能逐帧生成同步动画,实现“音画一致”。音频驱动模块确保角色的嘴型动作紧跟语音变化,不说话时则自动切换为“聆听态”。自回归生成模块替代过去多模态常用的扩散模型,并结合一系列加速算法,每段视频只关注上一段和初始图像,实现边播放边生成,低延迟。
2)视频效果自然:从Demo看,语音与口型比较同步,对话节奏流畅,延迟比较短;当角色结束说话或处于聆听状态时,会偶然出现微笑、惊讶等表情反应,增加角色的真实性。此外肢体动作也较为自然,通过双手插袋、叉腰等动作,与语言内容相匹配。
AI陪伴硬件是以情绪价值为核心功能,集成人工智能等技术的硬件产品,包括AI玩具、AI宠物等。与AI虚拟陪伴应用相比,AI陪伴硬件提供独有的触感和实体属性,陪伴价值更高。未来这些硬件还有望承接智能音箱的更新换代需求,一方面进行音乐播放,另一方面与智能家居联动,成为智能家居新的控制入口。
2024年是AI玩具的元年,字节AI玩偶“显眼包”引领AI玩具出圈。显眼包是字节跳动内部研发的一款情感陪伴玩偶,表面上是一款蓝白配色、小山状的毛绒玩具,内在集合了火山引擎的多项人工智能技术,包括豆包大模型、扣子专业版、语音识别和合成等。由于该产品不对外售卖且制作数量不多,在二手平台的转让价格最高达500元。
显眼包具备AI对话交互功能,情感交流表现出色。根据多知网、36氪、Z Finance等媒体对显眼包的测评,显眼包可以与用户进行中英文对话交互,例如讲故事、背诵古诗等;当用户将自己的困惑告诉显眼包时,显眼包也会给出针对性的建议,情感交流和陪伴效果较好。同时还具备记忆能力,可以准确回答前两轮对话的内容。但它在数理逻辑方面表现较弱,无法对9.9和9.11两个数字进行大小比较。
显眼包内嵌了一个AI大脑,从而集成豆包大模型能力。这款AI大脑称为Magicbox魔匣,通过wifi联网的形式调用云端的豆包大模型和扣子专业版能力。它是一款由第三方公司Folotoy研发的通用型AI硬件,整合了AI对话芯片、麦克风和扬声器,体积较小,用户可以将其套在各种玩偶内部,为玩偶增加AI对话和陪伴功能。
25年CES大会大量展出AI陪伴机器人,传统科技大厂与初创公司均积极布局。1)三星和TCL分别发布陪伴机器人Ballie和Ai Me,Ballie在语言交互、移动的基础上,还提供电影放映功能;2)日本初创公司Yukai Engineering推出黏在书包背带上的毛绒机器人Mirumi和挂在杯壁上的小猫形态机器人Nékojita FuFu,虽然并不具备语言交互的能力,但前者会四处“偷看”周围的人,后者则会把热的食物吹凉。随着AI陪伴产品供给增加,使用场景和功能已从最初的问答和教育,扩展到更广的范围。3)成立于2022年的中国创业公司萌友智能在CES大会上发布首款人工智能机器宠物Ropet,它既可以和用户进行直接的语言对话,也能够识别用户的动作和情绪,通过眼神和叫声做出反应。从外表看,Ropet外形圆润毛绒,眼睛部分占比较大,“萌”属性较强。从功能看,Ropet基于视觉和声音输出做出反应,例如用户露出无聊的表情时,它会瞪大眼睛看着对方,发出“求抱”的信号;用户将香蕉摆在它眼前时,它的眼中也会出现香蕉图标,还会发出咀嚼声。
25年AI玩具价格下探、成人陪伴向产品增加。从价格层面看,24年国产AI玩具价格普遍在400元以上,且部分产品除了硬件收费外,后续还会收取每年约100元的大模型调用费用;海外AI玩具价格最高达7万,是日本创业公司GROOVEX开发的家庭陪伴机器人LOVOT。它早在2018年就上市发售,配备光度传感器、360度半球形摄像头、模拟眼睛的液晶显示屏等高精度设备,且每个机器人的性格不一致,为用户提供养成类玩法。截至23年底该产品在日本销量破万。进入25年,AI玩具的价格下探至200元以内,一款是奥飞娱乐的第二代AI智趣喜羊羊,入门价格199元,接入豆包、通义、DeepSeek等多个大模型;另一款是日本公司Yukai Engineering研发的Nekojita FUFU,通常吸附在杯子边缘,通过吹气快速冷却热饮或食物,预计售价180元。
从产品定位层面,成人陪伴向的AI玩具新品显著增加,包括萌友智能Ropet、珞博科技Fuzozo、恺英网络治愈系玩偶暖星谷梦游记等。这类产品通常提供基础的语音交互以外,还支持触感反馈、体温调整、眼神互动等,提供类似宠物的AI陪伴体验。
当前企业端AI渗透率滞后于C端(美国B端渗透率~9.2%),在不同细分场景的渗透节奏不同,总体呈现以下:从易到难,从虚拟到现实,从科技到传统,从研发到生产,从大型企业到中小企业的渗透趋势。渗透进度的核心矛盾在于企业场景的高复杂度与低容错率制约。从落地顺序看,呈现“四象限阶梯式渗透”特征:以任务复杂度为纵轴、容错率为横轴,高容错+低复杂象限(如AI编程/文档工具)率先突破,代表产品Claude/Cursor年化收入(ARR)已突破30亿/5亿美金;而低容错+高复杂象限(如AI制药、手术机器人)因专业壁垒与安全要求极高,仍处技术攻坚期。这种从虚拟协作(程序员代码生成)向现实生产(制药分子设计)的渐进路径,印证了“从易到难、从研发到生产”的渗透规律。
道阻且长,行则将至,模型能力的持续迭代和成本快速降低正加速场景破局。推理能力提升推动复杂任务场景突破(如工业视觉检测准确率达99.2%),幻觉率下降拓宽低容错场景安全边界(如金融风控误判率降至0.3%)。尽管制药、具身智能等前沿领域道阻且长,但大模型训练成本快速下降,叠加AI编程等成熟场景的商业化验证,本轮B端渗透速度较互联网时代提升明显,传统产业的智能升级和AI落地或将远超预期。
AI+编程是利用AI大模型和海量代码库辅助完成代码编写和项目搭建,可广泛用于数据分析、软件编写、网页搭建、游戏制作、科学研发等场景。随着大模型能力的逐步提高,AI+ Coding已经逐步从过去的代码补全、代码debug等协助类工具,转变成具备自主理解、自主拆分任务、直接交付完整产品的全能编程Agent。目前,大量科技公司的代码依靠AI生产,Anthropic曾公开表示“目前公司的代码有80%以上由AI生成,未来 3-6个月内90% 的代码都将由AI编写。”CSDN在2023年底的调研报告已指出,样本中近90%的开发者已将AI代码工具融入日常工作。
AI大模型已经在文字、代码、图片、视频等场景广泛应用,其中AI+ 编程无疑是产品最成熟,商业化最快的赛道。无论从产品的实用性、商业化的成熟度,还是从用户的渗透率与付费意愿来看,它都展现出应用广度和深度上的领先态势。我们认为,AI+代码之所以能率先突破,核心在于代码生成的本质是一项高度依赖于逻辑能力、代码规则的“标准化”工作,而大语言模型在逻辑性、数学能力、标准化拥有很强的优势。相较于风格多样、意图模糊和较高的幻觉率的文字/图片生成,代码拥有严谨的语法、清晰的逻辑、和可以被验证的确定结果,这使得大模型能够更精准地发挥其能力。随着Claude code的推出,无需手动敲代码只需自然语言交互的“Vibe coding”(“氛围编程”)受到全球开发者的热捧,标志着编程Agent时代的到来。
AI+编程是指利用人工智能技术(特别是大语言模型)赋能、增强乃至自动化软件开发生命周期各个环节的实践。随着大模型能力的快速提高,AI+编程已经并非单一工具,而是一个覆盖了需求分析、架构设计、代码编写、调试测试、代码审查、文档生成、项目维护的全方位智能体。
未来科技工作者不需要再去做重复的程序员代码工作,例如编写样板代码、格式化或基础调试,通过将重复性、模式化的任务自动化,AI将开发者从繁琐的劳动中解放出来,使其能够专注于更具创造性、战略性和监督性的工作,如系统架构设计、复杂问题解决和项目过程监督。未来,开发者的核心技能将从语法掌握转向问题分解和意图清晰化,即如何准确地向AI描述需求,更加注重系统性思维和高效的提示工程能力。
AI编程工具市场快速扩张,已形成清晰的技术-商业闭环。整体看,AI编程的技术进步显著,已从辅助编程的角色转变成可理解上下文、拥有“记忆”、主动发现问题并提出解决方案的协同伙伴,智能化程度进一步提升。随着AI编程技术不断进步,其已可在多个行业中使用。据亿欧智库显示,当前AI编程在互联网、游戏中的渗透率已达80%及以上。预计随着AI编程的持续向好发展,其在电信(30%)、政务(15%)等行业的渗透率有望进一步提升。整体看,AI编程领域的前景广阔。Verified Market Research分析预测显示,全球AI代码工具市场规模在2024年已达到49.1亿美元,并预计从2025年开始将以27.1%的复合年增长率(CAGR)在2032年增长至301亿美元。
用户数快速增长:GitHub Copilot凭借其庞大的用户基础、强劲的财务表现和深度的生态整合,确立了市场领导者的地位。微软第三财季业绩电线倍的增长,Copilot 已从“编程助手”进化到“编程伙伴”,尤其是 VS Code 的 Agent Mode,能自主迭代代码、识别并修复错误。在B端的需求更加旺盛,购买Copilot for Business的企业组织超过5万家,涵盖Etsy、HelloFresh等数字创新公司以及Autodesk、Dell、高盛等传统企业。微软CEO纳德拉还表示微软公司代码库中有 20% 至 30% 的代码是已经由人工智能生成。
Anthropic的Claude模型凭借代码能力上表现出色也迅速获得了市场关注,根据Menlo Ventures的2025年7月披露,Claude Code在推出仅约四个月后,已吸引了11.5万名开发者使用,且全部为付费用户。
ARR快速增长:据Cursor 2025年6月融资公告披露,Cursor的ARR已超过5亿美元,2024年ARR仅为6400万美金,实现了快速增长,超过半数的财富500强公司(如NVIDIA, Uber, Adobe)都在使用Cursor。
Github Copilot在2024年7月披露的ARR已超过3亿美金,付费用户超过180万。虽然2025年微软没有更新其ARR的最新数据,但从其MAU的增长可以推断ARR应该也取得了快速增长。
基于Claude Code当前的用户采纳率和定价模型初步估算,Claude Code的年化收入潜力约为1.3亿美元。在发布后短短一周内,它就处理了高达1.95亿行代码,显示出极高的用户活跃度。
商业化成功的原因:AI+Code之所以能成为AI应用中发展最快的领域之一,根本原因在于代码本身的特性与大型语言模型的内在优势形成了完美的共生关系。
1) 代码作为一种语言,是对数学和逻辑推理的高度浓缩,这是LLM最擅长处理的领域。各模型在EvalPlus基准测试中的pass@1得分显示,顶尖的大型语言模型在标准化的代码生成任务上已经达到了极高的水准。排名前列的模型,如O1 Preview、Qwen2.5-Coder和GPT-4o,其 pass@1 分数已接近90%。这意味着在面对一个全新的、从未见过但定义清晰的编程问题时,它们有近九成的把握一次性生成完全正确的代码。
2) 程序员很难记住大量的代码语法规则,而LLM可以通过海量代码库快速检索调用。海量、高质量的训练数据是LLM在编程领域取得成功的基石。LLM作为强大的模式匹配和序列预测引擎,能够在高度结构化的环境中精准地学习语法规则、函数调用、类库使用等模式,其表现远超在模糊的自然语言领域的应用。模型在GitHub等代码托管平台、Stack Overflow等技术问答社区以及官方技术文档等海量、多样化的公开代码库上进行训练。这使得LLM不仅能掌握多种主流编程语言(如Python, JavaScript, C++)的语法,更能学习到通用的编程范式、最佳实践、代码风格乃至特定框架下的惯用写法。截至 2024 年,超过 1 亿开发人员在使用 GitHub,全球 GitHub 开发人员帐户增长了 26%。
3)LLM目前最严重的问题是幻觉率,而代码的结果可以快速验证,为结果提供了可靠保证。代码的精确性和结构性为LLM提供了理想的训练环境。与充满歧义和灵活性的自然语言不同,计算机编程语言要求绝对的语法精确和逻辑严密。这种“非对即错”的特性,使得代码的评估标准极为明确。
4)AI正在从执行中学习。AI模型的发展已经超越了仅仅学习静态代码的阶段。它们正在通过一个闭环反馈系统进行自我优化:首先,通过已有标注数据对大模型进行SFT监督微调得到一个能生成初步代码响应的模型;然后再由多个奖励模型通过强化学习的反馈不断调整参数。总而言之,模型生成代码,尝试编译并运行它,然后根据测试用例的成功或失败结果进行学习和调整。这个过程完全自动化,无需人类干预,从而能够以极高的效率和规模进行。这种模式让模型从学习“代码应该长什么样”转变为学习“代码实际上如何工作”。
1)降本。随着AI编程助手的广泛应用,开发团队规模缩小,初创公司和小型企业通过AI工具以更少的人力实现更高效率,显著降低了人员成本并改变了软件开发的工作方式。团队精简与效率提升:根据《华尔街日报》报道,许多公司采用 GitHub Copilot 等 AI 工具后,通过精简团队获得更高效率。部分公司报告效率提高了 10% 至 20%,特别是初创公司,通过 AI 工具缩减开发人员数量,显著降低了人力成本。
提高开发者生产力:GitHub 研究显示,使用 Copilot 的开发者能提高任务完成速度 55%,从而减少对初级开发者的需求,进一步降低了人力成本。这一生产力提升帮助公司在不增加人手的情况下完成更多工作。
加速代码合并与发布:FarosAI 的研究发现,使用 Copilot 的团队在代码合并和发布速度上显著提速,合并时间缩短了50%,工作成果可在更小团队规模下实现。
2)增效。多项大规模、有控制的实证研究,已经量化了AI+编程对开发者生产力的显著提升。除了编码速度的提升,AI工具还通过减少开发者在重复性任务上耗费的精力,以及帮助他们更长时间地保持专注状态,从而间接提升了工作质量和满意度。
GitHub/Microsoft的受控实验:在一项著名的对照实验中,研究人员要求两组开发者用JavaScript实现一个HTTP服务器。获得GitHub Copilot辅助的实验组,完成任务的速度比未获辅助的对照组快了55.8%。这一数据成为衡量AI编码工具效率提升的经典指标。
Accenture的企业级研究:全球咨询巨头Accenture在其内部开发者中进行的研究发现,使用GitHub Copilot不仅提升了代码质量,还极大地改善了开发者的工作体验,90%的开发者表示在使用Copilot后工作满意度更高,42%的开发者认为copilot对他们有非常大的帮助。另一项涉及数百个团队的随机对照试验显示,使用AI辅助工具的团队,任务完成速度平均提升了约30%。
Cognizant的内部实践数据:全球IT服务巨头Cognizant的报告提供了来自大规模商业实践的有力证据。该公司透露,目前其项目中超过20%的代码是由AI编写的。这直接带来了显著的生产力提升:对于公司中生产力处于后25%的开发者,生产力提升了34%;对于前50%的开发者,生产力也提升了17%。
3)开发的民主化:赋能非程序员。AI的普及正在快速降低软件开发的门槛,让没有经过系统编程训练的产品经理/创业者/个人用户也能够构建功能性应用和自动化工作流程。
无代码/低代码平台的崛起:Thunkable、Glide等平台正在利用AI,让用户通过拖放组件和自然语言描述的方式来构建移动和Web应用,将复杂的代码逻辑完全抽象化。
普通人的创造力释放:在各大技术社区,涌现出大量普通人利用AI工具成功构建并发布应用的案例。有用户在几乎没有编程经验的情况下,通过向ChatGPT、Cursor等工具发出数千次提示,在三周内就成功开发并上架了一款iOS应用。
整体来看,AI+编程在降本增效之外,实现了一定程度上的技术平权,让代码这个高技术性的门槛大大降低了。对于专业的开发者,他们可以节省大量重复和低级的代码工作,将更多时间放在算法架构、产品设计上。对于初级开发者,他们可以快速提升生产力,快速借鉴高级开发者的代码能力。对于非开发者,AI让他们拥有了可以独立开发应用的能力,可以将产品想法快速实践和落地。对于团队而言,AI让整个团队的开发能力进一步拉近,产品可以快速迭代,提高了回报率。
AI编程技术发展分三阶段(Copilot → Agent → Multi-Agent),已从辅助工具转向自主协作。
Copilot阶段(L1-L3):以代码补全为主,代表产品包括GitHub Copilot、Cursor,可以提升效率30%-60%,尤其在高强度开发领域(如游戏、金融)。
Agent阶段(L4):AI可独立处理任务,如Devin(收费500美元/月)完成代码开发、测试;Claude 3.5在HumanEval代码生成测试得分93.7%,接近中级工程师水平。微软、Meta等巨头宣布2025年实现Agent级能力。以最新的Claude code和Google Gemini CLI为代表的vibing code(氛围编程,只需自然语言就能完成整个项目从开发到debug全套流程)是L4阶段的典型产品。
Multi-Agent阶段(L5):AI团队协作(如MetaGPT),多智能体系统实现端到端开发。阿里提出技术路径:copilot → agent → multi-agents。
中国和美国是全球AI编程领域的领先者,但二者的技术路径有所差异。中国在本土化与行业场景落地方面更具有优势。例如,字节跳动的Trae支持原生中文,集成Claude和GPT等主流AI模型,用户可免费使用部分功能;美团在近日发布首款AI Coding Agent(AI编程智能体)产品NoCode,助力中小商户降低IT化和数字化门槛。美国则在通用性与开发者体验方面更具优势,其在通用AI、多模态技术等领域仍占据领先地位。例如,Claude Opus 4在SWE-bench基准测试中的准确率达73.2%,支持连续7小时自主编程。Cursor也仍是全球最受欢迎的AI编程工具之一,据非凡产研数据,2025年5月其WEB访问量为2127万,仅次于lovable的3033万;月活跃用户数为789万,位列第一。
GPT4系列基础模型表明,预训练受到Scaling Law限制愈发明显,仅提升参数规模、扩大数据集对模型性能的提升边际递减。而后训练、测试时扩展方兴未艾,DsspSeek-R1等实践证明推理时代已全面开启;Claude4、Gemini 2.5 pro强大的代码能力则说明大模型行业正走入智能体阶段。
AI+编程已经通过一系列强大的工具和平台,深度融入了开发者的日常工作。从集成开发环境(IDE)中的智能伙伴,到自动化生成用户界面,再到赋能数据分析和加固软件生命周期的各个环节,全方位地提升软件开发的效率和质量。
当前最普及的AI+编程应用形式是作为插件直接集成在开发者IDE中,实时提供编码辅助,极大地提升了编码效率。以GitHub Copilot为例,它深度集成于Visual Studio Code (VS Code)、JetBrains系列等主流IDE中,提供实时、上下文感知的代码建议。当开发者输入代码时,Copilot会智能地预测并补全单行乃至整个函数或代码块。
除了自动补全以外,IDE中还具备了与AI直接聊天交互功能。例如,Copilot Chat允许开发者在不离开编辑器的情况下,通过对话窗口提问、请求代码重构、或要求解释某段复杂的代码。这种沉浸式的交互模式,让开发者能够保持专注状态,避免了在代码、文档和搜索引擎之间频繁切换所造成的中断和效率损失。
自动化文档生成:编写和维护技术文档是开发过程中一项耗时且易被忽视的工作。AI工具可以解析代码,自动生成符合规范的文档,如函数的注释、API参考手册等,并能随着代码的更新而同步更新,确保文档的实时性和准确性。Sourcegraph的Cody和DocuWriter.ai等工具在此方面表现出色。
AI正在颠覆前端开发和UI原型设计的传统流程,实现了从文本描述甚至图片直接生成可交互界面的跨越。
Vercel的v0.dev是这一领域的杰出代表。它允许用户通过自然语言描述来构建用户界面。开发者只需用几句话描述所需界面,例如“创建一个包含侧边栏和四张卡片的仪表盘”,v0.dev 便会即时生成对应的 React 前端代码,并应用 Tailwind CSS 等样式组件。用户可以对生成结果进行调整,满意后直接将高质量的代码用于项目或部署到 Vercel 平台。
依靠多模态大模型VLMs还可以实现从一张图片到代码的转换。开发者可以上传一张现有网站或设计稿的截图,AI工具能够分析图像中的布局、颜色、组件和文本,并自动生成复现该设计的HTML/CSS代码。这一功能极大地缩短了从设计到开发的原型验证周期。例。