红杉资本:生成式AI市场正在进入“第二阶段”

来源:爱集微 #红杉资本# #AI#
2.3w

集微网消息,近日,红杉美国发文《Generative AIs Act Two》,指出生成式AI市场正在进入“第二阶段”,从以技术出发转变为以客户需求出发。第二阶段将从头到尾解决人类问题。这些应用程序本质上与出道的第一批应用程序不同。它们往往将大模型作为更全面解决方案的一部分,而不是整个解决方案。它们引入新的编辑界面,使工作流更具吸引力,产出更好它们通常是多模式的。

红杉资本在文中写道,从创业公司的收入来看,生成式AI产业已经比SaaS取得了更加成功的开端然而,这些早期的成功迹象并不能改变一个事实,即很多AI公司并没有产品市场契合度或可持续的竞争优势,AI生态系统的整体繁荣是不可持续的。

“尘埃已经落定了一段时间,我们认为现在是一个可以放眼远方并反思生成式人工智能的机会——我们今天所处的位置以及可能前进的方向。”

红杉资本指出,生成式AI并不缺乏使用案例或客户需求。用户渴望AI能使他们的工作变得更容易,他们的工作产品变得更好。但用户参与度不佳。简而言之,生成式AI最大的问题不是寻找使用案例、需求或分发,而是证明价值。

红杉资本复盘了自己曾经的预测。

以下是预测错的:

1、事情发展得很快。去年,我们预计还需要近十年的时间拥有实习生级别的代码生成、好莱坞质量的视频或不发机械声的人类质量语音。但听一听Eleven Labs在TikTok上的声音或Runway的AI电影节就明白,未来已经以光速到来。甚至3D模型、游戏和音乐都快速变得优秀。

2、瓶颈在供应端。我们没有预料到最终用户的需求会超过GPU的供应。许多公司增长的瓶颈很快就不是客户需求,而是获取Nvidia的最新GPU。长时间的等待成为常态,出现了一个简单的商业模型:支付订阅费跳过等待队列并获得更好的模型。

3、垂直分离尚未发生。我们仍然相信“应用层”公司和基础模型提供商之间会有分离,模型公司专注于规模和研究,应用层公司专注于产品和UI。实际上,这种分离还没有干净利落地发生。事实上,最初面向用户的应用中最成功的是垂直整合的。

4、竞争环境残酷,现有竞争者的反应迅速。去年,竞争格局中有几个过于拥挤的类别(尤其是图像生成和文案写作),但总体上市场还是一个空白区域。如今,竞争格局的许多角落比机会还要竞争激烈。从Google的Duet和Bard到Adobe的Firefly,现有竞争者迅速的反应——以及他们最终愿意承担“风险”的意愿——加剧了竞争的热度。即使在基础模型层,我们也看到客户在不同供应商之间建立自己的基础设施。

5、壁垒在客户中,而不是在数据中。我们预测,最好的生成式AI公司可以通过数据飞轮生成可持续的竞争优势:更多使用→更多数据→更好的模型→更多使用。尽管这在某种程度上仍然是对的,特别是在拥有非常专业和难以获得的数据的领域,但“数据壕沟”正处于不稳定的地面:应用公司生成的数据并没有创造一个无法逾越的壕沟,下一代基础模型很可能会摧毁初创公司生成的任何数据壕沟。相反,工作流和用户网络似乎正在创造更持久的竞争优势来源。

以下是预测对的:

1、生成式AI是一种事物。突然之间,每个开发者都在研究生成式AI应用,每个企业买家都在要求它。市场甚至保留了“生成式AI”的名称。人才涌入市场,风险资本也涌入。生成式AI甚至成为了流行文化现象,如“哈利·波特巴伦西亚加”这样的病毒视频,或者由Ghostwriter创作的模仿德雷克的歌曲“Heart on My Sleeve”,这首歌已经成为了排行榜上的热门歌曲。

2、第一个杀手级应用已经出现。众所周知,ChatGPT是最快达到1亿MAU的应用程序——并且在短短6周内自然而然地做到了这一点。相比之下,Instagram花了2.5年,WhatsApp花了3.5年,YouTube和Facebook花了4年才达到那种用户需求水平。但ChatGPT并不是一个孤立的现象。Character AI的参与深度(平均每次会话2小时)、Github Copilot的生产力益处(效率提高55%)以及Midjourney的商业化路径(数亿美元的收入)都表明,第一批杀手级应用已经到来。

3、开发者是关键。像Stripe或Unity这样以开发者为中心的公司的核心洞察是,开发者创造了你甚至无法想象的使用案例。在过去的几个季度里,我们接到了从音乐生成社区到AI红娘到AI客户支持代理的各种想法。

4、形态正在发展。AI应用的第一版大多是自动完成和初稿,但这些形态现在正在变得越来越复杂。Midjourney引入的摄像机平移和填充是生成式AI优先用户体验变得更丰富的一个很好的例子。总的来说,形态正在从个体到系统级的生产力,从人在循环中到执行导向的代理系统发展。

5、版权、伦理和存在的恐惧。这些热点话题的辩论如火如荼,艺术家、作家和音乐家意见不一,有些创作者正当地愤怒于其他人从衍生作品中获利,有些创作者则接受了新的AI现实(Grimes的利润分享提议和James Buckhouse对成为创意基因组的一部分的乐观态度浮现在脑海中)。没有初创公司想成为最终的Spotify的Napster或Limewire(感谢Jason Boehmig)。规则是模糊的:日本已经宣布用于培训AI的内容没有IP权利,而欧洲已经提议下重手进行监管。

关于第二阶段发展的分析,红杉资本指出,我们现在有了共享的技术来使模型变得有用,以及将塑造生成式AI第二幕的新兴UI范式。

模型开发栈

1、新兴的推理技术,如连锁思考、树状思考和反射,正在提高模型执行更丰富、更复杂的推理任务的能力,从而缩小了客户期望与模型能力之间的差距。开发者使用像Langchain这样的框架来调用和调试更复杂的多链序列。

2、迁移学习技术,如RLHF和微调,正变得更加可用,特别是随着GPT-3.5和Llama-2的微调的最近可用性,这意味着公司可以将基础模型适应其特定领域,并从用户反馈中改进。开发者从Hugging Face下载开源模型,并微调它们以实现优质的性能。

3、检索增强生成(RAG)正在引入关于业务或用户的上下文,减少幻觉并增加真实性和实用性。像Pinecone这样的公司的向量数据库已成为RAG的基础设施支柱。

4、新的开发者工具和应用框架为公司提供了可重用的构建块,以创建更先进的AI应用,并帮助开发者评估、改进和监控生产中的AI模型的性能,包括像Langsmith和Weights & Biases这样的LLMOps工具。

5、像Coreweave、Lambda Labs、Foundry、Replicate和Modal这样的AI-first基础设施公司正在解除公共云的捆绑,并提供AI公司最需要的东西:大量的GPU以合理的成本、按需可用和高度可扩展,以及一个不错的PaaS开发者体验。

这些技术应该能够在基础模型同时改进的情况下,缩小期望与现实之间的差距。但使模型变得出色只是成功了一半,生成式AI优先的用户体验也在进化:

新兴产品蓝图

1、生成式界面:基于文本的对话用户体验是LLM的默认界面。渐渐地,新的形态进入了武器库,从Perplexity的生成用户界面到Inflection AI的语音发声等新的模态。

2、新的编辑体验:从Copilot到导演模式(Director‘s Mode)。随着我们从Zero-shot到ask-and-adjust(感谢Zach Lloyd),生成式AI公司正在发明一套新的旋钮和开关,它们看起来与传统的编辑工作流程非常不同。Midjourney的新的平移命令和Runway的导演模式创造了新的相机般的编辑体验。Eleven Labs使得通过提示(Prompt)操作声音成为可能。

3、越来越复杂的代理系统:生成式AI应用越来越不仅仅是需要人来审查的自动完成或初稿;它们现在有自主权来解决问题、访问外部工具并代表我们端到端地解决问题。我们正稳步从0级进展到5级自主性。

4、系统范围内的优化:有些公司并不是嵌入单个人用户的工作流程并使该个体更有效,而是直接解决系统范围内的优化问题。你能否选择一部分支持票据或拉取请求并自主地解决它们,从而使整个系统更加有效?(校对/刘沁宇)

责编: 刘沁宇
来源:爱集微 #红杉资本# #AI#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...