当AI视频生成赛道在2024年因Sora的横空出世陷入"大厂碾压论"的悲观预期时,一家成立仅一年的创业公司却用实际数据打破了行业魔咒。据最新披露的财务数据显示,快手旗下可灵AI在2025年第二季度实现营收超2.5亿元,占总营收比例达4.8%,而同期爱诗科技凭借其C端产品矩阵,用户规模突破1亿大关,成为该领域首个实现规模化盈利的初创企业。
时间回溯至2023年4月,在视频生成技术尚未形成市场共识的节点,前字节跳动视觉技术负责人王长虎与谢旭璋创立爱诗科技。彼时投资界普遍认为,该赛道将重蹈语言模型领域"2-3家大厂垄断"的覆辙,视频模型ROI(投资回报率)短期难以转正。这种质疑在2024年初达到顶峰——当Sora展示出颠覆性技术能力后,超过60%的早期投资人选择撤资或观望。
"我们走了一条反常识的路。"爱诗科技CEO王长虎在接受专访时透露,公司成立初期即确立两大核心原则:其一,拒绝资本驱动的盲目扩张,通过产品力实现自然增长;其二,突破Scaling Law(规模定律)的路径依赖,建立精细化迭代体系。这种战略在2024年11月迎来爆发点,其推出的"毒液变身"特效模板在TikTok平台获得超百亿次曝光,带动PixVerse用户量三个月内增长67%。
在技术路线选择上,爱诗展现出独特的战略定力。面对行业普遍追求的"60秒长视频生成"技术竞赛,团队通过用户行为分析发现:92%的短视频创作集中在10秒以内,专业制作领域单镜头时长中位数仅为8.7秒。基于此判断,公司将研发重心转向生成速度与画质优化,其独创的"分布匹配蒸馏"技术使生成效率提升12倍,将视频产出时间从分钟级压缩至秒级。
产品端创新同样颠覆传统认知。2025年8月上线的PixVerse V5模型,配套推出"Agent创作助手",通过预设的2000余个场景模板,将专业视频制作流程简化为"选择模板-输入指令-一键生成"三步操作。测试数据显示,零基础用户使用该功能创作的视频,在抖音平台的完播率较专业制作内容仅低18%,而创作效率提升40倍。这种"技术降维+体验升维"的策略,使拍我AI在国内iOS效率榜长期位居前五。
行业格局的演变印证着爱诗的预判。当多数企业仍在DiT(扩散变换器)架构上展开参数竞赛时,前商汤秒画负责人刘宇创立的Vivix聚焦AI成人内容生成,光年之外联合创始人曹越的Sand AI则采用自回归路线实现无限时长视频生成。这种技术路线分化,与爱诗"服务95%未被满足的普通用户"的定位形成鲜明对比。王长虎将这种差异比作设计软件领域的Canva与Photoshop之争:"我们要做的是让每个人都能成为视频创作者。"
资本市场开始重新评估视频生成赛道的投资逻辑。2025年Q2,爱诗科技完成3.2亿美元C轮融资,创下该领域单笔融资纪录。值得关注的是,本轮投资方中出现多家消费级产品巨头,显示产业资本开始认可"工具平权"带来的市场增量。数据显示,拍我AI用户日均创作视频量达1200万条,其中63%为首次尝试视频制作的普通用户。
技术测评机构的最新报告揭示着行业变局。在独立评测平台Artificial Analysis的全球排名中,PixVerse V5登顶图生视频榜单,文生视频排名紧随Sora位列第二。这种技术实力与商业落地的双重突破,使爱诗成为首个同时进入Gartner技术成熟度曲线"生产成熟期"与"商业回报期"的视频生成企业。
当被问及错失早期训练对标Sora模型的机会时,王长虎坦言这是资源约束下的必然选择:"但正是这种克制,让我们避免了技术路线误判的风险。"这种战略定力在2024年下半年得到回报——当行业集体转向DiT架构时,爱诗已通过持续迭代的V2-V5系列模型,建立起覆盖10秒至3分钟视频生成的全场景能力。