近期,AI技术对传媒行业的渗透持续深化,多家企业通过技术开源与场景创新推动行业变革。昆仑万维开源国内首个面向AI短剧创作的视频生成模型SkyReels-V1,百度宣布文心一言全面免费并向深度搜索领域扩展,天娱数科则通过数据积累与智能体技术赋能人形机器人研发。这些动作标志着AI技术正在加速重构内容生产与交互模式。
球王会技术突破推动AI内容生成效率提升
昆仑万维于2月18日开源了SkyReels-V1视频生成模型及SkyReels-A1表情动作可控算法。SkyReels-V1支持33种人物微表情与400多种自然动作组合,通过自研推理优化框架实现544p分辨率视频生成,单台NVIDIA4090显卡仅需80秒即可完成推理。该模型基于好莱坞级影视数据训练,在人物表演、光影美学等维度具备电影级质感,且支持文生视频与图生视频,是目前全球性能最强的开源视频生成模型之一。
百度同步宣布文心大模型4.5系列将于6月30日开源,并自4月1日起向所有用户免费开放文心一言及深度搜索功能。百度搜索将全面接入DeepSeek技术,进一步提升搜索结果的智能解析能力。文心大模型的免费策略旨在降低AI技术使用门槛,推动其在多场景中的规模化应用。
开源与免费策略正成为AI技术普及的关键路径。SkyReels-V1的开源解决了传统短剧制作中高成本、低效率的痛点,而文心大模型的开放则加速了AI工具在创作、搜索等领域的渗透。开源生态的壮大为中小开发者提供了技术平权机会,推动行业从集中式研发向分布式协作转型。
数据驱动智能体与场景应用深化
天娱数科通过Behavision空间智能平台构建了超百万组3D数据与35万组多模态数据,为AI智能体的训练提供了底层支持。其自研的“智者千问”大模型结合3D数据集,能够实现跨类型数据的融合与解析,目前已应用于人形机器人的动作控制、环境交互等环节,提升了智能体的场景适应能力。
AI技术在多模态内容生成与交互场景的应用持续扩展。以SkyReels-V1为例,其开源模型可直接用于短剧创作,用户可通过调整参数生成不同风格的剧情片段,大幅降低剧本可视化成本。百度深度搜索功能则通过大模型增强意图理解能力,实现更精准的信息检索与分析。
尽管技术迭代迅速,行业仍面临模型训练成本高、核心技术自主化不足等挑战。昆仑万维2024年因加大AI研发投入导致净利润亏损,反映出企业短期需平衡技术投入与商业化回报。此外,数据标注质量、多模态融合效率等细节问题仍需持续优化,以实现AI技术在影视、教育、安防等场景的深度落地。
本文源自金融界