杭州日报 | 当虹“模”力,刷新AI视听新体验
编者按:
从“苏超”到“浙BA”,当球赛制播遇上AI,会发生什么?
当虹科技“模”力出手,不但让普通摄像机也能实现慢动作回放,还能一键生成高光集锦,轻松实现横屏转竖屏,刷新视听新体验。
《杭州日报》发布了《滨江模力,抢占AI新高地》一文,展示了当虹科技背后的“模”法力量。现将部分内容摘编如下:
这个夏天,“苏超”点燃了全民足球的热情。即使没有入场观看,屏幕前的观众也能通过赛事转播,看到草根球员的精彩瞬间,无论是传球慢动作,还是射门的高光时刻,不同呈现方式满足了观众不同口味的观看需求。
这背后,高新区(滨江)企业杭州当虹科技股份有限公司(以下简称“当虹科技”)的BlackEye多模态视听大模型可是出了不少力,融合了AI横竖屏转换、AI慢动作、AI视觉增强的AI制播技术实现规模化应用,为赛事生产了超多“物料”,无疑为“苏超”的出圈再添一把火。
滨江“模”力不止于此,据不完全统计,高新区(滨江)已有30多家企业训练发布超40个模型,应用领域涵盖电力、金融、智能制造、传媒等领域,截至今年一季度,其中11个大模型已通过中央网信办人工智能生成式大模型备案,数量位列杭州第一。
可以说,高新区(滨江)正在成为杭州人工智能大模型发展新高地。
在当虹科技展厅,工作人员播放了一段球员射门的慢动作视频,这在大型赛事上常常看到的高光时刻,以往都是由高速摄像机拍摄而成,而运用BlackEye多模态视听大模型后,通过普通摄像机拍下的片段,也可一键生成慢动作效果,降低拍摄成本的同时,也大大提升了观众的观赛体验。据介绍,该应用也已经在“浙BA”赛事中广泛应用。
2024年,BlackEye多模态视听大模型通过中央网信办算法、大模型“双备案”。该模型整合了视频、音频、图像、文本和三维模型等跨模态内容的推理与生成能力,既包括文生视频、图生视频的生成式算法,也涵盖了AI智能集锦等分析式算法。比如一段视频可通过分析算法,直接剪辑出多个不同主题的视频片段,提高短视频生产速度。
今年,芒果TV的综艺节目《歌手2025》首次采用了由当虹科技支持的国产三维声技术,电视、手机甚至是车载系统的用户只需切换模式,就能够身临其境地感受歌手声音的流动性和空间感,让客厅、车内秒变演唱会前排。
被问及为何要发布大模型,当虹科技相关负责人表示,大模型研发的目标就是要推动视频超高清技术与人工智能大模型融合发展,为视听传媒、空间计算、工业视觉和智能座舱等行业赋能,“我们提高自身的竞争力,也是在帮助客户提质增效,提高行业竞争能力。”他说,“在研发过程中,我们深刻意识到算料的重要性,大力进行算料库建设。”
据该负责人介绍,目前,当虹科技与国家广播电视总局广科院、浙江广电新媒体等单位发起并设立应用创新联盟共建共享高质量视听语料库,同时作为“中国数谷”数据产业发展联盟的首批成员,也主动接入了“三数一链”数据可信流通基础设施框架,进行持续探索。
抢占人工智能产业新高地,作为杭州建设国家新一代人工智能创新发展试验区、创新应用先导区核心区的高新区(滨江)已经积累了先发优势,2024年,全区高端软件与人工智能产业规上企业实现营业收入超2000亿元,占全市比重41.6%,支柱地位明显,高新区(滨江)已初步形成覆盖先进计算芯片、计算和AI框架、高性能服务器、算力基础设施、行业大模型、公共数据交易中心等产业环节的完整产业链。