钱塘江畔探“视界”

本报记者 吴雪聪
图片
图为“中国视谷”窗口园区标志牌。
图片
图为先临三维公司跟踪式激光三维扫描系统正在扫描整车。
图片
当虹科技展厅。
图片
俯瞰“中国视谷”窗口园区。
据统计,人类70%的信息通过视觉获得。一定程度来说,“视界”有多大,人类对“世界”的认知就会有多大。
在浙江杭州,越来越多的“黑科技”正不断拓展视觉边界。工业视觉、医学影像、虚拟现实、数字安防、自动驾驶……如今,钱塘江畔已形成覆盖多个细分领域的视觉智能产业集群。建设“中国视谷”、打造“视觉智能第一城”……
视觉智能将给人们的生活带来哪些改变,对工业生产又意味着什么?记者来到杭州实地探访。
融入千行百业
工程师手持一个酷似魔方的不规则多边体,一会儿蹲下,一会儿起来,对着汽车左一下、右一下地挥舞……
刚走进先临三维科技股份有限公司,眼前的一幕引起了记者浓厚的兴趣。乍一看,有些让人摸不着头脑;视线一转,眼前的汽车竟“钻”进了电子屏幕里——原来,机器发出的50条蓝色激光线,正以每秒最高368万次的速度扫描汽车,约8分钟后,一个完整的车辆数字三维模型跃然浮现。转动鼠标滚轮,汽车细节在屏幕上不断放大,直至轮廓、起伏、弧度全部消失不见,只剩最原始的点、线,以及三角网格。
“这就是高精度工业3D扫描仪!它保留了物体结构、几何细节、尺寸关系等信息,和现实物体高度一致,可以广泛运用于工业测量的各个环节。”先临三维董事长李涛介绍。
先临三维位于杭州市萧山区,是一家聚焦高精度3D视觉的国家级制造业单项冠军企业。在杭州,像这样深耕视觉智能领域的企业还有很多:不仅有海康威视、大华股份、新华三等叫得响的行业龙头,也有先临三维、当虹科技、虹软科技等一批专注视觉智能产业某一领域的企业。据统计,2023年,杭州视觉智能规上企业达846家,全市视觉智能产业总营收达到7763亿元。
视觉智能产业,为何能在杭州落地生根、枝繁叶茂?这得从20多年前说起。
21世纪初,国内视频行业经历了一场大洗牌,数字信号技术风头日盛。彼时,初创不久的海康威视和大华股份嗅到商机,接连向市场推出一系列采用数字技术的视频监控产品。到2021年,杭州生产的视频监控产品DVR、NVR、摄像机市场占有率超过50%。
“虽然视频监控产品是杭州的传统优势,但从产业端角度看,单纯的监控安防需求已趋于饱和,加上国际市场不明朗、海外拓展受限等因素,只靠视频安防单一路径,恐怕走不远。”浙江省北大信息技术高等研究院院长蒋云告诉记者。
要想谋求新的生机,杭州必须蹚出一条更深、更宽的路。“既然人70%的信息是靠视觉获取的,那么理论上,信息产业中70%都可以和视觉技术关联,这是一片巨大的蓝海。”蒋云说。
将目光探向千行百业——环保领域,大华股份的热成像摄像机可以全天候监控秸秆焚烧易发区;教育领域,宇视科技的多媒体一体化的智慧黑板能让课堂更多彩;文保领域,海康威视对13.74公里的西安古城墙进行厘米级三维建模保护;交通领域,当虹科技的压缩技术能让远洋船舶在卫星窄带宽传输条件下清晰、流畅调阅视频……2023年,杭州提出“数字安防—视觉智能—智能物联”的产业跃迁之路,一大批企业融入千行百业,以视觉智能为核心提供智慧物联解决方案和运营服务。
如何将自家的视觉科技融入更多的应用场景之中?各家企业有独门“心法”。
“请躺下,放轻松。”在先临三维展厅,工作人员带记者体验了一把牙齿扫描。将设备放入口腔,左扫一下,右探一下,一两分钟左右,记者的口腔模型便实时在电脑上生成,整个过程口腔没什么特别的感觉。
记者不禁好奇:一个做工业测量的企业,是如何迈进齿科大门的?
十多年前,齿科数字化在国内还是新鲜事,牙齿正畸、种植不仅需要患者长时间张口咬硅橡胶印模,而且在后期制取、邮寄过程中,所产生的误差也会影响佩戴体验。就算医院有口腔内数字化取模设备,大多也是从国外进口。
有需求就有商机。齿科数字化这片国内市场的空白,正好给拥有高精度3D视觉技术的先临三维一个机遇。2011年,先临三维开始攻关口腔内三维扫描技术:牙齿表面有一层透明膜,这是3D扫描的天然障碍,为了在不喷粉情况下获取三维数据,团队大胆革新,放弃熟悉的方案,采取全新策略;同时,团队自主研发算法和软件,智能识别并摈除人体颊舌侧等杂余数据……现在,公司口腔数字印模仪已能将最远端两颗牙齿的距离误差控制在50微米以内,单颗牙齿的误差控制在10微米以内。
“我们不断寻找市场机遇,根据客户的痛点针对性升级技术,目前产品已广泛应用于汽车、航空、能源、电子、医疗等领域。只有生长出更多、更广的应用场景,视觉科技企业的生命力才能不断绽放。”李涛说。
掌握核心技术
视觉智能的应用潜能巨大。然而,如果只在下游应用端打得火热,却不掌握核心技术、核心标准、核心芯片等,企业的“命门”终是掐在他人手中。
中国视频产业就曾吃过“卡脖子”的亏。
2002年1月的一天,一艘来自中国的轮船抵达英国港口,孰料刚刚靠岸,便遇到难题。原来,船上漂洋过海的DVD机没有获得国际编码标准的专利授权,被欧洲市场拒之门外。一时间,传票纷至沓来,要求中国厂商缴纳高额的专利费用。火热的国内DVD市场犹如当头浇下一桶冰水被迅速冰冻。
如何避免“卡脖子”?杭州的企业交上了各自的答卷。
“嘭,嘭,嘭……”画面屏幕中,一个工匠正在打铁,无论是亮部迸溅的火花高光,还是暗部冷调的铁器,甚至是布衣上的褶皱,全都清晰可辨……在杭州市当虹科技股份有限公司展厅,一台8K超高清编解码设备吸引了记者的目光。公司董事长孙彦龙介绍:“这台设备以全国产化为特色,采用的是中国自主研制的AVS3编码标准。”
啥是编码?孙彦龙介绍,以8K视频为例,一帧内的像素点比1080p扩大16倍,帧数也从每秒24帧扩大为50帧;视频“体积”如此巨大,要想流畅传输,就要经过压缩编码,先变细,再还原变粗。这就像是经过一道两头宽、中间窄的哑铃型传送门,如此,视频才能变成大小合适的数字信号,在数字世界自由驰骋。
对于企业来说,想要实现这种编解码,就必须遵守行业“游戏规则”——采用一套业内通用的音视频编码标准。但是,很长一段时间里,“游戏规则”的制定权并不在中国。
“过去,编码标准由国外机构和企业制定,我们要用,就必须支付相当比例的专利费用。”已经与视频算法打交道20多年的谢亚光,是当虹科技创新研究院院长。2002年起,他和团队就开始参与制定中国自主知识产权的视频编码标准(AVS)。
“这就好比蚂蚁搬家、蜜蜂筑巢,在外国标准已经占据先机的情况下,成千上万个技术细节都需大量补充,自主研制难度很大,得一点点磨。”谢亚光回忆说,这是全国音视频领域学术界、产业界的一次合力突围。经过数年艰难推进,2009年,AVS标准已经被认为是国际上最重要的3个先进视频编码标准之一,并正式成为国际通行标准。现在,作为全球首个面向8K、5G产业应用的视频编码标准AVS3,已经领先于国际同类标准。
此外,杭州市政府积极引导当地视觉智能产业集群攻关核心技术,预计到2027年将突破视觉智能关键技术100项,核心零部件、电子元器件、基础软件等领域建立多源可供体系,实现备份系统全覆盖。
“你看这两个画面,有什么区别?”在当虹科技展厅,记者来到一个实时显示某学校动态画面的屏幕前,只见一条细线将画面一分为二,肉眼却察觉不出什么差别。疑惑之际,孙彦龙为记者揭晓了答案:“右边是经过超级编码的视频,能为行业客户节省近90%的传输带宽及中心端存储的成本。之所以你看不出区别,是因为人、车、衣服、背包等关键信息没有丢失,只有天空、地面等不重要的信息,被不着痕迹地弱化了。”据悉,这项技术目前已在卫星视频通信和工业视频传输领域得到广泛应用。
编码是当虹科技的核心技术之一,这种神奇的“区别对待”效果,端赖人工智能的“大脑”。“我们对画面的压缩不是简单、粗暴、无差别的,而是基于人工智能算法的感知编码,精准淡化不重要的信息,而且可以在调阅的时候按需还原。”谢亚光介绍。
“对于视觉智能企业,不光要做大应用层,更要做深基础层、做强技术层,这也是杭州打造‘中国视谷’的目标之一,要掌握核心技术,将产业‘命门’牢牢攥在自己手里。”蒋云说。
打造高效集群
沿着杭州时代高架一路向南,穿过冠山隧道,“中国视谷”四个大字逐渐醒目。这里是位于杭州萧山的湘湖未来产业社区,也是“中国视谷”窗口园区所在地。
“中国视谷”起笔在湘湖。两年前,园区里还是一片低矮的老旧厂房;如今,站在园区高处俯瞰,只见一座座高楼拔地而起,时代高架为“一竖”,湘滨路、腾飞路、亚太路作“三横”,构成了整个园区的“丰”字形空间格局。
“如果说千百年来,人们在湘湖看到的是‘一泓新水绿罗铺’的自然风光;那么今天,视觉智能产业集群俨然成为一道新的风景线,人们在这里更能看见未来‘视界’。”湘湖国家旅游度假区管委会副主任、中国视谷·萧滨一体化专班负责人章菲说。如今,杭州市萧山区、滨江区、余杭区、钱塘区等联动共建,一个视觉智能产业生态圈逐渐显现,成为杭州具有辨识度的产业新地标。
蒋云表示,集群化的发展策略能集聚更多资源:“原材料供给、运输物流、配套建设、人才引进等都会因为集群化得到提升,产业集群让资源配置更有效率。”
在“中国视谷”窗口园区,产业集群带来的效应已初步体现。“以前,我们先临三维会在设计好产品电路后,交给广东的一些贴片厂或者电路板生产企业来做,现在我们发现,本地也有企业能做,质量还蛮好,节省了物流和沟通成本。”说着,李涛指了指窗外,“这家企业离得很近,就在隔壁。”
这家“隔壁”企业,正是近年落户园区的杭州云尖信息技术有限公司,主要为行业客户提供服务器和算力芯片设计与制造服务。章菲介绍,到2027年,杭州将进一步强链、补链、稳链,培育视觉智能产业链主企业5家以上,招引视觉智能重点项目100个以上,产业投资800亿元以上。
未来,怎样确保视觉智能产业的“蛋糕”越来越大?杭州将目光投向了增量市场。
“一个短发的女生在街头唱歌,早期彩色电影效果……”在后台输入指令,片刻后,一段视频便生成:熙熙攘攘的人群中,一个穿着针织裙、盘着卷发的姑娘高歌于马路中央,她双目微闭,表情沉醉,画面色调复古而怀旧。如此逼真的一幕,完全由AI生成。
今年4月,当虹科技发布了自主研发的BlackEye多模态视听大模型。“随着Sora的出现,业内对视频大模型都很关注,虽然现在它还没有大规模商用,但技术研发必须超前。”孙彦龙介绍,当虹科技很多前瞻性的技术都是提前3—5年进行布局,企业内七成都是研发人员,每年研发投入占营业收入的30%以上。
“每一个崛起的行业新秀,并非只是靠在存量市场上争份额,而是因为前瞻了市场的变化趋势,才在增量市场弯道超车。”蒋云表示,回看过去几十年视觉产业发展,企业的业务增长不是“争”出来的,而是“长”出来的。
立足存量、锚定增量,如今,杭州这个“数字之城”正在乘“视”而上。据预测,到2027年,杭州市视觉智能产业总体规模达到1万亿元,开发视觉智能领域新产品新应用达1000个,越来越多的未来“视界”图景,将在钱塘江畔徐徐展开。
本版照片均由浙江省杭州市萧山区委宣传部和受访企业提供