浙大学金融的他,在纺织生意里孵化出一只先进制造“独角兽”,要给AI装上人类的“眼睛”

“大自然花费了数百万年时间,让人类进化出空间智能,眼睛捕捉光线,将2D图像投射到视网膜上,大脑将这些数据转换成3D信息。”
这段话来自“AI教母”李飞飞的最新分享。不久前,她宣布创业,方向是“空间智能”。在她看来,充分了解人类所生活的3D世界,是人工智能实现下一步突破的重点。
无独有偶,在刚结束的GTC2024大会上,英伟达创始人黄仁勋表示,“下一波AI浪潮将是AI对物理世界的学习。”
在与3D视觉技术打交道这件事上,位于杭州萧山“中国视谷”的先临三维已经做了20年。
纺织生意孵化出先进制造“独角兽”
时间拨回2004年,李涛从浙江大学国际金融专业毕业后,在导师的引荐下,体验了3D技术,当即被吸引;同样对这一技术充满期待的还有当时位于萧山的一家民营纺织企业——“永盛”。李涛的创业热情加上永盛对技术创业的支持,3D的火种就此而生。同年12月,先临三维成立。李涛带领团队探索了一条从技术、产品到市场应用的全新路径。
图片
“我们的第一款产品是高分辨率、能实现瞬时拍摄的三维相机,用非接触式结构光技术获取物体的三维模型。”李涛解释,原先一张照片里的信息是平面的,通过三维呈现就可以在真实空间里获得物体的位置、角度、尺寸等信息。
他透露,当时这款产品在国内还没有市场,只能远销海外发达国家。“我们根据光的特点给公司取了英文名shining,后来才音译成‘先临’”。
一个月前,挂牌新三板的先临公布了去年的业绩:营收10.18亿元,增幅32.56%;归母净利润1.42亿元,增幅622.5%。其中的绝大部分营收来自于3D扫描仪。
3D扫描是科幻片里几乎必备的场景。先临三维通过高清摄像头和激光发射器,再借助算法快速获得复杂物体的精准三维模型,目前这一方案广泛应用于汽车工业、航空航天、能源重工、电子电器、文博艺术、齿科医疗、康复矫治、虚拟现实、教育科研等行业。
在不久前发布的《2024杭州独角兽&准独角兽企业榜单》里,先临三维是新晋3个“独角兽”之一,成了先进制造的代表。
让微米级的尺寸“误差”无处遁形
何为先进制造?李涛认为,先进制造意味着更高的效率、更强的品质以及更低的损耗。以一辆车的生产为例,全车上万个零件,一旦一个零件超出误差标准,就会导致返工、浪费,打破生产节拍。
要想实现精准组装,每一个零件都要做尺寸控制,而高精度3D视觉扫描技术,是工业制造领域进行全尺寸控制的优选方案——通过3D扫描快速获取零部件全尺寸信息,导入软件匹配,加工误差清晰可见。
图片
目前,先临三维的高精度工业3D扫描仪最高精度已经达到了5微米,差不多是普通人一根头发丝直径的十分之一。
“这20年,我们一直在做的就是让精度更高、更稳定。”李涛表示,影响一台设备精度的因素有很多,涉及成百上千个控制点,每一点都要做大量测试,从而找到发挥硬件性能和算法的最优解,实现精度提升。
有了好产品,还得想办法卖出去。大概10年前,先临三维向客户推介产品和技术,经过测试验证,客户的认可度和接受度很高,但就在准备引入时却发现没有相关标准支持。
“如果没有相关标准,就只能算作科研项目。”李涛表示,从那个时候开始,公司着手推进3D测量相关行业标准的制定。截至目前,先临三维已经主导或参与制定了3D测量领域1项国家计量技术规范、1项国家标准、2项行业标准的制定,这也成为高精度3D视觉产品和技术在更广阔领域应用的依据。
“刷个牙”就能生成牙齿模型
除了在工业制造领域的应用,近些年先临三维进军齿科医疗领域,推出了齿科数字化解决方案。用一台长得像“枪”的口腔数字印模仪对准牙齿,用“刷个牙”的工夫就能完成牙齿全套的3D建模。
图片
李涛回忆,2011年,有义齿领域的生产商向他们定制3D扫描和打印方案,他们发现义齿制作过程中的取模、实物制作、定制设计等环节,和工业生产流程非常相似,“开发这个领域,至少有六七成的技术逻辑都是相通的。”
经过产品的多次迭代,2019年,先临三维发布的新款手持口腔数字印模仪,一举打开了全球齿科数字化市场,也让三维扫描技术从工业领域走进每个人的生活。
借助这一技术,普通人到牙科医院做矫正、种植牙等项目,不需要咬厚厚的硅橡胶来取模倒模,只要用装有探头的仪器在口内轻轻扫描一两分钟。
这套3D模型让患者能直观地看到自己牙齿的情况,医生也可以通过软件设计下一步的治疗方案,通过3D打印直接获得实物模型。李涛透露,生成的牙齿模型全口误差在50微米以内,单颗牙齿的误差在10微米以内。
第四次视觉革命
让AI“看懂”真实世界
回顾先临三维走过的20年,李涛说公司发展的“分水岭”出现在2019年。这一年,通信技术领域发生了一件大事,中国正式进入5G商用时代。他认为,信息传输技术迈上新台阶,大容量、高精度的三维数据将会有更广阔的应用天地。作为技术流的掌门人,他连续十几年坚持将公司年营收的20%投入研发。
1826年人类第一次通过拍摄的手段获取到了第一张黑白照片,通过机器获取了真实的影像信息。后来的100多年,从黑白照片到彩色照片,从胶卷时代的模拟信号到手机的数字信号,从低分辨率影像到高清影像,机器视觉经过了三轮技术革命。
伴随着AI的迅猛发展,所有科技公司都在思考,如何让机器像人一样感知和理解现实世界?
正如李飞飞所说,3D视觉所代表的“空间智能”将会开启第四轮视觉革命:让机器获得人的“眼睛”,通过光线看清三维世界中的物体,并加以识别和理解,最终在大脑形成认知或决策。
打个比方,所有人看到猫把杯子推向桌边,就能立刻意识到接下来会发生什么,并及时采取行动。在AI发展的下一阶段,机器将通过大量学习3D数据,拥有对空间的判断能力。
图片
作为3D视觉领域的先行者,李涛明显感觉到各行各业对于3D数据的使用需求在急剧增长,这令他更加笃定公司的发展战略:“一项技术能有广泛的应用领域是好事,但如果什么都想做,恰恰有可能什么都做不好。”
他介绍,目前公司38%员工都是研发人员,平均年龄29岁,主要因为近几年在海内外顶尖高校开启了大力度的校招。这支年轻团队的研究方向也高度一致:专注高精度3D视觉扫描技术和配套软件、硬件的开发,继续打磨这把开启AI时代的利剑。