于视频影像中,比如一个街道的监控视频,计算机程序很难分辨建筑的立体结构,计算机无法辨识楼房、门窗、车辆,找不到它们之间的区别。当人体出现在视频中,计算机也很难将其从背景中区分出来。
这就面临着一个算法的障碍,莫回如果想要将所有监控视频数据化,变成可供分析的数据,而不是一帧帧照片,那么他必须搞定照片的三维重建算法,必须让程序能辨认物体,辨认轮廓。
就算他实现了以上能力,他还面临着其他难题,比如他如何让计算机把邓雪从街上的人流中辨认出来?
这里面就需要人脸识别技术,人体的动作识别技术。
而为了实现全面监控,只观察邓雪的行为还不行,必须获得等丰富信息,比如邓雪和周围人都交流了什么。
这一点如果要实现,那么莫回必须赋予程序表情识别能力,甚至唇语识别能力,以便获得邓雪的语言交流数据。
这些还只是莫回必将面对的部分技术障碍,如果他想将邓雪的日常行为全部变为可分析的数据,那么还会有更多的技术难关需要攻破。
莫回又有事做了~~~
好在莫回现在已经不再是光杆一个,他手里已经有了现成的研团队,他