在技术高速发展的今天,大家基本已经形成了一个共识,那就是新格局的奠定需要人工智能(AI)与物联网(IOT)技术来支撑。放眼国内互联网发展近况,AI、IOT等成了巨头们之间厮杀的热门领域,阿里、华为、腾讯、百度等都在暗自发力。但在AI和IOT还在蓄力发展的时候,极链科技推出了一个新的概念——视联网(IOV)。
根据思科可视化网络指数,2015年视频在互联网数据中占比70%,并预测到2020年将达到82%。因此整个视频市场空间非常大,如果仅仅看到文娱视频的娱乐消费,那所有人都低估了视频这个互联网核心介质的能力。
当前,全国几乎绝大多数的优质APP都已经进行了视频化,而视频也已经成为了很多流量的入口。虽然流量被唱衰,C端红利风口似乎已过,但作为以视频为主要信息传递介质和功能载体的下一代互联网形态,视联网将颠覆当前图文生态的互联网形态,引发新一轮互联网生态的激烈竞争。
视联网的诞生
当前,互联网已经成为了我们工作生活中不可或缺的部分,人们利用互联网搜索信息、进行社交、消费购物、协作办公,大幅提高了人们的生活质量和工作效率。从互联网的发展历史来看,信息 传递速率和信息处理能力的大幅提升会带来互联网的巨大变革。最典型的例子就是移动互联网带来的繁荣。自从3G等移动通讯技术投入使用和手机芯片处理能力大幅提升,可以随取随用的移动 设备(主要是手机)取代了传统的家用 电脑,将人与互联网更紧密的结合在了一起,产生了诸多基于移动端的商业模式(如共享经济),也给人们的生活工作方式带来了很大变化(手机打车、刷抖音、手机打卡等)。那么,面临即将到来的5G+AI时代,互联网又会迎来怎样的巨大变革,对经济社会和身处其中的每个个人又会带来怎样的变化呢?
有一些观点认为,移动智能时代的下一步是可穿戴式智能时代。以眼镜为代表的下一代可穿戴式智能设备将取代手机等设备,成为更为便利的互联网节点,引领下一代互联网的潮流。
但不难发现,上述观点仅反映了硬件层面的迭代,还缺乏对于软件层面迭代的思考。毕竟人需要一定的渠道和方式去与眼镜等下一代智能设备沟 通,而且这种沟通在新技术的支持下必然是与当前移动智能设备与人的交互方式是不同的。
从软件层面看,在5G+AI支持 下,下一个互联网时代将是基于视频的时代,视频将成为连接人与下一代智能设备、人与互联网的重要媒介,进而形成以视频作为主要信息传递介质和功能载体的互联网形态。将这一代互联网称之为“视联网”。
视联网发展的核心驱动力
技术的发展是为人带来更大的便利。从技术便利性的角度出发,我们可以对视联网的成熟形态作出大胆而又坚实的想象。 起初,人们刚学会如何利用AI技术打破视频的信息壁,并能够利用视频信息进行初步的商业应用。对于视频信息的解读和利用是比较有限的,表现为数据维度较少、可辨识的类别有限。这主要是受限于视频数据的数据量和标识量。当前以深度学习多层神经网络算法为主 流的AI技术需要大量经过标识的视频数 据作为训练AI算法的养料,只有通过大量差异化数据的喂养才能令AI算法达到,甚至超过人眼的识别能力。但数据的标识需要大量的人力投入,同时视频内容的版权和信息安全问题也制约了视频数据的传播。人力与数据共同限制着视频识别能力的提升,而视联网在这些基础上做出三个发展方向,作为核心力量的驱动。
一、视频识别能力提升
作为推动视联网发展的核心能力,也是视联网的 实现基础。可以说,视频识别的精度和速度决 定了视联网链接的广度和深度。速度上的提升 能提高视联网的适用范围,越快的识别速度意 味着观众可以更迅速的与视频内容产生互动。 识别的精度和维度的提升有助于提高视联网的 链接深度。更多维度和更高精度的识别才能精 准定位用户需求,进而深耕具体的需求内容, 调用最为合适的互联网服务。
二、视频互动生态建设
生态建设作为视联网的价值体现,可以通过多样的互动形式链 接丰富的互联网服务,将视频识别的技术能力 转化为给视频观众带来服务的功能模块,在生态集聚中实现产业价值的最大化。视频互动生 态是建立视频识别能力之上的。如何最大化利 用既有的视频识别能力,链接尽可能多且好的 互联网服务、为视频观众提供最为便利性的服 务,是视频互动生态建设的核心问题。
三、软硬件协同发展
视联网真正走向成熟,还需要软硬件层面的协同发展,促进视联网的快速推广与应用落地。 这其中的协同包括处理芯片、通讯带宽、摄影 设备、互动设备等。这就要求在硬件设计层面 就尽可能囊括视联网的软件应用,包括识别算 法、互动程序等。
为了最大化的利用识别出的有限信息,利用外部已有的用户行为大数据(抑或是常识)对观看用户的心态和行为进行预判,进而在计算机解析出的场景信息中挑选那些被认为最能引起观众共鸣的场景,推送与之相关的应用服务。针对视频中的场景,通过AI技术识别出几大场景,通过数据分析和常识判断,选取观众最有共鸣的场景,再进行推动与此相关的场景,进行商品及服务等的售卖。
小结
当前,视联网还处于建立初期,而在视联网发展成熟阶段,我们或许可以借助可穿戴智能设备、尤其是智能眼镜的普及,人所见的一切信息都将被摄像头捕捉并在极短的时间内处理成计算机可以识别的视频信息。此时,人们从视觉信息中激发的所有需求都能得到直接的响应。通过语言、手势、眼动捕捉等多种形式,计算机能够接收到人们提出的需求,并结合捕捉到的视频信息明确需求的内容和对象,进而调用互联网的相关应用和服务来满足人的需求。最终,以一种极为便利的交互形式(可能是AR、VR或MR)将应用和服务反馈在人机交互的虚拟层上,形成了我们理想中的视联网模式。
相信在不远的未来,智能硬件与视联网将完美结合,可以将人的视觉感官建成互联网的入口,链接到一切联入互联网的设备。
评论 {{userinfo.comments}}
{{child.content}}
{{question.question}}
提交