您的位置：首页 > 业内资讯 > 计算机“看”我们的世界长啥样？

计算机“看”我们的世界长啥样？

来源：雷锋网　|　时间：2015-12-23 14:01:43 |　阅读：113　|　标签：人工智能　 |　分享到：

下载游戏

计算机虽然有了人工智能的程序支持，但事实上也不能将其机器学习的功能等同于像人类那样。至少，到目前还不是这样。那么，向Google的图片识别或者Facebook的M应用等一类系统，它们是怎么能够理解自然语言或视觉的呢？

计算机“看”我们的世界长啥样？

下面，是人工智能系统Josh的自我独白：

简而言之，我们将单词和短语的含义以数字的形式储存在计算机上。目前，市场上有许多这类产品，比如将单词转换成向量形式的工具word2vec，该工具使用浅人工神经网络来计算文字嵌入。此外也有一些诸如记忆网络的技术，能够自主学习文本，进行一些简单有限的问答。

计算机“看”我们的世界长啥样？

在过去的几年中，由于先进的人工神经网络算法有了许多惊人的成果，图像识别和数字信号处理技术异常火爆。但是相比较之下，同是人工智能领域的理解自然语言方面似乎显得困难得多，为什么呢？

自然语言处理本质上是另一种约束关系的问题

研究自然语言是困难的，很多时候甚至超过了我们的想象——因为语言永远不变的是改变，因为全世界有千万种语言……无论你的观点是什么，自然语言难以为算法所处理的最大原因是——我们没有足够多的样本。

确实，我们拥有大量的文本资源，包括书籍、博客、社交媒体等。但即便如此，我们得到的用以分析的文本相对来说还显得不足。看一看以下图片：

计算机“看”我们的世界长啥样？

当我们分析音频数据，或者图像数据时，事实上我们得到的数据信息比人类意识中的要多。以佳能5D Mark III相机为例，摄影领域的人通常会说这是一个令人尊敬的相机，因为它有着5760 x 3840的分辨率。因为每个颜色像数都分别由红、蓝、绿、α值（RGBA）来表示，所以每个像素拥有4个标准数值。在其原始格式当中，一张这种像素的图片大约含有 88.47 MB数据。相比较之下，莎士比亚的所有作品也只有4.4 MB。一个像数等于4个字节，一个字符则占一个字节。

小编推荐阅读