今天早晨,谷歌推出了开源工具TensorFlow,打算把人工智能相关的知识和经验向大众分享。按照谷歌披露的信息,TensorFlow是一种机器学习系统,从智能手机到大型数据中心服务器都能使用。
但问题是,从搜索到智能手机上的图片识别,再到几乎可以看成交通未来的无人驾驶,人工智能在方方面面都几乎是当下谷歌的技术核心。把自家的人工智能系统以开源的方式对外开放,从而使任何人,包括竞争对手,都可以看到系统的核心代码并加以利用,谷歌这么做,是在故意作死么?
先说结论:人工智能,或者机器学习,本身不是即插即用的家用电器。只有系统没有用,人工智能中的核心,谷歌是万万不敢对外开放的。
实际上,机器学习系统只是人工智能技术的冰山一角。谷歌保留下来的东西还有很多,比如说海量的数据,比如说运转这一系统的强大网络化计算机,比如说由调配算法的人工智能专家组成的庞大团队。而赋予人工智能灵魂的,恰恰是谷歌没有公开的东西。
用英国布里斯托尔大学(University of Bristol)的人工智能教授奈罗-克里斯坦尼尼(Nello Christanini)的话来说,“谷歌开源人工智能系统不是自杀行为。深度学习需要大量的测试、调试和适配工作。”
人工智能系统在进行深度学习某个领域的时候,需要通过大量数据进行“训练”。几年前,谷歌教会其系统识别猫的图像时,就采用了大约1000万张图像,而这些图像都是从YouTube中海量的视频里截取出来的。处理这些图像,又动用了由16000台计算机组成的计算机网络。
而在这个过程中,系统或许会受到数百万条需要调整的参数。没有相关工程师参与其中,自己搭建一套人工智能系统出来难于登天,谷歌公布出来的深度学习算法用处也极其有限。
调试参数是件需要从失败和错误里汲取经验的活儿。人工智能公司Loop AI Labs的首席科学家帕特里克-埃伦(Patrick Ehlen)在《华尔街日报》的采访中说,“头一次做这件事的人需要花上很长时间。”
小编推荐阅读