人工智能之所以比Talking Tom要更加神奇,是因为AI不仅仅是一张有着卖萌小脸儿的复读机,以小娜为例,咱们小娜不仅能听到你说话、能对你说话,更重要的是,小娜还能明白你在说啥。
顾名思义,NLP的意思就是能够理解用户的自然表述。如果没有语义理解,那么我们只能通过类似“关键词”的特定指令来让小娜帮我们做事。
但是!不管你对小娜说“北京天气”,“北京今天天气如何”,还是“北京今儿个天气咋样啊”,小娜都能明白你想知道北京的天气如何。
这些是怎么实现的呢?
一切都要归功于语言理解模型,简单的说,就是攻城狮们让小娜在大量数据上进行机器学习。
这些数据中,有一些已经明确了用户意图和关键信息,比如“北京今天的天气怎么样”这样一句话的意图是查询天气,关键信息是“北京”和“今天”。而像“去中关村怎么走”这句话的意图是查路线,关键信息是“中关村”。
就像学习课本知识一样,这些已经明确了用户意图和关键信息的数据就是小娜的课本。这种学习“课本”的方式即为有监督的机器学习方式。当然,小娜也可以学习非“课本”内容,而这种学习方式,就是非监督的学习方式。
通过学习大量数据【数据量要超乎你想象的大】,小娜就具有了自然语言理解的能力。当她听到用户说话时,也就能快速地判断出你的意图是什么,你这句话的关键信息是什么。
只要学习的时间足够久、学习的内容足够多,小娜的理解能力就会越来越强,即使是她从来没有见过的句子,小娜也能从已有的知识中推断出用户的意图和关键信息。
中华文化的博大精深,很多时候作为千足中国人的软妹子都要在脑内好好反应一下,NLP中出现的歧义现象也就更让小娜迷茫啦。
比如“以前我喜欢一个人,现在我喜欢一个人”……类似这样的内容都需要更加强大的算法来支撑NLP技术,才能让小娜彻底搞懂,你到底是想静静呢还是想静静。
小编推荐阅读