
谷歌今天在一篇博客文章中宣布,它正在改变其搜索应用程序显示结果的方式。去年,该公司推出了BERT模型的双向编码器表示。后者通过观察单词前后的单词来找出单词的意思。这有助于谷歌搜索找出问题的真正含义。与其在句子中查看关键字并根据这些词提供搜索结果,BERT还不如查看句子中这些词的顺序,以便更好地理解它们的意思。
谷歌说,他们在美国使用的是最新的软件和硬件。在美国,每十个谷歌搜索请求中就有一个会因为BERT算法的存在而被更好地理解。该公司表示,随着时间的推移,它将在更多的国家和更多的语言中使用BERT。这款应用程序可以更好地理解那些更长、更口语化的查询,以及“for”和“to”这两个词对问题意义有很大影响的查询。
“不管你在寻找什么,或者你说什么语言,我们希望你能够放弃一些关键词式的用词,以一种你觉得自然的方式搜索。但是你还是会时不时地遇到谷歌。即使和伯特在一起,我们也不总是对的。如果你搜索“内布拉斯加州以南是哪个州”,伯特的最佳猜测是一个叫做“南内布拉斯加州”的社区。(如果你觉得它不在堪萨斯州,那你是对的。)语言理解仍然是一个持续的挑战,它使我们有动力继续改进搜索。我们总是做得更好,并努力在你发送给我们的每一个查询中找到意义以及最有帮助的信息。”
这是一个例子。有人在谷歌上搜索“2019年巴西赴美游客需要签证”。谷歌承认,以前它使用的算法会返回美国公民前往巴西的结果。但与BERT一起,Search查看了“to”这个词的用法,以帮助理解这是一个关于巴西人去美国旅行的问题

在谷歌给出的另一个例子中,“审美师在工作中站得多吗?”这产生的结果对个人的查询没有用处。但是有了BERT, Search就可以找出单词“stand”的上下文,并意识到它与工作的物理需求有关。

最后一个例子是“你能帮药房的人买到药吗?”谷歌再次承认,在过去,它完全错过了这个问题的真正意义,并将提供一个关于填写处方的一般反应。感谢BERT,谷歌搜索理解了问题的“for someone”部分,这意味着问这个问题的人想知道如何为他们取别人的处方。
