【Chromium Blog】机器学习如何改进 Windows、Mac 和 ChromeOS 上的 Chrome 浏览器地址栏

Chrome 浏览器地址栏(我们称之为 “omnibox“)每天被使用数十亿次,无论是快速查找标签页或书签、返回以前访问过的网页,还是查找信息,它都是一个功能强大的工具,能让网络搜索更轻松。

在最新发布的 Chrome 浏览器(M124)中,我们集成了机器学习模型来支持桌面版 Chrome 浏览器的全能搜索框,从而使网页建议更精确、更贴近您的需求。未来,这些模型还将帮助改进搜索建议的相关性评分。下面我们将详细介绍帮助我们的团队建立这一集成的一些重要见解,以及我们希望新模型能为我们带来什么。

我们是如何做到这些的

作为负责 omnibox 的团队的工程负责人,每次发布都让我感觉很特别,但这次发布对我来说真的是近在咫尺。当我刚开始开发 Chrome 浏览器全能盒子时,我四处征求意见,希望能为用户带来更好的体验。我听到的第一个答案是 “改进评分系统”。问题并不是评分系统不好。事实上,omnibox 经常能让你找到想要的 URL 或查询,这让人感觉很神奇!问题在于它缺乏灵活性。一套手工建立和调整的公式可以很好地完成工作,但很难改进或适应新的情况。因此,该评分系统在很长一段时间内基本上没有得到改进。

在大部分时间里,人工智能训练的评分模型是显而易见的前进之路。但经过多次失败后,我们才最终找到了这条路。我们之所以长期无法应对这一挑战,是因为要替换每天使用数十亿次的功能的核心机制非常困难。软件工程项目有时被描述为 “边飞边造飞机”。这个项目给人的感觉更像是 “在全世界所有飞机都在飞的时候更换所有的座椅”。项目规模巨大,每个用户都能直接感受到变化。

如果没有这样一支才华横溢、兢兢业业的团队,这项雄心勃勃的事业是不可能完成的。在前进的道路上,我们遇到了很多坎坷,有很多墙壁需要我们去突破,还有一些意想不到的问题拖慢了我们的进度,但是我们团队的动力来自于一个真诚的信念,那就是要为我们的用户做好这件事。

惊人的洞察力

使用 ML 系统的乐趣之一在于,训练会考虑到所有数据的规模,这对任何个人或团队来说都是难以做到的。这可能会带来惊人的洞察力。

在这个项目中,这种现象最酷的例子是我们观察了一个特殊信号的评分曲线:自上次导航以来的时间。对这一信号的预期是,它越小(您最近导航到特定 URL 的时间越短),该信号对更高相关性评分的贡献就越大。

事实上,这也是该模型的学习结果。但是,当我们仔细观察时,我们发现了一些令人惊讶的现象:当导航时间很短时(几秒钟,而不是几小时、几天或几周),模型的相关性得分就会降低。原来,训练数据反映了这样一种模式:用户有时会导航到一个并不是他们真正想要的 URL,然后立即返回 Chrome 浏览器的全能框再试一次。在这种情况下,他们刚刚导航到的 URL 几乎肯定不是他们想要的,因此在第二次尝试时,该 URL 应该获得较低的相关性得分。

现在回想起来,这是显而易见的。如果我们没有启动 ML 评分,我们肯定会在旧系统中添加一条新规则来反映这种情况。但在训练系统观察到这种模式并从中学习之前,从未有人想到会发生这种情况。

未来

有了新的 ML 模型,我们相信这将为改善用户体验带来许多新的可能性,因为它有可能纳入新的信号,比如区分一天中的不同时间以提高相关性。我们希望探索针对特定环境训练专门版本的模型:例如,移动用户、企业用户或学术用户,也可能是不同地区的用户。

此外,我们注意到用户与 Chrome 浏览器综合框的交互方式会随着时间的推移而改变,因此我们认为相关性评分也应随之改变。有了新的评分系统,我们现在可以简单地收集更新鲜的信号,重新训练、评估并定期部署新的模型。

作者:Justin Donnelly,Chrome 浏览器软件工程师

本文文字及图片出自 How Machine Learning improved the Chrome address bar on Windows, Mac and ChromeOS

你也许感兴趣的:

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注