百度陈翔:人工智能+搜索引擎,提升信息获取效率及准确性

原创
新闻
2017年7月21日-22日,由51CTO主办的以人工智能为主题的WOTI2017全球创新技术峰会在北京富力万丽酒店隆重举行。分论坛上,来自百度的资深研发工程师陈翔带了精彩的演讲。会后,记者采访了陈翔,就人工智能在百度搜索的应用以及人工智能的发展前景等问题进行了深入交流。

【51CTO.com原创稿件】2017年7月21日-22日,由51CTO主办的以人工智能为主题的WOTI2017全球创新技术峰会在北京富力万丽酒店隆重举行。分论坛上,来自百度的资深研发工程师陈翔带了精彩的演讲。会后,记者采访了陈翔,就人工智能在百度搜索的应用以及人工智能的发展前景等问题进行了深入交流。

【讲师简介】

[[199811]]

陈翔,百度资深研发工程师,负责网页搜索部相关研发工作:在搜索spider,阿拉丁等部门先后从事数据挖掘,机器学习等相关工作。

人工智能+搜索引擎

陈翔表示,其实一直以来,搜索就是一个人工智能的问题。只不过以前的人工智能更倾向于用一系列的超链技术、检索技术将用户查询通过切词和数据进行综合,然后通过查询数据关联得到相关的结果。但是,通过这些年的发展,搜索在人工智能或者说在机器学习、深度学习上进行了很多的改造升级。随着机器学习时代的来临,百度搜索把人工搜索规则变成机器学习模型,其中应用最多的就是深度学习技术建立模型。

那么,怎样才能真正的用好一个深度学习模型?陈翔认为,我们可以将深度学习看成一个黑盒子。判断一个查询是不是属于某个类别的过程中,会产生一维特征,将它作为一个判断的依据,也就是核心特征,然后通过深度学习专家评判,以及其他的辅助平台,将特征做综合,最终形成高级模型。

现在,百度搜索凭借机器学习、数据挖掘、自然语言处理、语音、图像及用户建模等技术日渐智能化。如今的百度搜索,不仅能针对移动场景将搜索结果有机聚合,继而结构化呈现精准的信息内容,提升人们的信息获取效率,而且可以通过大数据技术描绘人的个体特征,在准确判断用户需求的基础上提供个性化信息服务。

百度搜索如何准确了解用户的搜索意图,识别用户需求?

在无线时代和语音时代,用户在百度上的搜索会更多使用自然语言,而很多情况下用户的搜索带着很明确的意图。除去使用传统的搜索技术外,我们可以针对一些重要的领域进行深入的搜索意图理解。

利用每个用户搜索附带的语义信息,结合大数据挖掘,百度搜索能够理解每次查询用户的核心意图,借用各领域的内容开放生态建立起的知识库系统,精准的满足每个用户搜索的核心意图。比如当用户搜索苹果手机,百度搜索会给出围绕这个手机相关的一系列商品,资讯,评测等结果。

基于这个目标,百度针对每个领域的需求特点,基于海量的数据和知识库信息设计了一个通用需求理解模型,针对每个领域通过自动游走,模型生成的方式都快速产出一个理解模型,更进一步利用深度学习挖掘特征并加以应用大大优化了效果。

陈翔表示:目标在大多数类目上,需求识别基础数据能够达到95%准确率,在经过一些其他的策略的综合优化后,更能进一步提升达到98%。

2017年7月21日-22日,由51CTO主办的以人工智能为主题的WOTI2017全球创新技术峰会在北京富力万丽酒店隆重举行。分论坛上,来自百度的资深研发工程师陈翔带了精彩的演讲。会后,记者采访了陈翔,就人工智能在百度搜索的应用以及人工智能的发展前景等问题进行了深入交流。

在更复杂的带歧义场景下,百度搜索究竟是如何做到准确了解用户的搜索意图? 对此,陈翔表示,这个问题其实解决起来很困难。这是搜索最终完成的一件事情,这里牵扯很多技术。

现在百度通过已有的技术,能够针对不同用户同一个具有歧义的查询进行基于场景和用户画像的更深入分析和结果展示。同时,通过交互等方式进一步协助用户判断他的真实意图,比如苹果,尽管大部分查询都是寻找iphone相关的官方信息,但百度仍然会有比较多样性的方式,能够让寻找水果或者电影的人有比较简单的获取信息方式。

采访***,谈及人工智能应用的市场发展前景,陈翔表示,在WOTI峰会现场,他发现深度学习会场的人非常多,是各个会场之最。深度学习时代已经来临,深度学习深受社会认可,吸引了很多从业者不断涌入。大规模的机器集群、计算能力,大量的算法的不断改进,高精人才的持续投入,国家政策的支持等因素正在推动深度学习,推动人工智能不断向前发展。

对于想要踏入人工智能研究领域的技术人员,陈翔建议首先要懂机器学习的内核,然后了解深度学习的能力,并学会如何充分发挥出深度学习的能力。目前互联网上有很多的相关课程,可以多关注实战类,多看深度解析类的读物,只要足够用心必将有所成。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

责任编辑:蓝雨泪 来源: 51CTO.com
相关推荐

2011-05-17 18:01:52

搜索引擎优化

2011-11-15 08:40:17

百度

2010-05-06 13:32:59

2023-01-11 12:49:49

AIChatGPT

2009-08-07 08:29:36

百度搜索引擎

2022-11-18 12:06:48

App接口搜索

2023-02-08 11:05:38

2017-02-14 07:26:59

人工智能搜索引擎

2020-10-20 07:49:12

百度搜索引擎

2009-12-04 09:27:02

搜索引擎色情

2009-08-12 09:27:31

Google搜索

2018-11-06 12:58:43

大数据人工智能搜索引擎

2022-04-02 16:14:09

百度教育人才

2013-10-21 17:42:39

百会搜索赢家

2020-03-17 08:23:47

搜索引擎百度Google

2012-04-06 09:23:09

百度苹果

2016-11-10 13:15:43

百度

2011-05-17 17:40:59

搜索引擎信任度

2024-03-26 15:02:34

生成式人工智能人工智能SEO

2014-04-21 10:25:01

大数据
点赞
收藏

51CTO技术栈公众号