百度拆字技术,框计算理念崭露头角

3月2日,百度研发推出拆字检索技术:用户只要输入诸如“没字去掉三点水怎么念”的搜索需求即可第一时间获得最专业的解答结果。据记者了解,基于拆字检索技术目前百度已经上线了近万个相关数据,可以为用户提供精准的拆字搜索请求。

百度官方表示,拆字检索技术旨在为用户提供更精准的搜索结果。其技术的实现基于百度搜索与拆解生僻字的资源数据库的成功对接,通过对用户搜索需求进行智能识别,第一时间合理分配给相应资源,并将解析出来的关键字段放到数据库中进行查询,再迅速返回给用户最优的结果。

拆字技术源自“框计算”理念

百度早在去年提出“框计算”技术创新理念,旨在为用户提供一站式的搜索服务。作为“框计算”的重要应用,阿拉丁平台已推出多种创新技术与搜索应用功能,其中包括列车时刻查询、股票时时查询、邮箱搜索页面直接登录以及拆字检索功能等多种搜索服务。”

我们从实际的搜索结果中就可以看到:当用户搜索相关信息的时候,例如“"曦字去掉日字怎么读”、“语字去掉言字旁怎么读”,相关的搜索结果会显示在搜索页面最上方,信息框里显示有关于该字读音、用法、出处等专业精准的解答。

据悉,这项技术被称为语义搜索,即搜索引擎的工作不再拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索,从而更准确地向用户返回最符合其需求的搜索结果。

如一个用户在搜索框中输入“孟字去掉子”时,深谙语义搜索的搜索引擎就能够判断出,用户想要找的并不是含有“孟”、“去掉子”等字眼的内容,而是想要查找与“皿”这个字相关的内容;

同样,当用户搜索“表现春天的图片”时,搜索引擎会向其呈现出各种与春天相关的图片,而不仅仅局限于该图片的标题是否包含“春天”字样。

内部人士介绍,语义搜索的实质是自然语言处理技术,这正是百度自推出框计算概念以来一直重点投入的研发领域——早在去年,百度就曾与在该领域非常权威的哈尔滨大学建立联合实验室,着手自然语言相关技术的研发。

有分析人士指出,这项应用看似简单,实际上,却标志着百度的框计算已经突破了针对完整文字进行匹配的传统检索时期,进入了更加精准、智能和人性化的语义搜索时代。

庞大的中文数据为依托

据悉,拆字检索技术除了以“框计算”为主导外,百度强大的中文数据库资源,为该技术提供了重要的物理基础。百度表示,凭借百度强大的数据库资源,可以更清楚的理解用户的拆字需求,并辅助以业内领先的语义分析技术,通过强大的拆字、语义分析、系统识别等一系列复杂的过程,将最精准的答案返回给用户。

有关专家表示,百度的搜索数据优势还将更好的体现在反应用户需求方面。据悉,此次拆字检索服务的上线,就是基于百度在网民的搜索请求中发现,有很多用户搜索类似的关键词,所以推出的新功能。

可见,凭借中文搜索平台的先天优势,百度将更好的把用户需求直接作为产品技术和服务的创新点。

陕西弈聪软件信息技术股份有限公司
电话:13679229477    02989322522
陕西省西安航天基地神州四路科为城墅20栋4301