(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 1806243 A
(43)申请公布日 2006.07.19
(21)申请号 CN200480016890.X
(22)申请日 2004.06.17
(71)申请人 GOOGLE公司
    地址 美国加利福尼亚
(72)发明人 拉德海卡·马尔帕尼 维伯胡·米塔尔
(74)专利代理机构 中国国际贸易促进委员会专利商标事务所
    代理人 李镇江
(51)Int.CI
     
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      用于企业列表搜索的搜索查询类别划分
(57)摘要
      一种类别分类部件定位应用于用户搜索查询的适当类别。该类别可以是黄页企业列表。该类别分类部件可以包括类别模型,该类别模型在多个可能的训练数据源的一个或多个上自动地训练。该训练数据源可以包括目录列表、web文档、查询业务、以及广告业务。
法律状态
法律状态公告日
法律状态信息
法律状态
权 利 要 求 说 明 书
      1、一种用于识别与搜索查询相关的类别的方法,该方法包括:
      接收该搜索查询;
      将该搜索查询输入到分类部件,该分类部件包括用来自于一个或多个将项与类别相联系的信息源的训练数据训练的类别模型;
      响应该搜索查询,从该分类部件中接收一个或多个类别;以及
      传送该一个或多个类别。
   
      2、权利要求1中的方法,其中该类别是企业列表类别。
   
      3、权利要求1中的方法,其中该分类部件使用基于贝叶斯的分类技术。
   
      4、权利要求1中的方法,其中该一个或多个信息源包括预定的黄页目录列表。
   
      5、权利要求4中的方法,进一步包括:
      从该预定的黄页目录列表中提取训练数据作为与该项相应的企业名称以及与该企业名称相联系的企业类别。
   
      6、权利要求1中的方法,其中该一个或多个信息源包括预分类的企业网站。
   
      7、权利要求6中的方法,其中该企业网站与基于预定黄页目录列表中的信息的企业分类中的至少一个相联系。
   
      8、权利要求6中的方法,其中在该企业网站中的项被用于修改该类别模型。
   
      9、权利要求8中的方法,其中在该企业网站中的项被用于基于该企业网站中的项的倒数文档频率来修改类别模型。
   
      10、权利要求1中的方法,其中该一个或多个信息源包括消费者报告信息和餐厅指南中的至少一个。
   
      11、权利要求1中的方法,其中该一个或多个信息源包括查询业务数据。
   
      12、权利要求11中的方法,其中该分类部件使用该查询业务数据以推断该类别模型中含糊不清的项的概率。
   
      13、权利要求11中的方法,进一步包括:
      基于该查询业务数据动态地更新类别模型中的概率。
   
      14、权利要求1中的方法,其中该一个或多个信息源包括广告业务数据。
   
      15、权利要求14中的方法,进一步包括:
      基于该广告业务数据动态地更新该类别模型中的概率。
   
      16、一种类别分类装置,包括:
      类别分类部件,配置用于实现将搜索查询与同该搜索查询相关的企业类别相联系的统计模型,该类别分类部件运行于第一模式,在第一模式中该类别分类部件基于训练数据获知该搜索查询和企业类别之间的联系,并且该类别分类部件运行于第二模式,在第二模式中该类别分类部件响应于输入搜索查询,产生相关的企业类别;以及
      类别模型,配置用于将该搜索查询和企业类别之间的联系存储为一组概率,该类别模型基于训练数据进行构造,该训练数据从预定的黄页列表、已分类的企业网站、消费者报告信息、餐厅指南、查询业务数据、以及广告业务数据中的至少一个中进行选择。
   
      17、权利要求16中的类别分类装置,其中该类别分类部件实现统计分类器。
   
      18、权利要求16中的类别分类装置,其中该类别分类部件基于查询业务数据或广告业务数据动态地更新该类别模型中的概率。
   
      19、一种计算装置,包括:
      处理器;以及
      与该处理器相耦合的存储器,该存储器包括:
      类别分类部件,配置用于实现将搜索查询与同该搜索查询相关的企业类别相联系的统计模型,该类别分类部件运行于第一模式,在第一模式中该类别分类部件基于训练数据获知该搜索查询和企业类别之间的联系,并且该类别分类部件运行于第二模式,在第二模式中该类别分类部件响应于输入搜索查询,产生相关的企业类别,该训练数据从预定的黄页列表、已分类的企业网站、消费者报告信息、餐厅指南、查询业务数据、以及广告业务数据中的至少一个中进行选择;以及
怎样到黄页网站
      类别模型,配置用于将该搜索查询和企业类别之间的联系存储为一组概率,该类别模型基于训练数据进行构造。
   
      20、权利要求19中的计算装置,其中该类别分类部件实现统计分类。
   
      21、权利要求19中的计算装置,其中该类别分类部件基于该查询业务数据或广告业务数据动态地更新该类别模型中的概率。
   
      22、一种训练模型以将类别与搜索查询相联系的方法,该方法包括:
      将训练数据接收为每一个都与搜索查询相联系的一组分类条目,其中每一个搜索查询都由一个或多个搜索项来表示;以及
      基于该训练数据将统计分类模型自动地产生为一组值,该组值定义了该搜索项与类别条目中特定的条目相联系的概率。
   
      23、权利要求22中的方法,其中该训练数据包括预定的目录列表。
   
      24、权利要求22中的方法,进一步包括:
      从该预定的目录列表中提取训练数据作为与该搜索项相应的企业名称以及与该类别条目相应的企业类别。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。