视频

谷歌动态

Google搜索原理

就像一个藏有数十亿本图书的公共图书馆,其藏书量一直在不断增加,查找我们想要的书或想要的内容,确是一个很大的问题,Google就像给我们的图书馆安装一个中枢查询系统。Google 在抓取了所有书的文字,内容图片,视频等所有信息,并创建了索引,因此我们确切知道如何找出所需内容。与图书后面的索引类似,Google 索引也包含一些字词及其位置的信息。当您执行搜索时,在最基本的情况下,我们的算法会在索引中查找您搜索的字词,从中找到相应的网页。搜索“狗狗”时,您可能并不希望看到有几百个“狗狗”字样的网页,而可能希望获得相关的图片、视频或品种信息。Google 的索引系统会注明网页的发布时间、是否包含图片和视频等多方面的信息。借助,我们的搜索服务将继续使用包括关键字匹配在内的方法,以便更好地了解您所关心的人物、地点和事件等信息。

抓取与索引编制

通过抓取查找信息

我们使用称为“网页抓取工具”的软件来查找公开网页。最著名的抓取工具是“Googlebot”()蜘蛛。抓取工具会查看网页并访问这些网页上的链接,就像您在浏览网页内容时所做的操作一样。它们从一个链接跳转到另一个链接,并向 Google 服务器返回相应网页的相关数据。

系统会从以前抓取的一系列网页地址和网站所有者提供的站点地图开始抓取。访问这些网站时,我们的抓取工具会查找其他网页的链接以进行访问。该软件会特别注意新的网站、现有网站所发生的更改和无效链接。

计算机程序会决定要抓取的网站、抓取的频率以及要从各网站抓取的网页数量。Google 不会为了收费而将任何网站更频繁地抓取到我们的网络搜索结果中。我们更关心如何尽可能提供最佳结果,因为从长远来看,这才是对用户最有利的,也正是我们业务的立足之本。
 

Google搜索算法
     
        当你在谷歌搜索前我们已经收录数万亿个网页在我们的数据中心。我们从索引信息算法中找到与你关键字相关性最强的信息提取出来,以与你最相关的信息索引出来反馈到你的计算机上。

                                                           Google搜索流程原理

   1 搜索前                                                  
 

      在您向Google 输入搜索关键字之前,Google搜索查询的过程就已经开始了。我们使用软件机器人(也就是网页抓取工具或“蜘蛛”程序)找到网页,将这些网页的数据采取收录存储在Google数据中心里。 网络数据中心就像是一本厚达数万亿页的书,我们的工作就是为这本书编写索引,高速,准确的找到你所需信息。 
我们的索引远远大于 1 亿千兆字节。 
.  迄今为止,我们花费了超过 100 万小时的计算时间来构建索引。 
 2 搜索时 --足球                                           

        当您开始"足球"搜索时,Google 的算法会开始查找您要查找的内容。"足球"搜索查询历经平均 2,400 公里的路程,以每小时几亿英里的速度为您返回答案(在此过程中还可能访问世界各地的不同数据中心),其速度接近光速。 
分析用户需求:
1.足球(耐克,阿迪达斯)
2.球赛(世界怀,球队,球员)
3.足球(视频,图片等)
 3 排名                                                                     
   该算法着眼于您的查询,并使用 200 多种指标从数百万网页和内容中确定与该查询相关程度最高的答案。 Google 每年进行 500 多次改进,以完善其排名算法。 
 指标示例如下: 
 1.网站内容的及时性                  2. 网页的网址和标题 
 
 3.链接到某个特定网站的其他   4. 最佳结果是网页、图 
   网站的数量,以及这些网站        片、视频、新闻报道还 
   的权威性                                      是个性化搜索结果等 
 
 5.网页上的文字                          6.个性化 

 
 7.搜索关键字的同义词               8.与您关联的人员推荐的结果


 9.拼写检查                                 10.网站内容的质量 
 4 结果                                                                     
        搜索结果按相关程度排序并显示在网页上, 除了能即时看到结果外,将鼠标悬停在结果右侧的箭头上,您还可以看到这些网页的预览,因此您可以快速确定是否要访问该网站。
 更多统计信息: 
  * 每天在 Google 上进行的搜索有几十亿次。 
 
  * 从 2003 年开始至今,Google  已解答 4500 亿不同的新查询,此搜索量是我们前所未见的。 
 
 * 我们每天接触的搜索中有 16% 是新的。 

Google搜索信息索引:

       对于常规搜索查询,就算没有数百万,也有数千个包含相关实用信息的网页。算法是一种接受您的问题并返回相应答案的计算机过程和公式。目前,Google 的算法会根据 200 多种独特的信号或“线索”进行计算,从而推测出您真正的搜索意图(网站上的字词、内容的新鲜程度、您所在的地区)我们一直致力于更新技术和系统,以提供更好的搜索结果;其中很多更改涉及知识图或 Google 即搜即得等令人振奋的新创意。还有一些重要的系统是我们一直在调整和优化的。

下列项目可让您大概了解搜索的众多不同方面。

答案

显示天气信息、比赛成绩和时事快讯之类的内容的即时答案和信息。

自动填充

预测您可能要搜索的内容。这包括理解具有多种含义的字词。

图书

从数以百万计的图书中(包括来自全球各地的图书馆和出版商处的预览和文字)查找结果。

时效性

显示最新的新闻和信息。这包括当您搜索特定日期时收集及时结果。

Google 即搜即得

在您输入时显示即时结果。

图片

为您显示带有缩略图的图片结果,让您一眼就能确定要访问哪个网页。

索引编制

使用适于在网络上收集并存储文档的系统。

知识图

根据现实世界的人、地点、事物及它们之间的联系提供结果。

移动

包括专门针对平板电脑和智能手机之类的移动设备进行的改进。

新闻

包括来自全球的网络报纸和博客的结果。

对查询的理解

了解您输入的字词的深层含义。

优化

提供“高级搜索”、相关搜索等功能以及其他搜索工具,所有这些都可以帮助您提高搜索的准确性。

安全搜索

减少您结果中的成人网页、图片以及视频的数量。

搜索方法

创建新搜索方法,包括“按图搜索”和“语音搜索”。

网站和网页质量

通过一系列的线索确定来源的可信度、信誉或权威程度(其中一个线索是 PageRank,它是 Google 最初使用的算法,会通过网页之间的链接关系确定它们之间的相关程度)。

片段

显示信息的小范围预览,例如网页标题和各搜索结果的简短描述文字。

拼写

找出并纠正可能存在的拼写错误,并提供备选字词。

同义词

识别具有相似含义的字词。

翻译与国际化

根据您所用的语言和所在的国家/地区定制结果。

全面搜索

将具有相关性的内容(比如图片、新闻、地图、视频和您的个人内容)通通纳入一个统一的搜索结果页。

用户环境

根据地理位置、网络历史记录以及其他因素提供相关度更高的结果。

视频

显示带有缩略图的视频结果,以便您快速确定要观看哪个视频。

 

本页关键词: Google搜索原理, Google排名算法, Google搜索,

预约留言

视频

在线预约

联系我们

业务直线: +86 0755-8670 2367
24小时服务热线: 15820447449
传 真: 0755-8670 2367
QQ: 284004799
Email:
地址:深圳市南山区科技园沙河西路2009号尚美科技大厦18层


友情链接
谷歌推广 外贸网站建站 电商网站建设 SEO搜索引擎优化 深圳诺仁
合作伙伴
谷歌中国
联系我们

深圳诺仁技术有限公司

业务直线:+86 0755-8670 2367
24小时服务热线:15820447449
传 真:0755-8670 2367
QQ:284004799
Email:tommy@nuorw.com
地址:深圳市南山区科技园沙河西路2009号尚美科技大厦18层