海棠书屋 > 都市小说 > 生在唐人街 > 第258章 传票
    变得出名了固然值得高兴,但更让苏木开心的是owo搜索引擎真的可以投入实际使用,网络上有许多跟他有关的消息,构想出超文本链接、创建bee聊天软件等等。

    再去搜索galaxy公司,这回只有寥寥几条链接,詹姆斯在一旁解释说:“互联网内的资源太多,我们只是通过蜘蛛机器人抓取了一部分,然后利用这部分资料进行模拟,按照某种我们程序员制定出的规则排列筛选,今天早晨开始进行更广泛、更深度的抓取,服务器确实应该更换一台容量更大的了。”

    苏木对理论方面有所了解,蜘蛛机器人通过wcnc网络进行文件抓取,随后经过分析、过滤、列队等方式,组成一部“书”,用户输入关键词,就像是在检索书的目录,随后按照某种算法按照优先顺序,将它展现在用户的面前,供用户进行选择。

    网络蜘蛛即“web-spider”,名字很形象,把互联网比作蜘蛛网,那么网络蜘蛛就是在这张网上爬来爬去的蜘蛛,通过网页的链接地址来寻找网页,随后再从网页读取上面的内容,并且储存进公司独立的数据库当中保存起来,还可以找到网页中的其他链接,然后通过链接去寻找其他网页抓取数据,直到将一个网站里的所有网页全部抓取完


本章未完,请点击下一页继续阅读 >>