c 网页开发_注册公司需要多少费用_免费的商城网站_供应商管理   互联网 发展早期,以雅虎 为代表的网站 分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自 己想找的网站。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。
  1990 年,加拿大麦吉尔大学(University of McGill )计算机学院的师生开发出Archie 。当时,万维网 World Wide Web )还没有出现,人们通过FTP 来共享交流资源。Archie 能定期搜集并分析FTP 服务器上的文件名信息,提供查找分别在各个FTP 主机中的文件。 用户必须输入精确的文件名进行搜索,Archie 告诉用户哪个FTP 服务器能下载该文件。虽然Archie 搜集的信息资源不是网页(HTML 文件),但 和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie 被公认为现代搜索引擎的鼻祖。
  搜索引擎的起源:
  
所有搜索引擎的祖先,是1990 年由MontrealMcGill University 三名学生(Alan EmtagePeter DeutschBill Wheelan )发明的ArchieArchie FAQ )。Alan Emtage 等想到了开发一个可以用文件名查找文件的系统,于是便有了ArchieArchie 是第一个自动索引互联网上匿名FTP 网站文件的程序,但 它还不是真正的搜索引擎。Archie 是一个可搜索的FTP 文件名列表,用户必须输入精确的文件名搜索,然后Archie 会告诉用户哪一个FTP 地址可以 下载该文件。 由于Archie 深受欢迎,受其启发,Nevada System Computing Services 大学于1993 年开发了一个GopherGopher FAQ )搜索工具VeronicaVeronica FAQ )。Jughead 是后来另一个Gopher 搜索工具。
  发 展(1 ):
  
 世界上第一个Spider 程序,是MIT Matthew GrayWorld wide Web Wanderer ,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL ) 。
  搜索引擎一般由以下三部分组成:
  爬行器 (机 器人、蜘蛛)
  索引生成器
  查询检索器
  发 展(2 ):
  
 Excite 的历史可以上溯到19932 月,6Stanford University (斯坦福大学)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993 年中,这已是一个完全投资项目,他们 还发布了一个供webmasters 在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers
  注:Excite 后来曾以概念搜索闻名,20025 月,被Infospace 收购的 Excite 停止自己的搜索引擎,改用元搜索引擎 Dogpile
  发 展(3 ):
  
 19944 月,斯坦福大学的两名博士生,美籍华人杨致远和David Filo 共同创办了Yahoo !。随着访问量和收录链接数的增长,Yahoo 目录开始支持简单的数据库搜索。因为Yahoo! 的数据是手工输入的,所以不 能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo! 中收录的网站,因为都附有简介信息,所以搜索效率明显提高。
  注:Yahoo 以后陆续有 AltavistaInktomiGoogle 提供搜索引擎服务
  Yahoo! --几乎成为20 世纪90 年代的因特网 的代名词。
  发 展(4 ):
  
 1995 年,一种新的搜索引擎形式出现了—— 元搜索引擎(Meta Search Engine )。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集 中起来处理后再返回给用户。
  第一个元搜索引擎,是Washington 大学硕士生 Eric Selberg Oren Etzioni Metacrawler 。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。
  发 展(5 ):
  智能检索的产生:它利用分词词典、同义词典,同音词典改善检索效果,进一步还可在知识层面或者 说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典检索处理形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索 效果。
  例:
  (1 )查询 算机 ,与 相关的信息 也能检索出来;
  (2 )可以进一步缩小查询范围至 微机 服务器 或扩大查询至 信息技术 或查询相关的 电子技术 软件 计算机应用 等范畴;
  (3 )还包括歧义信息和检索处理,如苹果 ,究竟是指水果还是电脑品牌, 华人 中 华人民共和国 的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。
  发 展(6 ):
  个性化趋势是搜索引擎的一个未来发展的重要特征和必然趋势之一。一种方式通过搜索引擎的社区化 产品(即对注册用户提供服务)的方式来组织个人信息,然后在搜索引擎基础信息库的检索中引入个人因素进行分析,获得针对个人不同的搜索结果。自2004 10yahoo 推出myweb 测试版,到11a9 推出个性化功能,到2005Googlesearchhistory 基本上都沿着一条路子走,分析 特定用户的搜索需求限定的范围,然后按照用户需求范围扩展到互联网上其他的同类网站给出最相关的结果。另外一种是针对大众化的,Google 个性化搜索引 擎,或者yahooMindSet ,或者我们都知道的前台聚类的vivisimo 。但是无论其中的哪一种实现方式,即Google 的主动选择搜索范围,还 是yahoohttp://my.yahoo.com ),vivisimo 的在结果中重新组织自己需要的信息,都是一种实验或者创想,短期内无法成为主 流的搜索引擎应用产品。
  发 展(7 ):
  
 网格技术(great global grid) :由于没有统一的信息组织标准对网络信息资源进行加工处理,难以对无序的网络信息资源进行检索、交接和共享乃至深层次的开发利用,形成信息孤 岛。网格技术就是要消除信息孤岛实现互联网上所有资源的全面连通。
  美国全球信息网格(Global Information Grid)
  Robot (机器人)一词对编程者有特殊的意义。Computer Robot 是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的Robot 程序像蜘蛛(spider) 一样在网络间爬 来爬去,因此,搜索引擎的Robot 程序被称为spider 程序。
  1993Matthew Gray 开发了 World Wide Web Wanderer ,这是第一个利用HTML 网页之间的链接关系来检测万维网规模的 机器人(Robot 程序。开始,它仅仅用来统计互联网上的服务器数 量,后来也能够捕获网址(URL )。
  19944 月,斯坦福大学(Stanford University )的两名博士生,美籍华人Jerry Yang杨致远 )和David Filo 共同创办了Yahoo 。随着访问量和收录链接数的增长,Yahoo 目录开始支持简单的数据库搜索。因为Yahoo !的数据是手工输入的,所以不能 真正被归为搜索引擎,事实上只是一个可搜索的目录。雅虎于20021223 日收购inktomi2003714 日收购包括Fast Altavista 在内的Overture200311 月,Yahoo 全资收购3721 公司。
  1994 年初,华盛顿大学(University of Washington )的学生Brian Pinkerton 开始了他的小项目WebCrawler1994420 日,WebCrawler 正式亮相时仅包含来自6000 个服务器的内容。 WebCrawler 是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL 和摘要搜索,摘要一般来自人工评论或程序自动取 正文的前100 个字。
  19947 月,卡内基· 梅隆大学(Carnegie Mellon University ) 的Michael MauldinJohn Leavittspider 程序接入到其索引程序中,创建了Lycos 。除了相关性排序 外,Lycos 还提供了前缀匹配和字符相近限制,Lycos 第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。
  1994 年底,Infoseek 正式亮相。其友善的界面,大量的附加功能,使之和Lycos 一 样成为搜索引擎的重要代表。
  1995 年,一种新的搜索引擎形式出现了—— 元搜索引擎(A Meta Search Engine Roundup )。用户只需提交一次搜索请求,由元搜索引擎负责转换处理,提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果, 集中起来处理后再返回给用户。第一个元搜索引擎,是Washington 大学硕士生 Eric Selberg Oren Etzioni Metacrawler
  199512 月,DEC 的正式发布AltaVistaAltaVista 是第一个支持自然 语言搜索的搜索引擎,第一个实现高级搜索 语法的搜索引擎(如AND OR NOT) 。用户可以用AltaVista 搜索新闻组(Newsgroups )的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索 Titles 、搜索Java applets 、搜索ActiveX objectsAltaVista 也声称是第一个支持用户自己向网页索引库提交或删除URL 的搜索引擎,并能在24 小时内上线。AltaVista 最有 趣的新功能之一,是搜索有链接指向某个URL 的所有网站。在面向用户的界面上,AltaVista 也作了大量革新。它在搜索框区域下放了“tips” 以帮 助用户更好的表达搜索式,这些小tip 经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引 擎广泛采用。1997 年,AltaVista 发布了一个图形演示系统LiveTopics ,帮助用户从成千上万的搜索结果中找到想要的。
  1995926 日,加州伯克利分校助教Eric Brewer 、博士生Paul Gauthier 创立了Inktomi1996520 日,Inktomi 公司成立,强大的HotBot 出现在世人面前。声称每天能抓取索引1 千万页 以上,所以有远超过其它搜索引擎的新内容。HotBot 也大量运用cookie 储存用户的个人搜索喜好设置。
  19978 月,Northernlight 搜索引擎正式现身。它曾是拥有最大数据库的搜索引 擎之一,它没有Stop Words ,它有出色的Current News7100 多出版物组成的Special Collection 、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。
  199810 月之前,Google 只是斯坦福大学(Stanford University )的一个小项目BackRub1995 年博士生Larry Page 开始学习搜索引擎设计,于1997915 日注册了google.com 的域名,1997 年底,在Sergey BrinScott HassanAlan Steremberg 的共同参与下,BachRub 开始提供Demo19992 月,Google 完成了从Alpha 版到Beta 版的蜕变。 Google 公司则把1998927 日认作自己的生日。Google 以网页级别(Pagerank )为基础,判断网页的重要性,使得搜索结果的相关性 大大增强。Google 公司的奇客(Geek )文化氛围、不作恶(Don’t be evil )的理念,为Google 赢得了极高的口碑和品牌美誉。20064 月,Google 宣布其中文名称谷歌 ,这是Google 第一个在非英语国家起的名 字。
  FastAlltheweb )公司创立于1997 年,是挪威科技大学(NTNU) 学术研究的 副产品。19995 月,发布了自己的搜索引擎AllTheWebFast 创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。 FastAlltheweb )的网页搜索可利用ODP 自动分类,支持Flashpdf 搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、 MP3 、和FTP 搜索,拥有极其强大的高级搜索功能。(2003225 日,Fast 的互联网搜索部门被Overture 收购)。
  19968 月,sohu 公司成立,制作中文网站分类目录,曾有 出门找地图,上网找搜狐 的 美誉。随着互联网网站的急剧增加,这种人工编辑的分类目录已经不适应。sohu20048 月独立域名的搜索网站搜狗 ,自称第三代搜索 引 擎
  Openfind 创立于19981 月,其技术源自台湾中正大学吴升教授所领导的GAIS 实验室。Openfind 起先只做中文搜索引擎,鼎盛时期同时为三大著名门户新 浪、奇摩、雅虎提供中文搜索引擎,但2000 年后市场逐渐被BaiduGoogle 瓜分。20026 月,Openfind 重新发布基于GAIS30 ProjectOpenfind 搜索引擎Beta 版,推出多元排序(PolyRankTM ),宣布累计抓取网页35 亿,开始进入英文搜索领域。
  20001 月,两位北大校友,超链分析 专利发明人、前Infoseek 资深工 程师李彦宏 与 好友徐勇 (加 州伯克利分校博士后)在北京中关村创立了百度(Baidu )公司。20018 月发布Baidu.com 搜索引擎Beta 版(此前Baidu 只为其它门户网站 搜狐新 浪Tom 等提供搜索引擎),20011022 日正式发布Baidu 搜索引擎,专注于中文搜索。Baidu 搜索引擎的其它特色包括 :百度 快照、网页预览/ 预览全部网页、相关搜索词、错别字纠正提示、mp3 搜索、Flash 搜索。20023 月闪电计划(Blitzen Project )开始后,技术升级明显加快。后推出贴吧 、知道、地图、国学、百科 、文档、视 频、博客等一系列产品,深受网民欢迎。200585 日在纳斯达克上市,发行价为USD 27.00 ,代号为BIDU 。开盘价USD 66.00 ,以USD 122.54 收盘,涨幅353.85% ,创下了5 年以来美国股市上市新股当日涨幅最高纪录。
  20031223 日,原慧聪 搜索正式独立运做,成立了中国搜索 20042 月,中国搜索发布桌面搜索引擎 网络猪 1.02006 3 月中搜将网络猪更名为IGInternet Gateway ) 。
  20056 月,新浪正式推出自主研发的搜索引擎 爱问2007 年起,新浪爱问 使用 google 搜索引擎。
  200771 日 全面采用网易自主研发的有道 搜索技术,并且合并了原来的综合搜索和网页 搜索。有道网页搜索、图片搜索 博客搜索 为网 易搜索提供服务。其中网页搜索使用了其自主研发的自然语言处理、分布式存储及计算技术;图片搜索首创根据拍摄相机品牌、型号,甚至季节等高级搜索功能;博 客搜索相比同类产品具有抓取全面、更新及时的优势,提供 文章预览 博客档案 等创新功能。

">

宁波seo搜索引擎优化公司

软件开发的工作、计算机培训机构靠谱吗、永久使用、不限域名、网络培训系统入口

自己设计装修房子软件?

c 网页开发_注册公司需要多少费用_免费的商城网站_供应商管理

    北京市建筑设计研究院有限公司信息流优化师是做什么的桂林百姓网汕头网站外包上海定制建站网站建设网站设计 联系硬件开发是什么淘宝店铺装修模板免费下载北京官网建设多少钱高端的网站设计制作在哪注册域名长沙网站se0推广优化公司南京网站优化平台有寓意的网络公司名字个人房产备案查询网上查询网页设计需要哪些软件中华人民共和国住房建设部网站全网最低价业务网站网页制作作业南昌seo网站推广网络关键词优化方法中国工程信息网站大学生网页设计期末作业乐清人才网口碑好的网站建设公司郴州网站制作公司有哪些建网站公司是如何赚钱免费做网站的网址有哪些重庆网站建设有名 乐云践新珠海市品牌网站建设公司广州市工程交易中心官网

猜你喜欢

  • 友情链接:
  • 免费注册淘宝店铺 武汉新闻网站 30岁零基础学室内设计 个人信息查询 杭州营销型网站建设工作室 广东省人民政府网官网