Google图书(Google Books)是一个由Google研发的搜索工具,它可以自Google所扫描、经由光学字符识别、储存的数位化数据库中搜索资料。此服务于2004年10月在法兰克福书展发布,命名为Google Print。当用户使用关键字搜索,Google图书搜索的结果索引会显示在Google网络搜索服务的上方。用户还可以在Google图书搜索搜索书籍。点击Google图书搜索的结果索引打开页面,使用户可以查看书籍中的页面以及内容相关的广告,链接到出版商的网站和书店。Google以限制网页的浏览数量,来阻止书籍被打印和保护文字内容的复制版权,并追踪用户使用记录,作为通过各种准入限制和保障措施的依据。
图书搜索引擎_GOOGLE图书搜索 -简介
GOOGLE图书搜索
Google Books搜索仍然在测试阶段,但基础数据库仍持续增长。Google图书搜索允许公有领域的作品和其他没有版权的内容,可以以PDF的格式被下载。对于在美国境外的用户,Google必须确保它们的工作没有触犯到用户所在的国家的法律,根据Google图书搜索支持小组的成员说法:“一本书是否是在公有领域往往是一个棘手的法律问题,我们会谨慎的处理,直到我们确定本书已进入公有领域。”
关于扫描方面,许多书籍使用Elphel 323相机扫描,这种相机每小时可以照1000页。
而Google的这一计划受到极大称赞,它可能成为前所未有、全球最大的网上主体的人类知识,但它仍有其潜在的批评――关于侵犯版权。
谷歌联合创始人谢尔盖・布林(Sergey Brin):不要让书籍消失在图书馆的黑洞里。
当Google图书搜索大量的扫描一些过期学报、杂志时产生了一个问题,就是其扫描时并没有办法将元数据(metadata)也一并扫入。这使得GOOGLE学术搜索只好开办自己的数位化计划,并放置认同这个计划的出版社的过期期刊文章。
图书搜索引擎_GOOGLE图书搜索 -扫描数量
Google曾表示,他们目前一天可扫描三千本书籍。到2007年3月为止,Google已经数位化100万本图书,根据纽约时报
google图书搜索
的估计,花费了约500万美元。在2008年10月28日Google说,通过此项服务,他们有700万本的图书被搜索,其中包括扫描的20000个出版商的合作伙伴。这700万册图书当中,100万基础上与出版商有“完全预览”的协议,100万属于在公有领域,以及其余500万是绝版或商用。
图书搜索引擎_GOOGLE图书搜索 -来源
Renowned Library 计划
Google 是 renowned libraries 项目的合作伙伴,可以获得他们的图书收藏。对于那些尚处于版权期的图书,Google 图书搜索结果中会显示图书的一些资料,以及小部分内容摘要。对于那些已经过了版权期的图书,用户可以阅读和下载全部内容。
合作项目
Google 还同超过2000家出版商与作者建立了合作关系,将他们的图书上线。Google 对这些图书提供预览,还提供收藏该书的图书馆,书店的链接。
图书搜索引擎_GOOGLE图书搜索 -竞争
微软在2006年开发了一个类似的计划,名叫Live Search Books。它持续进行了一段时间,直到2008年5月该计划才被取消。[12] 所有的Live Search Books的资料,现已存在Internet Archive。Internet Archive是非营利性的,它是继Google之后第二大图书扫描计划。截至2008年11月已超过100万全文公有领域的作品扫描上网。Europeana主宰约300万份的数位物件,其中包括影像、照片、绘画、音频、地图、手稿、印刷书籍、报纸等,这些档案超过一千项是由欧盟自过去两千年的欧洲历史搜集而成的。
图书搜索引擎_GOOGLE图书搜索 -时间表
2004十二月:Google表明要扩张其Google Print计划,初期称为Google Print Library Project。[14]Google宣布与几个知名的大学和公共图书馆建立伙伴关系,包括密歇根大学、哈佛大学(哈佛大学图书馆)、史丹佛大学(Green Library)、牛津大学(博德利图书馆),以及纽约公共图书馆。根据新闻稿和各大学图书馆长所言,Google计划在十年之内数位化并提供约15万册的Google图书搜索服务。Google动作之迅速引发了争议,因为出版商和作者协会都质疑Google计划进行的数位化,不仅是针对公共领域的图书,同时也挑战了著作权。
2005
九月至十月间:两起对Google提出的诉讼指出,Google公司并不尊重版权,并且未能妥善补偿作者以及出版商。其一是集体作者诉讼代表(作家协会Authors Guild控诉Google,2005年9月20日);另一是五个大型出版商和美国出版商协会Association of American Publishers控诉的民事诉讼(McGraw Hill 控诉Google,2005年10月19日。)
十一月:Google将Google Print正式改名为Google图书搜索。[15]这个方案使出版商、作者及他们在此服务中的书籍改了名,称为“Google Books Partner Program"(见Google Library Partners),并且与图书馆的合作关系就成为了Google Books Library Project。
2006
八月:加州大学系统宣布它们将加入图书搜索数位化的计划。
九月:马德里Complutense大学图书馆成为加入Google图书计划的第一个西班牙语图书馆。
十月:威斯康星大学麦迪逊分校宣布,它与威斯康星州历史学会的图书馆,将加入图书搜索数位化计划。合并后,图书馆馆藏变为720万册。
十一月:弗吉尼亚大学加入该计划。该库包含超过5万册和1700多万份的手稿、珍贵书籍和档案。
2007
一月:在得克萨斯州大学奥斯汀分校宣布,它将加入图书搜索数位化计划。至少有一万册数位化将是由该大学的13个图书馆定位。
三月:巴伐利亚州图书馆宣布与Google建立合作伙伴关系,来扫描超过100万份关于公共领域,和绝版的德语以及英语、法语、意大利语、拉丁语和西班牙语作品。[18]
五月:一本数位化计划的书,被公告为Google及县立、洛桑大学图书馆所纳入。[19]
五月:根特大学的Boekentoren图书馆,将参与Google图书数位化计划,且将把19世纪的图书制成法国和荷兰的语言并上线。
六月:合作委员会(Committee on Institutional Cooperation)宣布,其12个成员图书馆未来六年将参与扫描1000万本书的过程。
七月:庆应义塾大学成为Google在日本的第一个图书馆合作伙伴,他们将数位化至少12万本公共领域的书籍。
八月:Google宣布,它将数位化达50万本有版权的书籍,也将数位化在康奈尔大学图书馆的公共领域书籍。Google还将提供一个系统,可将数位化复制的所有作品扫描并纳入大学自己的图书馆。
九月:Google增加了一个功能,允许用户在公共领域共享片段的书籍。
九月:Google推出一项新功能,名为“我的图书馆”,允许用户创建个人体制的图书馆。他们可以运用标签、审查、利率、或全文检索来选择图书。
十二月:美国哥伦比亚大学成为一个数位化公共领域的伙伴。
2008
五月:微软逐渐势衰,并打算结束其扫描计划。该计划扫描了75万份的书籍和八千万篇的杂志文章。
十月:经过两年的谈判,出版业和Google终于达成协议。Google同意以补偿作者和出版商,换取有权将数以百万计的图书提供给公众。
十一月:Google和合作伙伴的图书扫描计划达到了700万大关。其中一百万已达成完全预览模式,另有一百万已是可完全浏览和下载的公共领域的作品。
图书搜索引擎_GOOGLE图书搜索 -参与者
参与计划的成员人数自Google图书计划(Google Books Library Project)实行之初已成长许多;迈索尔大学在许多媒体的报道都提到其为此计划之合作伙伴,但他们实际上并没有被Google列为合作伙伴。首批参与者
哈佛大学,哈佛大学图书馆,Harvard + Google
密歇根大学,密歇根大学图书馆,Michigan + Google
纽约公共图书馆,New York Public Library + Google
牛津大学,博德利图书馆,Oxford + Google
史丹佛大学,Stanford University Libraries(SULAIR), Stanford + Google
后期加入参与者
Bavarian State Library,Bavaria + Google,Bayerische Staatsbibliothek + Google (in German)
哥伦比亚大学,Columbia University Library System,Columbia + Google
Committee on Institutional Cooperation,CIC + Google
Complutense University of Madrid,Madrid + Google,Complutense Universidad + Google (in Spanish)
康乃尔大学,Cornell University Library,Cornell + Google
Ghent University,Ghent University Library/Boekentoren,Ghent/Gent + Google
庆应义塾大学,Keio Media Centers (Libraries),Keio + Google (in English),Keio + Google (in Japanese)
普林斯顿大学,Princeton University Library,Princeton + Google
加利福尼亚大学,California Digital Library,California + Google
洛桑大学(en), Cantonal and University Library of Lausanne/Bibliothèque Cantonale et Universitaire/BCU + Google (in French)
University of Mysore,Mysore University Library,Mysore + Google
得克萨斯州大学奥斯汀分校,University of Texas Libraries,Texas + Google
维吉尼亚大学,University of Virginia Library,Virginia + Google
威斯康星大学麦迪逊分校,University of Wisconsin Digital Collection,Wisconsin + Google
图书搜索引擎_GOOGLE图书搜索 -争议
违反著作权争议
出版业与作家协会批评该计划列入片段的作品是侵犯版权的行为。2005年秋季,作家协会和美国出版商协会分别控诉Google。Google反驳说,该计划的每个项目皆是合理使用,并且在这数位时代,每一个字都有对应到其出版索引。2006年6月,在诉讼之后,法国出版商宣布它打算控诉法国Google。2006年底,德国控诉被撤回。
2007年3月,Google被告侵犯著作权法的图书搜索服务。微软的副总兼法律顾问托马斯・鲁宾(Thomas Rubin)批评Google一再任意复制作品,并且总是直到有人出面指证才会停手。 2008年11月28日,作家协会、出版界和Google签订了和解协议,Google同意支付总共1.25亿美元,包括诉讼费用及建立图书权登记处。该解决方案将在2009年5月得到法院的批准。解决的反应有好有坏,其中一个与Google合作的图书馆表示,如果Google无法找到“更合理的条款”,它会选择撤回与其合作的关系。
弗吉尼亚大学的副教授Siva Vaidhyanathan,以法律观点研究一已出版的见解之后他指出Google该计划构成了危险的理论――合理使用,因为索赔的使用其实是不合理的,它可能会导致司法限制这一权利。而之后作家协会控诉Google没有去法院,导致合理使用争端得不到解决方案。
Google许可的公有领域作品也是一个令人关注的议题。一些出版作业是在公有领域进行的,例如美国联邦政府创造的所有作品,但那些作品仍被视如其他版权保护的作品般对待,导致它们在1922年之后遭禁。
语言争议
一些欧洲政治家和知识分子批评Google有语言帝国主义倾向,理由是因为绝大多数的书籍都扫描成英文,这会导致英文成为世界代表性的自然语言,如此一来受欢迎的语文学例如德语、俄语、法语则会渐渐不被重视,并不公平。在这些批评声浪中出面表达意见的是法国国家图书馆馆长Jean-No?l Jeanneney。
图书搜索引擎_GOOGLE图书搜索 -学术搜索
当Google图书搜索大量的扫描一些过期学报、杂志时产生了一个问题,就是其扫描时并没有办法将元数据(metadata)也一并扫入。这使得GOOGLE学术搜索只好开办自己的数位化计划,并放置认同这个计划的出版社的过期期刊文章。
图书搜索引擎_GOOGLE图书搜索 -现状
Google 的全文图书搜索包含了大约700万册图书,在下面的搜索框中输入关键词,就可以对这700万册图书进行搜索:
事实上,Google 的Web搜索也包含了图书索引,相关内容也会出现在搜索结果中,点击即可进入图书的相关章节。
图书搜索引擎_GOOGLE图书搜索 -前景展望
Google 的使命是对世界上的信息进行组织以方便用户访问。Google 联合作者,出版商,图书馆将这一目标又推进了一步。虽然这个协议对 Google 与合作伙伴来说是双赢的,但真正受益的是用户与读者。
Google 图书搜索将发展成一种为图书业带来繁荣的服务。