Home » 图书馆员的未来

专访:图书馆员的未来 – Tim Spalding

18 九月 2007 155 被读 No Comment

原文出处:Tim Spalding – Future of Librarians Interview

Tim Spalding是密歇根大学希腊语和拉丁语的毕业生,他也创建了LibraryThing,一个专为藏书者而设的社会网络站点。
timspalding.jpg您是LibraryThing的创造者,但有些读者可能对您还不太了解,能否给我们介绍一下您自己和您的背景?
当然可以。我个人倒是没什么可以说的。LibraryThing是我第一个受到注意的尝试。我在Houghton Mifflin工作过一段时间,还有我是密歇根大学希腊文和拉丁文的毕业生。

书在我们的生命中占有非常中心的部分。我最终跟一个小说作家结了婚,想要控制家里书的数量是不可能的。我从孩子时代就一直在给书分类;我有一个专门存书的FileMaker数据库,我试了各种不同的解决方案,觉着好玩。也不是说我不会从LibraryThing赚到钱,我的意思是这会是一个我自己感兴趣的小小项目,而不是变成一个公司。

我是在2005年的八月开始做LibraryThing的,当时我在做自由网络设计师的工作,它用了大概一个星期就起步,从此成长很快。在开始的时候,它只是个分类。转折点发生在后来,我发现人们开始社会化地用它,他们互相分享他们图书馆(译者注:这里“图书馆”指是个人图书收藏,与LibraryThing中的含义对应。下同)的URL和各自对书的评论——所以我就开始给它加上社会项,我想这的确给了它很大的推动力。

这些人是谁?

像我一样的书虫,还有很多做学术的人。现在不同了,很多人只是将正在读的书放入LibraryThing,然后评论一下或者获得一些推荐。没有必要是家藏万卷、汗牛充栋的人。

LibraryThing在做着与普通社会化网络所不同的事,它不只是你与朋友相连那么简单的二元逻辑,要么你是我朋友,要么你不是我朋友,或者你是我朋友而我不是你朋友。LibraryThing背后的观点是,你以更复杂的方式与他人联系起来。实际上在LibraryThing没有一个“朋友”项。使得人们的联系主要是通过书,比方说,如果你跟我有两本相同的书,那不足为奇;但如果你跟我有40本相同的书,而它们又恰巧都是我们的冷门书,那么很有可能我们有相当深的共同兴趣。所以网站的内容,也就是人们放进的书,和社会化动态,是紧密相连的。

马歇尔·麦克卢汉说过“未来的书就是简介”,看起来您的网站似乎是在证明他的预言是正确的。LibraryThing对书有什么影响?

LibraryThing的对书影响可以说是新式的,也可以说是古老的。我想50年前如果你跟一群才俊聚会,通常他们中会有人引用一部小说,今天会是一部电影,这没什么两样。你最好在开始谈论小说前,了解别人跟你共同的嗜好。而你又不能确定每个人都读了这本书,除非它是《Harry Potter》。我想LibraryThing正是基于此想法,并且使得围绕书的社会化变成可能,通过它你可以找到与你有共同阅读爱好的人,而之前你不可能知道你们有共同的爱好。这种研究生院般的氛围棒极了,你可以几乎只谈某本书,跟任何人谈都行。这在现实生活中是不可能的,所以在线能够实现就显得很酷。

作为新事物,LibraryThing尝试利用关于书的数据,在做一系列有趣的事,例如标签——你甚至将会看到一个跟踪批注的选项。它是在试着社会化难以实现的社会化,同时使社会化扩展到更宽的层面。

可以谈谈推荐机制吗?

当然。在展示某书的网页上,你会看到一系列推荐列表,其中的一个链接是更多的推荐。现在我想我已经有了五个推荐算法了,在这当中涉及到的数学很吸引人。Amazon的是一个很好的例子。LibraryThing依赖良好的数据。其中来源之一便是标签,通常是很好的,但也有出错的情况。经典的例子是标签“leather”,可以指书的装帧,皮革包装;也可以指一种色情书——不通过复杂算法是无法区分出来的。算法很大部分跟持有模式有关。如果你和我的书有交集,那么交集以外的书应该会交叉吸引。只要做一些标准的统计,是会出良好的数据的。Amazon就做了这个,不过你在Amazon买书可能是帮你的同事买,或者帮你老婆买,因此你在Amazon买的书并不是你所买的东西的良好样本。LibraryThing通过在某种程度上代表你的所有藏书——或者甚至只是你目前在读的——而可以更真实地代表你是谁。

这对所谓的“长尾”也更有效。我的藏书中有些卖得不怎么好但它们依然是好书。Amazon上一个经典的例子是,你打“Harry Potter”,得到的五个推荐就是五本《Harry Potter》。为了保证推荐有意义,LibraryThing会进行封锁,只推荐两本《Harry Potter》,然后给你《A Wrinkle in Time》(译者注:麦德林·兰歌《时间的皱纹》)。《时间的皱纹》是本伟大的书,不过本周它的销售不大理想。但它在人们的藏书阁中。所以,LibraryThing看到它并说出,喜欢《Harry Potter》的人也将喜欢《A Wrinkle in Time》和Susan Cooper的书(译者注:另一位儿童文学家,其作品《The Gray King》曾在1976年获得纽伯瑞儿童文学奖,参此)或者其他。

LibraryThing采用Z39.50协议。这是一个类似于“在黑胶唱片上听音乐”的小花招,还是的的确确是个打着灯笼都找不到的好事情?

Z39.50是一个图书馆间用来交换数据的协议,图书馆已经用了好些日子了,但他们把它做得很专业,返回的记录不好分析,你必须懂得它们的语法分析。用LibraryThing,我做到了。并不是什么高尖精技术,但需要一点点的努力和对不太好的老技术的很多宽容。很多LibraryThing的竞争对手止步于此,因为Amazon的API(译者注:编程接口)可以向Amazon请求查询并返回漂亮的格式化XML数据。如果你不是够深的书虫那样就够了,但如果你有绝了版的书那这可不够好。如果你关心图书馆编目数据,如果你想要主题、杜威十分法等等——如果你想要真正高质量的图书数据,你躲不开图书馆。在这点上LibraryThing可以说是多走了一步。

在家我是用色标来整理书柜的,在LibraryThing我怎样做到这点?

你必须贴标签。也有人建议我们用色标——分析颜色,并允许用颜色显示他们的书柜。我想那会是一项很有趣的功能。

通过图书馆技术和真正个人化的荐书,它会取代图书馆员吗?

在荐书上,图书馆员并不是扮演着知道全宇宙的书的角色。图书馆员很早就来源于读者咨询网站、期刊、其他图书馆员、他们所尊重的赞助者等等的帮助。LibraryThing只是在这当中的另一个来源。我不认为它会比Amazon或其他任何事,更排斥对图书馆员的需求。如果真有图书馆员危机,我想也不会在这点上。

但LibraryThing也有做类似图书馆员做的事。有一个功能可以消除版本歧义:你可以将一部作品的所有版本放在一起,然后由用户决定一本书是否也是《霍比特人》的一个版本(译者注:《指环王》/《魔戒》前传)。图书馆员有自己的方法来做这个,而LibraryThing却由于集合了成千上百的群体智慧而成为一个很好的解决办法。LibraryThing在用用户生成的内容和统计数据做着一些有趣的事。

搞定了相关标签后,我转而想到主题,看哪些主题与哪些标签最相关,并按统计相关度顺序显示Library of Congress(译者注:美国国会图书馆,下称“国会图书馆”)的主题词。这似乎从来没人做过。

可以多说一点吗?

当然。有了标签分类法,你就建立起了人们对书的看法的巨大数据库。举个例子,像“chick lit”这个标签(译者注:鸡仔文学,英美出版界的一个创作流派,其作品是专门以女性为阅读对象的流行读物。),它会给你返回一个标签同为“chick lit”的书单,按相关度降序排列,一个很不错的列表。“cyberpunk”或者其他词也一样。从设置目的和生成过程看来,它们都会比国会图书馆的主题词要好。LibraryThing生于数字化,所以它可以拥有很多图书馆分类法都没有的相关度概念。举个例子,在国会图书馆,有一个条目叫“Man-Woman Relationships”。一本书要么关于此,要么不关于此。但当然80%的西方文学都在某种程度上与此有关。LibraryThing所以超过其他很多网站的地方,在于我们有标签,并且我们把标签和像国会图书馆那样的可控主题词来混合起来用,所以当你给出某标签,就可以看到与它最相关的是哪些主题,反之逆然。这有优点也有缺点。一方面有很有歧义如“leather”的LibraryThing标签,另一方面图书馆主题词也有不足,比如国会图书馆主题词“Cookery”本来是个很好的主题词,只是没人会把“Cookery”打进条目查询。两种方法都互有长短;我不认为标签会取代分类法,就像电视不会取代收音机一样。

事实上,LibraryThing在发布一系列可以插入图书馆类目的专用插件,让图书馆员可以将LibraryThing的功能和内容,不用另外自己再实现,直接就放进他们的分类。其中一个插件是推荐书的,根据的是LibraryThing的数据,但只会在你所拥有的书中推荐。我想荐书这点很容易接受,但真正难的是要图书馆分类接受标签——我们走着瞧。

您觉得LibraryThing是图书馆未来模式的一个探索者吗?

我想它提出了结合用户参与的概念。其他人也提出了,只不过LibraryThing是在线对书贴标签和分类的最突出的例子。Amazon一百万年前就有了评级和推荐,只是那一直只服务于商业。LibraryThing的方法更加“书迷”一点。图书馆科学太二元绝对和排斥统计,而把相关性等事物放到网络上看,则可以给人们稍微有别于此的一些启发。

真正吸引图书馆员的,是LibraryThing有认真对待图书馆数据。图书馆分类有很多真正优秀的数据,只是没有亮出来。如果回到10年、15年以前,你注意到因特网,如果你在搜索引擎上搜“The Hobbit”(译者注:霍比特人),你猜国会图书馆的条目很可能会排得很前吧?但不是!没有图书馆会排在头几项里!它们落后了几百名,因为图书馆员没有将他们的数据亮出来,没有告诉人们他们的数据有多好。像OCLC这样的组织有职责防止图书馆信息外流;而像Amazon这样的组织热衷于把数据公诸于互联网,但是以买得更多作为目的的方式。LibraryThing则会认真对待这些数据,用来做统计分析,将50个不同图书馆的所有霍比特人的记录都拿出来,去理解数据的意思,指出哪些是可以放一起构成完整意思的数据。这是在15年前就应该发生的,而我们现在才开始做。不管是完全受启发了,还是只是追潮流,人们现在开始利用图书馆数据做东西了,这才是真正激动人心的。

感谢Tim抽时间接受我们专访。你可以到LibraryThing.com开一个免费帐号;官方博客是LibraryThing news;最酷的图书馆精髓在Thingology blog

翻译:SwinG

Leave your response!

Add your comment below, or trackback from your own site. You can also subscribe to these comments via RSS.

Be nice. Keep it clean. Stay on topic. No spam.

You can use these tags:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

This is a Gravatar-enabled weblog. To get your own globally-recognized-avatar, please register at Gravatar.