原文出处:Tim Spalding - Future of Librarians Interview
Tim Spalding是密歇根大学希腊语和拉丁语的毕业生,他也创建了LibraryThing,一个专为藏书者而设的社会网络站点。
您是LibraryThing的创造者,但有些读者可能对您还不太了解,能否给我们介绍一下您自己和您的背景?
当然可以。我个人倒是没什么可以说的。LibraryThing是我第一个受到注意的尝试。我在Houghton Mifflin工作过一段时间,还有我是密歇根大学希腊文和拉丁文的毕业生。
书在我们的生命中占有非常中心的部分。我最终跟一个小说作家结了婚,想要控制家里书的数量是不可能的。我从孩子时代就一直在给书分类;我有一个专门存书的FileMaker数据库,我试了各种不同的解决方案,觉着好玩。也不是说我不会从LibraryThing赚到钱,我的意思是这会是一个我自己感兴趣的小小项目,而不是变成一个公司。
我是在2005年的八月开始做LibraryThing的,当时我在做自由网络设计师的工作,它用了大概一个星期就起步,从此成长很快。在开始的时候,它只是个分类。转折点发生在后来,我发现人们开始社会化地用它,他们互相分享他们图书馆(译者注:这里“图书馆”指是个人图书收藏,与LibraryThing中的含义对应。下同)的URL和各自对书的评论——所以我就开始给它加上社会项,我想这的确给了它很大的推动力。
这些人是谁?
像我一样的书虫,还有很多做学术的人。现在不同了,很多人只是将正在读的书放入LibraryThing,然后评论一下或者获得一些推荐。没有必要是家藏万卷、汗牛充栋的人。
LibraryThing在做着与普通社会化网络所不同的事,它不只是你与朋友相连那么简单的二元逻辑,要么你是我朋友,要么你不是我朋友,或者你是我朋友而我不是你朋友。LibraryThing背后的观点是,你以更复杂的方式与他人联系起来。实际上在LibraryThing没有一个“朋友”项。使得人们的联系主要是通过书,比方说,如果你跟我有两本相同的书,那不足为奇;但如果你跟我有40本相同的书,而它们又恰巧都是我们的冷门书,那么很有可能我们有相当深的共同兴趣。所以网站的内容,也就是人们放进的书,和社会化动态,是紧密相连的。
马歇尔·麦克卢汉说过“未来的书就是简介”,看起来您的网站似乎是在证明他的预言是正确的。LibraryThing对书有什么影响?
LibraryThing的对书影响可以说是新式的,也可以说是古老的。我想50年前如果你跟一群才俊聚会,通常他们中会有人引用一部小说,今天会是一部电影,这没什么两样。你最好在开始谈论小说前,了解别人跟你共同的嗜好。而你又不能确定每个人都读了这本书,除非它是《Harry Potter》。我想LibraryThing正是基于此想法,并且使得围绕书的社会化变成可能,通过它你可以找到与你有共同阅读爱好的人,而之前你不可能知道你们有共同的爱好。这种研究生院般的氛围棒极了,你可以几乎只谈某本书,跟任何人谈都行。这在现实生活中是不可能的,所以在线能够实现就显得很酷。
作为新事物,LibraryThing尝试利用关于书的数据,在做一系列有趣的事,例如标签——你甚至将会看到一个跟踪批注的选项。它是在试着社会化难以实现的社会化,同时使社会化扩展到更宽的层面。
可以谈谈推荐机制吗?
当然。在展示某书的网页上,你会看到一系列推荐列表,其中的一个链接是更多的推荐。现在我想我已经有了五个推荐算法了,在这当中涉及到的数学很吸引人。Amazon的是一个很好的例子。LibraryThing依赖良好的数据。其中来源之一便是标签,通常是很好的,但也有出错的情况。经典的例子是标签“leather”,可以指书的装帧,皮革包装;也可以指一种色情书——不通过复杂算法是无法区分出来的。算法很大部分跟持有模式有关。如果你和我的书有交集,那么交集以外的书应该会交叉吸引。只要做一些标准的统计,是会出良好的数据的。Amazon就做了这个,不过你在Amazon买书可能是帮你的同事买,或者帮你老婆买,因此你在Amazon买的书并不是你所买的东西的良好样本。LibraryThing通过在某种程度上代表你的所有藏书——或者甚至只是你目前在读的——而可以更真实地代表你是谁。
这对所谓的“长尾”也更有效。我的藏书中有些卖得不怎么好但它们依然是好书。Amazon上一个经典的例子是,你打“Harry Potter”,得到的五个推荐就是五本《Harry Potter》。为了保证推荐有意义,LibraryThing会进行封锁,只推荐两本《Harry Potter》,然后给你《A Wrinkle in Time》(译者注:麦德林·兰歌《时间的皱纹》)。《时间的皱纹》是本伟大的书,不过本周它的销售不大理想。但它在人们的藏书阁中。所以,LibraryThing看到它并说出,喜欢《Harry Potter》的人也将喜欢《A Wrinkle in Time》和Susan Cooper的书(译者注:另一位儿童文学家,其作品《The Gray King》曾在1976年获得纽伯瑞儿童文学奖,参此)或者其他。
LibraryThing采用Z39.50协议。这是一个类似于“在黑胶唱片上听音乐”的小花招,还是的的确确是个打着灯笼都找不到的好事情?
Z39.50是一个图书馆间用来交换数据的协议,图书馆已经用了好些日子了,但他们把它做得很专业,返回的记录不好分析,你必须懂得它们的语法分析。用LibraryThing,我做到了。并不是什么高尖精技术,但需要一点点的努力和对不太好的老技术的很多宽容。很多LibraryThing的竞争对手止步于此,因为Amazon的API(译者注:编程接口)可以向Amazon请求查询并返回漂亮的格式化XML数据。如果你不是够深的书虫那样就够了,但如果你有绝了版的书那这可不够好。如果你关心图书馆编目数据,如果你想要主题、杜威十分法等等——如果你想要真正高质量的图书数据,你躲不开图书馆。在这点上LibraryThing可以说是多走了一步。
在家我是用色标来整理书柜的,在LibraryThing我怎样做到这点?
你必须贴标签。也有人建议我们用色标——分析颜色,并允许用颜色显示他们的书柜。我想那会是一项很有趣的功能。
通过图书馆技术和真正个人化的荐书,它会取代图书馆员吗?
在荐书上,图书馆员并不是扮演着知道全宇宙的书的角色。图书馆员很早就来源于读者咨询网站、期刊、其他图书馆员、他们所尊重的赞助者等等的帮助。LibraryThing只是在这当中的另一个来源。我不认为它会比Amazon或其他任何事,更排斥对图书馆员的需求。如果真有图书馆员危机,我想也不会在这点上。
但LibraryThing也有做类似图书馆员做的事。有一个功能可以消除版本歧义:你可以将一部作品的所有版本放在一起,然后由用户决定一本书是否也是《霍比特人》的一个版本(译者注:《指环王》/《魔戒》前传)。图书馆员有自己的方法来做这个,而LibraryThing却由于集合了成千上百的群体智慧而成为一个很好的解决办法。LibraryThing在用用户生成的内容和统计数据做着一些有趣的事。
搞定了相关标签后,我转而想到主题,看哪些主题与哪些标签最相关,并按统计相关度顺序显示Library of Congress(译者注:美国国会图书馆,下称“国会图书馆”)的主题词。这似乎从来没人做过。
可以多说一点吗?
当然。有了标签分类法,你就建立起了人们对书的看法的巨大数据库。举个例子,像“chick lit”这个标签(译者注:鸡仔文学,英美出版界的一个创作流派,其作品是专门以女性为阅读对象的流行读物。),它会给你返回一个标签同为“chick lit”的书单,按相关度降序排列,一个很不错的列表。“cyberpunk”或者其他词也一样。从设置目的和生成过程看来,它们都会比国会图书馆的主题词要好。LibraryThing生于数字化,所以它可以拥有很多图书馆分类法都没有的相关度概念。举个例子,在国会图书馆,有一个条目叫“Man-Woman Relationships”。一本书要么关于此,要么不关于此。但当然80%的西方文学都在某种程度上与此有关。LibraryThing所以超过其他很多网站的地方,在于我们有标签,并且我们把标签和像国会图书馆那样的可控主题词来混合起来用,所以当你给出某标签,就可以看到与它最相关的是哪些主题,反之逆然。这有优点也有缺点。一方面有很有歧义如“leather”的LibraryThing标签,另一方面图书馆主题词也有不足,比如国会图书馆主题词“Cookery”本来是个很好的主题词,只是没人会把“Cookery”打进条目查询。两种方法都互有长短;我不认为标签会取代分类法,就像电视不会取代收音机一样。
事实上,LibraryThing在发布一系列可以插入图书馆类目的专用插件,让图书馆员可以将LibraryThing的功能和内容,不用另外自己再实现,直接就放进他们的分类。其中一个插件是推荐书的,根据的是LibraryThing的数据,但只会在你所拥有的书中推荐。我想荐书这点很容易接受,但真正难的是要图书馆分类接受标签——我们走着瞧。
您觉得LibraryThing是图书馆未来模式的一个探索者吗?
我想它提出了结合用户参与的概念。其他人也提出了,只不过LibraryThing是在线对书贴标签和分类的最突出的例子。Amazon一百万年前就有了评级和推荐,只是那一直只服务于商业。LibraryThing的方法更加“书迷”一点。图书馆科学太二元绝对和排斥统计,而把相关性等事物放到网络上看,则可以给人们稍微有别于此的一些启发。
真正吸引图书馆员的,是LibraryThing有认真对待图书馆数据。图书馆分类有很多真正优秀的数据,只是没有亮出来。如果回到10年、15年以前,你注意到因特网,如果你在搜索引擎上搜“The Hobbit”(译者注:霍比特人),你猜国会图书馆的条目很可能会排得很前吧?但不是!没有图书馆会排在头几项里!它们落后了几百名,因为图书馆员没有将他们的数据亮出来,没有告诉人们他们的数据有多好。像OCLC这样的组织有职责防止图书馆信息外流;而像Amazon这样的组织热衷于把数据公诸于互联网,但是以买得更多作为目的的方式。LibraryThing则会认真对待这些数据,用来做统计分析,将50个不同图书馆的所有霍比特人的记录都拿出来,去理解数据的意思,指出哪些是可以放一起构成完整意思的数据。这是在15年前就应该发生的,而我们现在才开始做。不管是完全受启发了,还是只是追潮流,人们现在开始利用图书馆数据做东西了,这才是真正激动人心的。
感谢Tim抽时间接受我们专访。你可以到LibraryThing.com开一个免费帐号;官方博客是LibraryThing news;最酷的图书馆精髓在Thingology blog。
翻译:SwinG
0 responses so far ↓
There are no comments yet...Kick things off by filling out the form below.
Leave a Comment