迷惑!为科学开放而生的开放获取 却反推知识垄断?
- 相关推荐
作者 | 丛末
编辑 | 贾伟
关于科研成果是否应该对外开放现在几乎没有什么可争论的地方,而伴随着互联网而兴起的开放获取(open access,OA),经过二十几年的发展,已然成为了开放科学的一种主流模式。
然而,追求开放科学,开放获取还远远不够。
近日Science 上发表了一篇文章,阐述了当前开放获取模式存在的一些缺陷,以及这种模式带来的隐患,即知识基础设施的市场垄断。也就是说,原本以开放科学为初衷的开放获取,最终或许会反过来成为知识垄断的“推手”。
如此一来,学术社区对于开放科学的追求该如何继续?最直观的答案便是,要阻止这种垄断局面的出现。
Science 原文地址:https://science.sciencemag.org/content/368/6491/574
文章开头便指出:虽然 OA 模式意味着学者能够更直接地免费获取全球的科学出版物,但依旧需要更实用、可持续的其他模式,并且仔细分析这些商业模式选择所带来的后果以及谨慎应对公众对“默认开放”的呼吁。
这是因为,OA 模式在壮大过程中,也给包括出版、数据分析、门户网站等在内的市场竞争,带来了一些隐患,而这些隐患,最终都会与 OA 的初衷——开放科学背道而驰。
其中,给出版市场带来的最直接的负面影响便是:期刊在从传统订阅制向 OA 转变的过程中,其订阅收入难免下降,一些出版商开始优先考虑其他收入来源,导致大型学术出版商掌控的数据分析托管以及门户服务在不断在增加。这可能会增强出版商通过“捆绑销售”的方式来锁定机构客户的能力,即要求用户购买其他服务才能使用开放获取。
从长期来看,这种“捆绑式”协议会减弱出版商之间的竞争并减少服务的多样性,这也与学术社区的长期利益南辕北辙。
OA 带来的隐患之一:捆绑销售,出版市场或面临垄断竞争
历史上,期刊采取捆绑销售的方式(通常使用未公开的定价模式)对商业期刊出版商很有用,不过通常会让大学图书馆这类机构有所牺牲,因为它们需要“打包”购买其并不需求或者需求很少的资料,来获得对需求高的科学文献的开放获取。
与此同时,不少出版商还在尝试捆绑销售的另一种形式:将获取期刊的付款条件与作者在OA期刊上发表论文的费用捆绑为一份协议。
这种合作方式可能会加速OA 的进展,但是这种文章收费方式可能会影响研究人员选择在哪里发表他们的工作,这实际上违反了学术自由的基本原则。
随着OA模式的不断发展壮大,一些出版商正试图通过加快对研究基础设施和数据分析的投资,以及将研究基础设施、数据分析与期刊获取服务捆绑在一起销售,以此保护自己的盈利能力。
例如,Elsevier 在2019年底宣布与荷兰多所高校和资助机构签订了一项有争议的框架协议,让这些机构提供数据分析的内容以“兑换”其机构下属作者对期刊的开放获取权限,与此同时还与这些机构承诺合作开发新的智能研究工具和服务。
虽然细节未公开,但这意味着这些高校要为Elsevier 的产品开发提供机构性的元数据,以换取其研究人员开放获取出版物的权限。这些数据的所有权可能仍属于高校,但不确定的是高校是否拥有基于这些数据得到的分析结果的永久获取权。
鉴于学术出版商主要通过收购现有的商业公司和非盈利技术公司自我定位,从而与独立的分析产品供应商竞争,向高校管理员提供决策分析工具,因而这种将“获取”和“分析”进行捆绑的行为是令人担忧的。
由于仅提供分析服务的供应商无法将其服务与内容获取或发表文章收费的价格折扣结合起来,竞争中可能处于不利地位,可能会增加数据分析行业成为垄断或高度集中的寡头垄断市场的可能性。
与此同时,让这类出版商的收入增长从内容转向数据分析,可能会对纯期刊出版商的收入造成通缩压力,使他们缺乏有效竞争和创新所需的资本。
这种现象,除了上述对学术生态系统产生的影响,对大学和学术自由带来的风险可能远远超出过度支出和减少竞争的风险。当然,原则上,利用数据为机构决策提供信息本身值得称赞,而在数据分析的发展中纳入一系列商业利益,为推动这一尝试提供有用的技能和方法。
也就是说,学术界的度量和数据分析的普及并不是研究人员不关心的问题,他们是那些受量化手段的使用影响最大的群体之一,但对是否以及如何应用算法以及解释算法输出,有最少的控制权。事实上,在晋升的审查过程中,评估他们的生产力的僵化模式往往不如对其工作进行定性评估有帮助。
在学术界,生产力这一评价指标被广泛认为是有问题的,但在许多学术任职和晋升决定中仍然是核心指标。它给出了一个警示:一种为期刊质量排名而创建的算法,在很大程度上会由于其广泛的可用性而演变成了一种通用的学术衡量标准。
因此,世界上许多学术机构的高级领导层也都专注于大学排名,而不管其有效性如何。在个人、部门、机构和国家的标准学术学科中,用于比较生产力的算法激增,这有可能加剧偏见,并较大控制核心决策过程(如资源分配和职业发展决策)。
如果没有一个存在有效竞争的市场来推动相关替代标准的出现,领先的学术机构可能更倾向于为同样有限的优秀指标进行优化,并制定同样的研究投资优先次序。
OA 带来的隐患之二:门户网站或平台或“几家独大”
长期来看,主题门户网站或全文数据库的“几家独大”,则是另一个担忧点。
将特定主题领域中的信息组织到可搜索的索引中,对学术出版来说不再是新鲜事。事实上,首个摘要和索引服务可以追溯到数字化早期阶段。一般而言,书目数据库通常只包含元数据、关键字和摘要,而全文数据库则包含完整的文档,近年来人工智能赋能的全文挖掘和分析,也为完善发现服务创造了潜力。
从研究者的角度来看,功能齐全的主题门户网站可能很有意义。系统地收集研究数据和论文、会议记录、讨论、相关事件,甚至媒体报道和工作公告,可能成为各学科学者使用这些门户网站自然而然的目的。
如此强大的学科门户网站迄今未能普及的一个原因是,创建一个覆盖范围真正全面、管理可靠、可实现交叉索引并保持更新的平台所需的费用成本,非常高昂。例如,CZI(Chan Zuckerberg Initiative)所拥有的巨大资源,使得创建 CZI在2017年收购的人工智能赋能的 Meta 平台成为可能,并且在索引和链接到生命科学领域的资源商,比任何竞争对手都多。
对全文门户网站来说,一个更大的历史性障碍是科学内容的碎片化。由于大多数文章都设立了付费墙,任何一个出版商都很难(尽管并非不可能)获得具有需要法律权利的关键内容。
全面采用OA模式和限制较少的创作共用许可证(Creative Commons licenses)改变了这一现状,也推动大型出版商或基金会加大对技术的投资规模,用相关技术来划分全文数据库的聚合功能,如协作平台、数据托管、文献和数据集搜索和链接、公开评论、会议记录和讨论、教员消息、求职以及其他的学术团体活动。
尽管研究人员可以免费获得基本服务,但更高级的服务和机构协议的定价可能会很高。
同时,获取协议方交换的数据和信息,将为管理者提供评估有关部门和单个教员过去生产力和预测未来生产力有价值的参考,并有可能导致新的“信息套利”市场。
随着生物和医学逐渐开始研究智能,生物医学领域可能会产生第一个强大的门户网站,而其他领域的门户网络会随后产生。无论这些门户网站多有用,其潜在收益必须与高度集中控制市场的潜在成本进行权衡。
无论是在价格、用户隐私还是整体服务质量方面,一旦门户彼此之间的竞争微乎其微或根本不存在,都可能给订阅机构带来不利条款。
导致这一结果的可能性有多大?以Meta为例,尽管它是一个完全开放的平台,并且不是一个多用途的门户,但它很好地表明了平台在自动获取、分析和连接已发布内容等技术上的可能性。
在商业方面,一项旨在聚合多个数据源的创新,是Elsevier 2018年推出的一个全新的基于云端的数据平台——Entellect。2019年,Elsevier 还推出了一个新的PracticeUpdate社区,重点关注晚期黑色素瘤,作为其过去几年主导的其他医疗社区的补充。在生命科学之外,该公司还在同一年与石油工程师学会签署了一项“内容整合”协议。
上述案例,都只是一个组织创建主题门户策略中构建相关模块的一些方法。
开发跨多个学科的门户,将在开发和运行基础软件以及销售机构订阅上实现规模经济,这可能导致更大的整合效应。
一般而言,只有相当少一部分企业能够承担起建设和维护这些平台所需的前期投资。一旦成立,后来者便会很难获得足够的竞争规模,这样会增加垄断控制和垄断定价的风险。
阻止知识基础设施的市场垄断,是学术社区的下一场战役
实际上,这篇Science 文章强调了 OA 带来的“最坏的情况”。或许这些最坏的情况还没有成为现实,但是“未雨绸缪”有助于确保数据分析和学术基础设施的健全和学术生态系统的多样化。
学术社区如果不探索出版商提供的协议以外可替代的方案,可能会发现自身受惠于少数供应商在管理社区、数据流、研究评估和学习型社会通信方面的帮助,不过这一切都是在数字化筒仓中进行,结果可能会阻碍跨学科协作和科学发现的发展。
针对这些问题,学术出版与学术资源联盟(SPARC)提供了一些学术机构应该考虑的实际举措,包括:确保相关的机构政策和管理研究数据和分析教员生产力的人员到位;投资社区自有的解决方案和加强跨机构的合作关系,让基础设施的生态系统更加多样化;积极与研究基金会和学术团体合作,为实现良好的学术生态系统而努力。
学术机构和学术团体之间的关系是复杂的。许多教师都是学术团体的成员或领导者,有些则在社会期刊的编辑部任职。而学术团体是OA 最不热心的支持者之一,这源于他们对资助其研究工作的期刊订阅收入下降的担忧。
学术团体在与大型出版商合作出版过程中,如果向OA模式的转变导致收入下降,可以选择与主题门户提供商合作,作为替代收入损失的一种方式。与此同时,为了保证学术团体的可持续发展,机构领导者最好让学术团体参与发展社区自有的基础设施和联盟。通过利用学术团体的专业知识和召集力量来努力为自身提供新的收入来源。
即使垄断性主题门户网站永远不会成为现实,但少数公司控制着科学界使用的大部分关键数据资产、分析和平台的情况,是有可能出现的。
长期以来,学术期刊托管平台数量有限,近年来,这些服务大多也都被出版商(如Wiley收购Atypon,SAGE 出版商收购地球村出版公司)或私募股权公司(如Accel KKR持有HighWire Press的大量股份)收购。Taylor&Francis 收购 F1000 Research,则是OA出版平台领域进行市场整合的一个最新案例。
随着一些开源托管和工作流解决方案已经开始出现,新的 OA 出版商在相关技术上迎来了多样化的选择。不过,这些解决方案大多缺乏长期增长和可持续性的稳定规划。
支持竞争和避免垄断整合的第一步,是努力为非商业平台争取所有权以及建立融资模式。大学应加大对本土研究基础设施和跨机构联盟的投资力度,以建立竞争为目标,维持同类最佳的开放式替代方案,或许最终有可能提供一套可以替代一体化商业工作流解决方案的服务。
像 lens.org这样开放、为社区所有的数据分析和科学发现服务,以及斯坦福图书馆自主开发的分析解决方案RIALTO,都值得学术领导者进一步关注,此外,大众在人文和社会科学方面发起的一些不错的指标(如HuMetricsHSS计划),也值得关注。
在期刊出版中广泛使用的Altmetric指标,以及 CRediT taxonomy (作者贡献度角色分类法)这样的开放标准也是如此,后者为凸显每一位作者在科学研究至学术论文出版全过程中的工作及贡献,提供了一个定性指标。
学术机构还应该重新审视前人努力的经验教训,从过去做过和没有做过的事情中吸取教训,设计出有效和持久的合作关系。例如,在物理、数学和计算机科学领域取得了较大成功的 arXiv电子存储库,其采取的与赠款、实物支持和机构会员资格等相配合的运营模式,就有许多值得学习的地方。
反对知识和信息垄断的斗争迫在眉睫。当 Berners Lee 创建万维网时,他的目的是让研究人员能够分享他们的工作。然而到目前为止,不仅研究交流工具和实践没有实现网络所带来的民主化,网络本身的演变也提醒我们,让大量的链接数据随时可供第三方访问,可能会引发一些意想不到的后果。
有限数量的社交网络、购物服务和搜索引擎的主导地位,向我们展示了基于数据和分析的互联网平台是如何走向垄断的。在研究信息领域,出版商与学术社区正在谈判的协议为如何提供数据分析服务确定可能并不那么公平的条款和条件,与此同时它们也正在寻求学术团体的支持,正在提出研究评估指标,正在建立学科门户的创建模块。
现在,该是学术社区采取行动阻止知识基础设施走向市场垄断的时候了!