2亿篇论文免费看!“微软学术”停用,OpenAlex要接班

图片
新智元报道
编辑:David 时光
【新智元导读】为了接替已下线的「微软学术搜索」,大型免费学术索引OpenAlex已于今年年初正式上线,它涵盖2亿篇科学文献,易学易用,完全免费,网站将于2月上线。
最近,大型免费学术资源索引OpenAlex宣布上线,该索引包含超过 2 亿份科学文献。
图片
这个资源索引服务名为OpenAlex,源自古代埃及亚历山大图书馆馆名。
创始人表示,该索引对出版物来源、作者信息和研究主题进行编目,旨在绘制这些数据点之间的联系,以创建一个全面的、相互关联的全球研究系统数据库。
图片
去年 5 月,微软宣布将于当年年底关闭学术搜索知识图谱(MAG) ,让一些学者和其他使用其数据进行研究和开发的人感到担忧。
图片
为应对 MAG 的下线,位于加拿大温哥华的非营利性学术服务公司 OurResearch利用伦敦慈善机构 Arcadia Fund 提供的 450 万美元的一部分,创建了这项「伟大工程」。
今年1月3日推出的这个免费学术索引数据库,功能上与微软的Academic Graph (MAG) 类似,MAG 是Scopus、Dimensions 和 Web of Science 等学术订阅平台的免费替代品,已于 2021 年底停止运营。
据悉,该索引当前通过可执行复杂搜索的应用程序编程接口或 API 访问。
微软「学术图谱」接班人
无论是研究人员,还是开发者,都需要大量查阅论文、专著等学术成果。近年来,越来越多的人开始绕过学术出版商的「付费墙」,通过多种手段免费获取学术资源。
作为微软MAG的替代品,此前OpenAlex一直在从MAG获得论文、作者和其他数据实体。在MAG正式停止运营后,OpenAlex开始自己从互联网收集更多新内容。
目前OpenAlex已经发布新的 REST API 。与之前下载安装的方式相比,可以更快、更简单地访问 OpenAlex 数据库,无需账户和令牌,完全免费。
图片
目前,通过API可以获取单一实体、实体列表和实体组。
图片
OpenAlex数据集描述了5类学术实体以及这些实际之间的联系。每类实体分别对应其目标:
成果:包括论文、书籍、数据集等,会引用其他成果
作者:做出成果的人
出处:刊载成果的期刊或资源库
机构:(通过作者)与成果相关的大学或其他组织
概念:以话题方式对成果进行标签
OpenAlex表示,探索 OpenAlex 数据集的最简单方法是通过 Web 界面,无需编写代码即可探索 OpenAlex。不过目前网站开发尚未完成,预计在今年2月上线。
图片
尽管MAG已停用,但作为其继任者和替代,OpenAlex将继续维护MAG格式至今年7月2日,从2022年7月起,OpenAlex将不再支持MAG格式。
由于目前尚处于早期开发阶段,各项功能尚待进一步完善,OpenAlex将每日单个用户调用数量限制在10万次以下。
OpenAlex三大优势
在综合比较各种数据库之后,小编发现,OpenAlex具有明显的三大优势,这将带给用户美好的体验。
海量数据,覆盖面超MAG
OurResearch的联合创始人贾森•普里姆(Jason Priem)表示,「OpenAlex的创立是为了实现与其他几个数据库互联互通,使其覆盖更加广泛全面。」
与某个单一数据库相比,OpenAlex拥有更加开放的获取覆盖面,它拥有来自Wikidata 标识符、MAG 、ORCID、Crossref、ROR、Unpaywall等数据资源。
普里姆表示,「我们不仅可以给用户提供文章的免费版本,还可以告诉你该文章的授权和不同版本。」
图片
简单易用,20分钟就会
「OpenAlex是在用一种聪明的方式,将大量的数据库整合在一起。」欧弗顿公司(Overton)的创始人尤安•阿迪(Euan Adie)说。
欧弗顿是家总部位于伦敦的公司,主要用于跟踪政策文件的引用。过去,欧弗顿公司从不同的来源获取数据,包括MAG、ORCID、Crossref,也直接向个人获取。
现在,欧弗顿只使用OpenAlex,寄希望于检索过程更加便捷,简单设置让人容易学会。
「我只需要20分钟就会使用OpenAlex,而对比MAG却要3-4天。」阿迪说。
图片
「我花了大约2小时就学会了OpenAlex,而开始用MAG却要一周。」另一位使用者Roar Bakken Stovner说。
Stovner认为,对于更精通计算机的人来说,MAG可能不算难,而对于那些想要自己尝试开发小项目的人来说,OpenAlex将更容易开始。
不用登录,完全免费
OpenAlex的底层代码在CC0版权许可下可以免费获得,任何人都可以在其上进行开发。
因此,贾森·普里姆(Jason Priem)表示,OpenAlex每两周更新一次,比MAG更向前迈进了一步。
假如,哪一天OpenAlex停止运行,那么,任何人都可以从接着Priem停下的进度继续开发,而不必从头开始搭建数据库。
此前,MAG的用户必须登录系统,并支付少量费用,才可以下载。而OpenAlex可以免费使用。
普里姆表示,这要感谢Amazon Web Services的赞助,不需要注册或登录,这使得使用过程更加友好。
不过,OpenAlex可能会考虑为那些想要超快访问的用户,推出付费高级版本。
但,免费的版本总是可用的。
图片
参考资料:
https://docs.openalex.org/