layout: post
title: "SCIgen与野鸡期刊的梗"
date: 2019-04-28 19:06:21 +0800
作者:吴甜甜
个人博客网站: wutiantian.github.io
SCIgen与野鸡期刊的梗
SCIgen 这个程序的诞生,就是为了戏耍学术界的那些“野鸡期刊”。
这些只以盈利为目的的野鸡期刊也叫掠夺性期刊(Predatory journals),学术质量与信誉都很低。
-
因为日常不堪骚扰,麻省理工学院(MIT)计算机科学与人工智能实验的几个学生就看不过去了。
2005年,Dan Aguayo、Max Krohn 和 Jeremy Stribling三人,决定向这种”水”得不行的期刊和会议宣战。 -
SCIgen 的原理很简单,有些类似于填词游戏。
学术论文的格式是非常相似的,它本身就充满了专业词汇和固定的句式。而 SCIgen 则能够从固定的词库中,随机抽取出这类计算机领域内的专业术语,以符合语法的方式生成文本。再加上一些漂亮的图表和详细的参考文献等,就能骗过不少外行。
但这个软件真没多厉害,内行人一看就知道全文是在“胡说八道”。
要怪,就怪一些期刊和会议灌水得太过分了。
不出所料,他们第一篇自动生成的论文就攻破了 WMSCI(World Multiconference on Systemics, Cybernetics and Informatics)会议的防线。这篇论文名为《Rooter:处理接入点与冗余的典型合一方法》,看似高大上其实内容根本不知所云。
而 WMSCI 会议,不但接受了这篇假论文,还邀请作者出席会议作报告。
这下可高兴坏了 MIT 三剑客。
毕竟在这之前,他们就听说 WMSCI 会议以接受水货著称,但没真想到他们居然这么水。
于是,他们便把 SCIgen 攻陷 WMSCI 的事情经过发到网上。
一波嘲讽下来,这在科研圈立马引起了广泛的关注。
毕竟大家早就看不惯这些掠夺性期刊和会议。
越来越多人开始使用 SCIgen 产出的“钓鱼文”在其他学术期刊“试水”。
而他们留下的这款软件,则将学术界搅得天翻地覆。
现在 SCIgen 的访问量依然惊人。每年的浏览量仍超过 60 万次,无数钓鱼文在源源不断地产出。
这导致了这个页面,隔几个月就要崩溃一回。
https://pdos.csail.mit.edu/archive/scigen
我也试着打开网页,输入自己的名字拼音,生成了一篇Deconstructing Voice-over-IP的文章。
发现增加几个人名,效果还是关于这个类似主题,所以每个人名不会给几篇造成混乱。
看了这7页文章,貌似也比较正规,外行人特别是大二学生知识量以下的极有可能被忽悠。文章关于“IP”与“语音”周边的概念与公式,例如信息量公式摆上去貌似增加理论依据,其实仅仅是周边概念的拼凑。
但这一论文思路也提供了一个思路:想投SCI这种高级期刊,就要有极大的“创新”。什么是创新?别人没想到的,就是完全不相干的东西拼凑,如果这拼凑符合逻辑那就是优秀,如果不能予以证明那就是水货。