1. 引言
心理学是一门实验科学,20世纪开始,计算机技术的发展提高了心理实验科学性,越来越多的基于计算机和网络平台的心理学研究反映了这一趋势。为服务于心理学科的发展,研究者们也越来越注重充分利用现代计算机和网络技术,改善心理实验的环境条件,进行科学的实验设计和科学的选择被试,采用先进的实验仪器,改革实验心理学教学内容。根据前人总结,心理学计算机化实验方法分为单机实验、多种设备联机实验和在线实验三种(卢伊颖,2011)。近年来,日益发展的互联网技术被认为是心理学实验的有效手段(李婕,2011),研究人员纷纷转向网络平台进行实验研究。基于网络的实验设计能够廉价地收集到较大范围地区和人口的数据资料,逐渐受到研究者的喜爱。
考虑到亚马逊平台是个被广泛使用的在线被试平台,我们在Google scholar以Mturk psychology为关键词进行固定年限搜索时(自2016年以来,以2019年1月1日数据为准),发现自2016年以来发表的基于Mturk的心理学研究超过1.1万个,这无疑是个惊人的数字。当然,基于在线研究的平台不只是Mturk,随着进行在线实验数据的收集应用越来越广泛,网基实验的各种平台如雨后春笋般出现于人们的视野。基于网络的心理学研究简称网基研究,Reips把常见的网基研究类型分为非反应性网基研究、网基调查、网基心理测验和网基实验等(Reips, 2012)。本文将对这些在线研究和研究平台分类介绍,并提供一些笔者个人的评价和思考。
2. 国际的在线实验平台简介
2.1. Qualtrics在线实验平台简介
史密斯在2002年与父亲共同创办了Qualtrics,它是一个在线调查的软件公司。Qualtrics的目标是简化调查难题,为此,在上面做调查研究的单位或者企业可以集中精力关注研究调查,而不是软件。发展至今,只要研究者有需求的,Qualtrics都可以做到。而参与调查的被试,只需轻松地在电脑前通过鼠标、键盘输入反应,就可以完成调查问卷从而获得一定的收入。
能在在线调查平台中脱颖而出,是因其团队首先定位在学术院校并培养了一批高学历的忠实用户。Qualtrics完成任务的速度快过其他软件,而且发布调查的用户可以管理自己的商标,推广活动,信息,选择,报道,图标,图表,图像,颜色,报道,编码,邮件,字体,皮肤,分享,面板等。伴随开发团队的的壮大,Qualtrics公司的调查软件也一直在不断地提升,添加新的功能,实现和兼容了很多自定义的JavaScript的编程语言,这些早期的突破使其在研究调查领域独占鳌头。另外对于学术研究者来说,Qualtrics提供免费使用的基本版软件满足了很多调查研究的基本需求。其同样也提供很多付费的专业服务。
这一国际研究平台在国内心理学研究机构也得到应用,如北京师范大学心理学部实验中心就购置了Qualtrics在线调查平台系统,面向心理学院全体师生免费开放,用户可使用bnu的后缀邮箱进行注册获取使用权限。通过该系统,主试可无限制添加调查项目,并通过丰富的模块库和流程控制系统灵活定制调查内容,并通过该平台分发邀请、数据收集和整理导出,极大的提升了心理学问卷调查的质量和效率。
2.2. Mturk在线实验平台简介
基于众包(crowd sourcing)而搭建一个虚拟的“行为实验室”,为解决心理学研究中的样本可获得性问题提出了崭新的思路。研究者可通过互联网平台招募实验参与者,通过程序要求本身寻找合适的实验对象,允许实验对象在虚拟的网络环境内进行互动共同完成一个实验任务,同时允许实验者进行灵活的实验控制,可以较低的价格吸引更多的实验参与者。采用这一思路最成功的案例来自于亚马逊的Mechanic Turk (简称Mturk)平台,见图1。
亚马逊旗下Amazon Mechanical Turk成立于2005年11月,作为一个众包平台,其出现提供了一种发布任务并收集数据的新途径。在这一平台上,worker (被试)是真实存在,且经过身份住址认证。只是主试(requester)未必需要搜集被试的个人ID信息。为了保证requester采集数据的有效性,亚马逊提供了两个方式:1)只有当参与者的任务反应或者回答(HIT)被研究人员确认(approve)才能得到对应的报酬;2)每一次实验完成后,研究人员都会对参与者进行评价,只有当参与者的综合评价达到一定标准时才有机会参加其他实验。
为了增加亚马逊平台对开发者的友好度,Mturk也发布了自己的API,研究者可以通过编程方式直接发布实验,自动approve被试的反应甚至自动支付被试费用。大大节省了研究人员的工作时间。也正是基于这个API,越来越多的开发者结合Python和JavaScript发布了越来越多相关的开发工具,使得这一平台对具有基本编程知识的研究者就能发布自己的研究应用到Mturk。
例如PsiTurk这一软件包,就可较好解决在线收集行为数据的麻烦。通过修改测试已有的代码模板,发布HIT到Mturk,再付费给参与者。另外一个值得一提的工具是TurkServer,这是一个专注于做多人交互研究的实验工具。如2017年,基于TurkServer的一项研究通过在线的虚拟实验室,采用多人的囚徒困境范式,考察了人们长期合作行为,该研究发表在自然通讯(Nature Communications)杂志上(Mao et al., 2017)。类似psiTurk这样的工具使用可以让研究者专注于研究而不是软件开发。
然而,这一在国际上广泛使用的研究平台在国内尚未得到推广。我们在百度学术以Mturk为关键词搜索,结果显示从2016年到2018年,心理学领域的文献数量100多篇,和国际上研究数量相比这一数字非常低。这其中一个原因是访问限制,另外人工成本价值的优势对中国研究者来说吸引力也不足。目前MTurk平台用户体验一般,该平台抽成也较高。截止目前,主试支付给被试的费用,亚马逊将会抽取高达20%的中介费。
2.3. PsychoPy在线实验平台简介
PsychoPy是使用python语言编写的一个开源软件,可在神经科学、心理学以及心理物理学的各种实验中用于刺激呈现和数据收集。这一软件免费且拥有强大的功能可以替代传统的Presentation、E-Prime

Figure 1. The interface of requester in Mturk
图1. 亚马逊平台的主试界面
和MATLAB等心理学编程工具。2003年,英国诺丁汉大学的Jonathan Peirce教授(https://www.nottingham.ac.uk/psychology/)。
people/jonathan.peirce)开发了这一软件,并首先在诺丁汉大学心理学实验室应用。相比其他刺激编程软件,PsychoPy提供独有的两种界面选择:1) 使用Builder界面可以轻松拖动、编制丰富灵活的实验程序;2) 使用Coder界面使得有一定Python编程语言基础的研究者能编写非常强大的实验程序。在经历了十几年间数次的版本更新后,2018年1月,PsychoPy得到英国Wellcome Trust基金的资助,招募开发团队,最终在2018年底发布了PsychoPy3和其基于PsychoPy的在线实验功能。

Figure 2. The interface of requester in Pavlovia.org
图2. Pavlovia.org网站的主试界面
其基本方式是:将研究者编写的实验程序导出为JavaScript语言,为在线实验做准备。之后GitLab上传到PsychoPy官方提供的Pavlovia.org网站(见图2)。在激活(activate)该研究后,把研究的网址发送给实验被试以完成实验数据搜集。值得一提的是,Pavlovia.org网站不仅接受PsychoPy的编程材料,而且兼容基于Python和JavaScript的编程实验(如PsychoJS)。尽管目前很多功能还不支持,但这一工作对全世界心理学研究者来说都是值得兴奋的。
2.4. Crowd Flower (CF)
2009年,Crowd Flower (已于18年3月更名为figure eight,网址https://www.figure-eight.com)在Tech Crunch 50会议上正式启动。该平台更多面向企业,拥有庞大的客户基础(包括eBay、SAP、Oracle、Adobe等)。Crowd Flower专注于AI数据,是必不可少的一个人机交互平台。2013年12月起,Crowd Flower宣布停止从Mturk招募worker。但是依然,Crowd Flower从许多不同渠道的合作伙伴那里获取worker,包括广泛的人口统计数据。其被试的平均时薪是3美元左右,对于与人力资源有关的心理研究来说,依然是一个选择。
2.5. 其他在线实验平台简介
除了以上介绍的一些平台,很多其他的网站也提供了可用于在线心理学实验的平台。如testable.org网站,支持研究者通过上传.csv格式的实验设计作为trial file,支持多种格式的刺激材料上传(包括知情同意书),也支持基本的中文显示(见图3)。其提供的在线被试平台叫做Testable Minds,但是在线的用户较少。虽然其提供给学术研究者免费在Testable Minds搜集数据,但是因为worker较少,一般都需通过外部链接进行数据搜集。从Testable官方提供的资料来看,搜集500名被试的数据需付费给网站150美元。其数据存储有两种选择,被试进行本地保存或者保存在testable网站,后者研究者可以随时下载,但是对免费用户存储空间是100 M。

Figure 3. The interface of requester (left) and subject (right) in Testable.org
图 3. Testable.org网站的主试界面(左)和被试界面(右)举例
与testable类似的网站还有gorilla (https://gorilla.sc/)。该网站提供了较为基础的实验模板供研究者编辑发布(图4)。然而,其采用的模式是由网站直接支付给被试参与费用,如搜集500名被试,gorilla估算的被试费收费为1430美元,加上10%的管理费用。由于简单易用,也发布了自己的API, 目前很多英国高校的心理系都是gorilla的客户。

Figure 4. The template interface in Gorilla
图 4. Gorilla 网站的实验模板界面
2.6. 研究者在个人或实验室网站实现的实验平台
随着互联网技术的发展,越来越多的研究者注重建设自己的实验室网站。与此同时,研究者也重视将个人研究有关的实验发布到网站进行在线演示或者数据搜集。这种方式一方面可以对研究者的研究进行宣传,也可以实现进一步在线的数据采集。如加州州立大学富勒顿分校的Michael Birnbaum教授就通过自己个人网站的在线实验搜集人们赌博决策的行为数据(图5)。

Figure 5. The gambling experiment interface in Professor Michael Birnbaum’s website
图5. Michael Birnbaum教授网站的赌博实验界面
当然还有很多在线实验平台未被本文一一介绍。读者可以参考社会心理学网站提供的Web-Based Data Collection Service栏目获得更多相关信息(https://www.socialpsychology.org/expts.htm#services)。很多研究不会只在一个平台进行,而是结合不同平台的优点,采用多平台的数据。如2017年Jonathan Phillips和Fiery Cushman发表在美国国家科学院院刊的一项研究用到了Mturk, testable, Quatrics和Turkprime等 (Phillips & Cushman, 2017)。
3. 国内的在线实验平台简介
3.1. 问卷星
长沙冉星信息科技有限公司旗下问卷星(https://www.wjx.cn),是国内最早也是目前最大的在线问卷调查、考试和投票平台,自2006年上线至今用户累计发布了超过3380万份问卷,累计回收超过23.39亿份答卷,并且保持每年100%以上的增长率(官网信息显示,截至2019年1月数据)。因为长期的用户累积,问卷星官方称用户已覆盖国内90%以上的高校和科研院所,其模块被应用于问卷调查、考试、投票等各方面。和Quatrics相似,问卷星提供了丰富的模块和模板方便研究者进行测试和调研。而用户数量的庞大,也进一步促进了模板的丰富。
3.2. 调查派
调查派(https://www.diaochapai.com/)是另外一款在线自助调查工具,由重庆甚为派科技有限公司设计开发,至今已有超过5千万人次参与过由调查派生成的调查问卷(官网信息显示,截至2019年1月数据)。重庆甚为派科技有限公司自2007年11月推出调查派以来,经过7年的积累,现已成为国内领先的自助在线调查系统。为全球500强企业、国内知名互联网公司、各大专院校、非盈利机构及个人用户提供服务。其特点是可以设置独立的数据搜集渠道。如根据需求设置新浪微博渠道,微信渠道,即只有该渠道的用户才能提交数据,另外调研派的API也给开发者开发和集成提供了更多可能。
其他在线调研类的平台还有问卷网(https://www.wenjuan.com/)和乐调查(https://www.lediaocha.com/)等。
3.3. 中科院心理所云端心理实验室
中国科学院心理研究所蔡华俭课题组较早在国内开启了在线实验和数据搜集的尝试。以内隐测验的研究为基础,云端心理实验室集合了教学、资源分享和实验数据采集等多项模块(http://www.cpsylab.com/) (见图6)。

Figure 6. The homepage in Cpsylab.com
图6. 中科院心理所云端心理实验室首页界面
3.4. 微信小程序
在制作调查问卷时,我们希望能尽可能多地收集大量数据。2019微信公开课PRO现场发布的《2018微信数据报告》显示,截至2018年9月,微信的月活跃用户数约为10.8亿。选择在微信发放问卷,或许是一个不错的渠道,而小程序分享的便利性,让它成为一个收集问卷的优选载体。小程序是一种全新的连接用户与服务的方式,它可以在微信内被便捷地获取和传播,同时具有出色的使用体验。任何一个普通的开发者,经过简单的学习和练习后,都可以轻松地完成一个小程序的开发和发布(见图7)。

Figure 7. The interface of WeChat developer tool
图7. 微信开发者工具界面
4. 在线实验研究的优点
相比于传统的实验室研究,笔者总结在线研究具有以下一些优点:
1) 短时间内能获得大量实验样本,通过众包平台,可以快速找到匹配信息的被试,便于大数据搜集,数据来源广泛,有网民的地方几乎都可以成为数据来源;
2) 增强研究信息公开性和研究的可重复性,许多实验数据和过程在网络上公布,大家可根据网络链接追本溯源;
3) 接第二点,便于共享,有些实验平台已经编制好的实验小程序可以拿来即用,作为自己实验程序的参考;
4) 节省了研究经费,在线实验整体费用较低,降低了被试往来实验室的时间和交通成本,比实验室实验节省人力、物力、财力。
5. 在线实验研究的争议
随着人们对于在线研究的接受和关注程度的提高,目前对于在线实验参与者群体存在着激烈的争论。尽管大家已经看到Mturk参与者成功取代实验室被试效果初显,然而人们普遍关注的一个问题是:考虑到注意力和努力程度的问题,这些参与在线实验的样本群体是否能生成高质量的实验数据(Crump et al., 2013)?我们可以做的努力之一就是,在主要的游戏任务之前,我们先测验了实验参与者对指导语的理解能力,并按照研究者的建议在测验中加入了检测注意力的相关问题(Berinsky et al., 2014)。另一个担忧就是:在线实验的工作者可能曾经参与太多的在线实验任务,这可能影响实验结果。这个担忧也许可以通过操控是否使用重复的实验样本来解决,而且研究显示在实验室实验中被试是否有过实验经验对结果并无影响(Benndorf et al., 2017)。
无论是Mturk还是实验室环境,被试动机都显著影响实验结果。在一些决策和道德有关的研究中,如被试暴露于带有金钱诱惑的欺骗任务中,在线匿名的研究可能更容易观察到人们真实的想法和决策行为。我们注意到当人们与实验室的真人交流或面对他人在线交流时,做出的道德层面的决策也会不一样(Levitt & List, 2007)。
6. 心理学的大数据:在线研究的展望
心理学中的大数据包括社交心理数据、社会心理数据、消费心理数据、学生心理健康数据、学习行为数据等(余嘉元,2015)。大数据技术包括采集、存取、分析等技术,核心是数据挖掘算法。大数据影响着心理学研究范式的革新、数据采集方式的改变、教学内容的改革和思维方式的变革。在大数据的视野中,不要随机样本,而要全体数据;不是绝对追求精确性,而是允许少量错误和不完美;从因果关系的串联思维转变为相关关系的并联思维,然后从相关关系中挖掘出事物发展的概率性规则;数据不再是静止和陈旧的,而是变化和最新的(段文杰,2017) (林思远&王洪宇,2018)。
长远来看,随着计算机技术的发展和VR、人工智能等技术的进步,在线实验的优势可能会逐渐加强,劣势不断减小,有可能在一些领域上完全取代实验室现场实验。但是对于严谨的实验科学而言,一个可能的发展趋势是结合在线实验的大样本数据发现有关的心理现象和规律,同时通过较小样本的实验室实验去证实有关结论的可靠性和推广性。
基金项目
本研究得到国家自然科学基金项目(U1736125)资助。
NOTES
*通讯作者。