两位科学家在的帮助下在不到一个小时的时间内发表了一篇研究论文,是一种由人工智能(AI)驱动的工具,可以理解和生成类似人类的文本。这篇文章流畅,有见地,并以科学论文的预期结构呈现,但研究人员表示,在该工具真正有用之前,有许多障碍需要克服。
目标是探索作为研究“联合驾驶”的能力,并引发关于其优势和陷阱的辩论,海法以色列理工学院的生物学家和数据科学家Roy 说。“我们需要讨论如何以更少的缺点获得好处,”他说。
研究人员设计了一个软件包,可以自动向提供提示,并基于其响应随着时间的推移改进论文。这种自主的数据到纸张系统引导聊天机器人完成了一个反映科学过程的分步过程,从最初的数据探索到编写数据分析代码和解释结果,再到撰写精美的手稿。
为了测试他们的系统,和他的学生Tal ,也是以色列理工学院的数据科学家,从美国疾病控制和预防中心的行为风险因素监测系统下载了一个公开的数据集,这是一个与健康相关的电话调查数据库。该数据集包括从超过250万人收集的有关其糖尿病状况,水果和蔬菜消费以及身体活动的信息。
他们启动了他们的系统,然后去吃午饭。
论文的构建块
首先,系统要求编写数据探索代码。在第一次尝试时,聊天机器人生成的数据探索代码充满了错误并且不起作用。但是当团队的系统检测到这些错误时,它会自动将提示发送回 ,从而修复代码。
接下来,和的系统促使制定了一个研究目标。建议探索身体活动和饮食如何影响糖尿病风险。然后要求它创建一个数据分析计划和数据分析代码,并根据该代码的输出, 提供了结果:多吃水果和蔬菜以及锻炼与降低患糖尿病的风险有关。
有了结果,系统随后引导撰写论文。它开启了两个对话。其中,该工具告诉聊天机器人它是一名科学家,并指示它编写论文的每个部分。第二个 扮演了审稿人的角色,对聊天机器人的“科学家”版本生成的文本提供建设性的反馈。
生成式人工智能工具的一个常见问题是它们倾向于通过编造来填补空白,这种现象被称为幻觉。为了帮助解决它构成参考文献的可能性,该团队允许访问文献搜索引擎,以便它可以生成具有正确引用的论文。
午餐结束时,已经生成了一份清晰的手稿,其中包含可靠的数据分析。但这篇论文并不完美。例如,它指出这项研究“解决了文献中的空白”——这个短语在论文中很常见,但在这种情况下并不准确,耶路撒冷希伯来大学的计算机科学家汤姆·霍普(Tom Hope)说。他说,这一发现“不会让任何医学专家感到惊讶”。“这还不算新奇。”