《科(kē)创板日报》12月(yuè)28日讯(编辑 宋子乔(qiáo)) 众多专(zhuān)业学(xué)科中,医学以难度强、压力大著称,但仍有无数人接受挑战(zhàn),选择迎难而上,如今,AI也跑来和医(yī)学(xué)生“抢饭碗(wǎn)”。
当地时间12月27日,谷歌公(gōng)布了(le)一个新的医疗AI模(mó)型“Med-PaLM”。在经历一系列考(kǎo)核后,该模(mó)型被(bèi)证实“几乎达到”了(le)人类医生(shēng)的水平。
![]()
具体来看(kàn),研究团队准备了一个医学问题问答数据(jù)集“MultiMedQA”,涵盖医学考试、医学研(yán)究(jiū)和消费者医(yī)学问(wèn)题,该(gāi)“题库”收集了MedQA(USMLE,美国医师执(zhí)照考试题),还引入(rù)了他们自己(jǐ)的新数据集(jí)HealthSearchQA,它由搜索过的健康(kāng)问题组成。
该团队又请(qǐng)来一组临床医生作答(dá)。这些临床医(yī)生分布于美国和英国,在初级保(bǎo)健、外科、内科和(hé)儿科方面具有(yǒu)专业(yè)经验。
最后,研究人(rén)员将模(mó)型(xíng)和人类医生的答案(àn)匿(nì)名后交给9名分(fèn)别(bié)来(lái)自美(měi)国、英国和印度的临床医生(shēng)进(jìn)行评估。
结果显(xiǎn)示(shì),Med-PaLM在科学常识方面的正确率在92%以上,在理解(jiě)、检索和推理能力方面(miàn),也几乎(hū)达到了人类医生(shēng)的水平,并(bìng)在克服隐性(xìng)偏见(jiàn)方面略胜(shèng)一筹。
不过,该研究负责人(rén)也表示,Med-PaLM给出的答案(àn)在整体上仍(réng)然不如临床医(yī)生,该模型(xíng)在实际应用前有待进一步完善。
追(zhuī)根溯源,Med-PaLM是怎么(me)诞生的(de)呢?
这里不得不提谷歌(gē)在今年发布(bù)的转换(huàn)器语言模型——PaLM,该模型基(jī)于Pathways架构、拥有5400亿参(cān)数(shù),是Google迄(qì)今为止研发的最大规(guī)模(mó)的模型(xíng),全名为Pathways Language Model。
PaLM模型在语言(yán)理解等各种(zhǒng)方面的(de)评估(gū)测(cè)试中的表现(xiàn)十分出色,甚至还在语言和推理类(lèi)的测评(píng)中超过了人类。
Med-PaLM正是PaLM的衍生品。谷歌研究团队首先在(zài)上文提及的医学(xué)问题问答数据集“MultiMedQA”上(shàng)评估了PaLM及微调变体Flan-PaLM,然后,基(jī)于此提(tí)出了指令(lìng)提示x调整,让Flan-PaLM进一步与医学(xué)接轨(guǐ),进一步产生了Med-PaLM。
值得注意的(de)是,AI模型(xíng)的每一次突破,都预示着(zhe)更聪明的机器人即(jí)将到来。指挥机器人干活(huó)不是什(shí)么新奇的事,但要让机器人能够理解你的命令背后的意图,那就要考验它的“大脑”好不好(hǎo)用(yòng)了(le)。将AI模(mó)型应用到机器人身上相当(dāng)于给机器(qì)人“开智”。
据了(le)解(jiě),今年8月份,谷歌就将(jiāng)大型语(yǔ)言模型首次(cì)集成到机器(qì)人中,有了(le)AI模型的加持,机器人(rén)能像人类(lèi)一(yī)样(yàng)响(xiǎng)应完(wán)整(zhěng)的命令。
谷歌研究人(rén)员就此做了演示(shì)。当对(duì)机器人说:“我(wǒ)饿了,你(nǐ)能给我点零食吗?”机器人(rén)在自(zì)助餐厅中搜(sōu)索(suǒ)一番后,打开了一个抽屉,找到一袋薯片并(bìng)将它拿给(gěi)研(yán)究人员(yuán)。
可以预(yù)见的是,通过进一步的训练(liàn)、优化,Med-PaLM模型(xíng)的(de)回答准确率(lǜ)将进一步提(tí)高,基于此(cǐ)模型的机器人医生(shēng)也(yě)有望更快出现。