《科创板日报》12月28日讯(编辑 宋子乔) 众多专(zhuān)业学(xué)科中,医学(xué)以难(nán)度(dù)强、压力大著(zhe)称(chēng),但仍(réng)有无数人接受挑(tiāo)战,选择迎难而上,如(rú)今,AI也跑来和医学生“抢饭碗”。
当地时(shí)间12月27日,谷歌(gē)公布了(le)一(yī)个新的医疗AI模型“Med-PaLM”。在经历(lì)一系(xì)列考(kǎo)核后(hòu),该模型被证实“几(jǐ)乎达到(dào)”了(le)人类医生的水平。
![]()
具体来看,研究团(tuán)队准(zhǔn)备了一(yī)个(gè)医学问(wèn)题问答(dá)数(shù)据集“MultiMedQA”,涵盖医(yī)学考试、医学研究和消费者医学问题,该“题(tí)库”收集(jí)了(le)MedQA(USMLE,美国医师执(zhí)照考试(shì)题(tí)),还引入(rù)了他们自己的新数(shù)据集HealthSearchQA,它由搜索(suǒ)过的健康问题组成。
该团队又请来一组临床(chuáng)医生作答。这些(xiē)临床医生分布于美国和英国,在初级保健(jiàn)、外科、内(nèi)科和儿科方面(miàn)具有(yǒu)专业经验。
最后,研究人(rén)员将模(mó)型和人类医生(shēng)的答案匿名(míng)后(hòu)交给9名分别来自(zì)美国、英国和印度的临床(chuáng)医(yī)生(shēng)进行评(píng)估。
结果(guǒ)显(xiǎn)示(shì),Med-PaLM在科学常识方面(miàn)的(de)正确率在92%以上(shàng),在理解、检索和推(tuī)理能力方面,也(yě)几乎达到了(le)人类医生的水平,并在克(kè)服隐性偏见方面略(luè)胜一筹。
不过,该研究负(fù)责人也表示,Med-PaLM给出的(de)答案在整体上仍然不如临床医生,该(gāi)模型在实际应用前有(yǒu)待进一步(bù)完善。
追(zhuī)根(gēn)溯源,Med-PaLM是怎(zěn)么诞生的呢?
这里不(bú)得不提谷歌(gē)在今年发布的(de)转换器语言模型——PaLM,该模(mó)型基于Pathways架(jià)构、拥有(yǒu)5400亿(yì)参数,是Google迄(qì)今为止研发的最大规模的模型,全名为Pathways Language Model。
PaLM模型在语言理解等(děng)各种方面的评估测试中的表现十分(fèn)出(chū)色,甚至还在语(yǔ)言和推(tuī)理类的测评中超过了人类。
Med-PaLM正是PaLM的(de)衍生品(pǐn)。谷歌研究团队首先在上(shàng)文(wén)提及(jí)的医学问题问(wèn)答数据集“MultiMedQA”上评(píng)估(gū)了PaLM及(jí)微调变体Flan-PaLM,然后,基于此提出了指令提示x调(diào)整,让Flan-PaLM进一(yī)步与医(yī)学接轨,进一步产生了Med-PaLM。
值得(dé)注意的是,AI模型的每一次突破,都预示着更聪明的机器人即将到来。指挥机器人干活(huó)不是什么新奇(qí)的事,但要让(ràng)机器人能够理解你的命令背后的意(yì)图,那就要考验它(tā)的“大脑”好(hǎo)不好用(yòng)了(le)。将AI模型应(yīng)用(yòng)到机器人(rén)身上相当于给机器人“开(kāi)智”。
据(jù)了解(jiě),今年8月(yuè)份,谷(gǔ)歌就将大(dà)型语言模(mó)型首次集成到(dào)机器人中,有了AI模型(xíng)的加持(chí),机(jī)器(qì)人能像人类一样响应完整的命令。
谷歌研究人员就此做(zuò)了演示。当对机器(qì)人说:“我饿(è)了,你能给我(wǒ)点零食吗?”机(jī)器(qì)人在自助餐厅(tīng)中搜索(suǒ)一番(fān)后,打开了(le)一个抽(chōu)屉,找到一袋薯(shǔ)片并将它拿给研究人(rén)员。
可以预见的是,通(tōng)过进一步的训练、优(yōu)化,Med-PaLM模型的回答准确率将进一(yī)步(bù)提高,基于此模(mó)型的机器人(rén)医生也(yě)有望更快(kuài)出现。