麻省理工学院的一组研究(jiū)人(rén)员最近开发了(le)一(yī)个(gè)人工智能模型,它可以获取指(zhǐ)令列(liè)表并生成(chéng)一个成品。未来对建筑和机器人领域的影响巨(jù)大(dà),但团(tuán)队(duì)决定从我(wǒ)们现在都需要(yào)的(de)东西(xī)开始(shǐ):披(pī)萨。
pizza GAN是麻省理工学院计算(suàn)机科学与人工智能实验室(CSAIL)和卡塔尔(ěr)计(jì)算(suàn)研究所(QCRI)天才们创造的最(zuì)新神经网(wǎng)络,它是一个生成性的对抗性网络,可以在披萨烹饪(rèn)前后(hòu)创建披萨的(de)图像。
不,它(tā)实(shí)际上(shàng)不是做一个你(nǐ)可以吃的(de)披萨——至少,现在还做不到。当我们听到机器人在食品工业中(zhōng)取代(dài)人类时,我们可能会(huì)想象波士顿动(dòng)力机器在厨房里走动,翻转(zhuǎn)汉堡,做薯条(tiáo),然(rán)后大喊“点餐(cān)”。但事(shì)实要温和得多(duō)。
实际上(shàng),这些餐馆使用(yòng)的是自(zì)动化(huà)技术,而(ér)不是(shì)人工智(zhì)能。汉堡翻转机器人不关心(xīn)它的(de)抹刀上(shàng)是否有真正(zhèng)的汉堡(bǎo)或冰球。它(tā)不了(le)解(jiě)汉堡包,也不知道成品应(yīng)该是什么样子。这些机器在(zài)家里,就(jiù)像在汉(hàn)堡店把包装(zhuāng)盒关在亚马逊的仓库里一样。他们(men)不(bú)是智能的(de)。
麻省理(lǐ)工学院(yuàn)和QCRI所做的是(shì)创(chuàng)建一个神经网络,它(tā)可以查看比(bǐ)萨饼的图(tú)像,确定(dìng)配料的类型和分布(bù),并在烹饪前确定比(bǐ)萨(sà)饼分层的正(zhèng)确(què)顺序。它(tā)理解任何人工智能都(dōu)能理解(jiě),做披(pī)萨从头到尾应该有的过(guò)程。
联合小组通过(guò)一种新颖的(de)模(mó)块化方法完成了这一任(rèn)务(wù)。它开(kāi)发了人工智(zhì)能,能够(gòu)根(gēn)据添加或删(shān)除的成分来可(kě)视化比萨饼应该是什么样子。例如(rú),你可以给(gěi)它看一张比萨(sà)饼(bǐng)的图片,然后让(ràng)它去掉蘑菇(gū)和洋葱,它(tā)就会生(shēng)成一张修改过(guò)的披(pī)萨图片。
研究人员称:
从视觉角度来看,每一个(gè)指(zhǐ)令步骤都可以被视为通过添加额(é)外的对象(例如添加配料)或更改现有对象(例如烹饪菜)的(de)外观来(lái)更改(gǎi)菜(cài)的视觉外观的一种方(fāng)法(fǎ)。
为了(le)让机器人或(huò)机器有一天能在现实(shí)世界里做披萨,它必须了解披(pī)萨是什么。到目前为止(zhǐ),人类(lèi),即使是CSAIL和QCRI里真正(zhèng)的(de)人类,在机器人中复制(zhì)视觉的能力也比味蕾强(qiáng)得多(duō)。
例如,Domino’Pizza目(mù)前正在测试一种用于质量控制(zhì)的(de)计算机视觉解决方案。它在一(yī)些地方使用人(rén)工智能来(lái)监控从烤箱里(lǐ)出来的每一个比(bǐ)萨饼,以(yǐ)确定(dìng)它们是否看起来足够好,能够满足公司的(de)标准。像浇(jiāo)头分配、甚至烹饪、圆度(dù)之类的东西(xī)也可以(yǐ)通过机器实时学习来测量和量化,以确保客(kè)户(hù)不会得到一个(gè)糟糕的披萨。
麻(má)省理工(gōng)学院和QCRI的解(jiě)决方案整合了(le)烹饪(rèn)前(qián)的阶段(duàn),并(bìng)确(què)定了(le)适当的分层,以制作美味、诱人的披萨。至少在理论(lùn)上,我们可能离一个端(duān)到端的人工智能解决方案(àn)还需(xū)要好几年的时间(jiān)来准备、烹(pēng)饪和供(gòng)应比萨饼。
当(dāng)然,一旦机器人了解了配料的细微差(chà)别、操作说明以及项目最终结果应该如何出现,那么比萨饼就并不是机器人唯(wéi)一(yī)能做的事(shì)了。研究人员(yuán)得出结(jié)论,PizzaGAN背后的(de)人工(gōng)智能模型可能在其他(tā)领域也有用武(wǔ)之(zhī)地:
虽然我们只(zhī)是在(zài)比萨的背(bèi)景下(xià)对我们的模型(xíng)进(jìn)行了评估,但我们相(xiàng)信,对于其他(tā)自(zì)然分(fèn)层的(de)食(shí)物,如汉(hàn)堡、三明治和沙拉,类(lèi)似的方法是(shì)有希望的。除了(le)食物,我们还将有趣地看到我们的模型在数字时尚(shàng)购物助理等领域的表现,其中一个关键的操作是(shì)不同层次衣服的虚拟组合。
但是,老实说(shuō),我们都(dōu)不(bú)会正式进入人工智能时代,除(chú)非有一天,我们可以得到一个体面的砖(zhuān)炉玛格丽塔比(bǐ)萨饼自制机器(qì)人。