如今(jīn),人(rén)工(gōng)智能已成为普遍的流行语,但大多(duō)数消费者可能不知道(dào)它如何与日常生活息息相关。分析人(rén)员和技术(shù)新闻界中的某些(xiē)人可能还会嘲(cháo)笑该术语用于(yú)某些几乎不像真正的人工智能(néng)的(de)技术的频率。也就是说,除了强大的数据(jù)中心外,还有一(yī)些平台(tái)对于AI处(chù)理和驱动它们的(de)NN(神经网(wǎng)络)来说(shuō)是(shì)很自(zì)然的。其中之一是(shì)AI推理(使用AI推理信(xìn)息,而不是训练NN)在边(biān)缘和口袋中,使用智(zhì)能手机(jī)。
就(jiù)像您想象的(de)那样,从androids到(dào)Apple的智能手机平(píng)台差别很大,但(dàn)是语音-文本翻译和推荐(jiàn)器引擎(例如Google Assistant和Siri)等常见工作(zuò)负载大量使(shǐ)用了常见的AI NN模(mó)型,在设备上(shàng)执行此操作可提高(gāo)速度和延迟。
衡量(liàng)移动设(shè)备中的AI性能
随着任何新设备的推出以及热门新应用的(de)出(chū)现,精(jīng)通技术的消费者和技术媒(méi)体成员希望能够(gòu)衡量和收集各种移动生态系统中设备的相对(duì)性能。此外,目(mù)前智能手机测试和评论中的AI处(chù)理性(xìng)能正在(zài)发展,因此,在主要的应用(yòng)商店(diàn)中当然会出现多种工具,这些工具声称能够测量电话和其他移动设(shè)备的AI性能。而且-您猜对了(le)-这些应用程(chéng)序的创建肯(kěn)定不尽相同。为了解(jiě)决这个(gè)问题,Marco和我深入研究了(le)HotHardware,分析了(le)三种主流AI基准测试中各种(zhǒng)旗舰androids手机的性能,这(zhè)些基准在某(mǒu)些情况下(xià)会产生截然(rán)不同的(de)结(jié)果。
关(guān)键是要更好地了解(jiě)实际(jì)测(cè)试的(de)特定基准度(dù)量标准。测试是否代表尽可能接近实际(jì)的工作(zuò)负载?理想的(de)基(jī)准测(cè)试使用(yòng)的是消费者可能会使用(yòng)的实际应用程序,但短短的(de)基准测试可以使用流行应用程序的相同核(hé)心软件组件(jiàn)来代表实(shí)际的性能期望。在这(zhè)种情况下,这意味着(zhe)我们(men)需(xū)要了(le)解这些基准测试工具要针对哪(nǎ)些NN进行测试,以及要使用哪些数学精度(dù)和AI算法来处理这些工(gōng)作量。