如今,人工智能已成为普遍的流(liú)行语,但大多(duō)数消费(fèi)者可能(néng)不知道它如何(hé)与日常生活息息相关。分析人员和技术(shù)新闻界中(zhōng)的(de)某(mǒu)些人可能还(hái)会嘲笑(xiào)该术(shù)语用于某(mǒu)些几乎不像真正的人(rén)工(gōng)智能的技术的频率。也(yě)就是说,除了强大(dà)的数据中心外,还有一些平台对于(yú)AI处理和驱动它们的NN(神经网络)来说是很(hěn)自然的(de)。其中之一是AI推理(使用(yòng)AI推理信息,而不是训练NN)在边缘(yuán)和口袋中,使用智能手(shǒu)机。
就像您(nín)想象的那样,从androids到Apple的(de)智能(néng)手机平台差别很大,但是(shì)语音-文本翻译和推(tuī)荐器引擎(例如Google Assistant和Siri)等常见工作负载大(dà)量使用了常见的(de)AI NN模型,在设备上(shàng)执(zhí)行此操作可提高速度和延迟。
衡量移动设备中的(de)AI性能
随着任(rèn)何新设(shè)备的推出以及热门新应用的(de)出现,精通技术的消(xiāo)费者和技术媒体成员希望能够衡量和收集各种移动(dòng)生态系统中设备的相对性能。此外,目(mù)前智能手机测试和评(píng)论中的AI处理性能正在发展,因此,在(zài)主要的应用商店中当然会出现多种工(gōng)具,这些工具(jù)声称能够(gòu)测量电话和其他移动设备的AI性能。而且-您猜对了-这些应用程序的创建(jiàn)肯定不尽(jìn)相同。为(wéi)了解决(jué)这个问题,Marco和我深入研(yán)究了HotHardware,分(fèn)析(xī)了(le)三种主流AI基准测试(shì)中各种旗舰androids手机的性(xìng)能,这些基(jī)准在某(mǒu)些情况下会产生截然不同的结果。
关(guān)键是要(yào)更好地了解实际测(cè)试(shì)的特定基准(zhǔn)度量标准。测试(shì)是否代(dài)表尽可能接近实际的工作(zuò)负(fù)载?理想的基准测试使用的是消费者可能会(huì)使(shǐ)用的实际应(yīng)用程序,但短短的基准测试可以使用流行应用(yòng)程序的相同核心软件组(zǔ)件来代表实际的性能期望。在这种情况下,这意味着(zhe)我们需要了解这些基准测试工具要针对(duì)哪些NN进行测(cè)试(shì),以及要使用哪些数学精度(dù)和AI算(suàn)法(fǎ)来处理这些(xiē)工作量。