2016年,击败围棋世界冠军李世石九(jiǔ)段的(de)AlphaGo震惊世人,随之引爆的AI大潮如雨后春笋。近年来,人工智能(néng)技术频频亮(liàng)相(xiàng),已然成(chéng)为炙手可热的全球科(kē)技(jì)新宠。业内人士评价,如果说以(yǐ)蒸汽技(jì)术驱动的第一次(cì)工业革命延伸了人的(de)肢体,拓展了人类(lèi)的力量,那么,以新一(yī)代人工智能技术为驱动的(de)新一轮科技革命和产业变革将拓展人类(lèi)的智能(néng),极大(dà)提升人类智(zhì)力所能创造(zào)的价值。
“2016-2018年,AI非常火爆。” 3 月 27 日(rì)的云知声AI 技(jì)术开放日上,云知声(shēng)董事长兼(jiān)CTO梁(liáng)家恩谈及AI技(jì)术时表示,但他同时认为,AI大(dà)潮正(zhèng)在退却,原(yuán)因是有(yǒu)些伪AI公司已经消失,而(ér)真正的AI公司还在继续。“真AI和伪AI公司不仅在技术(shù)实力上有(yǒu)明(míng)显(xiǎn)差距,他们对产业问题(tí)的(de)态度也是区别比较大的(de)。到今(jīn)天当(dāng)AI大潮退去,我(wǒ)们可以站出(chū)来说,AI真正的时代到来。”
portant;" />
AI技术结合产业(yè)才有未(wèi)来
关于人工智能(néng),官方解(jiě)释为,AI是计算机科学的(de)一个分支,它企(qǐ)图了解智(zhì)能(néng)的(de)实质,并生产出一种新的能以人类智能相(xiàng)似的方式做出反应(yīng)的智能机器(qì),该领域的(de)研究包括机器人、语(yǔ)言识别、图像识别、自然(rán)语言处理和专(zhuān)家系统等。梁家恩认为(wéi),AI是(shì)一种技(jì)术,但如(rú)果(guǒ)不跟产(chǎn)业结(jié)合,就只是一种纯粹(cuì)的炫技。
追溯AI发展这起伏变(biàn)动的(de)60多年,共经历了三次浪潮。1956年的Dartmouth会议后(hòu),人们陆续发明了第一款的感知(zhī)神经网络(luò)软件和聊(liáo)天软(ruǎn)件,证明了数学定(dìng)理。彼时,大家都惊(jīng)呼“人工智能来了,再过十年机器要超越(yuè)人类了”,然而直到70年代后期,人(rén)们发现(xiàn)过(guò)去的理论(lùn)和(hé)模型只(zhī)能解決(jué)一些非常简单(dān)的(de)问题。很快,AI第(dì)一次(cì)浪潮被拍在沙(shā)滩上。
随(suí)着1982年(nián)Hopfield神经网(wǎng)络和BT训(xùn)练算法的提出,外界又有了“人工智能春天(tiān)来临”的呼(hū)声。于(yú)是80年代又兴起(qǐ)一波人工(gōng)智能的(de)热朝,包括(kuò)语(yǔ)音识别、语音翻译计(jì)划,以及(jí)日本提出(chū)的第五代计算机。到了90年代后期,人们再次发(fā)现这种东西离(lí)实(shí)际生活还很遥远。即使IBM在90年代时提(tí)出了一款(kuǎn)名为“IBM Viavoice”的(de)语(yǔ)音(yīn)听(tīng)写软件(jiàn),在演示当中效(xiào)果不错,但真正用的时候却很难使用。2000年左右,第二次人(rén)工智能的(de)浪(làng)潮又一次破灭。
第三次(cì)人工智能浪潮是随着(zhe)2006年 Hinton提(tí)出的深度学习的技术,以及在图像、语音识别以及其他领域(yù)内取得(dé)的一(yī)些成(chéng)功而(ér)开(kāi)启的。业界普遍认为经过(guò)两次起伏,人工智能开始进(jìn)入(rù)了(le)真正爆(bào)发的(de)前夜。
“AI过去两次浪潮都没有跟产业结合。” 梁(liáng)家恩(ēn)称,而第三次浪潮更大的背景是万物智(zhì)联的时代,这是(shì)一(yī)个互联网的(de)延伸,从(cóng)PC互联(lián)到移(yí)动(dòng)互联,再到(dào)未(wèi)来万物互联才是真正的主战场(chǎng)。在这个战场(chǎng)上,除了AI技(jì)术之外(wài),还有IOT、5G等技术的逐渐成熟落地,所有这些技术的结合,会给人们生活带来天翻地覆的变化。“互联网未来从线上沉入到线(xiàn)下,改(gǎi)变(biàn)我们的消(xiāo)费(fèi)和整个(gè)产业升(shēng)级,在这(zhè)个时(shí)代会有很大(dà)的机会来(lái)临。”
portant;" />
云知声(shēng)董事长(zhǎng)兼CTO梁家恩
据梁家恩介绍(shào),云(yún)知声基(jī)于在(zài)移动端的三年探索,发现语(yǔ)音助手在手机上(shàng)的运用和(hé)电视上(shàng)的运(yùn)用活跃度相差20倍以上,从而得(dé)到启(qǐ)发(fā):只有AI技术跟硬件以及跟整(zhěng)个物联(lián)网产业结(jié)合,才有未来(lái)。
从AI企(qǐ)业来看,据了解,百度AI能力正逐渐(jiàn)被应用于医(yī)疗、零售、农业和金(jīn)融等(děng)各(gè)个领域。去年12月份,百度(dù)宣布成立“百度AI产(chǎn)业研究中心”,该中心(xīn)将与产业(yè)、学(xué)术、研究机构携手,探(tàn)索各(gè)产业呈现(xiàn)出(chū)的新应用、新模式(shì)、新业态、新价值(zhí)。腾讯围绕着计算机视觉、智能语音、机器人控制、NLP自然语言处理等(děng)AI技(jì)术全面布(bù)局(jú)。网易也正在通(tōng)过(guò)AI+教育消(xiāo)除城乡(xiāng)教育鸿沟。可见行业已(yǐ)经普遍意识(shí)到,唯有加强人工智能和产业发展的融合,培育(yù)新增长点、形成新动能,以人工智能技术推动各产(chǎn)业变革,推动人工智能和商业场景(jǐng)的深度融合,才能真(zhēn)正实现商业化落地。
“全栈”、“硬核(hé)”两大(dà)挑(tiāo)战
在当(dāng)下AI 技术驱动的产业(yè)变革浪潮中,要服务好消费与产业(yè)升(shēng)级(jí)的需求,技术与应用的挑战(zhàn)是十分艰巨的。从(cóng)云知声的(de)AI 技术分(fèn)享会上,记者获取到两(liǎng)个象征行业挑战的关键要素——“全栈”和“硬核(hé)”。
全栈可以从(cóng)两个(gè)维度解读,第一(yī)个维度是(shì)如何构建(jiàn)多模态生态(tài)拟人(rén)化智能系统(tǒng)。以云知声为例,以(yǐ)语(yǔ)音交互起家的(de)云知(zhī)声,其(qí)目前为止的技术图谱已(yǐ)经超(chāo)过了语音能力范围,包(bāo)括感知和认知和表达(dá)能力,用视觉和听觉、降噪和(hé)语音识别、对话管理系统(tǒng)、行业智能系统、人(rén)脸和语音合成,最终反馈给用户。据梁家恩透露,云知(zhī)声最终想构建的便是多模态生态拟人化智能系(xì)统(tǒng)。
要实现这(zhè)个目(mù)的(de),需要解(jiě)决两个(gè)问(wèn)题:落地(dì)问(wèn)题和快速响应问题。“我们(men)有两块,一(yī)个是智能芯(xīn)片,另外一个是超算(suàn)平(píng)台(tái),一(yī)个解决我(wǒ)们落地的问题,一个解决(jué)快速响应的问题。” 这是梁家恩(ēn)或者说(shuō)云(yún)知声(shēng)对(duì)全栈的理解。
第二个维(wéi)度是(shì)如何打通完整的产业闭环,把感知和(hé)表达的技术真正跟(gēn)认知结合。“我们有一个从0到1、从1到10。从(cóng)1到(dào)10在技术领域已经比较完美了,但是对产业来说,从(cóng)1到10才是刚开(kāi)始。”梁家恩表(biǎo)示,能不能从10做到60分,60分意味着(zhe)什么,这需要解决产业(yè)里面融(róng)合性的产(chǎn)品体系,包括整个技术(shù)方案能(néng)不(bú)能达到量产要(yào)求等,这主要是功(gōng)能和产品运维的挑战。
全栈打通以(yǐ)后,产(chǎn)业规模化应(yīng)用的痛点如何(hé)解决(jué)?这就需要有足够(gòu)强的技术支(zhī)撑,也(yě)即“硬(yìng)核”。硬核技术涉及四个方面,一是语音技术,语音技术方向非(fēi)常成熟(shú),但在(zài)产业(yè)落地上的挑战非常大;二是机器(qì)智能水(shuǐ)平的提升,因为它代(dài)表大脑,如果只是鹦鹉学舌,是不(bú)能解决产业问题的;三(sān)是AI芯片落(luò)地,这需要较长时间的技术积累,云知声从2014年开(kāi)始布局(jú)AI芯(xīn)片(piàn),2016年动(dòng)工,到2018年才(cái)拿到(dào)第一块(kuài)芯片,并且还(hái)在不断完善的过程中(zhōng);四是(shì)超算能力,超算能力在延伸图像翻译(yì)时,能够得到非常(cháng)快的演进(jìn)。梁家恩认为超算平台(tái)对于(yú)云计算的价值,就相(xiàng)当于高铁对于中国经济(jì)发展(zhǎn)价值,“可以让(ràng)我们的运转体(tǐ)系提高不止一(yī)倍(bèi)以上的效率。”但如(rú)何搭建一(yī)个真正(zhèng)强大的超算平(píng)台,这同样(yàng)是一项挑战。
基于以上关于“全栈”和(hé)“硬核”的两个(gè)关键难点,梁家恩的(de)分析中也提到(dào)的云知声的突破:2016年(nián)开始挑战远场识别,做一些工程和技术(shù)方面的打磨。同年(nián)开(kāi)始(shǐ)布局芯片、超算(suàn)平台和云计算。2018年(nián)拿到芯片,超算平台(tái)开始铺开,同(tóng)期把全栈的技术构建(jiàn)起(qǐ)来,为AI技术(shù)与产业的(de)融合发展奠定了很大(dà)的基(jī)础(chǔ)。
portant;" />
“让(ràng)机器(qì)更好的服务人类”是整个AI行业(yè)以及所有AI企业都(dōu)需要去努(nǔ)力的方向与目标。总结而言(yán)要解决(jué)三个问(wèn)题(tí):一是(shì)多模态的交互,能不能变成多模(mó)态拟人化的交互能力是重点;二是行业问(wèn)题(tí)的解(jiě)决,“我们(men)不是要(yào)颠覆(fù)这个行业(yè),而(ér)是(shì)要进入行业(yè)里面去(qù),看这个产业有什么问题。” 梁家恩称,有(yǒu)些问题是能够通过人工智(zhì)能(néng)技术解决的(de)问题,那(nà)么就通过去解(jiě)决行业问题来(lái)推(tuī)动AI行业的发展。三是底层创新(xīn)能力支撑(chēng),只靠当下的技(jì)术能(néng)力推(tuī)进并不足(zú)以(yǐ)改变整个AI行(háng)业,只有(yǒu)包括芯(xīn)片(piàn)、超算、机器(qì)学(xué)习和认知学习等底层创(chuàng)新能力不能提升与突(tū)破,才能更好的面对未来的行业挑战,以及获得(dé)更(gèng)好(hǎo)的发展。
2019年之于AI,是最好的时代,也是最坏的(de)时代。“伪AI退却,真AI前行(háng)”是梁家恩给予今年人工智能(néng)行业的预判,“AI的大时代已经到来了,但是对于伪(wěi)AI企(qǐ)业已经消失,只要我们扎扎(zhā)实实的(de)把行(háng)业问题解决掉,市场(chǎng)就(jiù)会给(gěi)予最大(dà)的回报。”