即將發(fā)布的云知聲AI芯片
AI芯片領(lǐng)域近年來一片火熱,不論是資本市場(chǎng),還是大眾創(chuàng)業(yè),無不對(duì)其表現(xiàn)出極大的熱情。而作為一家專注物聯(lián)網(wǎng)人工智能服務(wù)的企業(yè),云知聲對(duì)AI芯片又有著怎樣的需求與思考?接下來,本文即將從AI與IoT融合的角度(AIoT),為您詳實(shí)解析。
一、 AIoT領(lǐng)域中人機(jī)交互的市場(chǎng)機(jī)會(huì)自2017 年開始,“AIoT”一詞便開始頻頻刷屏,成為物聯(lián)網(wǎng)的行業(yè)熱詞。“AIoT”即“AI+IoT”,指的是人工智能技術(shù)與物聯(lián)網(wǎng)在實(shí)際應(yīng)用中的落地融合。當(dāng)前,已經(jīng)有越來越多的人將AI 與IoT 結(jié)合到一起來看,AIoT 作為各大傳統(tǒng)行業(yè)智能化升級(jí)的最佳通道,已經(jīng)成為物聯(lián)網(wǎng)發(fā)展的必然趨勢(shì)。
在基于IoT技術(shù)的市場(chǎng)里,與人發(fā)生聯(lián)系的場(chǎng)景(如智能家居、自動(dòng)駕駛、智慧醫(yī)療、智慧辦公)正在變得越來越多。而只要是與人發(fā)生聯(lián)系的地方,勢(shì)必都會(huì)涉及人機(jī)交互的需求。人機(jī)交互是指人與計(jì)算機(jī)之間使用某種對(duì)話語言,以一定的交互方式,為完成確定任務(wù)的人與計(jì)算換機(jī)之間的信息交互過程。人機(jī)交互的范圍很廣,小到電燈開關(guān),大到飛機(jī)上的儀表板或是發(fā)電廠的控制室等等。而隨著智能終端設(shè)備的爆發(fā),用戶對(duì)于人與機(jī)器間的交互方式也提出了全新要求,使得AIoT人機(jī)交互市場(chǎng)被逐漸激發(fā)起來。
AIoT發(fā)展路徑
以智能家居市場(chǎng)為例,數(shù)據(jù)顯示,2018年中國(guó)智能家居規(guī)模將達(dá)到1800億元,到2020年智能家居市場(chǎng)規(guī)模將達(dá)到3576億元。分析師預(yù)測(cè),2021年全球智能家居市場(chǎng)規(guī)模將達(dá)5000多億元。飛速爆發(fā)中的AIoT市場(chǎng),所蘊(yùn)藏的人機(jī)交互需求及前景無疑是令人期待的。
人類生活的數(shù)字化進(jìn)程已持續(xù)約三十年,這些年我們經(jīng)歷了從模擬時(shí)代到PC互聯(lián)時(shí)代再移動(dòng)互聯(lián)時(shí)代的演進(jìn),而目前我們正處在向物聯(lián)網(wǎng)時(shí)代的演進(jìn)過程中。從交互方式上來講,我們可以看到機(jī)器是越來越“遷就”人的:從PC時(shí)代的鍵盤和鼠標(biāo)到移動(dòng)時(shí)代的觸屏、NFC以及各種MEMS傳感器,再到物聯(lián)網(wǎng)時(shí)代正在蓬勃發(fā)展的語音/圖像等交互方式,使用門檻正在變得越來越低,這導(dǎo)致了越來越多的用戶的卷入。同時(shí)我們需要注意到另一個(gè)深刻的變化,即由于交互方式的演進(jìn)(至少是重要原因之一),大量的新維度的數(shù)據(jù)也在不斷地被創(chuàng)造出來和數(shù)字化,比如PC時(shí)代的工作資料和娛樂節(jié)目,智能手機(jī)時(shí)代的用戶使用習(xí)慣、位置、信用和貨幣,再到物聯(lián)網(wǎng)時(shí)代的各種可能的新數(shù)據(jù)。
在物聯(lián)網(wǎng)時(shí)代,交互方式正在往本體交互的方向發(fā)展。所謂“本體交互”,指的是從人的本體出發(fā)的,人與人之間交互的基本方式,如語音、視覺、動(dòng)作、觸覺,甚至味覺等。例如,通過聲音控制家電,或者空調(diào)通過紅外來決定是否應(yīng)該降溫,通過語音和紅外結(jié)合來進(jìn)行溫度的控制(偵測(cè)到房間里沒人的時(shí)候,即便電視節(jié)目里提到了“降溫”,空調(diào)也不做反應(yīng))。
新的數(shù)據(jù)是AI的新的養(yǎng)料,而大量的新維度的數(shù)據(jù)正在為AIoT創(chuàng)造出無限可能。
從AIoT發(fā)展路徑來看,當(dāng)前行業(yè)人士普遍認(rèn)為,其將經(jīng)歷單機(jī)智能、互聯(lián)智能到主動(dòng)智能的三大階段。
單機(jī)智能指的是智能設(shè)備等待用戶發(fā)起交互需求,而這個(gè)過程中設(shè)備與設(shè)備之間是不發(fā)生相互聯(lián)系的。這種情境下,單機(jī)系統(tǒng)需要精確感知、識(shí)別、理解用戶的各類指令,如語音、手勢(shì)等,并正確決策、執(zhí)行和反饋。AIoT行業(yè)正處于這一階段。以家電行業(yè)為例,過去的家電就是一個(gè)功能機(jī)時(shí)代,就像以前的手機(jī)按鍵式的,幫你把溫度降下來,幫你實(shí)現(xiàn)食物的冷藏;現(xiàn)在的家電實(shí)現(xiàn)了單機(jī)智能,就是語音或手機(jī)A P P的遙控去實(shí)現(xiàn)調(diào)溫度、打開風(fēng)扇等。
無法互聯(lián)互通的智能單品,只是一個(gè)個(gè)數(shù)據(jù)和服務(wù)的孤島,遠(yuǎn)遠(yuǎn)滿足不了人們使用需求。要取得智能化場(chǎng)景體驗(yàn)的不斷升級(jí)、優(yōu)化,首先需要打破的是單品智能的孤島效應(yīng)。而互聯(lián)智能場(chǎng)景,本質(zhì)上指的是一個(gè)相互互聯(lián)互通的產(chǎn)品矩陣,因而,“一個(gè)大腦(云或者中控),多個(gè)終端(感知器)”的模式成為必然。例如,當(dāng)用戶在臥室里對(duì)空調(diào)說關(guān)閉客廳的窗簾,而空調(diào)和客廳的智能音箱中控是連接的,他們之間可以互相商量和決策,進(jìn)而做出由音箱關(guān)閉客廳窗簾的動(dòng)作;又或者當(dāng)用戶晚上在臥室對(duì)著空調(diào)說出“睡眠模式”時(shí),不僅僅空調(diào)自動(dòng)調(diào)節(jié)到適宜睡眠的溫度,同時(shí),客廳的電視、音箱,以及窗簾、燈設(shè)備都自動(dòng)進(jìn)入關(guān)閉狀態(tài)。這就是一個(gè)典型的通過云端大腦,配合多個(gè)感知器的互聯(lián)智能的場(chǎng)景落地。
主動(dòng)智能指的是智能系統(tǒng)根據(jù)用戶行為偏好、用戶畫像、環(huán)境等各類信息,隨時(shí)待命,具有自學(xué)習(xí)、自適應(yīng)、自提高能力,可主動(dòng)提供適用于用戶的服務(wù),而無需等待用戶提出需求,正如一個(gè)私人秘書。試想這樣的場(chǎng)景,清晨伴隨著光線的變化,窗簾自動(dòng)緩緩開啟,音箱傳來舒緩的起床音樂,新風(fēng)系統(tǒng)和空調(diào)開始工作。你開始洗漱,洗涑臺(tái)前的私人助手自動(dòng)為你播報(bào)今日天氣、穿衣建議等。洗漱完畢,早餐和咖啡已經(jīng)做好。當(dāng)你走出家門,家里的電器自動(dòng)斷電,等待你回家時(shí)再度開啟。
二、 AIoT的人機(jī)交互對(duì)AI芯片需求邊緣計(jì)算指在靠近物或數(shù)據(jù)源頭的網(wǎng)絡(luò)邊緣側(cè),融合網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)、應(yīng)用核心能力的開放平臺(tái),就近提供邊緣智能服務(wù),滿足行業(yè)數(shù)字化在敏捷連接、實(shí)時(shí)業(yè)務(wù)、數(shù)據(jù)優(yōu)化、應(yīng)用智能、安全與隱私保護(hù)等方面的關(guān)鍵需求。在行業(yè)內(nèi)有個(gè)十分形象的比方,邊緣計(jì)算猶如人類身體的神經(jīng)末梢,可以對(duì)簡(jiǎn)單的刺激進(jìn)行自行處理,并將特征信息反饋給云端大腦。伴隨AIoT的落地實(shí)現(xiàn),在萬物智聯(lián)的場(chǎng)景中,設(shè)備與設(shè)備間將互聯(lián)互通,形成數(shù)據(jù)交互、共享的嶄新生態(tài)。在這個(gè)過程中,終端不僅需要有更加高效的算力,在大多數(shù)場(chǎng)景中,還必須具有本地自主決斷及響應(yīng)能力。拿智能音箱舉例,其不僅需要支持本地喚醒的能力,還應(yīng)該具備遠(yuǎn)講降噪的能力,而由于實(shí)時(shí)性以及數(shù)據(jù)有效性的考慮,這方面的計(jì)算必須發(fā)生在設(shè)備端而不是云端。
智能家居行業(yè)作為AIoT人機(jī)交互最重要的落地場(chǎng)景,正吸引越來越多企業(yè)進(jìn)入。在這其中,既有如Apple、Google、Amazon等這樣的科技巨頭,也有像海爾、三星這類的傳統(tǒng)家電廠商,當(dāng)然也不乏小米、京東這樣的互聯(lián)網(wǎng)新貴。基于互聯(lián)智能的構(gòu)想,未來的AIoT時(shí)代,每個(gè)設(shè)備都需要具備一定的感知(如預(yù)處理)、推斷以及決策功能。因此,每個(gè)設(shè)備端都需要具備一定不依賴于云端的獨(dú)立計(jì)算能力,即上面提到的邊緣計(jì)算。
在智能家居的場(chǎng)景下,通過自然語音的方式與終端設(shè)備進(jìn)行交互,在當(dāng)前已成為行業(yè)主流。由于家庭場(chǎng)景的特殊性,家用終端設(shè)備需精準(zhǔn)區(qū)分、提取正確的用戶命令(而不是家人在談話時(shí)無意說到的無效關(guān)鍵詞),以及聲源、聲紋等信息,因此,智能家居領(lǐng)域的語音交互對(duì)于邊緣計(jì)算也提出了更高要求,具體表現(xiàn)在以下幾方面:
1) 遠(yuǎn)講降噪、喚醒家居環(huán)境下聲場(chǎng)復(fù)雜,比如電視聲音、多人對(duì)話、小孩嬉鬧、空間混響(廚房做飯、洗衣機(jī)等設(shè)備工作噪音),這些容易干擾用戶與設(shè)備間正常交互的聲音,很大概率會(huì)在同一時(shí)間存在,這就需要對(duì)各種干擾進(jìn)行處理、抑制,使得來自真正用戶的聲音更加突出。在這個(gè)處理的過程中,設(shè)備需要更多的信息量來進(jìn)行輔助判斷。家居場(chǎng)景語音交互的一個(gè)必備功能是使用麥克風(fēng)陣列進(jìn)行多通道的同步聲音錄入,通過對(duì)聲學(xué)空間場(chǎng)景進(jìn)行分析,使得聲音的空間定位更加準(zhǔn)確,大幅提升語音質(zhì)量。另一個(gè)重要功能是通過聲紋信息輔助區(qū)分真正用戶,使他的聲音從多人的竄擾中更加清晰地區(qū)分出來。這些都需要在設(shè)備端實(shí)現(xiàn),且需要較大的算力支持。
2) 本地識(shí)別家居領(lǐng)域人機(jī)交互的本地識(shí)別離不開邊緣計(jì)算,具體體現(xiàn)兩個(gè)方面:
高頻詞。從實(shí)際統(tǒng)計(jì)來看,用戶在特定場(chǎng)景下的常用關(guān)鍵詞指令數(shù)量有限。例如車機(jī)產(chǎn)品,用戶最常使用的可能是“上一首/下一首”,空調(diào)產(chǎn)品有可能最常用的命令是“開啟/關(guān)閉”等,這些用戶經(jīng)常用到的詞就叫做高頻詞。對(duì)于高頻詞的處理,完全可以放在本地處理而不依賴于云端的延時(shí),從而帶給用戶最佳的體驗(yàn)。
聯(lián)網(wǎng)率。在智能家居產(chǎn)品尤其是家電產(chǎn)品落地的過程中,聯(lián)網(wǎng)率是一個(gè)問題。如何在不聯(lián)網(wǎng)的情況下讓用戶感知到語音AI的強(qiáng)大,進(jìn)行用戶培養(yǎng),也是邊緣計(jì)算在當(dāng)前的一個(gè)重要作用。
3) 本地/云端效率的平衡家居領(lǐng)域的自然語言交互過程中,當(dāng)所有的計(jì)算被放到云端時(shí),聲學(xué)計(jì)算的部分將對(duì)云端計(jì)算造成較大壓力,一方面造成云平臺(tái)成本的大幅增加;另一方面帶來計(jì)算延遲,損害用戶體驗(yàn)。自然語音交互分成聲學(xué)和自然語言理解(NLP)兩個(gè)部分,從另一個(gè)維度上來講,可看成是“業(yè)務(wù)無關(guān)”(語音轉(zhuǎn)文字/聲學(xué)計(jì)算)和“業(yè)務(wù)有關(guān)”(NLP)的部分。業(yè)務(wù)有關(guān)的部分毫無疑問需要在云端解決,例如用戶問天氣、聽音樂等需求,那么設(shè)備對(duì)用戶語句的理解,以及天氣信息的獲取必須通過聯(lián)網(wǎng)來完成。但是,對(duì)于用戶語音到文字的轉(zhuǎn)換,例如下達(dá)指令“打開空調(diào)、增加溫度等”,其中的部分甚至大部分計(jì)算是有可能在本地完成的。這種情況下,從本地上傳到云端的數(shù)據(jù)將不再是壓縮后的語音本身,而是更為精簡(jiǎn)的中間結(jié)果甚至是文本本身,數(shù)據(jù)更為精簡(jiǎn),云端計(jì)算更為簡(jiǎn)單,則響應(yīng)也更為迅速。
4) 多模態(tài)的需求所謂多模態(tài)交互即多種本體交互手段結(jié)合后的交互,例如將多種感官融合,比如文字、語音、視覺、動(dòng)作、環(huán)境等。人是一個(gè)典型的多模態(tài)交互的例子,在人與人交流的過程中,表情、手勢(shì)、擁抱、觸摸,甚至是氣味,無不在信息交換的過程中起著不可替代的作用。顯然,智能家居的人機(jī)交互勢(shì)必不止語音一個(gè)模態(tài),而是需要多模態(tài)交互并行。舉個(gè)例子,智能音箱如果看到人不在家,那就完全不需要對(duì)電視里誤放出的喚醒詞進(jìn)行響應(yīng),甚至可以把自己調(diào)到睡眠狀態(tài);一個(gè)機(jī)器人如果感覺到主人在注視他,那么可能會(huì)主動(dòng)向主人打招呼并詢問是否需要提供幫助。多模態(tài)處理無疑需要引入對(duì)多類傳感器數(shù)據(jù)的共同分析和計(jì)算,這些數(shù)據(jù)既包括一維的語音數(shù)據(jù),也會(huì)包括攝像頭圖像以及熱感應(yīng)圖像等二維數(shù)據(jù)。這些數(shù)據(jù)的處理無不需要本地AI的能力,也就對(duì)邊緣計(jì)算提出了強(qiáng)力的需求。
三、 邊緣計(jì)算帶來的AI芯片需求AI算法對(duì)設(shè)備端芯片的并行計(jì)算能力和存儲(chǔ)器帶寬提出了更高的要求,盡管基于GPU的傳統(tǒng)芯片能夠在終端實(shí)現(xiàn)推理算法,但其功耗大、性價(jià)比低的弊端卻不容忽視。在AIoT的大背景下,IoT設(shè)備被賦予了AI能力,一方面在保證低功耗、低成本的同時(shí)完成AI運(yùn)算(邊緣運(yùn)算);另一方面,IoT設(shè)備與手機(jī)不同,形態(tài)千變?nèi)f化,需求碎片化嚴(yán)重,對(duì)AI算力的需求也不盡相同,因此很難給出跨設(shè)備形態(tài)的通用芯片架構(gòu)。因此,只有從IoT的場(chǎng)景出發(fā),設(shè)計(jì)定制化的芯片架構(gòu),才能在大幅提升性能的同時(shí),降低功耗和成本,同時(shí)滿足AI算力以及跨設(shè)備形態(tài)的需求。相比于傳統(tǒng)芯片,定制化的AI芯片在運(yùn)算效率及存儲(chǔ)器帶寬上有絕對(duì)優(yōu)勢(shì),其優(yōu)勢(shì)主要體現(xiàn)在以下幾點(diǎn):
首先,采用并行運(yùn)算架構(gòu)及專用矩陣加速器等技術(shù),例如Systolic Array架構(gòu)或更復(fù)雜的并行運(yùn)算架構(gòu)實(shí)現(xiàn)運(yùn)算單元的利用率,甚至采用Winograd等特定的矩陣加速器,降低矩陣運(yùn)算的運(yùn)算量,從而提高運(yùn)算效率。
其次,從降低外部存儲(chǔ)器帶寬的角度出發(fā),通過數(shù)據(jù)壓縮或相關(guān)功能模塊之間的pipeline技術(shù),降低內(nèi)存帶寬。以NVIDIA公司開源AI引擎NVDLA為例,在convolutions、activations、pooling等模塊之間設(shè)計(jì)了專用的數(shù)據(jù)通路,模塊之間的數(shù)據(jù)交互不在經(jīng)過系統(tǒng)內(nèi)存,而是由專用的數(shù)據(jù)通道完成。
NVDLA 核心架構(gòu)
隨著芯片運(yùn)算效率的提升及外部存儲(chǔ)器數(shù)據(jù)帶寬的降低,芯片運(yùn)算所需的時(shí)鐘周期和內(nèi)存訪問次數(shù)將會(huì)大幅減少。因此,相較通用芯片而言,AI芯片可以在更低的主頻、更小的芯片面積,完成機(jī)器學(xué)習(xí)中同等任務(wù)量的計(jì)算。采用更低的主頻,不單降低了芯片的動(dòng)態(tài)功耗,還可以降低芯片工作電壓,從而進(jìn)一步降低芯片動(dòng)態(tài)功耗。另外,低主頻使得在芯片加工工藝的選上有更多的選擇,進(jìn)一步影響芯片的靜態(tài)功耗。
由于芯片面積、功耗直接影響芯片封裝的選擇,因此AI芯片在芯片封裝上也要比傳統(tǒng)芯片更有優(yōu)勢(shì)。由此來看,AI芯片的性價(jià)比將遠(yuǎn)遠(yuǎn)大于傳統(tǒng)芯片。
四、 AI芯片落地面臨的挑戰(zhàn)AI芯片在保證高性能、高能效比的同時(shí),兼顧靈活性和通用性。AI算法有應(yīng)用領(lǐng)域廣、算法種類多樣化以及算法演進(jìn)較快的特點(diǎn),因此對(duì)AI芯片架構(gòu)設(shè)計(jì)提出較高的要求。只有性能與通用性兼顧的AI芯片才會(huì)有廣闊的市場(chǎng)和較長(zhǎng)的生命周期。只有在芯片架構(gòu)與軟件算法之間形成較高的耦合度時(shí),芯片的性價(jià)比才能夠達(dá)到較高的值,因此離開對(duì)算法的深刻理解是很難設(shè)計(jì)出高效的AI芯片的。而直接對(duì)AI算法的硬件化將極大地降低芯片靈活性,因此AI芯片的硬件加速往往體現(xiàn)在比算法更底層的數(shù)學(xué)運(yùn)算上。由于AI算法是建立在一系列的數(shù)學(xué)運(yùn)算之上的,因此設(shè)計(jì)一款高性價(jià)比和高靈活性的芯片需要從數(shù)學(xué)運(yùn)算及運(yùn)算之間的數(shù)據(jù)依賴著手。在大量數(shù)據(jù)統(tǒng)計(jì)的基礎(chǔ)上,根據(jù)數(shù)據(jù)運(yùn)算的復(fù)雜度、出現(xiàn)的頻度、數(shù)據(jù)依賴關(guān)系等信息,提煉基礎(chǔ)數(shù)學(xué)運(yùn)算指令及數(shù)據(jù)搬運(yùn)指令,并根據(jù)這些指令完成芯片架構(gòu)的定義和實(shí)現(xiàn)。因此,AI芯片架構(gòu)設(shè)計(jì)及實(shí)現(xiàn)是AI芯片設(shè)計(jì)的中間一個(gè)小的環(huán)節(jié),而AI指令集設(shè)計(jì)才是AI芯片成功的更為關(guān)鍵的因素。
做AI芯片不是搞軍備競(jìng)賽,任何產(chǎn)品在推向市場(chǎng)的過程中都有其產(chǎn)品定位,AI芯片也不例外。特定的AI芯片是面向特定場(chǎng)景的,而場(chǎng)景則由芯片所面向的產(chǎn)品、市場(chǎng)所共同影響決定,不同場(chǎng)景對(duì)于AI芯片在價(jià)格、功耗,以及所支持的功能方面有著截然不同的需求。比如,大型服務(wù)機(jī)器人和智能開關(guān),對(duì)于AI芯片的價(jià)格要求可能會(huì)有比較大的反差,畢竟二者的售價(jià)相差懸殊,對(duì)于同一售價(jià)的AI芯片,出于產(chǎn)品成本的考慮,所表現(xiàn)出來的接受度可能截然相反。因此AI芯片不僅要做得來,還得賣得出。
在AI軟件生態(tài)方面,AI開發(fā)框架(Framework)相對(duì)碎片化,比如TensorFlow(Google),CNTK(Microsoft)及Torch7(Facebook)等,整個(gè)行業(yè)尚未形成統(tǒng)一的標(biāo)準(zhǔn)。在標(biāo)準(zhǔn)化方面的探索主要包括Microsoft和Facebook聯(lián)合推出的ONNX,Khronos組織推出的NNEF等神經(jīng)網(wǎng)絡(luò)交換層標(biāo)準(zhǔn)。不可否認(rèn),神經(jīng)網(wǎng)絡(luò)交換層標(biāo)準(zhǔn)是解決當(dāng)前碎片化AI框架的捷徑,但該標(biāo)準(zhǔn)處于起步階段,標(biāo)準(zhǔn)的成熟還需要較長(zhǎng)的路要走。因此AI芯片廠商解決各種框架之間的兼容性問題,對(duì)AI芯片的通用性帶來極大的挑戰(zhàn)。在AI產(chǎn)品生態(tài)方面,AI芯片的規(guī)模性的落地領(lǐng)域尚在探索之中。同時(shí)在落地過程中,AI芯片不是孤立的,還需要軟件應(yīng)用、解決方案以及服務(wù)商的支持。AI芯片歸根結(jié)底是一個(gè)產(chǎn)品,既然是產(chǎn)品,其落地時(shí)的交付物可能是芯片本身,但更可能是芯片+應(yīng)用+服務(wù)。如果只有芯片,但是沒有基于芯片的算法和應(yīng)用,那么無法稱之為一個(gè)完整的產(chǎn)品。舉例來說,對(duì)于智能音箱而言,作為一個(gè)解決方案的提供商,AI芯片只是其產(chǎn)品中的一小部分,而其他部分例如基于AI芯片的應(yīng)用、云端的智能語音交互服務(wù)、內(nèi)容服務(wù)以及服務(wù)支持等,這才是落地中更為重要的一環(huán)。在AI芯片落地的過程中,客戶需要的一般是一個(gè)完整的方案,如果僅僅提供AI芯片的話,勢(shì)必需要在應(yīng)用、云服務(wù)等各方面尋找相應(yīng)的合作伙伴,才有可能對(duì)客戶提供一個(gè)完整的解決方案。
五、 云知聲在AI芯片落地方面的探索就云知聲而言,在芯片產(chǎn)品形態(tài)方面,實(shí)際上公司已經(jīng)過很長(zhǎng)時(shí)間的探索。從市場(chǎng)著手,云知聲在家居、智能音箱、兒童機(jī)器人等市場(chǎng)方面已經(jīng)基于IVM(通用芯片方案)的產(chǎn)品形態(tài),驗(yàn)證了市場(chǎng)、產(chǎn)品、用戶場(chǎng)景的合理性。而伴隨合作客戶在更多產(chǎn)品種類和形態(tài)上對(duì)成本、穩(wěn)定性、集成度等方面的呼聲愈高,進(jìn)而推出自研AI芯片就成為一件水到渠成的事情。
基于Unisound的AI指令集和DSP 指令集,結(jié)合語音應(yīng)用場(chǎng)景,以麥克風(fēng)陣列信號(hào)處理、語音識(shí)別及語音合成為一體的全新的芯片架構(gòu)。通過運(yùn)算單元之間的可編程互聯(lián)矩陣保證運(yùn)算效率的同時(shí),采用多級(jí)-多組-多端口的Memory架構(gòu)保證片內(nèi)數(shù)據(jù)帶寬的提升及降低芯片功耗。在架構(gòu)靈活性方面,通過Scratch-Pad將主控CPU與AI加速器內(nèi)部RAM相連,提供高效的CPU與AI加速器之間的數(shù)據(jù)通道,以便CPU對(duì)AI加速器運(yùn)算結(jié)果進(jìn)行二次處理。另外,連接各個(gè)運(yùn)算單元的可編程互聯(lián)矩陣架構(gòu),提供了擴(kuò)展運(yùn)算指令的功能,從而進(jìn)一步提升硬件架構(gòu)的靈活性及可擴(kuò)展性。芯片架構(gòu)方面的其余探索,包括多級(jí)多模式喚醒、從能量檢測(cè)到人類聲音檢測(cè)到喚醒詞檢測(cè)、針對(duì)語音設(shè)備及使用場(chǎng)景的定制化Power Domain等技術(shù),將芯片功耗降至最低。
在業(yè)務(wù)體系上,云知聲在2014年即提出了“云端芯”的技術(shù)架構(gòu)體系,通過云端服務(wù)、設(shè)備端應(yīng)用以及嵌入式硬件面向IoT領(lǐng)域構(gòu)建完整的語音AI解決方案。隨著云知聲自主AI芯片的落地,通過提供標(biāo)準(zhǔn)化的人機(jī)交互產(chǎn)品對(duì)接接口,可為合作客戶提供允許在端和云兩個(gè)方面均可進(jìn)行高度定制的解決方案。
總之,AIoT的人機(jī)交互是一個(gè)巨大的市場(chǎng),并由此帶來了對(duì)AI芯片的巨大需求。但在AI芯片的落地過程中,面臨著研發(fā)、產(chǎn)品定位以及商業(yè)化路徑等多方面的挑戰(zhàn)。在研發(fā)方面,需要針對(duì)實(shí)際采用的AI算法進(jìn)行深度迭代優(yōu)化,以滿足產(chǎn)品需求并保持架構(gòu)的靈活性;在產(chǎn)品定位方面,鑒于IoT設(shè)備碎片化的現(xiàn)實(shí),必須先考慮應(yīng)用場(chǎng)景和適用范圍,由此再倒推AI芯片的功能和性能要求;在商業(yè)化路徑方面,最終客戶需要的往往是整體解決方案而非芯片本身,因此如何構(gòu)建一個(gè)完整的AI解決方案,是每個(gè)AI芯片玩家必須考慮的事情。