主页
产品
应用案例
新闻动态
购买渠道
下载与支持
关于我们
生态合作
联系我们
主页
产品
新闻动态
购买渠道
下载与支持
关于我们
加入我们
联系我们
  • 中文|
  • Eng
  • 智能机器人三大核心技术(二)

     

    服務(wù)機(jī)器人想要達(dá)到智能化程度,定位導(dǎo)航、人機(jī)交互及環(huán)境交互這三大通用底層技術(shù)必不可少,上一篇對于定位導(dǎo)航技術(shù)我們已做出詳細(xì)講解,感興趣的小伙伴可點(diǎn)擊《智能機(jī)器人三大核心技術(shù)(一)》進(jìn)行查看。在擁有基礎(chǔ)的自主定位導(dǎo)航技術(shù)后,機(jī)器人想要進(jìn)一步發(fā)揮自身作用,還需要擁有人機(jī)交互能力。人機(jī)交互技術(shù)可讓機(jī)器人進(jìn)一步了解人類,了解用戶訴求,從而為用戶提供更個(gè)性化的服務(wù)。

    從第一代以鍵盤鼠標(biāo)為交互方式的PC互聯(lián)網(wǎng)時(shí)代,到第二代以觸屏為主的移動互聯(lián)網(wǎng)時(shí)代,再到今天以多模態(tài)人機(jī)交互方式的第三代互聯(lián)網(wǎng),人機(jī)交互形式發(fā)生了巨大的變化。

    人機(jī)交互技術(shù)的演變

    目前,人機(jī)交互技術(shù)主要包含語音識別、語義理解、人臉識別、圖像識別、體感/手勢交互等技術(shù)。通過語音識別、合成、理解等技術(shù),實(shí)現(xiàn)更精準(zhǔn)的營銷和專屬服務(wù)。通過人臉識別,可幫助商家精準(zhǔn)的識別用戶,并主動與用戶打招呼,提升用戶體驗(yàn)……。這些交互方式的改變將會深層次的影響我們?nèi)粘I畹膽?yīng)用場景。

    智能機(jī)器人核心技術(shù)人機(jī)交互

    基于語音的人機(jī)交互是當(dāng)前人機(jī)交互技術(shù)中最為主要的表現(xiàn)形式,語音人機(jī)交互過程中包含信息輸入和輸出的交互、語音處理、語義分析、智能邏輯處理以及知識和內(nèi)容的整合。結(jié)合語音人機(jī)交互過程,在人機(jī)交互中的關(guān)鍵技術(shù)中包含了自然語音處理、語義分析和理解、知識構(gòu)建和學(xué)習(xí)體系、語音技術(shù)、整合通信技術(shù)以及云計(jì)算處理技術(shù)。

    自然語音處理技術(shù):包括中文分詞、詞性標(biāo)注、實(shí)體識別、句法分析、自動文本分類等技術(shù)。

    語義分析和理解:包括知識表示、本體理論、分領(lǐng)域的語義網(wǎng)絡(luò)、機(jī)器推理等。

    知識構(gòu)建和學(xué)習(xí)體系:包括搜索技術(shù)、網(wǎng)絡(luò)爬蟲、數(shù)據(jù)挖掘、知識獲取、機(jī)器學(xué)習(xí)等技術(shù)。

    語音技術(shù):包括語音識別、語音合成和聲紋識別等。

    整合通信技術(shù):包括跨平臺即時(shí)通訊整合技術(shù)、超大負(fù)載消息集群處理技術(shù)、移動客戶端開發(fā)技術(shù)。

    云計(jì)算技術(shù):包括海量數(shù)據(jù)分布式存儲、統(tǒng)計(jì)和分析技術(shù)。

    經(jīng)過科研人員的不斷努力,目前語音交互技術(shù)已成功進(jìn)入商用門檻,如今在智能手機(jī)、智能音箱、智能臺燈等設(shè)備中大多采用了語音人機(jī)交互技術(shù),隨著語音人機(jī)交互技術(shù)應(yīng)用價(jià)值的逐漸顯現(xiàn),眾多企業(yè)紛紛布局語音人機(jī)交互領(lǐng)域,如科大訊飛、谷歌、捷通華聲等企業(yè)。隨著布局企業(yè)的不斷增多,語音人機(jī)交互的產(chǎn)業(yè)規(guī)模也在不斷擴(kuò)大,并帶動了機(jī)器人、家電、汽車等相關(guān)產(chǎn)業(yè)的發(fā)展。

    除了語音人機(jī)交互,基于視覺的人機(jī)交互技術(shù)也是目前研究的一大熱點(diǎn),對于一個(gè)人來說最為主觀的就是看臉部表情,未來機(jī)器人也需要理解人的感情,這當(dāng)中就會涉及到人臉識別技術(shù),包括特征提取及分類,目前在該技術(shù)中,對于人類基本的七種表情識別率可達(dá)到百分之八十左右,當(dāng)然目前還是一些比較明顯的表情,如在高興或者發(fā)怒的情況下,但在人的自然交流過程中,人的表情還是比較平淡的,對于機(jī)器人來說,目前還難以達(dá)到準(zhǔn)確的分辨效果,這些過程是需要進(jìn)行一些更加復(fù)雜的特征來提取。

    當(dāng)然,除了對臉部表情的理解,手勢也是人最為直接的表現(xiàn)形式,通過一些手勢也可以達(dá)到很多的命令,不同的手勢形狀可以構(gòu)成不同的動作指令。雖然手勢有很多種,但可以找到比較容易記憶的手勢,然后進(jìn)行交互。

    手勢識別是人機(jī)交互的重要手段之一,通過手部的動作直接控制計(jì)算機(jī),相比傳統(tǒng)的鍵盤、鼠標(biāo)等控制方式,具有自然直觀和便于學(xué)習(xí)等優(yōu)點(diǎn)。

    目前常用的手勢識別方法主要包括基于神經(jīng)網(wǎng)絡(luò)的識別方法、基于隱馬爾可夫模型的識別方法和基于幾何特征的識別方法?;谏窠?jīng)網(wǎng)絡(luò)的手勢識別方法,具有抗干擾、自組織、自學(xué)習(xí)且抗 噪聲能力等優(yōu)點(diǎn),但訓(xùn)練時(shí)需要采集的樣本量大,且對時(shí)間序列的處理能力不強(qiáng)?;陔[馬爾可夫模型的識別方法,能夠細(xì)致的描述手勢信號,但拓?fù)浣Y(jié)構(gòu)一般,計(jì)算量相對較大?;趲缀翁卣鞯淖R別方法,是根據(jù)手的區(qū)域及邊緣 幾何特征關(guān)系進(jìn)行手勢識別,該方法無需對手勢進(jìn)行時(shí)間上的分割,計(jì)算量小,

    隨著移動機(jī)器人和手勢識別的發(fā)展,人機(jī)交互技術(shù)也在不斷更新,自從微軟推出Kinect體感外設(shè)以來,自然的人機(jī)交互成為當(dāng)前的研究熱點(diǎn),通過Kinect外設(shè),可以解除人們受鍵盤、鼠標(biāo)等傳統(tǒng)交互方式的束縛,具有重要的意義。

     

     

    聲明:本欄目僅代表作者個(gè)人觀點(diǎn),不代表思嵐科技立場

    關(guān)鍵字:机器人核心技术,人机交互,机器人

    top