AI從雲端走向實體 視覺成具身AI關鍵

劉孟迪表示,2022年底OpenAI推出ChatGPT後,生成式AI快速帶動整體產業發展,AI也逐漸從螢幕走向實體世界,從數位生成延伸至實體感知與行動控制,也就是具身AI。同時,在全球供應鏈重組與地緣政治影響下,企業生產模式轉向分散式布局,使AI與自動化需求持續升溫。

鍾毓修指出,所羅門投入AI視覺技術已超過十年,主要發展影像辨識與視覺感知軟體平台,希望讓機器人與設備具備「眼睛與大腦」。早期技術多應用於機械手臂搬運與物件辨識,如今已延伸至機器人、自動化設備、穿戴式裝置與各類攝影設備。

他表示,隨著相機解析度持續提升,加上AR眼鏡、手機、IP Camera與無人機等終端設備普及,影像資料已成為AI的重要資訊來源。透過電腦視覺技術,AI可從影像中進行辨識與判讀,協助企業在品質檢測、設備巡檢與流程管理等方面提升效率。

目前AI視覺已逐步導入物流、自動化倉儲與製造業。例如物流中心可透過視覺辨識不同尺寸與形狀的商品,再由機械手臂進行自動分揀與貼標;在餐飲與零售場域,也可透過影像辨識確認訂單與包裝流程,降低出貨與外送錯誤。此外,在設備巡檢與公共設施管理方面,AI視覺也逐漸取代人工巡檢,例如透過自走車或無人載具巡檢設備儀表狀態,並即時回傳影像進行分析。

所羅門資深協理鍾毓修。呂承哲攝
所羅門資深協理鍾毓修。呂承哲攝

AI落地帶動網通需求 無線網路成「數位神經」

劉孟迪指出,隨著AI視覺與自動化設備普及,工業網路基礎架構也面臨新的挑戰。過去工廠網路主要傳輸設備感測資料,但隨著影像與影音資料大量增加,資料型態與流量出現明顯變化,對網路頻寬與即時傳輸能力提出更高要求。

他表示,AI應用也促使工廠網路架構逐漸從傳統集中式系統,轉向雲地混合架構(Hybrid Cloud),並結合邊緣運算。同時,隨著AGV無人搬運車、AMR自主移動機器人等移動設備導入工廠,無線通訊需求快速增加,企業必須建立更穩定可靠的工業無線網路。

在具身AI應用場景中,網路通訊已不再只是資料傳輸工具,而是支撐整個系統運作的「數位神經」。例如AGV巡檢設備時,若能即時將影像回傳至中控室,系統即可立即判斷設備異常並採取行動,而不必等巡檢完成後再分析資料。

不過,無線通訊在工業環境中仍面臨設備干擾、頻段壅塞與基地台漫遊封包遺失等挑戰。例如2.4GHz頻段容易受到其他設備干擾,移動設備在基地台之間切換時也可能出現短暫斷線。劉孟迪指出,Moxa長期深耕工業無線網通與軌道交通領域,例如高速列車在時速130公里行駛時仍需穩定傳輸車載影像與資料,這些技術經驗也讓公司在工業無線網通領域具備優勢。

所羅門資深協理鍾毓修(右)、Moxa亞太區總經理林世偉(中)、台灣區負責人劉孟迪(左)。公司提供
所羅門資深協理鍾毓修(右)、Moxa亞太區總經理林世偉(中)、台灣區負責人劉孟迪(左)。公司提供

人形機器人要落地 有「好眼力」才知道往哪裡去

談到具身AI的下一步,鍾毓修表示,近兩年AI技術發展速度極快,其中最受關注的仍是人形機器人何時能真正成熟並投入實際應用。他指出,人形機器人是最具象的具身AI形態,整合邊緣運算與無線通訊等技術,最終目標是進入家庭與日常生活場景,但要實現這一步,關鍵仍在於視覺能力。

他指出,目前外界常在影片中看到人形機器人展示洗碗、摺衣服或搬運物品等功能,但多半假設機器人已經站在正確位置開始執行任務,卻忽略人類在動作前,還有一層「先觀察、再尋找、再靠近」的視覺判斷流程。

鍾毓修舉例,人們到便利商店購買礦泉水時,會先透過遠距視覺判斷商品位置,再走近後用近距視覺辨識品牌與價格,最後才完成拿取動作。若機器人缺乏這種能力,即使訓練再多任務模型,也難以真正落地。

他表示,所羅門近期投入發展的技術,就是讓移動載具與人形機器人具備類似「千里眼」的能力,也就是所謂的「超眼力」。透過這項技術,機器可先進行線索式導引與索引,再移動到目標附近後進一步精準辨識,提升任務執行效率。

鍾毓修指出,若缺乏這種視覺能力,即使VLA(Vision-Language-Action)模型訓練得再完整,機器人在移動過程中仍可能因找不到目標或繞過多路徑而失去實用性。換言之,真正讓具身AI落地的關鍵,不只是讓機器人學會執行任務,而是先讓它知道該往哪裡去、看什麼以及如何找到正確目標。

他強調,所羅門希望透過「超眼力」技術結合VLA模型,賦予人形機器人、輪式機器人與機器狗更完整的感知與導航能力,加速具身AI的實際落地。

作者簡介

呂承哲

壹蘋新聞網財經科技記者,專注半導體、AI與新能源產業,追蹤台積電、輝達及台廠電子供應鏈動態,並解析市場投資趨勢。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
台達電啟動18場校園徵才!全台招募1700人 電力與機器人研發等職缺