賓士把 ChatGPT 集成到車機後,理想、蔚來等車企也蜂擁入場,用最前沿的對話機器人完成對車機大腦的更新換代。但人機交互不是終點,自動駕駛才是盡頭,AI大模型為自動駕駛帶來了更符合人類「腦迴路」的技術路線,不依賴高精地圖是第一步。
(前情提要:ChatGPT 接入賓士車語音助理 :駛向人工智慧與汽車產業新篇章)
(背景補充:SEC主席Gary Gensler請辭,查證是「假新聞」!源頭疑用ChatGPT生成)
ChatGPT 改造汽車的序幕已經拉開,賓士率先出手。
不久前,梅賽德斯 – 賓士將 ChatGPT 整合到了車機上,開啟了為期三個月的測試,結果顯示,它的語音助手不僅可以完成簡單地指令,還能進行連續多輪對話,理解能力和響應質量都有較大提升。
理想、創維、蔚來等汽車廠商隨即蜂擁而入,用前端的 GPT 能力讓車機智慧化程度更上一層樓。車機也徹底從最初的 「收音機」 變成了功能豐富的智慧終端,加上 GPT 「大腦」 後,又開始從木訥、雞肋的機器向行車夥伴轉變。
而人車互動不是 AI 上車的盡頭,自動駕駛才是未來。以往的自動駕駛解決方案過於依賴高精地圖,一旦地圖更新跟不上瞬息萬變的路況,行車安全將受到威脅。AI 大模型的進化升級,讓車企們看到了機會。
讓 AI 主動感知和決策,放棄對高精地圖的依賴,正在成為一種主流趨勢。幾天前,理想汽車開啟城市 NOA(導航輔助駕駛)內測,它將 BEV(Bird’s eye view,鳥瞰圖)大模型作為主要解決方案,讓汽車模仿人類 「腦回路」 駕車。通過連續學習,城市 NOA 還能被訓練成使用者通勤路線上 「代駕」。
接棒網際網路,AI 正在對汽車進行更深層次的改造,四個輪子的大傢伙越來越神似變形金剛。
車機 + GPT 賓士先出手
一場由內而外的 「變形記」 正在席捲汽車圈,從傳統燃油動力到新能源,從駕駛工具到智慧化產品。多年以來,科技驅使下,汽車不斷變幻著外貌和內在,網際網路改造汽車後,人工智慧又來了。
梅賽德斯 – 賓士在這股新浪潮中一馬當先,要把 ChatGPT 移植進車機。
6 月 16 日,賓士為期 3 個月的 ChatGPT 測試計劃在美國啟動,它與微軟合作,通過 Azure OpenAI 服務將 ChatGPT 整合到車機中。車主可以通過 Mercedes me APP 選擇使用 ChatGPT,還有更直觀測試方式 —— 直接在車內使用語音命令 「Hey Mercedes,我想加入測試計劃」,賓士的 MBUX 資訊娛樂系統就會將語音助手 「Hey Mercedes」 自動接入 ChatGPT。
過往,Hey Mercedes 可以提供體育、天氣等資訊,並回答有關車輛周圍環境的問題,還能控制使用者的智慧家居,這都是制式化的。ChatGPT 加入把問答變靈活了,使用者能詢問目的地詳細資訊,獲得晚餐建議,可以不斷提出問題,連續收到回覆。這是 ChatGPT 的看家本領。
當前,僅在美國地區約 90 萬輛配備 MBUX 的賓士汽車可以優先測試 ChatGPT,賓士打算利用這個初始測試期深入瞭解使用者提出的請求,來確定未來開發的優先事項,以及調整不同市場和語言的推出策略。
關於接入 ChatGPT 這事兒,賓士給了一個充滿感性的宣告,「一切目標都圍繞著重新定義您與梅賽德斯的關係。」 賓士要讓 ChatGPT 重塑人車互動體驗,更形象的類比是,車機從一個木訥的注重功能性的機器 「活」 起來了,向著車內生活夥伴的角色轉變。
賓士之後,國內的汽車廠商率先跟上。
6 月 19 日,理想汽車推出了自研的認知大模型 「Mind GPT」,這個大模型由理想的空間演算法團隊研發。據說大模型訓練的開始日期早在 ChatGPT 釋出之前,Mind GPT 基於數 10 TB 的原始訓練資料,使用了 1.3 兆個 Token 進行基座模型訓練,能識別聲紋和語音內容,還能聽懂方言,同時能為車主提供出行規劃,甚至具備 AI 繪畫和 AI 計算等功能。
理想透露,Mind GPT 釋出後,理想汽車將新增 LUI(使用者語言介面)互動方式,「比如你想吃個火鍋,只需要呼叫理想同學,車機介面就會生成火鍋的圖片供你選擇,隨後自動算好出行路線。」
創維汽車也在近日宣佈,旗下兩款車型創維 EV6Ⅱ 及創維 HT-iⅡ 在智慧車機上集成了 ChatGPT,此外,長城汽車、蔚來汽車、小鵬汽車、奇瑞汽車四家車企都在上個月申請了 GPT 相關商標。
GPT 上車成為一股潮流。奧緯諮詢董事合夥人張君毅認為,GPT 技術的接入能夠提升車的人機互動能力和綜合環境問題的互動能力。今後車企在同一價位段的硬體方面的品牌差異會越來越小,當舒適性、安全性、動力和續航里程上競爭難以產生太大的差異時,卷智慧就成了必然選擇。
給智慧座艙裝上 「大腦」
ChatGPT 上車又是汽車進化史上可書的一筆,最前端的自然語言處理大模型應用到了人類的出行工具上,更豐富的車內生活體驗將會出現。
回望 30 多年前,車載娛樂功能和車機智慧化,尚是一片空白。第一代車機誕生於上世紀 80-90 年代,當時人們普遍的關注點還是汽車的發動機、底盤和變速箱 「三大件」,突然有一些車型不僅能聽收音機,還能吞進磁帶,自由播放音樂,汽車有了一些第二生活空間的影子。
第二代車機則加入了 DVD 播放、MP3,娛樂性凸顯的同時,汽車又向駕駛體驗邁了一步,加入了車載導航。此時,解決 「路盲」 問題成為一個主流趨勢。許多老司機一定記得,在沒有車聯網的時代,凱立德車載導航成了高階車型的標配,它使用 GPS 衛星定位和存在車機裡的地圖包資料,實現相對準確的導航精度。
但除了導航和聽歌、收音之外,當時的人們並不對車機抱有太多期待,車機也往往不是決定購車與否的主要因素。
進入 21 世紀,電子數碼技術不斷髮展,手機的形態先變了。循著這個進化思路,車機上出現大屏,智慧化成為新賣點。基於 linux、WinCE、安卓等系統的車機陸續被汽車廠商採用,而後汽車不僅可以免費即時導航,還具備全景可視系統、汽車駕駛輔助系統,比如 360 度影像等。
當汽車連了網,一切由變得更不一樣。線上觀影、路書、語音控制、預約保養、遠端診斷等功能被加入車機,中控臺的螢幕越來越大,功能越來越多,一些廠商直接在駕駛室裝上了比平板電腦還大的顯示屏,甚至廠商們近來捲起了 「全面屏」,就連副駕和後排都要裝上螢幕。
終於,「第三塊屏」 的概念越來越顯眼,主機廠們希望,車機能夠成為繼電腦和手機之後,影響人類生活的第三代智慧終端。用富含科技感的車機佔領使用者心智,拓展更多的商業模式,成為現在的車企們攻堅的方向。
現在,「車機」 這一原始概念逐漸被 「智慧座艙」 所替代。蔚來甚至造出了 「第二起居室」 的新詞,不僅車機越來越智慧化,車企們開始卷內飾用料、音響系統、燈光系統,蔚來還發布了一款 AR 眼鏡,支援隨車巨幕觀影;理想 L9 甚至配備了一個後排冰箱,讓汽車成了可移動的房子。
但無論是車機還是智慧座艙,語音對話一直都是發展相對滯後的功能,考慮到駕駛安全性,語音操控又十分必要。
過去近十年來,幾乎所有車企和大量的 AI 創業公司,在自然語言處理領域投入頗多,希望優化車內的語音互動體驗。許多車機都能回答簡單的預設命令,比如調高溫度、預報天氣等,升級和創新圍繞拓寬自然語言口令展開,比如當用戶說 「有點熱」 後,車機可以開啟空調製冷或調低溫度。
但想讓車機聽懂更多 「人話」,比如用各種方言規劃路線、甚至找餐館,可能還真不如車主自己用手機地圖和大眾點評來得有效,更豐富的語音式人車互動陷入瓶頸,直到 ChatGPT 出現。
自然語言大模型產品(ChatGPT、文心一言、通義千問等)直接開放給 C 端使用,使智慧座艙的開發者們看到了曙光。強大的理解能力和邏輯推理能力,有望讓車機成為行車助手,暗藏商業可能。
比如,車主可以告訴語音助手,「幫我找出目的地附近有團購優惠、評分超過 4.5 的火鍋店,一會有 5 個人用餐,給我預定一下位置,再看一下哪裡停車方便。」 放在以前,車機絕對無法一次性理解如此多的資訊,但對 ChatGPT 來說,這只是它的基操,只要即時資料來源足夠多,需求被滿足的可能效能夠無限大。
GPT 的加入並不只是讓對話更流暢了,而是讓車機具有了 「大腦」,不僅能回答問題,還能理解需求並生成答覆。至於智商有多高、反應有多快,取決於汽車廠商對上車大模型的訓練能力,以及敢不敢 「氪」 金上更牛的硬體(晶片)。
AI 如何讓自動駕駛 「腦回路」 更像人?
車內生活的豐富,讓汽車逐漸成長為一個充滿溫情的載體,它不再是枯燥、冰冷的代步工具,轉而成為一個舒適的生活空間。
而 AI 主導的汽車進化還不止於 GPT 上車,它對自動駕駛的技術推動更加意義重大。
傳統的自動駕駛研究方法是通過採集大規模的駕駛資料、測試更長的駕駛里程來覆蓋所有可能的駕駛場景,以確保發生突發狀況時汽車有預先設定的應對方案。但突發狀況的複雜程度往往難以預料,一旦系統中沒有應對某種特殊突發狀況的預案,駕駛安全就將受到極大的威脅。
這也是為什麼當前的輔助駕駛系統,必須要求駕駛員手扶方向盤以應對即時突發情況。而 AI 的學習能力將有可能改變這個現狀。
不久前,清華大學研究團隊提出了自動駕駛 「可信持續進化」 技術,該技術是基於動態評估 AI 的可信賴程度進行學習訓練,保證自動駕駛汽車在遇到陌生新場景時,其駕駛能力可從基礎性的主動避讓開始持續提升,在確保安全前提下達到更好的駕駛表現。
簡單理解,利用 AI,自動駕駛功能的汽車能主動學習、熟悉各種新遇到的場景,進行持續進化,隨著駕駛里程與資料量的累積,效能得到持續提升。
理想汽車正將 AI 大模型用到自動駕駛領域。6 月 17 日,理想宣佈開啟城市 NOA(導航輔助駕駛)內測,並將在下半年向用戶開放通勤 NOA 功能。與常規解決方案不同的是,理想採用了 BEV(Bird’s eye view,鳥瞰圖)大模型,來即時感知和理解環境中的道路結構資訊,讓汽車更能模仿人類駕駛員的操作習慣。
以往多數汽車上的輔助駕駛系統,大多是採用高精地圖方案,相當於即時把路況投餵給自動駕駛系統,讓其做出決策。但在複雜的城市道路中,總會有高精地圖無法覆蓋和無法及時更新的區域,這成為了該方案的一大缺點。而採用 BEV 大模型後,相當於 AI 主動感知即時路況,自主決策駕駛操作。
當然,BEV 也有缺點,例如在一些跨度較大的路口,通行車輛較多,感測器視野容易被遮擋,導致車端即時感知的結果會丟失區域性的資訊。為了彌補這一不足,理想據稱搭配了神經先驗網路(NeuralPriorNet,簡稱 NPN)和端到端的訊號燈意圖網路,前者的作用相當於每當車走過自動駕駛車隊走過的路口,都有影象參考;後者則是學習大量人類司機在路口對於訊號燈變化的反應,幫助自動駕駛系統理解交通訊號。
根據實際的測試回饋,理想城市 NOA 還不能夠完全實現自動駕駛,它存在轉彎不夠及時和不擅長超車的問題,此外,面對一些特殊障礙物,演算法無法做出決策,必須進行人工接管。
不過,相比於傳統的訓練方式,大模型的引入最大的改變還是讓自動駕駛系統有了更強的學習能力,這意味著自動駕駛能力會逐漸提升。典型的案例是,理想汽車推出了通勤 NOA 功能,在開啟該功能之前,車主需要先設定通勤路線,通過日常通勤時的自動化訓練積累 NPN 特徵,大約 1 至 3 周時間後,AI 可以成長為通勤路段的 「代駕」。
這個過程體現了 AI 大模型加持下的自動駕駛汽車操作思路:先學習和熟悉路況,再進行輔助駕駛,「腦回路」 更像人類了。
用 AI 大模型研發自動駕駛鼻祖不是理想,而是特斯拉。早在 2021 年,特斯拉就曾推出基於 Transformer 架構的 BEV 感知方案,隨後華為、百度等企業也在 「BEV+Transformer」 上展開佈局,目前,特斯拉、小鵬汽車、問界汽車等都在落地和不斷優化類 「城市 NOA」 功能。
大模型的持續進化,很可能讓車企們找到了自動駕駛技術的突破方向,擺脫對高精度地圖的依賴是第一步。現在的自動駕駛還停留在 「輔助駕駛」 階段,未來,你很有可能會將你的交給 AI 接管。
你敢不敢將車交給 AI 開?
📍相關報導📍
Google AI 聊天機器人「Bard」是什麼?相比 ChatGPT 優缺點、誰更好用