美女av网站,国产精品视频久久久久,欧美视频在线观看免费黄一区网站,日韩精品一区二区三区swag,操骚妹子BB爽,欧美激情黄色,亚洲性视频一区二区三区,国产亚州精品女人久久久久久,国家黄色一级aa大片

CC-1000T智能座艙評測體系之AI專項評測體系

看車|車神榜|2025-06-30 20:03

近年來智能座艙逐漸呈現出同質化的發展特征,隨著AI大模型的爆發(尤其是DeepSeek的影響)有望在智能座艙領域換發新的生機,各車企紛紛下場布局大模型,力爭在未來搶占產品體驗與AI技術的制高點。

隨著大模型的快速發展與落地,智能座艙也從AI1.0時代逐步進入AI2.0時代。從呈現出的關鍵變化來看,其特點主要表現為從基于規則的智能轉向為基于模型的智能。

具體來看:

【AI1.0時代】有限場景+預設規則+功能累加+命令式交互+機械化情感+自定義能力

【AI2.0時代】泛化能力+推理能力+自主能力+自然的交互+情緒化情感+生成式能力

可以預料的是,AI2.0會從人性的六大維度上(懶、貪、饞、快、活、美)得到全面的體驗升級。也會推進智能座艙企業從原有的競爭力內核向新的競爭力內核轉變。

AI大模型作為智能座艙的一部分,在用戶端的體驗與場景的占比仍舊不夠凸顯,但其帶來的用戶體驗價值的增益將是巨大的,因此我們將AI評測體系作為CC-1000T智能座艙評測體系的專項體系,分別采用自上而下(從場景看技術)和自下而上(從技術看場景)的思路進行設計與搭建。

研究與搭建的過程中我們發現,當前AI大模型在智能座艙的用戶體驗中感知最高的依然聚焦在語音交互領域。而從用戶的認知上傳統的即AI1.0時代的語音交互是以“工具”屬性為用戶提供更加便捷的被動交互,而作為大模型賦能下的AI2.0時代的語音交互將以全新的“服務”屬性為用戶提供更加主動的移動智能體。當然從“工具”屬性“向“服務”屬性的轉變依然會經歷漫長的探索過程,但本著產品未至標準先行的原則,結合當前大模型在智能座艙領域的體驗現狀,車云研究院經過近半年的洞察與研究搭建出了《CC-1000T智能座艙AI專項評測體系》,目的是為各車企提供一把相對客觀的第三方標尺。

具體來看,AI專項評測體系主要覆蓋了“5+1”的核心能力

“5”主要指的是基礎必測項,主要以語音能力為主,即【推理能力】、【泛化能力】、【情緒能力】、【生成能力】、【自然程度】

“1”主要指的是創新加分項,主要以主動服務、多模態融合為主

整個AI專項評價體系涉及約50項評價內容,分別從模型能力和場景價值兩個維度來衡量不同車型在AI大模型領域的體驗差異。

接下來我們會針對以上6項核心能力的體系內容逐一進行解讀。

能力1——【推理能力】

推理能力作為AI大模型最核心的能力之一,正從“數據壓縮”邁向“世界模擬”, 從“數據擬合工具”向“認知決策體”躍遷,其本質是用計算重構人類認知金字塔的基石,是超越模式匹配的類人化思考。

為了全面且科學的檢驗大模型在座艙領域的推理能力,我們將從兩個方向逼近推理能力的全面性與專業性。

首先我們從“推理”本身將其分成了“邏輯推理”、“數學推理”、“常識推理”和“因果推理”,每一類推理又分成了“高熵”、“中熵”、“低熵”三個層次。同時AI大模型的誕生又伴隨著AI幻覺的產生。因此AI幻覺的評價也是必不可少的內容,我們又從最常發生的“知識幻覺”、“常識幻覺”、“對抗幻覺”和“上下文幻覺”進行綜合檢驗,進而保證推理能力的全面性和專業性。

以邏輯推理為例,每一個評價項目都會設計獨立的評價模型,再輔以豐富的評價用例來確保評價的準確性。

示例【幻覺抑制】-“知識幻覺”、“對抗幻覺”、“常識幻覺”:

1. 知識幻覺:(事實性錯誤)

如:2000年奧運會在雅典召開的(2000年澳大利亞悉尼,2004年雅典)

2、對抗幻覺:(如矛盾性指令)

如:獨在異鄉為已客的上一句是什么?(該句即為第一句,沒有上一句)

3、常識幻覺:(常識性錯誤)

如:“七月流火”是如何形容盛夏的酷熱?(指夏去秋來,天氣轉涼,而非形容炎熱)

能力2——【泛化能力】

AI大模型的出現進一步提升了語音交互的泛化能力,主要表現為“知識泛化”、“任務泛化”和“跨域泛化”。根據用戶在智能座艙域的用車場景與使用頻率又分別進行了拆解,力求能夠在泛化能力評價上從全面性與重要性兩方面得到平衡。具體為:

1、【知識泛化】:拆解成5個垂類,分別為“汽車知識”、新聞資訊“、“金融股市”、“醫療健康”、“歷史人文”。

2、【任務泛化】:拆解成5個任務,分別為“音樂任務融合”、“視頻任務融合”、“導航任務融合”、“點評任務融合”、“出行任務融合”。

3、【跨域泛化】:拆解成2個內容,分別為“特征搜索”、“幫助引導”

以知識泛化中“歷史人文”垂類查詢為例,我們會從準確性、時效性、專業性和覆蓋度四個維度進行評價,如覆蓋度檢驗是否涵蓋詩詞歌賦、節日習俗、素質教育、發明創造、歷史人名和文明著作,再通過手機大模型與車機大模型進行交叉驗證。

示例【泛化能力】-“任務泛化”:當用戶在搜索某一個歌手/影星的信息時,如果大模型的介紹中有其相關代表作品,那么用戶不需要在打開視頻或音樂應用,只需要在大模型顯示頁面選擇或語音選擇即可觀看或收聽,提高了用戶操作任務的效率。

能力3——【情緒能力】

隨著AI大模型多模態能力的增強,其互動性與陪伴性價值加速落地,旨在滿足用戶被理解、被傾聽與被關注的需求。智能座艙通過語音交互從解意到共情,多角度為用戶提供情緒價值。因此該部分能力的評價主要涉及兩個方面:

1、【類人化互動】:包括“形象互動”、“聲紋模擬”、“類人表達”

2、【情感化陪伴】:包括“情感化關懷”、“情景化互動”、“陪伴式聊天”

以【類人化互動】中的“形象互動”為例,我們會從互動的多樣性、形象的豐富性與情景的貼合度三個維度進行綜合評價。

示例【類人化互動】-“聲紋模擬”:家庭用車時經常會出現車內小朋友與語音助手互動,理想在打開小主人模式后當識別到兒童聲紋時也會以兒童的語氣回復,并且推薦兒童節目,增加了交互的互動性與趣味性。

能力4——【自然程度】

大模型的出現補全了傳統語音交互中語境理解的不足,通過對話語境的分析,大語言模型能夠更加精準的捕捉用戶的意圖,全面提升自然語言理解能力和對話的自然感。

傳統的語音交互也會涉及意圖理解與連續對話等,AI專項評價體系是在傳統語音交互        評價體系之上針對重要模塊進行補充,主要包括:

1、【意圖理解】:包括“模糊意圖”、“冗余意圖”、“簡稱理解”、“多意圖理解”、”話題轉移“

2、【連續對話】:包括“上下文理解”、“上下文記憶”

3、【跨域交互】:包括“跨語言交互”、“跨場景交互”、“跨空間交互”、“跨終端交互”、“跨生態交互”

以【連續對話】中“上下文理解”為例,我們把上下文理解共劃分為3種情況,分別為場景內上下文理解、跨場景上下文理解和跨聲區上下文理解,其中場景內上下文理解又分為7類高頻垂域場景。每個評測項目都會根據垂域的豐富性、指代的準確性和意圖的延續性進行綜合打分。如【跨場景上下文理解】“你好XX” → “導航去張家界XX地點” → “那邊天氣怎么樣”→“附近有沒有什么美食推薦”。

示例【跨域交互】-“跨空間語音交互”:在用戶開車快到家時想提前打開家里的窗簾/照明燈等智能設備,問界能夠實現通過車機語音實現,不需要在打開智慧家居APP進行操作,極大減少了用戶分心的同時便利性也得到了極大的提升。

能力5——【生成能力】

生成式AI作為大模型最重要的應用場景之一,是指利用機器學習模型來創建新的內容,包括且不限于文本、圖片、音樂、音頻、視頻等。再利用多模態的特征對創建的不同內容進行處理、拓展和融合。具有很好的場景與價值潛力。

我們針對當前智能座艙應用場景與產品現狀分析后,除了評價AI大模型生成的基礎能力外,還針對場景生成能力和內容生成能力重點體驗,具體指:

【基礎能力】:主要包含“性能”(首詞響應時間、出詞速度、出圖速度等)、“界面”(內容可讀性、內容邏輯性、布局美觀性等)、交互(自動播放匹配度、自定翻頁匹配度等)

【內容生成】:主要包含“文本生成”、“圖片生成”、“視頻生成”

【場景生成】:主要包含“基于模糊指令生成”、“單一簡單指令生成”、“復雜多條件指令生成”

示例【內容生成】-“文本生成”:陌生地點停車過程中車輛發生過潛在風險時,小鵬能夠實現將哨兵視頻中的內容生成文字摘要,讓用戶更高效,更及時的獲取停車時發生的危險信息。

能力6——主動能力

基于多模態感知能力與AI大模型的分析決策能力,智能座艙從被動變得越來越主動,其特點為從傳統基于規則的主動向基于模型的主動演化。

主動能力作為創新的一部分,整個行業仍處于場景探索和價值驗證階段,因此在評價過程中不設上限,但在創新性認定過程做了嚴格的要求。我們會從體驗屬性與價值屬性兩個維度進行評判,必須滿足所有要求才會作為創新項。

價值屬性:必須滿足“驚喜+獨創+實用”三個要求

體驗屬性:必須滿足“服務主動性+需求必要性+場景契合度”三個要求

同時從當前產品現狀看AI的座艙應用趨勢主要包含兩部分內容,主動服務和多模融合,在評價過程我們采用案頭研究+實車評測兩種方式進行評測,因為并非所有的主動能力場景都能夠被還原。      

示例【場景幫助】-“個性化場景服務”:多個人在車內聽音樂時,蔚來可以根據車內乘員的分布情況,自動調整音場的相位,不忽視每一位駕乘人員的聽覺感受。

最后我們以該專項評價體系實踐的兩個實車評測結果作為結尾。

從兩個頭部新勢力品牌的AI大模型基礎評測項來看,其差異還是非常明顯的,A車在推理、泛化、自然、清晰、生成五個方面全面領先于B車。其中高熵邏輯推理、任務泛化、連續對話中的上下文理解與內容生成中的場景符合度方面差異尤為明顯。

文章評論
大家都在搜