摘要:清華大學(xué)DeepSeek教程第五版由清華大學(xué)雙聘教授 @新媒沈陽團(tuán)隊(duì)撰寫,主要圍繞 AI 幻覺展開研究,以 DeepSeek 為例深入探討其現(xiàn)象、成因、評(píng)測(cè)、應(yīng)對(duì)策略及創(chuàng)造力價(jià)值。
感謝公眾號(hào)/招文袋提供分享,有興趣一起交流學(xué)習(xí)的可關(guān)注公眾號(hào)/招文袋,也可在文末掃碼加入知識(shí)星球-招文袋共同探討。
清華大學(xué)DeepSeek教程第五版由清華大學(xué)雙聘教授 @新媒沈陽團(tuán)隊(duì)撰寫,主要圍繞 AI 幻覺展開研究,以 DeepSeek 為例深入探討其現(xiàn)象、成因、評(píng)測(cè)、應(yīng)對(duì)策略及創(chuàng)造力價(jià)值。
AI 幻覺的定義:AI 幻覺指模型生成與事實(shí)不符、邏輯斷裂或脫離上下文的內(nèi)容,分為事實(shí)性幻覺(與現(xiàn)實(shí)事實(shí)不一致)和忠實(shí)性幻覺(與用戶指令或上下文不一致) 。
產(chǎn)生 AI 幻覺的原因:包括數(shù)據(jù)偏差、泛化困境、知識(shí)固化、意圖誤解等。此外,音樂因具有主觀性、抽象性和可感知性差異等特點(diǎn),雖不存在傳統(tǒng)意義上的幻覺,但也有邏輯斷裂的歌詞等潛在表現(xiàn)。
AI 幻覺評(píng)測(cè):通過隨機(jī)生成提示語和抽取事實(shí)性幻覺測(cè)試題進(jìn)行人工判斷標(biāo)注與交叉驗(yàn)證。測(cè)試結(jié)果顯示,不同模型幻覺率不同,如通用性測(cè)試中 DeepSeekV3 幻覺率為 2%、DeepSeekR1 為 3%;事實(shí)性測(cè)試中 DeepSeekV3 幻覺率達(dá) 29.67%、DeepSeekR1 為 22.33% 。推理能力與幻覺率存在雙向作用機(jī)制,聯(lián)網(wǎng)搜索、雙 AI 驗(yàn)證、提示詞工程等方法可降低幻覺率。
AI 幻覺的應(yīng)對(duì)策略:普通用戶可采用三角驗(yàn)證法,警惕 “過度合理” 的回答,理解并利用幻覺帶來的創(chuàng)意靈感。具體方法包括聯(lián)網(wǎng)搜索、雙 AI 驗(yàn)證、提示詞工程(知識(shí)邊界限定、對(duì)抗性提示)等。技術(shù)層面可采用 RAG 框架、結(jié)合外部知識(shí)庫、精細(xì)訓(xùn)練、開發(fā)評(píng)估工具等方案。
AI 幻覺的價(jià)值:在科學(xué)發(fā)現(xiàn)、文藝與設(shè)計(jì)、娛樂與游戲、技術(shù)創(chuàng)新等領(lǐng)域具有創(chuàng)造力價(jià)值。如助力蛋白質(zhì)設(shè)計(jì)獲諾貝爾化學(xué)獎(jiǎng),為游戲開發(fā)提供靈感,提升自動(dòng)駕駛系統(tǒng)識(shí)別精度等。
完整下載:清華大學(xué)第五版:DeepSeek與AI幻覺.pdf