{ SKIP }
文:MenClub 魏文青  
POSTED ON 30 Oct 2025

以前大家「有事問Google」,依家大家就可能已經習慣「有事問AI」,甚至有人會於網上討論時貼出AI答案當係金科玉律,認為AI講嘅嘢就一定啱。但《BBC》及歐洲廣播聯盟 (EBU) 近來公佈嘅一個最新研究,就發現市面上所有AI於處理新聞議題時有近50%機會出錯,當中包括錯誤引用、內容準確性等問題。而眾多AI中又以Google Gemini為最差。換言之,距離大家能夠靠AI提供一切答案嘅日子仍然離我哋好遠。

圖片:ImageFX

《BBC》及EBU早前進行咗一個大型研究,搵黎多名專業新聞記者去審查ChatGPT、Copilot、Gemini及Perplexity有關新聞嘅回覆,並評定AI回覆是否準確、是否有引用正確來源、能否分辦事實與意見、以及為閱讀者提供語境等。

結果就發現,有45%嘅AI回覆均有至少一項錯誤。當中31%回覆有嚴重引用錯誤,例如誤導、錯誤,又或直接缺失新聞來源引用;20%回覆則提供錯誤資訊,當中包括過期消息,以及「AI幻覺」資訊(即係AI自己作出黎嘅)等。亦即係話,如果用家無自己去做Fact Check的話,有近半機率會被AI誤導。

圖片:ImageFX

有趣嘅係,報告特別點名Google Gemini表現差劣,指其76%回覆都有錯誤,比其他高出一倍有多,而當中最主要嘅係錯誤引用問題。要留意嘅係Google依家會用Gemini為普通搜尋整理出總結,換言之佢好可能係普通人最常接觸到嘅AI。其影響亦可能係最為廣泛。

成份報告唯一正面嘅,係各大AI嘅表現其實已經比起今年2月嘅同系列研究有所改進,只係仍然唔合格咁解。《BBC》生成式AI專案總裁Peter Archer亦強調,作為新聞業者佢哋係希望AI工具能夠成功,以令更多人接觸到準確嘅新聞內容,不過目前睇黎都仲有好長條路要行。

資料來源:BBC

Apple早前推出史上最薄嘅iPhone Air,引起所謂「外型 v.s. 功能」(Form v.s. Function) 嘅討論。不過後續有報導指iPhone Air銷情未如理想開始減產,似乎就代表市場都係更加著重「功能」。無獨有偶,坊間最新傳閒指 ...
tech
【科技】最薄iPhone後是最厚重iPhone? 傳iPhone 18增磅增厚被嘲「健身器材」
18 Nov 2025
據《Bloomberg》記者Mark Gurman表示,Apple內部「幾乎已經放棄」Mac Pro系列嘅更新計劃,未來專業級桌面電腦重心將轉移到體積更細、設計更簡潔嘅Mac Studio。 Mac Pro曾深受剪接師、攝影師、設計師等專業 ...
tech
【科技】消息指Apple已擱置Mac Pro開發 Mac Studio將成為專業桌面電腦主力
17 Nov 2025