OpenAI 最近向Plus付費方案的用戶推出了 GPT-4.5 模型,雖然被官方稱為「史上最大、最有知識的 AI 模型」,但在全球科技圈和使用者中,卻掀起了一波不小的討論。因為這個模型的實際表現卻讓人質疑,性能提升或許沒有對得起它的高昂成本?尤其在其他AI 公司和其他競爭對手的壓力下,OpenAI 的領先地位是否還能維持?今天我們就來深入剖析這場風波,看看 GPT-4.5 好用嗎?面臨的問題是什麼?
OpenAI 的 GPT-4.5 好用嗎?
GPT-4.5 是 OpenAI 迄今為止規模最大的模型,但大不代表強。在多個業界常用的 AI benchmark 測試中,它的表現並沒有讓人驚艷。例如在 MMLU(多工語言理解)這類評測中,GPT-4.5 雖然比之前的 GPT-4o 有些進步,但幅度不大,甚至在科學和數學等需要精準推理的領域,還不如 Anthropic 的 Claude 3.7 Sonnet 或DeepSeek 的最新模型。
許多 AI 領域的研究者和使用者對此也有些失望,表示:「我們期待 GPT-4.5 能帶來突破性的改變,但現在看來,OpenAI 好像只是把模型塞得更大,卻沒解決核心問題。」確實,業界開始意識到,單純靠擴大模型規模來提升性能的時代可能已經走到盡頭,OpenAI 或許得在技術創新上多下點功夫。
GPT-4.5 API 價格

除了性能上的疑慮,GPT-4.5 的成本更是讓人瞠目結舌。OpenAI 為這個模型設定的 API 費用是每百萬輸入 token 75 美元、輸出 token 150 美元,整整比 GPT-4o 高出 30 倍和 15 倍。
GPT-4o的價格已經難以在廣泛規模上商業化了,GPT-4.5這樣的價格,對許多中小型企業或獨立開發者來說,幾乎是天文數字。
事實上,OpenAI 自己也承認,GPT-4.5 的運行成本高到他們正在考慮是否長期提供 API 服務,這無疑讓外界對它的實用性打了個問號。
AI 幻覺問題仍未根除
AI 會出現的幻覺,也就是模型生成不正確或憑空捏造的內容,目前仍然是一個無解的問題。OpenAI 宣稱 GPT-4.5 在這方面有進步,幻覺頻率比多數模型低,但實際測試卻顯示,問題遠未解決。例如,有不少用戶在使用 OpenAI 的 Deep Research 工具時發現,模型會編造不存在的數據,還聲稱這些資訊來自數千篇文章,但一查卻全是假的。
RSMedia,我們的編輯群也嘗試了進行一些議題研究,發現 Deep Research 不僅耗時漫長,正確性和引用資料也經常會出現嚴重錯誤。
所以雖然 OpenAI 強調 GPT-4.5 在情感智能和對話流暢度上有提升,但對許多用戶來說,這些軟性進步遠不如準確性和可靠性來得重要。
OpenAI 的競爭壓力前所未有
OpenAI 過去靠著技術領先和品牌效應吃香,但 GPT-4.5 的推出似乎讓這種優勢開始動搖。全球 AI 市場競爭越來越激烈,尤其是許多新興 AI 公司,不僅大語言模型性能逼近 OpenAI,價格還更具競爭力,甚至有些模型還開放原始碼,讓企業可以自己部署,省下不少成本。
在台灣,已經不少開發者已經開始轉向這些替代方案,且更糟的是,OpenAI 內部的人才流失也加劇了危機,許多資深研究員離職創業或跳槽,這讓外界開始擔心他們的技術實力是否能撐得住未來的競爭。未來幾個月,OpenAI 能否穩住陣腳,恐怕得看他們怎麼應對這波風雨了。
延伸閱讀
Grok 3 AI是什麼?馬斯克推出新人工智慧,聲稱超越 ChatGPT 與 DeepSeek
DeepSeek AI是什麼?超低成本AI模型震撼全球
OpenAI GPT4.5 和 GPT5 上線時間是什麼時候?「多步推理」技術的全新 AI 模型