ChatGPT圖像識別能力解鎖和深度分析。

新智元報道

來源:老羅不說

作者:羅予晨

編輯:好困

『新智元導讀』其實,ChatGPT是可以識別圖片的!你隻需要輸入圖片網址,並確保圖片能不受限制地被OpenAI的服務器讀取到。

目前看它讀取Wiki、CNN圖片都沒有問題。

普通新聞圖片

人物圖片

特定歷史圖片

這幅越戰美軍搜查敵人的照片。

被ChatGPT詳細的描述了細節,這幅圖的場景,人物和細節的信息量,會比上面的兩張更大《ChatGPT看起來沒有對特定的物體和人臉做針對性的優化》,所以描述非常生動,雖然有少許錯誤。

而且對人的工作態度這樣抽象的信息也有理解。

值得注意的是這裡提到 警察。

這圖片來自Wiki越戰詞條。

如果ChatGPT是通過讀取連接的文字信息來獲取圖片信息的,那麼就不會認為那些執行任務的人是警察。

因此可以認為它的結論完全來自於圖片信息。

全球著名圖片

針對圖片的人機互動

這幅畫,一開始ChatGPT沒有看懂。

給它輸入更多信息之後,它能理解這幅畫,且描述了畫面的感情。

所以ChatGPT對圖片的理解是能夠交互的,而不是一次性的輸出。

地標圖片

捏造了一個所謂地標,查了沒有這樣的地標。

如果不多問一句,都不知道它是不是真的看了視頻。

繼續保持對ChatCPT的關注。