ChatGPT圖像識別能力解鎖和深度分析。

小編輯

2023-09-01

AI chat

新智元報道

來源：老羅不說

作者：羅予晨

編輯：好困

『新智元導讀』其實，ChatGPT是可以識別圖片的！你隻需要輸入圖片網址，並確保圖片能不受限制地被OpenAI的服務器讀取到。

目前看它讀取Wiki、CNN圖片都沒有問題。

普通新聞圖片

人物圖片

特定歷史圖片

這幅越戰美軍搜查敵人的照片。

被ChatGPT詳細的描述了細節，這幅圖的場景，人物和細節的信息量，會比上面的兩張更大《ChatGPT看起來沒有對特定的物體和人臉做針對性的優化》，所以描述非常生動，雖然有少許錯誤。

而且對人的工作態度這樣抽象的信息也有理解。

值得注意的是這裡提到警察。

這圖片來自Wiki越戰詞條。

如果ChatGPT是通過讀取連接的文字信息來獲取圖片信息的，那麼就不會認為那些執行任務的人是警察。

因此可以認為它的結論完全來自於圖片信息。

全球著名圖片

針對圖片的人機互動

這幅畫，一開始ChatGPT沒有看懂。

給它輸入更多信息之後，它能理解這幅畫，且描述了畫面的感情。

所以ChatGPT對圖片的理解是能夠交互的，而不是一次性的輸出。

地標圖片

捏造了一個所謂地標，查了沒有這樣的地標。

如果不多問一句，都不知道它是不是真的看了視頻。

繼續保持對ChatCPT的關注。