新智元報道
來源:老羅不說
作者:羅予晨
編輯:好困
『新智元導讀』其實,ChatGPT是可以識別圖片的!你隻需要輸入圖片網址,並確保圖片能不受限制地被OpenAI的服務器讀取到。
目前看它讀取Wiki、CNN圖片都沒有問題。
普通新聞圖片
人物圖片
特定歷史圖片
這幅越戰美軍搜查敵人的照片。
被ChatGPT詳細的描述了細節,這幅圖的場景,人物和細節的信息量,會比上面的兩張更大《ChatGPT看起來沒有對特定的物體和人臉做針對性的優化》,所以描述非常生動,雖然有少許錯誤。
而且對人的工作態度這樣抽象的信息也有理解。
值得注意的是這裡提到 警察。
這圖片來自Wiki越戰詞條。
如果ChatGPT是通過讀取連接的文字信息來獲取圖片信息的,那麼就不會認為那些執行任務的人是警察。
因此可以認為它的結論完全來自於圖片信息。
全球著名圖片
針對圖片的人機互動
這幅畫,一開始ChatGPT沒有看懂。
給它輸入更多信息之後,它能理解這幅畫,且描述了畫面的感情。
所以ChatGPT對圖片的理解是能夠交互的,而不是一次性的輸出。
地標圖片
捏造了一個所謂地標,查了沒有這樣的地標。
如果不多問一句,都不知道它是不是真的看了視頻。
繼續保持對ChatCPT的關注。