OpenAI 針對 ChatGPT 推出了新升級功能,很快升級版用戶將可以語音方式直接向 ChatGPT 輸入指令、此外它也將能讀懂用戶上傳的圖片。
(前情提要:ChatGPT上線Canva擴充功能!可快速生成圖片、影片內容)
(背景補充:ChatGPT企業版上線!OpenAI客製模型、共享對話…六大功能一次看)
OpenAI 開發的人工智慧聊天機器人 ChatGPT,在 25 日宣布將正式支援用戶以口說的方式來輸入指令,且 GPT 將能夠直接與用戶語音對話、同時還將能讀懂用戶上傳的圖片。
官方表示語音、圖像辨識新功能將在 2 周內部署給 ChatGPT Plus 及企業(Enterprise)用戶;同時官方表示很快也會推向開發人員及免費版用戶,但尚未給出詳細時間。
延伸閱讀:ChatGPT企業版上線!OpenAI客製模型、共享對話..六大功能一次看
可透過語音向 ChatGPT 輸入指令
官方說明,用戶馬上可以使用語音功能來與 ChatGPT 進行來回對話,例如為您的孩子播放睡前故事、給你晚餐的建議、練習口說能力…應用範圍廣泛。
如何開啟語音功能?
(一)若要開啟語音功能,官方表示需前往行動應用程式上的「設定」→「新功能」
(二)然後選擇加入語音對話
(三)點擊主畫面右上角的耳機按鈕,還可以從五種不同的聲音中選擇你喜歡的聲音
ChatGPT 可讀懂圖片
很快的,用戶可以點擊照片按鈕拍攝或選擇影像,丟給 ChatGPT 來執行更多元的指令。例如可以拍下冰箱內部的照片就可取得餐點食譜建議,或是拍下孩子的數學作業照片就能幫忙解決題目。
GPT 的模型能讀懂照片、螢幕截圖以及包含文字和圖像的文件。其實早在今年 3 月時,OpenAI 在發布 GPT-4 時就展示過看圖的功能,但由於當時安全性以及功能不完善等原因,直到近期才決定開放權限。
📍相關報導📍
OpenAI傳破產危機?報告:ChatGPT每日燒2000萬、用戶流失超兩成