CHATGPT是美國OpenAI公司于2022年11月推出的AI聊天機(jī)器人程序,基于人工智能技術(shù)驅(qū)動的自然語言處理工具,ChatGPT能完成聊天、文字翻譯、文案撰寫、詩歌創(chuàng)作、代碼編輯、方案推算等任務(wù),是史上增長最快的消費(fèi)者應(yīng)用之一
OpenAI是一家人工智能研究和部署公司,使命是確保人工通用智能造福全人類。OpenAI的使命是確保人工通用智能(AGI)——指的是在具有經(jīng)濟(jì)價值的工作中超越人類的高度自治系統(tǒng)——造福全人類。OpenAI將試圖直接建設(shè)安全和有益的AGI,但如果工作幫助他人實(shí)現(xiàn)這一結(jié)果,OpenAI也將認(rèn)為我們的使命已經(jīng)完成。OpenAI已經(jīng)訓(xùn)練了一個名為ChatGPT的模型,它以對話的方式進(jìn)行交互。對話形式使ChatGPT能夠回答后續(xù)問題,承認(rèn)錯誤,質(zhì)疑不正確的前提,并拒絕不適當(dāng)?shù)恼埱蟆hatGPT是說明書,它被訓(xùn)練成遵循提示中的指令并提供詳細(xì)的響應(yīng)。
ChatGPT有時會寫出聽起來合理但不正確或無意義的答案。解決這個問題是具有挑戰(zhàn)性的,因?yàn)椋海?)在RL訓(xùn)練期間,目前沒有真實(shí)的來源;(2)訓(xùn)練模型更加謹(jǐn)慎導(dǎo)致它拒絕它能夠正確回答的問題;以及(3)監(jiān)督訓(xùn)練誤導(dǎo)模型,因?yàn)槔硐氪鸢溉Q于模型知道什么,而不是人類示威者所知道的。
ChatGPT對輸入措辭的調(diào)整或多次嘗試相同的提示很敏感。例如,給定一個問題的一種措辭,模型可以聲稱不知道答案,但給定一個輕微的措辭,可以正確地回答。理想情況下,當(dāng)用戶提供一個模糊的查詢時,模型會問一些澄清性的問題。相反,我們當(dāng)前的模型通常猜測用戶的意圖。
今天ChatGPT的研究發(fā)布是OpenAI的新一步迭代部署越來越安全和有用的人工智能系統(tǒng)。從早期模型的部署中吸取的許多經(jīng)驗(yàn)教訓(xùn)為此次發(fā)布的安全緩解措施提供了信息,包括通過使用人類反饋強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)的有害和不真實(shí)輸出的大幅減少。