回望2023年,全球科技發(fā)展日新月異,我國創(chuàng)新實力不斷提升,取得一系列令人振奮的突破性進展和標志性成果。近期,中央各大媒體等陸續(xù)評選出2023年度國內(nèi)國際科技進展新聞或發(fā)布年度科技進展回顧盤點。揭示衰老新機制、“中國天眼”探測到低頻引力波存在證據(jù)、發(fā)現(xiàn)在鹽堿地上促進糧食增產(chǎn)關(guān)鍵基因、制備51個超導量子比特簇態(tài)、圓環(huán)陣太陽射電成像望遠鏡正式建成、國家太空實驗室正式運行、觀測到M87星系中心黑洞噴流周期性進動……中國科學院主導或參與完成的多項創(chuàng)新成果入選其中。
大型語言模型不斷迭代升級
來源:科技日報 張夢然【字號:大 中 小】
2023年是“生成式人工智能之年”。
今年,GPT-4的表現(xiàn)被認為“可與人類相媲美”。在聊天機器人ChatGPT發(fā)布約4個月后,ChatGPT背后的OpenAI宣布正式發(fā)布為ChatGPT提供支持的更強大的下一代技術(shù)GPT-4,其擁有圖像識別功能、高級推理技能,以及處理25000個單詞的能力,在某些測試中的表現(xiàn)不輸于人類。
而在12月6日,谷歌公司則宣布推出一種名為Gemini的新人工智能模型,并聲稱該模型在一系列智力測試中的表現(xiàn)優(yōu)于GPT-4模型和“專家級”人類。谷歌聲稱,Gemini的中檔Pro版本擊敗了其他一些模型,例如OpenAI的GPT3.5,但更強大的Ultra超過了所有現(xiàn)有AI模型的能力。它在行業(yè)標準MMLU基準上的得分為90%,而“專家級”的人類預計能達到89.8%。這是人工智能首次在測試中擊敗人類,也是現(xiàn)有模型中得分最高的。
該測試涉及一系列棘手的問題,包括邏輯謬誤、日常場景中的道德問題、醫(yī)療問題、經(jīng)濟和地理問題。在同一測試中,GPT-4的得分為87%,LLAMA-2的得分為68%,Claude?2的得分為78.5%。Gemini在其他9項常見基準測試中的8項中擊敗了所有這些模型。
(責任編輯:江澄)
© 1996 - 中國科學院 版權(quán)所有 聯(lián)系我們 地址:北京市三里河路52號 郵編:100864
京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002