生成式人工智能(Artificial Inteligence Generated Content)是人工智能領域的重要分支,,一種基于算法和模型生成文本、圖片、聲音、視頻、代碼等內容的技術,不同于傳統(tǒng)A!的分析功能,生成式A1能學習并生成具有邏輜的新內容。不同于傳統(tǒng)的人工智能僅對輸入數據進行處理和分析,生成式人工智能可以學習并模擬事物的內在規(guī)律,根據用戶的輸入資料生成具有邏轄性和連貫性的新內容。這一技術的核心依托于多模態(tài)模型,能針對用戶需求實現異構數據的生成式輸出。
生成模型的基礎理論最早在20世紀50年代至80年代確立,這一時期主要集中于概率模型等生成理論算法的研究。1950年代的馬爾可夫鏈(Markov Chains)和1970年代的隱馬爾可夫模型(Hidden Markov Models, HMM)為生成式模型奠定了理論基礎。
隨著計算能力的提升和海量數據的應用,生成式AI進入了以大語言模型(LLMs)為主的階段。2018年,OpenAl發(fā)布了GPT(Generative Pre-trained Transformer)模型,通過大規(guī)模數據的預訓練和自回歸生成能力,推動了自然語言生成的顯著進展。
ChatGPT的普及與商業(yè)化應用
(2022年)
2022年底,ChatGPT正式上線并迅速普及:標志著生成式AI進入大規(guī)模商業(yè)化應用階段。ChatGPT基于GPT-3.5,能進行自然流暢的對話,廣泛應用于教育、客戶服務等領域。ChatGPT的成功激勵了其他科技公司加快生成式AI應用的開發(fā)。
2014年,lan Goodfellow等人提出了生成對抗網絡(GAN),標志著生成式人工智能的關鍵突破。GAN通過生成器和判別器的對抗訓練,能夠生成高度真實的圖像和數據,是現代生成式AI的重要模型之一。
GPT-3 和多模態(tài)生成模型
(2020年)
2020年,OpenAl發(fā)布了GPT-3,具備1750億參數,是當時規(guī)模最大的語言模型。GPT-3具備強大的自然語言理解和生成能力,廣泛應用于對話、寫作等任務。同年,OpenAl發(fā)布了DALL-E,展示了生成式AI在圖像生成領域的多模態(tài)能力。
伴隨生成式AI的廣泛應用,各國開始制定政策和行業(yè)標準,確保生成式AI技術的安全合規(guī)。2024年,聯合國科技大會上發(fā)布了生成式AI的應用安全測試標準,中國工信部和網信辦等也相繼出臺了生成式AI服務的管理辦法,規(guī)范行業(yè)發(fā)展。