前言
大模型是大語言模型(Large Language Model)的簡稱。大模型主要指具有數十億甚至上百億參數的深度學習模型,具備大容量、大算力、多參數等特點。大模型由早期的單語言預訓練模型發展至之後的多語言預訓練模型,再到現階段的多模態預訓練模型。隨著人工智慧技術的發展和應用場景的不斷擴大,大模型從最初主要應用於電腦視覺、自然語言處理逐漸應用於醫療、金融、智慧製造等領域,這些領域都需要處理大量的資料,可實現處理多工的目標,由於大模型能夠提供更高效、更精準的解決方案,目前已成為人工智慧領域的重要發展方向之一。
本書的內容和素材主要來源於以下方面:作者所在學校近幾年承擔的教育部和北京市的教育、教學改革專案與成果; 作者指導的所究所學生在物聯網方向的研究工作及成果; 北京郵電大學資訊與通訊工程專業創新實踐。該專業學生透過CDIO 工程教育方法,實現創新研發,不但學到了知識,提高了能力,而且為本書提供了第一手素材和資料,在此向資訊與通訊工程專業的學生表示感謝。
由於作者水準有限,書中難免存在不當之處,敬請讀者不吝指正,以便作者進一步修改和完善。
李永華