深入的理論解析與實用的程式碼範例,帶您掌握生成文本、圖像和音訊的最新技術。無論您是數據科學家還是軟體工程師,本書都將助您輕鬆上手,創造出令人驚豔的AI生成作品。立即開啟您的生成式AI之旅,讓創意與技術完美融合!
本書將教導資料科學家和軟體工程師,如何使用生成式媒體技術和人工智慧來創造新穎的圖像或音樂。書中介紹了理論概念,並提供豐富的程式碼範例和插圖,讓讀者能夠在Google Colaboratory、Kaggle或Hugging Face Spaces等服務上執行這些範例,並學習使用開源庫。
本書還探討了從頭開始訓練和使用大型預訓練模型之間的權衡,如何建立能夠修改圖像風格的模型,以及調整變形模型以達到創意目的。內容涵蓋了文本、圖像和音頻等多種數據類型的生成模型,並詳細講解了Transformer和擴散模型等先進技術的構建和訓練方法。最後介紹了如何訓練一個能夠根據個人風格撰寫文字的模型,以及如何部署模型作為互動展示或服務。
--------------------------------------------------
透過這本實作指南,學習運用生成式AI技術來建立奇妙的文本、圖像、音訊,甚至音樂。你將瞭解最先進的生成模型如何運作、如何微調與調整它們來滿足需求,以及如何結合現成的基礎模組來建立新模型,並在不同領域中開發創新的應用程式。
這本首選指南透過豐富的範例程式與容易瞭解的插圖來介紹理論概念,並帶你實際應用它們。
你將學習如何透過開源的程式庫來應用transformers和擴散模型,並探索程式、研究幾個既有的專案,藉以完成你的專案。
• 建立並自訂文本與圖像生成模型
• 瞭解「使用預訓的模型」與「微調自有的模型」之間的取捨
• 做出能夠以任意風格生成、編輯與修改圖像的模型,並運用它們
• 為各種創意用途量身打造transformer和擴散模型
• 訓練能夠反映獨特風格的模型
作者推薦先備書籍
•《精通機器學習》www.gotop.com.tw/books/BookDetails.aspx?Types=v&bn=A712
•《寫給程式設計師的深度學習》www.gotop.com.tw/books/BookDetails.aspx?Types=v&bn=A645