實用DeepSeek技術——開發真正可用的LLM應用程式

{{ _getLangText('m_detailInformation_goodsAuthorText') }}韓曉晨
{{ _getLangText('m_detailInformation_goodsPublisherText') }}深智
2025年10月19日
ISBN:9786267757390
{{ _getLangText('m_detailInformation_goodsTips1Text') }}
{{ _getLangText('m_detailInformation_goodsActivityText') }}
{{ activityObj.name }}

{{_getLangText("m_detailIntroduction_goodsIntroductionText") }}

☆Transformer 架構與 MoE 專家路由解析

☆DeepSeek 系列模型架構與優化策略

☆FP8 混合精度與 DualPipe 平行算法實作

☆多頭注意力與跨節點通訊技術最佳化

☆程式自動生成、自動補全與偵錯技術

☆Prompt 工程與 Few-shot、Soft Prompt 設計

☆多工任務調度與跨領域特化模型應用

☆零售、製造等行業的訂製化實戰案例

☆資料構建、自監督學習與模型微調

☆DeepSeek-R1 自回歸快取與長上下文推理

☆分散式訓練與推理部署策略

☆API 呼叫設計、吞吐調校與系統整合


本書共分為十一章,涵蓋大模型核心技術與實務應用。第一章介紹大模型的演進歷程與基礎概念,說明深度學習、Transformer 與 MoE 架構的發展脈絡。第二章深入解析 DeepSeek 的核心設計,包括多頭注意力、FP8 混合精度與跨節點通訊技術。第三章建立大模型開發基礎,從 API 調用到資料準備與模型訓練。第四章聚焦對話生成與語義理解,實作多輪對話與語意分析。第五章實作從文字到程式的智慧開發流程,包含程式補全與錯誤偵測。第六章說明多工學習與跨領域應用,包括少樣本調適與領域特化。第七章系統介紹 Prompt 工程設計與調優策略。第八章探討模型最佳化與分散式部署。第九章解析資料構建與自監督學習流程。第十章展示訂製化模型開發在零售與製造業的應用案例。第十一章專章說明 DeepSeek-R1 的推理引擎與最新優化技術。全書內容完整銜接理論與實踐,適合開發者快速掌握 DeepSeek 的開發核心。


{{ _getLangText("m_recently_viewed_products_titleText") }}