91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
湖倉架構(gòu):大規(guī)模數(shù)據(jù)平臺的設(shè)計(jì)和實(shí)現(xiàn)
湖倉架構(gòu):大規(guī)模數(shù)據(jù)平臺的設(shè)計(jì)和實(shí)現(xiàn)
Gaurav Ashok Thalpati
王磊 譯
出版時間:2025年09月
頁數(shù):219
“我曾與Gaurav并肩參與湖倉架構(gòu)的實(shí)施工作,如今看到他的知識將能為全球的數(shù)據(jù)從業(yè)者提供指導(dǎo),我感到非常激動?!?br /> ——Bruno Ascencio
阿布扎比第一銀行(FAB)數(shù)據(jù)轉(zhuǎn)型與創(chuàng)新主管
“對于即將踏上數(shù)據(jù)現(xiàn)代化之旅的人來說,這是一本必讀之作?!?br /> ——Anand M. Devani
Cognizant首席架構(gòu)師、數(shù)據(jù)布道者

這本簡明扼要且內(nèi)容全面的指南闡述了如何采用數(shù)據(jù)湖倉架構(gòu)來構(gòu)建現(xiàn)代數(shù)據(jù)平臺,探討了實(shí)施湖倉平臺時的設(shè)計(jì)考量、面臨的挑戰(zhàn)以及最佳實(shí)踐。本書深入剖析了采用湖倉架構(gòu)對數(shù)據(jù)平臺產(chǎn)生的多方面影響,包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的管理、對商業(yè)智能(BI)及人工智能/機(jī)器學(xué)習(xí)(AI/ML)應(yīng)用場景的支持,以及如何實(shí)現(xiàn)更嚴(yán)格的數(shù)據(jù)治理和安全措施。
通過學(xué)習(xí)本書,你將能夠:
● 理解湖倉的關(guān)鍵概念和特性,如ACID事務(wù)支持、時間旅行和模式演進(jìn)。
● 明晰傳統(tǒng)數(shù)據(jù)架構(gòu)與湖倉數(shù)據(jù)架構(gòu)之間的差異。
● 區(qū)分各種開放文件格式和開放表格式。
● 設(shè)計(jì)能夠支持?jǐn)?shù)據(jù)攝取、存儲、計(jì)算、元數(shù)據(jù)管理和數(shù)據(jù)消費(fèi)的湖倉平臺。
● 評估各類技術(shù),并為你的具體用例選擇最合適的技術(shù)棧來實(shí)施湖倉架構(gòu)。
● 做出關(guān)鍵的設(shè)計(jì)決策,應(yīng)對實(shí)際挑戰(zhàn),從而構(gòu)建能適應(yīng)現(xiàn)實(shí)需求且面向未來的數(shù)據(jù)平臺。
● 開啟你的湖倉實(shí)施之旅,并將數(shù)據(jù)從現(xiàn)有系統(tǒng)遷移至湖倉。
  1. 前言
  2. 第1章 湖倉架構(gòu)簡介
  3. 1.1 理解數(shù)據(jù)架構(gòu)
  4. 1.1.1 什么是數(shù)據(jù)架構(gòu)
  5. 1.1.2 數(shù)據(jù)架構(gòu)如何幫助構(gòu)建數(shù)據(jù)平臺
  6. 1.1.3 數(shù)據(jù)平臺的核心組件
  7. 1.2 為什么需要一個新的數(shù)據(jù)架構(gòu)
  8. 1.3 湖倉架構(gòu):一種新的模式
  9. 1.3.1 湖倉:博采眾長
  10. 1.3.2 理解湖倉架構(gòu)
  11. 1.3.3 湖倉架構(gòu)的特征
  12. 1.3.4 湖倉架構(gòu)的優(yōu)勢
  13. 1.4 關(guān)鍵要點(diǎn)
  14. 1.5 參考
  15. 第2章 傳統(tǒng)架構(gòu)與現(xiàn)代數(shù)據(jù)平臺
  16. 2.1 傳統(tǒng)架構(gòu):數(shù)據(jù)倉庫與數(shù)據(jù)湖
  17. 2.1.1 數(shù)據(jù)倉庫基礎(chǔ)
  18. 2.1.2 數(shù)據(jù)湖基礎(chǔ)
  19. 2.2 現(xiàn)代數(shù)據(jù)平臺
  20. 2.2.1 在云端尋找答案
  21. 2.2.2 獨(dú)立方式
  22. 2.2.3 組合方式
  23. 2.2.4 現(xiàn)代數(shù)據(jù)平臺的期望
  24. 2.3 比較:數(shù)據(jù)倉庫、數(shù)據(jù)湖、湖倉
  25. 2.3.1 能力與局限性
  26. 2.3.2 實(shí)施活動
  27. 2.3.3 管理與運(yùn)營
  28. 2.3.4 業(yè)務(wù)成果
  29. 2.4 湖倉架構(gòu):是未來數(shù)據(jù)平臺的默認(rèn)選擇嗎
  30. 2.5 關(guān)鍵要點(diǎn)
  31. 2.6 參考
  32. 第3章 存儲:湖倉架構(gòu)的核心
  33. 3.1 湖倉存儲:關(guān)鍵概念
  34. 3.1.1 行式存儲與列式存儲
  35. 3.1.2 基于存儲的性能優(yōu)化
  36. 3.2 湖倉存儲組件
  37. 3.2.1 云對象存儲
  38. 3.2.2 文件格式
  39. 3.2.3 表格式
  40. 3.3 關(guān)鍵設(shè)計(jì)考慮因素
  41. 3.3.1 生態(tài)系統(tǒng)支持
  42. 3.3.2 社區(qū)支持
  43. 3.3.3 支持的文件格式
  44. 3.3.4 支持的計(jì)算引擎
  45. 3.3.5 支持的特性
  46. 3.3.6 商業(yè)產(chǎn)品支持
  47. 3.3.7 當(dāng)前版本和未來版本
  48. 3.3.8 性能基準(zhǔn)測試
  49. 3.3.9 比較
  50. 3.3.10 共享特征
  51. 3.4 關(guān)鍵要點(diǎn)
  52. 3.5 參考
  53. 第4章 數(shù)據(jù)目錄
  54. 4.1 理解元數(shù)據(jù)
  55. 4.1.1 技術(shù)元數(shù)據(jù)
  56. 4.1.2 業(yè)務(wù)元數(shù)據(jù)
  57. 4.2 元存儲與數(shù)據(jù)目錄的協(xié)同工作方式
  58. 4.3 數(shù)據(jù)目錄的特性
  59. 4.3.1 搜索、探索與發(fā)現(xiàn)數(shù)據(jù)
  60. 4.3.2 數(shù)據(jù)分類
  61. 4.3.3 數(shù)據(jù)治理與安全
  62. 4.3.4 數(shù)據(jù)血緣
  63. 4.4 統(tǒng)一數(shù)據(jù)目錄
  64. 4.4.1 豎井式元數(shù)據(jù)管理的挑戰(zhàn)
  65. 4.4.2 什么是統(tǒng)一數(shù)據(jù)目錄
  66. 4.4.3 統(tǒng)一數(shù)據(jù)目錄的優(yōu)勢
  67. 4.5 實(shí)施數(shù)據(jù)目錄:關(guān)鍵設(shè)計(jì)考慮因素與選項(xiàng)
  68. 4.5.1 使用HMS
  69. 4.5.2 使用AWS服務(wù)
  70. 4.5.3 使用Azure服務(wù)
  71. 4.5.4 使用GCP服務(wù)
  72. 4.5.5 使用Databricks
  73. 4.6 關(guān)鍵要點(diǎn)
  74. 4.7 參考
  75. 第5章 湖倉架構(gòu)的計(jì)算引擎
  76. 5.1 湖倉架構(gòu)的數(shù)據(jù)計(jì)算優(yōu)勢
  77. 5.1.1 獨(dú)立擴(kuò)展
  78. 5.1.2 跨區(qū)域、跨賬戶訪問
  79. 5.1.3 統(tǒng)一的批處理和實(shí)時處理
  80. 5.1.4 增強(qiáng)的BI性能
  81. 5.1.5 選擇不同引擎類型的自由
  82. 5.1.6 跨區(qū)域分析
  83. 5.2 湖倉平臺的計(jì)算引擎選項(xiàng)
  84. 5.2.1 開源工具
  85. 5.2.2 云服務(wù)
  86. 5.2.3 第三方平臺
  87. 5.3 關(guān)鍵設(shè)計(jì)考慮因素
  88. 5.3.1 開放表格式支持
  89. 5.3.2 支持的版本和特性
  90. 5.3.3 生態(tài)系統(tǒng)支持
  91. 5.3.4 基于人物角色的偏好
  92. 5.3.5 托管開源、云原生與第三方產(chǎn)品
  93. 5.3.6 數(shù)據(jù)消費(fèi)類工作負(fù)載
  94. 5.4 關(guān)鍵要點(diǎn)
  95. 5.5 參考
  96. 第6章 湖倉架構(gòu)中的數(shù)據(jù)(與AI)治理和安全
  97. 6.1 什么是數(shù)據(jù)治理和數(shù)據(jù)安全
  98. 6.2 數(shù)據(jù)治理和數(shù)據(jù)安全的優(yōu)勢
  99. 6.3 湖倉架構(gòu)中的統(tǒng)一治理和安全
  100. 6.4 湖倉架構(gòu)中的治理和安全流程
  101. 6.4.1 元數(shù)據(jù)管理
  102. 6.4.2 合規(guī)和法規(guī)
  103. 6.4.3 數(shù)據(jù)與機(jī)器學(xué)習(xí)模型質(zhì)量
  104. 6.4.4 貫穿數(shù)據(jù)資產(chǎn)和AI資產(chǎn)的血緣
  105. 6.4.5 數(shù)據(jù)資產(chǎn)與AI資產(chǎn)共享
  106. 6.4.6 數(shù)據(jù)所有權(quán)
  107. 6.4.7 審計(jì)和監(jiān)控
  108. 6.4.8 訪問管理
  109. 6.4.9 數(shù)據(jù)保護(hù)
  110. 6.4.10 處理敏感數(shù)據(jù)
  111. 6.5 你的角色是什么
  112. 6.6 關(guān)鍵要點(diǎn)
  113. 6.7 參考
  114. 第7章 全景視圖:設(shè)計(jì)與實(shí)施湖倉平臺
  115. 7.1 設(shè)計(jì)前的活動
  116. 7.1.1 理解平臺需求
  117. 7.1.2 研究現(xiàn)有系統(tǒng)
  118. 7.1.3 理解組織的愿景與數(shù)據(jù)戰(zhàn)略
  119. 7.1.4 組織研討會和訪談
  120. 7.2 選擇合適的架構(gòu)
  121. 7.3 建立指導(dǎo)原則
  122. 7.3.1 數(shù)據(jù)生態(tài)系統(tǒng)
  123. 7.3.2 可擴(kuò)展性和性能
  124. 7.3.3 成本控制和優(yōu)化
  125. 7.3.4 平臺運(yùn)營
  126. 7.3.5 治理和安全
  127. 7.4 設(shè)計(jì)考慮因素與實(shí)施最佳實(shí)踐
  128. 7.4.1 架構(gòu)藍(lán)圖
  129. 7.4.2 數(shù)據(jù)攝取
  130. 7.4.3 數(shù)據(jù)存儲
  131. 7.4.4 數(shù)據(jù)處理
  132. 7.4.5 數(shù)據(jù)消費(fèi)和交付
  133. 7.4.6 通用服務(wù)
  134. 7.5 設(shè)計(jì)參考
  135. 7.5.1 分步設(shè)計(jì)指南
  136. 7.5.2 設(shè)計(jì)問卷
  137. 7.6 關(guān)鍵要點(diǎn)
  138. 7.7 參考
  139. 第8章 現(xiàn)實(shí)世界中的湖倉
  140. 8.1 交付一個現(xiàn)實(shí)世界的湖倉
  141. 8.2 估算與規(guī)劃階段
  142. 8.2.1 估算
  143. 8.2.2 規(guī)劃
  144. 8.3 分析與設(shè)計(jì)階段
  145. 8.3.1 分析現(xiàn)有系統(tǒng)
  146. 8.3.2 數(shù)據(jù)建模
  147. 8.3.3 確定技術(shù)棧
  148. 8.4 實(shí)施與測試階段
  149. 8.4.1 歷史數(shù)據(jù)遷移
  150. 8.4.2 數(shù)據(jù)核對與測試
  151. 8.4.3 逆向工程
  152. 8.4.4 數(shù)據(jù)質(zhì)量和敏感數(shù)據(jù)處理
  153. 8.5 支持與維護(hù)階段
  154. 8.5.1 審計(jì)與跟蹤
  155. 8.5.2 災(zāi)難恢復(fù)策略
  156. 8.5.3 舊系統(tǒng)下線
  157. 8.6 交付參考
  158. 8.6.1 項(xiàng)目交付成果
  159. 8.6.2 參考架構(gòu)
  160. 8.7 關(guān)鍵要點(diǎn)
  161. 8.8 參考
  162. 第9章 未來的湖倉
  163. 9.1 從倉庫到湖倉:接下來是什么
  164. 9.1.1 數(shù)據(jù)網(wǎng)格
  165. 9.1.2 HTAP
  166. 9.1.3 零ETL
  167. 9.2 互操作性與新格式
  168. 9.2.1 UniForm
  169. 9.2.2 Apache XTable
  170. 9.2.3 即將推出的文件格式和表格式
  171. 9.3 公有云和私有云的托管平臺
  172. 9.3.1 Microsoft Fabric和其他平臺
  173. 9.3.2 私有云平臺的托管湖倉架構(gòu)
  174. 9.4 湖倉中的AI
  175. 9.5 關(guān)鍵要點(diǎn)
  176. 9.6 本書總結(jié)
  177. 9.7 參考
書名:湖倉架構(gòu):大規(guī)模數(shù)據(jù)平臺的設(shè)計(jì)和實(shí)現(xiàn)
譯者:王磊 譯
國內(nèi)出版社:機(jī)械工業(yè)出版社
出版時間:2025年09月
頁數(shù):219
書號:978-7-111-78900-0
原版書書名:Practical Lakehouse Architecture
原版書出版商:O'Reilly Media
Gaurav Ashok Thalpati
 
Gaurav Ashok Thalpati是一名獨(dú)立顧問,專注于云數(shù)據(jù)架構(gòu)和數(shù)據(jù)管理領(lǐng)域。在20多年的從業(yè)經(jīng)歷中,他曾擔(dān)任過數(shù)據(jù)架構(gòu)師、數(shù)據(jù)分析師、數(shù)據(jù)工程師等多個職位。
 
 
本書封面上的動物是栗斑翠鳥(Todiramphus australasia),這是一種熱帶鳥類,僅分布于印度尼西亞和東帝汶,棲息地位于澳大利亞北部的小巽他群島。
這只色彩繽紛的翠鳥擁有藍(lán)綠相間的背部,與它沙褐色的腹部和肉桂色條紋的眉毛形成鮮明對比。一道寬闊的黑線橫貫眼部,頭頂則覆蓋著一頂深色的“帽子”。幼鳥的羽色較為暗淡,喙尖還帶有一抹白色。
栗斑翠鳥是一種食蟲性鳥類,其食譜主要包括蚱蜢、蟋蟀、甲蟲,甚至小型蜥蜴。它通常棲息于樹枝上,靜待獵物出現(xiàn),然后俯沖而下,在半空中捕獲目標(biāo)。
這些翠鳥是具有領(lǐng)地意識的鳥類,通常成對生活。與其他巢鳥類不同,它們會在白蟻丘或松軟的河岸上挖掘巢穴。
栗斑翠鳥在國際自然保護(hù)聯(lián)盟(IUCN)紅色名錄中被列為近危物種,這意味著由于種群數(shù)量持續(xù)下降和棲息地流失的威脅,該物種已接近被列入受威脅類別。
購買選項(xiàng)
定價:99.00元
書號:978-7-111-78900-0
出版社:機(jī)械工業(yè)出版社