`
stonebaba
  • 浏览: 3305 次
  • 性别: Icon_minigender_1
  • 来自: 北京
最近访客 更多访客>>
社区版块
存档分类
最新评论

试读《大数据时代的IT架构设计》体会

 
阅读更多

       本书是基于案例或技术体系来介绍大数据的IT架构,在章节划分上,每个节内容都是独立的,都分别由案例的参与/主导者来进行架构介绍。

       第一部分内容电信运营商上网日志处理架构
主要基于电信大量的客户上网日志,进行客户行为分析。该系统采用典型的HBase、MapReduce、HDFS部署结构实现存储、数据清洗、转换、校验和装载过程。

       第二部分内容Hadoop平台在金融银行业的应用架构
重点体现了Hadoop分布式存储、分布式计算、并行处理大数据集、提供数据冗余避免单点故障的优点
也描述了所扮演的海量数据存储、海量数据快速搜索功能、数据挖掘角色。

       第三部分优酷土豆Hadoop平台
该章节作者首先强调了系统的安全,围绕Hadoop平台以下几个问题,强调安全:
1、Linux终端随意连接,通过跳转机获取目标服务器较高权限的用户操作
2、非法应用的连接,缺乏身份认证,导致应用可以轻易的连接到资源并做操作
3、用户身份冒充,通过user.name属性设置,实现A用户冒充B用户,并且造成资源消耗假象
4、slave节点随意添加,容易造成数据存储结构被破坏
       并针对上述问题提供了解决方案,在文中描述问题解决的思路较为清楚,但是具体如何实现和指导落地还是缺乏内容支持。
       作者认为Hadoop平台对于最终用户不仅仅能够处于可用的状态,更重要的是需要运营好这个平台,因此提出了基于规范的操作、工作流程、监控及异常分析等作业内容。

       第四部分淘宝海量文件存储实践
该章节以淘宝的文件存储系统(TaoBao File System)为基础,进行了对系统的技术体系介绍,对于想要使用TFS来作为文件存储的读者,该章节内容起到了很好的入门效果

       我看了下整书的目录,分的类型很多,包括:Hadoop平台应用架构、推荐系统架构、应用架构实践、大数据下的存储实践、数据库架构实践、大数据下的IT架构变迁,我觉得通过这些章节的划分,能够迎合的读者类型也很多。
       从试读章节看,第一、二部分内容很适合售前人员,第三部分内容(如果还有类似章节内容)很适合运营管理人员,第四部分,那就是适合设计师、开发人员啦。我对整书这样的内容归类和章节侧重点的设置还是很有好感,各自独立不影响选择性阅读,各类读者可以根据自己最需要的内容快速定位阅读内容。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics