从第6章开始,写的就太敷衍太不走心了。很多东西一带而过。第七章需求分析还可以,第八章真正实战,那代码个人认为真是实习生水平,大数据场景下,到处用collect,到处是循环里套循环中间加sql。代码几乎很少有注释,声明的变量没有一个有注释的。
买了两本,都认真研读过,本着客观公正的角度评价,《Spark SQL 大数据实例开发教程》知识点真的太老了,现在Spark 都快2.6了,这本书的知识点才是1.6的,而且那个电商的工程实例也太不走心了吧?直接从网上扒的吧。然而 这本《Spark SQL入门与实践指南》知识点是2.0的,工程实例很丰富,可以直接应用到我们现在做的智能医疗的工程中,感觉很靠谱,很贴心,在一个这本书的章节安排感觉很合理,步步为营,浅显易懂,最给人惊喜的是,这本书不但基础篇十分详实、全面,实践篇代码可以直接用,而且调优篇写的超完美,读了之后感觉瞬间 项目效率提高一大截、而且耗存根据 它的调优七式 真的去除了些不规范的代码导致的内存、计算的额外消耗