丛书推荐序一
数字经济的思维观与人才观
大数据的出现,给我们带来了巨大的想象空间:对科学研究来说,大数据已成为继实验、理论和计算模式之后的数据密集型科学范式的典型代表,带来了科研方法论的变革,正在成为科学发现的新引擎;对产业来说,在当今互联网、云计算、人工智能、大数据、区块链这些蓬勃发展的科技领域中,主角是数据,数据作为新的生产资料,正在驱动整个产业进行数字化转型。正因如此,大数据已成为知识经济时代的战略高地,数据主权已经成了继边防、海防、空防之后,另一个大国博弈的空间。
实现这些想象空间,需要构建众多大数据领域的基础设施,小到科学大数据方面的国家重大基础设施,大到跨越国界的“数字丝路”“数字地球”。今天,我们看到清华大学数据科学研究院大数据基础设施研究中心已经把人才纳入基础设施的范围,组织编写了这套丛书,这个视角是有意义的。新兴的产业需要相应的人才培养体系与之配合,人才培养体系的建立往往存在滞后性。因此,尽可能缩窄产业人才需求和培养过程间的“缓冲带”,将教育链、人才链、产业链、创新链衔接好,就是“产教融合”理念提出的出发点和落脚点。可以说,清华大学数据科学研究院大数据基础设施研究中心为我国大数据、人工智能事业发展模式的实践,迈出了较为坚实的一步,这个模式意味着数字经济宏观的可行路径。
作为我国首套大数据及人工智能方面的产教融合丛书,其以数据为基础,内容涵盖了数据认知与思维、数据行业应用、数据技术生态等各个层面及其细分方向,是数十个代表了行业前沿和实践的产业团队的知识沉淀。特别是在作者遴选时,这套丛书注重选择兼具产业界和学术界背景的行业专家,以便让丛书成为中国大数据知识的一次汇总,这对于中国数据思维的传播、数据人才的培养来说,是一个全新的范本。
我也期待未来有更多产业界的专家及团队加入本套丛书体系中,并和这套丛书共同更新迭代,共同传播数据思维与知识,夯实我国的数据人才基础设施。
郭华东
中国科学院院士
丛书推荐序二
产教融合打造创新人才培养的新模式
数字技术、数字产品和数字经济,是信息时代发展的前沿领域,不断迭代着数字时代的定义。数据是核心战略性资源,自然科学、工程技术和社科人文拥抱数据的力度,对于学科新的发展具有重要意义。同时,数字经济是数据的经济,既是各项高新技术发展的动力,又为传统产业转型提供了新的数据生产要素与数据生产力。
这套丛书从产教融合的角度出发,在整体架构上,涵盖了数据思维方式拓展、大数据技术认知、大数据技术高级应用、数据化应用场景、大数据行业应用、数据运维、数据创新体系七个方面,编写宗旨是搭建大数据的知识体系,传授大数据的专业技能,描述产业和教育在相互促进过程中所面临的问题,并在一定程度上提供相应阶段的解决方案。丛书的内容规划、技术选型和教培转化由新型科研机构——清华大学数据科学研究院大数据基础设施研究中心牵头,而场景设计、案例提供和生产实践由一线企业专家与团队贡献,二者紧密合作,提供了一个可借鉴的尝试。
大数据领域人才培养的一个重要方面,就是以产业实践为导向,以传播和教育为出口,最终服务于大数据产业与数字经济,为未来的行业人才树立技术观、行业观、产业观,进而助力产业发展。
这套丛书适用于大数据技能型人才的培养,适合作为高校、职业学校、社会培训机构从事大数据研究和教学的教材或参考书,对于从事大数据管理和应用的人员、企业信息化技术人员也有重要的参考价值。让我们一起努力,共同推进大数据技术的教学、普及和应用!
谭建荣
中国工程院院士
浙江大学教授
前 言
写作背景
Linux是一套免费和开源的操作系统,从诞生至今对整个ICT行业都具有不可估量的影响及贡献。Linux可安装在各种硬件设备中,如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型计算机和超级计算机等,智能手机操作系统Android就是基于Linux内核开发的。
随着物联网、云计算、大数据和人工智能时代的来临,Linux将迎来更大的发展。大数据技术应用常常使用的开源的Hadoop生态圈也是基于Linux平台部署的。互联网企业的多样化、高难度且复杂的业务及不断扩展的应用领域,对Linux的运维人员提出了更高的要求。
在国家战略和信息安全的大背景下,国家大力推行“国产软件替代”计划。我国自主研发的操作系统也大多基于Linux内核,比如深度OS、中标麒麟等。相信国产操作系统和软件会从大型国企、事业单位等开始试点,然后全面铺开,并在很多关键业务上越来越多地使用Linux。因此,提前学习和掌握Linux将是一件体现战略眼光的事情。
本书特点
本书首次尝试将Linux操作系统管理与Hadoop生态圈部署结合起来编写。Linux是很多院校的相关专业的核心课程,但传统的Linux相关教材对比较流行的Hadoop生态圈部署鲜有涉猎,而Hadoop生态圈部署是大数据运维人员必须了解和掌握的。在目前的整个产业背景下,为适应新技术的发展,培养一批适应市场需求的应用型技能人才,并将两者结合起来显得很有必要。学生掌握Linux的系统管理、网络服务搭建及Hadoop生态圈部署,必将提升自身的竞争力。
本书选用版本较新且应用较为广泛的Linux发行版——CentOS 7.6为对象,并且书中所有实验都在CentOS 7.6平台上调试通过。读者学习本书,将有利于掌握Red Hat系列发行版及其他Linux发行版。
本书在内容的编排上,充分体现了先进性、系统性和实用性,将理论与实践相结合。本书的编者有在教育一线多年从事Linux教学的专业教师,有从企业到学校的大数据运维一线工程师。这些编者熟悉Linux的使用,了解在校学生的特点,并根据多年的教学经验和学生的认知规律精心组织了教材内容,力求做到理论够用、依托实践、深入浅出。
阅读指南
本书所有的命令注释均以“//”开头,写在命令行下方;所有的配置文件注释均以“#”开头;所有的命令和配置项皆测试通过。
本书命令大多是从Shell复制出来的文本,但是由于个别执行结果复杂,不便于排版,因此采用了插入截图的方式。
在实验前,请务必确认虚拟机的网络模式,以及iptables和SELinux的状态。
读者对象
本书既可以作为职业院校的计算机网络技术、大数据运维等相关专业的教材,也可以作为技能竞赛培训、Linux培训指导书,还可以作为Linux和Hadoop初学者、爱好者的入门书。
编写分工
本书由刘猛担任主编,由苏伟斌、张美珍担任副主编,同时参与编写的人员还有肖媚娇、李志军,具体分工如下:第1章由李志军编写;第2、5、6、7、8、9章由刘猛编写;第3、4章由肖媚娇编写;第10、11章由苏伟斌编写;第12、13章由张美珍编写。刘猛负责全书的统稿工作,苏伟斌、张美珍负责配套资源的整理工作。
致谢
感谢电子工业出版社编辑李冰在本书编写过程中对编写体例和内容上给予的悉心指导和大力支持,感谢清华大学数据科学研究院大数据基础设施研究中心学术研究部总监孙雪在本书立项和编写过程中给予的大力支持和指导。同时感谢全体参编人员的努力和付出,感谢我的同事彭武华协助处理书中的部分图片。最后感谢在本书编写过程中给予关怀和支持,提出宝贵编写意见的各位朋友、同事。
由于编者水平及时间所限,本书疏漏之处在所难免,恳请广大读者批评指正,提出宝贵意见,并发邮件到leumoon@vip.163.com。
编 者