Python自动化运维实战:从Linux系统中收集数据

新闻 前端 自动化
使用Linux命令可以查看当前系统状态和运行状况的相关数据。然而,单个Linux命令和应用程序只能获取某一方面的系统数据。

 使用Linux命令可以查看当前系统状态和运行状况的相关数据。然而,单个Linux命令和应用程序只能获取某一方面的系统数据。我们需要利用Python模块将这些详细信息反馈给管理员,同时生成一份有用的系统报告。

我们将报告分为两部分。第一部分是使用platform模块获取的一般系统信息,第二部分是硬件资源,如CPU和内存等。

首先从导入platform模块开始,它是一个内置的Python库。platform模块中有很多方法,它们可用来获取当前运行Python命令的操作系统的详细信息。

  1. import platform 
  2. system = platform.system() 
  3. print(system) 

上述代码的运行结果如下。

Python自动化运维实战:从Linux系统中收集数据

该脚本返回当前系统的类型,同样的脚本在Windows系统上运行会得到不同的结果。当它在Windows系统上运行时,输出结果就变成Windows。

Python自动化运维实战:从Linux系统中收集数据

常用的函数uname()和Linux命令(uname -a)的功能一样:获取机器的主机名、体系结构和内核信息,但是uname()采用了结构化格式,以便通过序号来引用相应的值。

  1. import platform 
  2. from pprint import pprint 
  3. uname = platform.uname() 
  4. pprint(uname) 

上述代码的运行结果如下。

Python自动化运维实战:从Linux系统中收集数据

system()方法获得的第一个值是系统类型,第二个是当前机器的主机名。

使用PyCharm中的自动补全功能可以浏览并列出platform模块中的所有可用函数,按Ctrl + Q组合键就可以查看每个函数的文档(见下图)。

Python自动化运维实战:从Linux系统中收集数据

然后,使用Linux文件提供的信息列出Linux机器中的硬件配置。这里需要记住,在/proc/目录下可以访问CPU、内存以及网络等相关信息;我们将读取这些信息并在Python中使用标准的open()函数访问它们。查看/proc/目录可以获取更多信息。

下面给出具体的脚本。

首先,导入platform模块,它仅在当前任务中使用。

  1. #!/usr/bin/python 
  2. __author__ = "Bassim Aly" 
  3. __EMAIL__ = "basim.alyy@gmail.com" 
  4.  
  5. import platform 

然后,定义函数。以下代码包含了本次练习中需要的两个函数——check_feature()和get_value_from_string()。

  1. def check_feature(feature,string): 
  2.     if feature in string.lower(): 
  3.         return True 
  4.     else
  5.         return False 
  6. def get_value_from_string(key,string): 
  7.     value = "NONE" 
  8.     for line in string.split("\n"): 
  9.         if key in line: 
  10.             value = line.split(":")[1].strip() 
  11.     return value 

最后是Python脚本的主要部分,其中包括用来获取所需信息的Python代码。

  1. cpu_features = [] 
  2. with open('/proc/cpuinfo') as cpus: 
  3.     cpu_data = cpus.read() 
  4.     num_of_cpus = cpu_data.count("processor"
  5.     cpu_features.append("Number of Processors: {0}".format(num_of_cpus)) 
  6.     one_processor_data = cpu_data.split("processor")[1
  7.     print one_processor_data 
  8.     if check_feature("vmx",one_processor_data): 
  9.         cpu_features.append("CPU Virtualization: enabled"
  10.     if check_feature("cpu_meltdown",one_processor_data): 
  11.         cpu_features.append("Known Bugs: CPU Metldown "
  12.     model_name = get_value_from_string("model name ",one_processor_data) 
  13.     cpu_features.append("Model Name: {0}".format(model_name)) 
  14.  
  15.     cpu_mhz = get_value_from_string("cpu MHz",one_processor_data) 
  16.     cpu_features.append("CPU MHz: {0}".format((cpu_mhz))) 
  17.  
  18. memory_features = [] 
  19. with open('/proc/meminfo') as memory: 
  20.     memory_data = memory.read() 
  21.     total_memory = get_value_from_string("MemTotal",memory_data).replace("kB",""
  22.     free_memory = get_value_from_string("MemFree",memory_data).replace("kB",""
  23.     swap_memory = get_value_from_string("SwapTotal",memory_data).replace("kB",""
  24.     total_memory_in_gb = "Total Memory in GB: 
  25. {0}".format(int(total_memory)/1024
  26.     free_memory_in_gb = "Free Memory in GB: 
  27. {0}".format(int(free_memory)/1024
  28.     swap_memory_in_gb = "SWAP Memory in GB: 
  29. {0}".format(int(swap_memory)/1024
  30.     memory_features = 
  31. [total_memory_in_gb,free_memory_in_gb,swap_memory_in_gb] 

这部分代码用来输出从上一节的代码中获取的信息。

  1. print("============System Information============"
  2.  
  3. print(""
  4. System Type: {0
  5. Hostname: {1
  6. Kernel Version: {2
  7. System Version: {3
  8. Machine Architecture: {4
  9. Python version: {5
  10. """.format(platform.system(), 
  11.            platform.uname()[1], 
  12.            platform.uname()[2], 
  13.            platform.version(), 
  14.            platform.machine(), 
  15.            platform.python_version())) 
  16.  
  17. print("============CPU Information============"
  18. print("\n".join(cpu_features)) 
  19.  
  20. print("============Memory Information============"
  21. print("\n".join(memory_features)) 

在上面的例子中我们完成了以下任务。

(1)打开/proc/cpuinfo并读取其内容,然后将结果存储在cpu_data中。

(2)使用字符串函数count()统计文件中关键字processor的数量,从而得知机器上有多少个处理器。

(3)获取每个处理器支持的选项和功能,我们只需要读取其中一个处理器的信息(因为通常所有处理器的属性都一样)并传递给check_feature()函数。该方法的一个参数是我们期望处理器支持的功能,另一个参数是处理器的属性信息。如果处理器的属性支持第一个参数指定的功能,该方法返回True。

(4)由于处理器的属性数据以键值对的方式呈现,因此我们设计了get_value_from_string()方法。该方法根据输入的键名通过迭代处理器属性数据来搜索对应的值,然后根据冒号拆分返回的键值对,以获取其中的值。

(5)使用append()方法将所有值添加到cpu_feature列表中。

(6)对内存信息重复相同的操作,获得总内存、空闲内存和交换内存的大小。

(7)使用platform的内置方法(如system()、uname()和python_version())来获取系统的相关信息。

(8)输出包含上述信息的报告。

脚本输出如下图所示。

Python自动化运维实战:从Linux系统中收集数据

 

另一种呈现数据的方式是利用第5章中介绍的Matplotlib库,可视化随时间变化的数据。

11.1.1 通过邮件发送收集的数据

从上一节生成的报告中可以看到系统中当前的资源。在本节中,我们调整脚本,增强其功能,比如,将这些信息通过电子邮件发送出去。对于网络操作中心(Network Operation Center,NOC)团队来说,这个功能非常有用。当某个特殊事件(如HDD故障、高CPU或丢包)发生时,他们希望被监控系统能够自动给他们发送邮件。Python有一个内置库smtplib,它利用简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)从邮件服务器中发送和接收电子邮件。

使用该功能要求在计算机上安装本地电子邮件服务器,或者能够使用免费的在线电子邮件服务(如Gmail或Outlook)。在这个例子中我们将使用SMTP登录Gmail网站,将数据通过电子邮件发送出去。

接下来,开始动手修改脚本,为其添加SMTP功能。

将所需模块导入Python,这次需要导入smtplib和platform。

  1. #!/usr/bin/python 
  2. __author__ = "Bassem Aly" 
  3. __EMAIL__ = "basim.alyy@gmail.com" 
  4.  
  5. import smtplib 
  6. imp        ort platform 

下面是check_feature()和get_value_from_string()这两个函数的代码。

  1. def check_feature(feature,string): 
  2.     if feature in string.lower(): 
  3.         return True 
  4.     else
  5.         return False 
  6.  
  7. def get_value_from_string(key,string): 
  8.     value = "NONE" 
  9.     for line in string.split("\n"): 
  10.         if key in line: 
  11.             value = line.split(":")[1].strip() 
  12.     return value 

最后是Python脚本的主体,其中包含了获取所需信息的Python代码。

  1. cpu_features = [] 
  2. with open('/proc/cpuinfo') as cpus: 
  3.     cpu_data = cpus.read() 
  4.     num_of_cpus = cpu_data.count("processor"
  5.     cpu_features.append("Number of Processors: {0}".format(num_of_cpus)) 
  6.     one_processor_data = cpu_data.split("processor")[1
  7.     if check_feature("vmx",one_processor_data): 
  8.         cpu_features.append("CPU Virtualization: enabled"
  9.     if check_feature("cpu_meltdown",one_processor_data): 
  10.         cpu_features.append("Known Bugs: CPU Metldown "
  11.     model_name = get_value_from_string("model name ",one_processor_data) 
  12.     cpu_features.append("Model Name: {0}".format(model_name)) 
  13.  
  14.     cpu_mhz = get_value_from_string("cpu MHz",one_processor_data) 
  15.     cpu_features.append("CPU MHz: {0}".format((cpu_mhz))) 
  16.  
  17. memory_features = [] 
  18. with open('/proc/meminfo') as memory: 
  19.     memory_data = memory.read() 
  20.     total_memory = get_value_from_string("MemTotal",memory_data).replace("kB",""
  21.     free_memory = get_value_from_string("MemFree",memory_data).replace("kB",""
  22.     swap_memory = get_value_from_string("SwapTotal",memory_data).replace("kB",""
  23.     total_memory_in_gb = "Total Memory in GB: 
  24. {0}".format(int(total_memory)/1024
  25.     free_memory_in_gb = "Free Memory in GB: 
  26. {0}".format(int(free_memory)/1024
  27.     swap_memory_in_gb = "SWAP Memory in GB: 
  28. {0}".format(int(swap_memory)/1024
  29.     memory_features = 
  30. [total_memory_in_gb,free_memory_in_gb,swap_memory_in_gb] 
  31.  
  32. Data_Sent_in_Email = "" 
  33. Header = """From: PythonEnterpriseAutomationBot <basim.alyy@gmail.com> 
  34. To: To Administrator <basim.alyy@gmail.com> 
  35. Subject: Monitoring System Report 
  36.  
  37. ""
  38. Data_Sent_in_Email += Header 
  39. Data_Sent_in_Email +="============System Information============" 
  40.  
  41. Data_Sent_in_Email +=""
  42. System Type: {0
  43. Hostname: {1
  44. Kernel Version: {2
  45. System Version: {3
  46. Machine Architecture: {4
  47. Python version: {5
  48. """.format(platform.system(), 
  49.            platform.uname()[1], 
  50.            platform.uname()[2], 
  51.            platform.version(), 
  52.            platform.machine(), 
  53.            platform.python_version()) 
  54.  
  55. Data_Sent_in_Email +="============CPU Information============\n" 
  56. Data_Sent_in_Email +="\n".join(cpu_features) 
  57.  
  58. Data_Sent_in_Email +="\n============Memory Information============\n" 
  59. Data_Sent_in_Email +="\n".join(memory_features) 

下面给出连接到gmail服务器所需的信息。

  1. fromaddr = 'yyyyyyyyyyy@gmail.com' 
  2. toaddrs = 'basim.alyy@gmail.com' 
  3. username = 'yyyyyyyyyyy@gmail.com' 
  4. password = 'xxxxxxxxxx' 
  5. server = smtplib.SMTP('smtp.gmail.com:587'
  6. server.ehlo() 
  7. server.starttls() 
  8. server.login(username,password) 
  9.  
  10. server.sendmail(fromaddr, toaddrs, Data_Sent_in_Email) 
  11. server.quit() 

在前面的例子中实现了以下功能。

(1)第一部分与上一个例子相同,只是没有将数据输出到终端,而是将其添加到Data_Sent_in_Email变量中。

(2)Header变量表示电子邮件标题,包括发件人地址、收件人地址和电子邮件主题。

(3)使用smtplib模块内的SMTP()类连接到公共Gmail SMTP服务器并完成TTLS连接。这也是连接Gmail服务器的默认方法。我们将SMTP连接保存在server变量中。

(4)使用login()方法登录服务器,最后使用sendmail()函数发送电子邮件。sendmail()有3个输入参数——发件人、收件人和电子邮件正文。

(5)关闭与服务器的连接。

脚本输出如下图所示。

Python自动化运维实战:从Linux系统中收集数据

11.1.2 使用time和date模块

到目前为止,我们已经能将从服务器中生成的自定义数据通过电子邮件发送出去。但由于网络拥塞、邮件系统故障或任何其他问题,生成的数据与电子邮件的传递时间之间可能存在时间差,因此我们不能根据收到电子邮件的时间来推算实际生成数据的时间。

出于上述原因,需要使用Python中的datetime模块来获取被监控系统上的当前时间。该模块可以使用各种字段(如年、月、日、小时和分钟)来格式化时间。

除此之外,datetime模块中的datetime实例实际上是Python中独立的对象(如int、string、boolean等),因此datetime实例在Python中有自己的属性。

使用strftime()方法可以将datetime对象转换为字符串。该方法使用下表中的格式符号来格式化时间。

Python自动化运维实战:从Linux系统中收集数据

修改脚本,将下面的代码段添加到代码中。

  1. from datetime import datetime 
  2. time_now = datetime.now() 
  3. time_now_string = time_now.strftime("%Y-%m-%d %H:%M:%S"
  4. Data_Sent_in_Email += "====Time Now is {0}====\n".format(time_now_string) 

在这段代码中,首先从datetime模块中导入datetime类。然后使用datetime类和now()函数创建time_now对象,该函数返回系统的当前时间。最后使用带格式化符号的strftime()来格式化时间并将其转换为字符串,用于输出(注意,该对象包含了datetime对象)。

脚本的输出如下。

Python自动化运维实战:从Linux系统中收集数据

11.1.3 定期运行脚本

在脚本的最后一步,设置运行脚本的时间间隔,它可以是每天、每周、每小时或某个特定的时间。该功能使用了Linux系统上的cron服务。cron用来调度周期性的重复事件,例如,清理目录、备份数据库、转储日志或任何其他事件。

使用下面的命令可以查看当前计划中的任务。

  1. crontab -l 

编辑crontab需要使用-e选项。第一次运行cron时,系统会提示你选择自己喜欢的编辑器(nano或vi)。

典型的crontab由5颗星组成,每颗星代表一个时间项(见下表)。

Python自动化运维实战:从Linux系统中收集数据

如果需要每周五晚上9点运行某个任务,可以使用下面的配置。

  1. 0 21 * * 5 /path/to/command 

如果需要每天0点运行某条命令(比如备份),使用这个配置。

  1. 0 0 * * * /path/to/command 

另外,还可以让cron以某个特定时间间隔运行。如果需要每5min运行一次命令,可以使用这个配置。

  1. */5 * * * * /path/to/command 

回到脚本,如果我们期望它每天早上7:30运行,使用这个配置。

  1. 30 7 * * * /usr/bin/python /root/Send_Email.py 

最后,记得在退出之前保存cron配置。

最好使用绝对路径的Linux命令,而不是相对路径,以避免出现任何潜在的问题。

 

 

责任编辑:张燕妮 来源: 今日头条
相关推荐

2013-04-16 14:55:21

自动化运维Puppet实战

2013-04-11 17:31:28

运维自动化Cobbler

2012-10-22 14:54:48

2014-08-04 10:10:35

IT运维自动化运维

2018-06-23 07:31:05

2017-03-22 18:30:44

Linux运维自动化ansible

2017-03-22 16:31:30

Linux运维自动化ansible

2017-10-13 13:14:35

互联网

2011-09-01 10:22:03

Cobbler运维自动化

2020-11-06 08:43:21

AIOps运维DevOps

2016-09-23 09:22:12

2012-11-20 17:22:57

2015-10-08 10:55:23

云服务自动化运维 ANSIBLE

2018-07-26 13:50:37

IT架构运维

2014-09-22 11:24:18

运维

2014-05-16 14:31:55

运维自动化Cobbler

2014-03-12 15:04:08

资产管理系统cmdb自动化运维

2017-01-17 16:12:26

数据中心运维技术故障

2018-05-02 11:16:27

数据中心

2017-01-17 16:02:29

运维技术数据
点赞
收藏

51CTO技术栈公众号